Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Nota:
Comprensión de contenidos ahora es un servicio disponible con carácter general (GA) con el lanzamiento de la versión de la API 2025-11-01. Para obtener más información, consulte Novedades.
La comprensión de contenidos de Azure en Foundry Tools es una herramienta de Foundry que está disponible como parte del recurso de Microsoft Foundry en Azure Portal. Usa ia generativa para procesar e ingerir muchos tipos de contenido, incluidos documentos, imágenes, vídeos y audio, en un formato de salida definido por el usuario. Content Understanding ofrece un proceso simplificado para razonar sobre grandes cantidades de datos no estructurados, lo que acelera el tiempo a valor mediante la generación de una salida que se puede integrar en flujos de trabajo de automatización y análisis.
Comprensión de contenidos ahora es un servicio disponible con carácter general (GA) con el lanzamiento de la versión de la API 2025-11-01. Ahora está disponible en una gama más amplia de regiones. Para obtener más información sobre las actualizaciones de la versión de disponibilidad general, consulte la página Novedades de Comprensión de contenidos.
¿Por qué usar Content Understanding?
Content Understanding acelera el tiempo necesario para alcanzar el valor al habilitar el procesamiento directo de datos no estructurados con puntuaciones de confianza, minimizando la revisión manual y reduciendo los costos operativos. Entre las ventajas clave se incluyen las siguientes:
Simplificar y simplificar los flujos de trabajo. Content Understanding estandariza la extracción y clasificación del contenido, la estructura y la información de varios tipos de contenido en un proceso unificado.
Simplificar la extracción de campos. La extracción de campos de comprensión de contenidos facilita la generación de resultados estructurados a partir de contenido no estructurado. Defina un esquema para extraer, clasificar o generar valores de campo sin ingeniería de mensajes compleja.
Mejorar la precisión. La comprensión de contenidos emplea varios modelos de inteligencia artificial para analizar y validar la información simultáneamente, lo que da lugar a resultados más precisos y confiables.
Puntuaciones de confianza y fundamentación. La comprensión de contenidos garantiza la precisión de los valores extraídos a la vez que minimiza el costo de la revisión humana.
Clasificar tipos de contenido. Content Understanding permite clasificar los tipos de documento para simplificar la capacidad de procesar el contenido. Esta característica ya está disponible en un enfoque unificado en analyze API.
Analizadores precompilados específicos del sector. Content Understanding incluye analizadores predefinidos diseñados para escenarios específicos del sector, como la preparación fiscal, el procesamiento de documentos de compras, el análisis de contratos, el análisis de centros de atención al cliente, el análisis de medios y mucho más.
Casos de uso de Comprensión de contenidos
Procesamiento inteligente de documentos (IDP). Content Understanding permite el procesamiento inteligente de documentos mediante la conversión de documentos no estructurados en datos estructurados con alta precisión. Las puntuaciones de confianza y las funcionalidades de puesta a tierra garantizan la calidad de los datos al tiempo que minimizan la revisión manual y reducen los costos operativos. Por ejemplo, automatice el procesamiento de facturas, el análisis de contratos y la administración de notificaciones mediante la extracción y validación de campos de documentos complejos.
Aplicaciones de agencia. Content Understanding transforma entradas de archivos desordenadas y multimodales en entradas predecibles y estandarizadas. Ofrece representaciones claras de Markdown para los flujos de trabajo de razonamiento y conocimiento, lo que garantiza la claridad y el contexto de las tareas posteriores. Cuando se requieren datos estructurados, proporciona campos clave-valor alineados con esquemas con puntuaciones de confianza y base, lo que permite a los agentes automatizar las decisiones con precisión y auditabilidad.
Generación aumentada por búsqueda y recuperación de información (RAG). Content Understanding permite la ingesta de contenido de cualquier modalidad en un índice de búsqueda, con amplio soporte para la descripción y el análisis de figuras, lo que hace que sus datos sean más accesibles. El servicio Content Understanding ofrece varios analizadores preconstruidos que están ajustados para proporcionarle los mejores resultados para los escenarios de búsqueda RAG.
Automatización de procesos robóticos (RPA). Content Understanding se integra perfectamente con los flujos de trabajo de RPA proporcionando datos estructurados extraídos de varios tipos de contenido. Esta funcionalidad permite la automatización de un extremo a otro de los procesos empresariales que requieren comprensión del contenido, como el procesamiento de pedidos, la incorporación de clientes y los flujos de trabajo de cumplimiento normativo.
Análisis e informes: las salidas de campo extraídas de Comprensión de contenidos mejoran el análisis y los informes, lo que permite a las empresas obtener información valiosa, realizar análisis más profundos y tomar decisiones fundamentadas basadas en informes precisos.
Optimización del flujo de trabajo a través de la clasificación: la característica de clasificación de Content Understanding permite clasificar primero los documentos antes de enrutarlos al analizador asociado para la extracción.
Aplicaciones específicas del sector
Algunas aplicaciones comunes específicas del sector para Content Understanding incluyen:
| Aplicación | Descripción |
|---|---|
| Automatización fiscal | Las empresas de preparación fiscal pueden usar Comprensión de contenidos para generar una vista unificada de la información de varios documentos y crear declaraciones de impuesto completas. |
| Procesamiento de solicitudes hipotecas | Analice la documentación complementaria y las solicitudes de hipotecas para determinar si un posible comprador de viviendas proporcionó toda la documentación necesaria para proteger una hipoteca. |
| Comprobación del contrato de factura | Revise cuidadosamente las facturas y los contratos contractuales con los clientes. Aplique un proceso de razonamiento de varios pasos para analizar los datos. Asegúrese de que las conclusiones, como validar la coherencia entre la factura y el contrato, sean precisas y exhaustivas. |
| Ingesta de generación aumentada de recuperación (RAG) | Las organizaciones pueden mejorar sus flujos de trabajo RAG mediante la extracción de información completa de documentos que, de lo contrario, se perdería. Las descripciones de figuras capturan información de gráficos, diagramas y visualizaciones, haciendo que sean buscables. El análisis de diseño conserva la estructura del documento, incluidas las tablas, las secciones y las jerarquías. La detección de anotaciones captura notas manuscritas, subrayados y tachos. |
| Análisis posterior a llamadas | Las empresas y los centros de llamadas pueden generar información a partir de grabaciones de llamadas para realizar un seguimiento de los indicadores clave de rendimiento (KPI), mejorar la experiencia del producto, generar información empresarial, crear experiencias de cliente diferenciadas y responder a consultas más rápidas y precisas. |
| Administración de recursos multimedia | Los proveedores de software y multimedia pueden usar comprensión de contenidos para extraer información más completa y dirigida de vídeos para soluciones de administración de recursos multimedia. |
| Soporte técnico al cliente mejorado | Las empresas con canales de soporte técnico pueden utilizar "Content Understanding" para la búsqueda RAG con el fin de mejorar la calidad de las respuestas basándose en datos de problemas y comentarios previos de los clientes. |
Componentes clave de Content Understanding
El marco Content Understanding procesa contenido no estructurado a través de varias fases, transformando las entradas en salidas estructuradas y accionables. En la tabla siguiente se describe cada componente de izquierda a derecha, como se muestra en el diagrama:
| Componente | Descripción |
|---|---|
| Entradas | Contenido de origen que procesa Content Understanding. Admite varias modalidades, como Documentos, Imágenes, Vídeo, Audio. Obtenga más información sobre los tipos de archivo de entrada. |
| Analizador | Componente principal que define cómo se procesa el contenido. Configura las opciones de extracción de contenido, el esquema de extracción de campos y las implementaciones de modelos. Una vez configurado, el analizador aplica de forma coherente estas opciones a todos los datos entrantes. Content Understanding ofrece analizadores creados previamente para escenarios comunes y admite analizadores personalizados adaptados a sus necesidades. Obtenga más información sobre los analizadores, los analizadores creados previamente y los analizadores personalizados. |
| Extracción de contenido | Transforma la entrada no estructurada en metadatos y texto estructurado normalizado. Extrae texto mediante el reconocimiento óptico de caracteres (OCR), identifica marcas de selección y códigos de barras, detecta fórmulas y reconoce elementos de diseño como párrafos, secciones y tablas. Para audio y vídeo, transcribe la voz e identifica los elementos visuales clave. Obtenga más información sobre la extracción de contenido. |
| Segmentación | Divide documentos o vídeos en secciones lógicas para el procesamiento dirigido. Configurado mediante la enableSegment propiedad en el esquema del analizador. Permite dividir el contenido en fragmentos significativos, como dividir un documento por tipo de documento o dividir un vídeo en escenas. Obtenga más información sobre la segmentación y la clasificación. |
| Extracción de campos | Genera pares clave-valor estructurados en función del esquema definido. Consulte Límites de servicio para los tipos de campo admitidos. Los campos se pueden generar a través de tres métodos: • Extraer: extraer directamente los valores tal como aparecen en el contenido de entrada (admitido solo para documentos), como fechas de recibos o detalles de artículos de facturas. • Clasificar: clasificar el contenido de un conjunto predefinido de categorías, como sentimiento de la llamada o tipo de gráfico, y pasarlo al analizador adecuado. • Generar: generar valores libremente a partir de datos de entrada, como resumir una conversación de audio o crear descripciones de escenas a partir de vídeos. Obtenga más información sobre la extracción de campos. |
| Puntuaciones de confianza | Proporciona estimaciones de confiabilidad de 0 a 1 para cada valor de campo extraído. Las puntuaciones altas indican la extracción de datos precisa, lo que permite el procesamiento directo en flujos de trabajo de automatización. Habilitado mediante la estimateFieldSourceAndConfidence configuración en analizadores de documentos. Obtenga más información sobre las puntuaciones de confianza. |
| Tierra | Identifica las regiones específicas del contenido donde se extrajo o generó cada valor. La referencia al origen permite a los usuarios en escenarios de automatización verificar rápidamente la exactitud de los valores de campo rastreándolos hasta su origen en el contenido original. Habilitado mediante la estimateFieldSourceAndConfidence configuración en analizadores de documentos. Obtenga más información sobre la puesta en tierra. |
| Contextualización | Capa de procesamiento de Content Understanding que prepara el contexto para los modelos generativos y posprocesa su salida. Incluye la normalización y el formato de salida, el cálculo de la base de origen, el cálculo de la puntuación de confianza y la ingeniería de contexto para optimizar el uso del modelo. Más información sobre la contextualización. |
| Foundry Models | Los modelos de lenguaje a gran escala (LLM) de Foundry y los modelos de incrustación que impulsan las capacidades generativas. Traiga sus propias implementaciones de modelos generativos admitidos y modelos de inserción de texto para ejemplos de entrenamiento. Content Understanding usa estos modelos para la extracción de campos, el análisis de figuras y otras características con tecnología de inteligencia artificial. Obtenga más información sobre los modelos e implementaciones. |
| Salida estructurada | El resultado final se proporciona en el formato elegido. El contenido se puede generar como Markdown para escenarios de búsqueda y recuperación, o como JSON estructurado que coincida con el esquema definido para flujos de trabajo de automatización y análisis. |
Experiencias de comprensión del contenido
Content Understanding es un servicio Foundry. Para usar Content Understanding, debe crear un recurso de Azure Foundry. Content Understanding Studio complementa la experiencia de Foundry para los clientes que necesitan funcionalidades avanzadas. Para obtener un desglose más detallado de cada servicio, consulte Comparación de características: Comprensión del contenido en Foundry frente a Content Understanding Studio.
- Comprensión de Contenidos en el portal Foundry (nuevo) (próximamente): El portal Foundry NextGen ofrece la capacidad de crear flujos de trabajo avanzados y completos con la herramienta de Comprensión de Contenidos.
- Content Understanding Studio: una experiencia de usuario complementaria, Content Understanding Studio permite una transición fluida para los clientes que pasan de la inteligencia de documentos. Ofrece una experiencia optimizada para mejorar el rendimiento del analizador, incluida la mejora de los analizadores personalizados mediante técnicas de etiquetado de datos. También admite la creación de analizadores personalizados basados en clasificación.
Inteligencia artificial responsable
Content Understanding está diseñado para protegerse contra el procesamiento de contenido dañino, como la violencia gráfica y el gore, el discurso odioso y el acoso, la explotación, el abuso y mucho más. El servicio aprovecha la infraestructura de Foundry estándar, incluida la seguridad del contenido de Azure AI, integrando los resultados de seguridad del contenido en la salida de Content Understanding. Para obtener más información y una lista completa de contenido prohibido, vea la nota de transparencia y el Código de conducta.
Filtrado de contenido modificado
Content Understanding admite el filtrado de contenido modificado para los clientes aprobados. Los identificadores de suscripción (identificadores) con filtrado de contenido modificado aprobado afectan a la salida del Servicio de comprensión de contenido. De forma predeterminada, Content Understanding emplea un sistema de filtrado de contenido que identifica categorías de riesgo específicas para contenido potencialmente perjudicial tanto en las solicitudes enviadas como en las salidas generadas. El filtrado de contenido modificado permite que el sistema anote en lugar de bloquear la salida potencialmente perjudicial, lo que le ofrece la capacidad de determinar cómo controlar el contenido potencialmente dañino. Para obtener más información sobre los tipos de filtro de contenido, vea Tipos de filtro de contenido.
Importante
- Aplique filtros de contenido modificados mediante este formulario: Revisión de acceso limitado de Azure OpenAI: Filtros de contenido modificados.
- Para obtener más información, consulte Filtrado de contenido.
Capacidades faciales
Content Understanding proporciona funcionalidades de descripción facial que pueden generar descripciones textuales detalladas de caras en contenido de vídeo e imagen. Cuando se habilita, el modelo generativo describe atributos faciales como el cabello facial, la expresión facial y puede identificar personas destacadas o celebridades. Obtenga más información sobre la descripción de la cara en el procesamiento de vídeo.
Seguridad y privacidad de datos
Los desarrolladores que usan el servicio Content Understanding deben revisar las directivas de Microsoft en los datos de los clientes. Para obtener más información, visite la página Datos, protección y privacidad .
Importante
Si utiliza productos o servicios de Microsoft para procesar datos biométricos, es responsable de: (i) notificar a los interesados, incluso respecto a los periodos de retención y destrucción; (ii) obtener el consentimiento de los interesados; y (iii) eliminar los datos biométricos, todo ello según corresponda y se requiera en virtud de los Requisitos de Protección de datos aplicables. "Datos biométricos" tiene el significado articulado en el artículo 4 del RGPD y, si procede, términos equivalentes en otros requisitos de protección de datos. Para obtener información relacionada, consulte Datos y privacidad de Face.
Comienza
Nuestras guías de inicio rápido le ayudarán a empezar a usar rápidamente el servicio Content Understanding: