¿Qué es un analizador de Content Understanding?

Un analyzer en Azure Content Understanding in Foundry Tools es una unidad de procesamiento configurable que define cómo se analiza el contenido y qué información se extrae.

Un analizador define:

Tipo de contenido que se va a procesar (documentos, imágenes, audio o vídeo)
Elementos que se van a extraer (texto, diseño, tablas, campos, transcripciones)
Estructurar la salida (Markdown, campos JSON, segmentos)
Qué modelos de inteligencia artificial se van a usar para el procesamiento

Los analizadores son los componentes fundamentales del Entendimiento de Contenido. Combinan la extracción de contenido, el análisis con tecnología de inteligencia artificial y la salida de datos estructurados en una única configuración reutilizable. Puede usar analizadores creados previamente para escenarios comunes o crear analizadores personalizados adaptados a sus necesidades específicas.

Tipos de analizador

Content Understanding proporciona varios tipos de analizadores:

Analizadores base: analizadores fundamentales que proporcionan funcionalidades de procesamiento principales para cada tipo de contenido (, , , ). Use estos analizadores como bloques de creación para analizadores personalizados.
Analizadores RAG: extraen contenido con la comprensión semántica para aplicaciones de búsqueda e inteligencia artificial. Están optimizados para escenarios de generación aumentada por búsqueda. Algunos ejemplos son y .
Analizadores específicos del dominio: preconfigurado para determinados tipos de documentos y sectores, como facturas, recibos, documentos de identificador y contratos. Entre los ejemplos se incluyen , y .
Analizadores personalizados: los analizadores que se crean mediante la extensión de analizadores base con esquemas de campo personalizados y configuraciones para satisfacer sus requisitos específicos.

Para obtener más información y una lista completa de analizadores específicos del dominio disponibles, consulte Analizadores creados previamente.

Estructura de configuración del analizador

Defina una configuración del analizador mediante un objeto JSON con varias propiedades de nivel superior. Puede configurar los siguientes componentes:

Propiedades del analizador : identidad principal y metadatos
- analyzerId : identificador único
- name : nombre para mostrar
- description : descripción de propósito
- baseAnalyzerId : referencia del analizador primario
Configuración del modelo : configuración del modelo de IA
- modelos : modelos predeterminados
Configuración de procesamiento : opciones de procesamiento de contenido
- config : configuración de comportamiento
Esquema de campo : extracción de datos estructurados
- fieldSchema : definiciones de campo

Este es un ejemplo condensado que muestra la estructura general de una configuración del analizador:

{
  "analyzerId": "myCustomInvoiceAnalyzer",
  "description": "Extracts vendor information, line items, and totals from commercial invoices",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "enableOcr": true
  },
  "fieldSchema": {
    "fields": {
      "vendorName": {
        "type": "string"
      }
    }
  },
  "models": {
    "completion": "gpt-4.1",
    "embedding": "text-embedding-3-large"
  }
}

Propiedades del analizador

Use estas propiedades para identificar y describir de forma única el analizador:

`analyzerId`

Descripción: Identificador único del analizador. Use este identificador para hacer referencia al analizador en las llamadas API.
Ejemplo:,
Directrices:
- Use nombres descriptivos que indiquen el propósito del analizador.
- En el caso de los analizadores personalizados, elija nombres que no entren en conflicto con los nombres de analizador precompilados.
- Use letras, números, puntos o caracteres de subrayado.

`name`

Descripción: nombre visible para los usuarios que aparece en las interfaces de usuario y en la documentación.
Ejemplo:,

`description`

Descripción: Breve explicación de lo que hace el analizador y qué contenido procesa. El modelo de IA usa esta descripción como contexto durante la extracción de campos, por lo que las descripciones claras mejoran la precisión de la extracción.
Ejemplo:
Directrices:
- Sea específico sobre lo que extrae el analizador.
- Mencione los tipos de contenido que admite.
- Manténgalo conciso pero informativo.
- Escriba descripciones claras a medida que guían la comprensión del modelo de IA.

`baseAnalyzerId`

Descripción: Hace referencia a un analizador primario del que este analizador hereda la configuración.
Analizadores básicos admitidos:
- : para analizadores personalizados basados en documentos
- : para analizadores personalizados basados en audio
- : para analizadores personalizados basados en vídeo
- : para analizadores personalizados basados en imágenes
Ejemplo:

Nota:

Al especificar un analizador base, el analizador personalizado hereda todas las configuraciones predeterminadas y puede invalidar configuraciones específicas.

Configuración del modelo

`models`

Descripción: Especifica los nombres de modelo de Foundry que se usarán al procesar con este analizador. Estos son los nombres de modelo (no los nombres de implementación) que usa el servicio. Deben coincidir con uno de los del analizador de base. La lista completa de modelos admitidos por Content Understanding se muestra en los modelos admitidos.
Propiedades:
- - Nombre del modelo para tareas de finalización (extracción de campos, segmentación, análisis de figura, por ejemplo)
- - Nombre del modelo para insertar tareas (mediante una base de conocimiento)
Importante: Estos nombres de modelo proceden del catálogo Foundry, no de los nombres de implementación. En tiempo de ejecución, el servicio asigna estos nombres de modelo a las implementaciones de modelos reales que configure en el nivel de recurso.

Example:

{
  "completion": "gpt-4o",
  "embedding": "text-embedding-3-large"
}

Consulte Conectar su recurso de Content Understanding con modelos Foundry para más detalles sobre cómo configurar modelos conectados.

Configuración de procesamiento

El objeto contiene todas las opciones de procesamiento que controlan cómo se analiza el contenido. Estas opciones se dividen en categorías basadas en la funcionalidad:

Propiedades del objeto config

Opciones generales

`returnDetails`

Valor predeterminado: false (varía según el analizador)
Descripción: Controla si se debe incluir información detallada en la respuesta, como puntuaciones de confianza, cuadros de límite, intervalos de texto y metadatos.
Cuándo usar:
- Establézcalo en al depurar problemas de extracción.
- Cuando necesite información de ubicación para los datos extraídos.
- Cuando se requieren puntuaciones de confianza para la validación.
- Para garantizar la calidad y las pruebas.
Impacto en la respuesta: Aumenta significativamente el tamaño de respuesta con más metadatos.

Opciones de extracción de contenido de documentos

`enableOcr`

Valor predeterminado: true
Descripción: Permite el reconocimiento óptico de caracteres para extraer texto de imágenes y documentos escaneados.
Cuándo usar:
- Habilite para documentos escaneados, fotos e archivos PDF basados en imágenes.
- Deshabilite los ARCHIVOS PDF digitales nativos para mejorar el rendimiento.
Compatible con: Analizadores de documentos.

`enableLayout`

Valor predeterminado: true
Descripción: Extrae información de diseño que incluye párrafos, líneas, palabras, orden de lectura y elementos estructurales.
Cuándo usar:
- Necesario para comprender la estructura y la jerarquía del documento.
- Necesario para la extracción precisa de párrafos y secciones.
- Deshabilite si solo se necesita la extracción de texto sin formato.
Compatible con: Analizadores basados en documentos.

`enableFormula`

Valor predeterminado: true
Descripción: Detecta y extrae fórmulas matemáticas y ecuaciones en formato LaTeX.
Cuándo usar:
- Habilitar para artículos científicos, documentos de investigación, documentación técnica.
- Desactive esta opción para documentos empresariales generales y mejore el rendimiento.
Compatible con: Analizadores basados en documentos.

`enableBarcode`

Valor predeterminado: true
Descripción: Detecta y extrae códigos de barras y códigos QR, devolviendo los valores descodificados.
Cuándo usar:
- Habilite para documentos de inventario, etiquetas de envío, documentación del producto.
- Deshabilite cuando los códigos de barras no estén presentes para mejorar el rendimiento.
Compatible con: Analizadores basados en documentos.
Tipos de códigos de barras admitidos: Código QR, PDF417, UPC-A, UPC-E, Código 39, Código 128, EAN-8, EAN-13, DataBar, Code 93, Codabar, ITF, Micro Código QR, Aztec, Data Matrix, MaxiCode.

Opciones de tabla y gráfico

`tableFormat`

Predeterminado:
Valores admitidos:,
Descripción: Especifica el formato de salida de las tablas extraídas.
Cuándo usar:
- Se usa para la representación web o cuando las estructuras de tabla complejas necesitan conservación.
- Se usa para tablas sencillas en documentación o procesamiento basado en texto.
Compatible con: Analizadores basados en documentos.

`chartFormat`

Predeterminado:
Valores admitidos:
Descripción: Especifica el formato de los datos extraídos de gráficos y gráficas. Compatible con la biblioteca de Chart.js.
Cuándo usar:
- Al extraer datos de gráficos de barras, gráficos de líneas y gráficos circulares.
- Al convertir gráficos visuales en datos estructurados para volver a representarlos.
Compatible con: Analizadores basados en documentos.

Opciones de análisis de figuras e imágenes

`enableFigureDescription`

Valor predeterminado: false
Descripción: Genera descripciones de texto en lenguaje natural para figuras, diagramas, imágenes e ilustraciones.
Cuándo usar:
- Para los requisitos de accesibilidad (generación de texto alternativo).
- Para comprender los diagramas, incluidos los diagramas de flujo.
- Para extraer información de infografías.
Compatible con: Analizadores basados en documentos.

`enableFigureAnalysis`

Valor predeterminado: false
Descripción: Realiza un análisis más profundo de las cifras, incluida la extracción de datos del gráfico y la identificación de componentes del diagrama.
Cuándo usar:
- Para extraer datos estructurados de gráficos incrustados en documentos.
- Para comprender diagramas complejos.
- Para obtener una clasificación detallada de la figura.
Compatible con: Analizadores basados en documentos.

Opciones de anotación

`annotationFormat`

Predeterminado:
Valores admitidos:
Descripción: Especifica el formato de las anotaciones devueltas.
Compatible con: Analizadores basados en documentos.

Opciones de extracción de campos

`estimateFieldSourceAndConfidence`

Valor predeterminado: false (varía según el analizador)
Descripción: Devuelve la ubicación de origen (número de página, cuadro de límite) y la puntuación de confianza para cada valor de campo extraído.
Cuándo usar:
- Para flujos de trabajo de validación y control de calidad.
- Para comprender la precisión de la extracción.
- Para la depuración de problemas de extracción.
- Para resaltar el texto de origen en las interfaces de usuario.
Compatible con: Analizadores de documentos (factura, recibo, documentos de identificación, formularios fiscales)

Opciones de audio y vídeo

`locales`

Predeterminado: (matriz vacía)
Descripción: Lista de códigos de idioma y configuración regional para el procesamiento específico del idioma, principalmente para la transcripción.
Valores admitidos: Códigos de idioma BCP-47 (por ejemplo, )
Cuándo usar:
- Para la transcripción de audio en varios idiomas.
- Para especificar el idioma esperado para mejorar la precisión.
- Para procesar contenido en variantes regionales específicas.
Compatible con:, ,

Nota:

Para obtener una lista completa de los idiomas y configuraciones regionales admitidos, consulte Compatibilidad con idiomas y regiones.

`disableFaceBlurring`

Valor predeterminado: false
Descripción: Controla si las caras de imágenes y vídeos están borrosas para la protección de la privacidad.
Cuándo usar:
- Establézcalo en cuando se requiera la visibilidad de las caras para análisis.
- Establézcalo en cuando se desee la desidentificación de personas en contenido compartido.
Compatible con:,

Importante

La funcionalidad de capacidades de reconocimiento facial en Comprensión de Contenidos es un servicio de acceso limitado, y se requiere registro para acceder. La característica de agrupación y identificación faciales de Content Understanding se limita en función de los criterios de idoneidad y uso. El servicio Face solo está disponible para clientes y asociados administrados por Microsoft. Use el formulario de admisión de reconocimiento facial para solicitar acceso. Para obtener más información, consulte Las inversiones y medidas de seguridad de inteligencia artificial responsable para el reconocimiento facial.

Opciones de clasificación

`contentCategories`

Predeterminado: No establecido
Descripción: Define categorías o tipos de contenido para la clasificación automática y el enrutamiento a controladores especializados. Cuando se usa con , actualmente solo se soporta para documentos. Clasifica todo el archivo. Cuando se usa con , el archivo se divide en fragmentos basados en estas categorías, con cada segmento clasificado y, opcionalmente, procesado por un analizador específico de categorías. Siempre selecciona una sola opción en la lista de categorías disponibles.
Estructura: Cada categoría contiene:
- - (Obligatorio) Descripción detallada de la categoría o tipo de documento. Esta descripción actúa como una solicitud que guía el modelo de IA para determinar los límites de segmento y la clasificación. Incluya características distintivas para ayudar a identificar dónde termina una categoría y otra comienza.
- - (Opcional) Referencia a otro analizador que se va a usar para esta categoría. El analizador al que se hace referencia está vinculado, no copiado, lo que garantiza un comportamiento coherente. Si se omite, solo se realiza la categorización sin más procesamiento (escenario de solo división).
Uso del modelo: Los modelos especificados en la propiedad del analizador primario solo se usan para la segmentación y la clasificación. Cada subanalizador usa su propia configuración de modelo para la extracción.
Comportamiento con :
- : el contenido se divide en segmentos en función de las descripciones de categorías. Cada segmento se clasifica en una de las categorías definidas. Devuelve metadatos de segmento en el objeto de contenido original, además de más objetos de contenido para segmentos con especificados.
- : todo el contenido se clasifica como un todo en una categoría y se enruta en consecuencia. Útil para la clasificación jerárquica sin dividir.
Coincidencia de categorías: Si no se define una categoría "otra" o "predeterminada", el contenido se ve obligado a clasificar en una de las categorías enumeradas. Incluya una categoría "otro" para gestionar correctamente los contenidos no coincidentes.
Compatible con: Analizadores de documentos y vídeos. En el caso del vídeo, solo puede definir una categoría de contenido.

`enableSegment`

Valor predeterminado: false
Descripción: Habilita la segmentación de contenido, lo que divide el archivo en fragmentos en función de las categorías especificadas en . A continuación, cada segmento se clasifica en una de las categorías definidas para el procesamiento selectivo.
Comportamiento de segmentación: El servicio divide el contenido en unidades lógicas mediante el análisis del contenido con las descripciones de categorías. Los límites de segmento se determinan mediante:
- Documentos: Descripciones de categorías combinadas con la estructura de contenido (páginas, secciones, cambios de formato).
- Videos: Descripciones de categorías combinadas con indicaciones visuales (cambios de captura, transiciones de escena, límites temporales). Solo se admite una categoría de contenido.
Cuándo usar:
- Procesamiento de lotes de contenido mixto en los que diferentes partes necesitan un control diferente (por ejemplo, un PDF que contiene facturas y recibos).
- Dividir documentos largos en fragmentos clasificados para el análisis selectivo.
- Analizar vídeos por tipo de contenido (por ejemplo, separar anuncios del contenido principal).
Estructura de salida:
- Devuelve una matriz en el objeto de contenido que contiene metadatos para cada segmento (identificador, límites, categoría).
- Cada segmento incluye su categoría clasificada de .
- Se devuelven más objetos de contenido para segmentos con la categoría especificada.
Segmentación jerárquica: Si el analizador de una categoría también tiene , los segmentos se pueden dividir de forma recursiva, lo que permite el desglose de contenido de varios niveles.
Impacto en el rendimiento: Aumenta el tiempo de procesamiento de archivos grandes, especialmente con muchos segmentos.
Compatible con: Analizadores de documentos y vídeos.

`segmentPerPage`

Valor predeterminado: false
Descripción: Cuando la segmentación está habilitada, fuerza un segmento por página en lugar de usar límites de contenido lógico. Reemplaza la necesidad de métodos de separación "perPage" independientes.
Cuándo usar:
- Flujos de trabajo de procesamiento de página a página.
- Cada página debe tratarse como una unidad independiente.
- Procesamiento paralelo de páginas individuales.
- Extracción de campos de nivel de página en documentos de varias páginas.
- Lotes de documentos mixtos en los que cada página es un tipo de documento diferente.
Compatible con: Analizadores basados en documentos.

`omitContent`

Valor predeterminado: false
Descripción: Cuando , excluye el objeto de contenido original de la respuesta. La respuesta solo incluye objetos de contenido o datos estructurados de campo de los subanalizadores cuando se usa .
Cuándo usar:
- Cuando solo necesita valores de campo extraídos.
- En analizadores compuestos con para devolver solo los resultados clasificados.
- En el caso de las cadenas de clasificación jerárquicas, devuelva solo los resultados del analizador de hoja.

Ejemplo: análisis selectivo:

{
  "config": {
    "enableSegment": true,
    "contentCategories": {
      "invoice": { "analyzerId": "prebuilt-invoice" },
      "other": { }  // Categorize but don't process
    },
    "omitContent": true  // Only return invoice analysis results
  }
}

Compatible con: Analizadores de documentos.

Configuración de campos

La propiedad define qué datos estructurados extrae el analizador del contenido. Especifica los campos, sus tipos y cómo se deben extraer.

Intención de diseño: Extracción estructurada

Los esquemas de campo transforman el contenido no estructurado en datos estructurados y consultables. El esquema actúa como ambos:

Un contrato que define qué datos se extraen
Una guía para el modelo de IA sobre qué buscar y cómo interpretarlo

Estructura de esquema de campo

{
  "fieldSchema": {
    "name": "InvoiceAnalysis",
    "fields": {
      "VendorName": {
        "type": "string",
        "description": "Name of the vendor or supplier",
        "method": "extract"
      },
      "InvoiceTotal": {
        "type": "number",
        "description": "Total amount due on the invoice",
        "method": "extract"
      },
      "LineItems": {
        "type": "array",
        "items": {
          "type": "object",
          "properties": {
            "Description": { "type": "string" },
            "Quantity": { "type": "number" },
            "UnitPrice": { "type": "number" },
            "Amount": { "type": "number" }
          }
        },
        "description": "List of items on the invoice, typically in a table format",
        "method": "generative"
      }
    }
  }
}

Propiedades del esquema de campo

`name`

Descripción: Nombre del esquema, que normalmente describe el tipo de contenido o el caso de uso
Ejemplo:, ,

`fields`

Descripción: Objeto que define cada campo que se va a extraer, con nombres de campo como claves. Un objeto vacío indica que no se extraen campos estructurados (por ejemplo, analizadores de solo diseño).
Compatibilidad jerárquica: Admite campos anidados a través de y tipos para representar estructuras de datos complejas
Procedimiento recomendado: Evite el anidamiento profundo (más de dos o tres niveles), ya que puede reducir el rendimiento y la precisión de la extracción.

Propiedades de definición de campo

Cada campo del objeto tiene las siguientes propiedades:

`type`

Valores admitidos: , , , , ,
Descripción: Tipo de datos del valor del campo. Elija el tipo que mejor coincida con la semántica de datos para una extracción óptima.

`description`

Descripción: Explicación clara de lo que contiene el campo y dónde encontrarlo. El modelo de IA procesa esta descripción como un mini-prompt para guiar la extracción de campos, de modo que la claridad y especificidad mejoran directamente la precisión de la extracción.

Para obtener información sobre cómo escribir descripciones de campos eficaces, consulte Procedimientos recomendados para la extracción de campos.

`method`

Valores admitidos:, ,
Descripción: Método de extracción que se va a usar para este campo. Cuando no se especifica un método, el sistema determina automáticamente el mejor método en función del tipo de campo y la descripción.
Tipos de método:
- - Los valores se generan libremente en función del contenido mediante modelos de IA (lo mejor para campos complejos o variables que requieren interpretación)
- - Los valores se extraen a medida que aparecen en el contenido (lo mejor para la extracción de texto literal de ubicaciones específicas). La extracción requiere que se establezca en verdadero para este campo.
- - Los valores se clasifican en un conjunto predefinido de categorías (mejor cuando se usa con un conjunto fijo de valores posibles)

`estimateSourceAndConfidence`

Valor predeterminado: false
Descripción: Devuelve la ubicación de origen (número de página, cuadro de límite) y la puntuación de confianza para este valor de campo. Debe ser verdadero para los campos con = extract. Esta propiedad sobrescribe la propiedad de nivel de analizador .
Cuándo usar:
- Para flujos de trabajo de validación y control de calidad.
- Para comprender la precisión de la extracción.
- Para la depuración de problemas de extracción.
- Para resaltar el texto de origen en las interfaces de usuario.
Compatible con: Analizadores de documentos (factura, recibo, documentos de identificación, formularios fiscales)

(para tipos de matriz)

Descripción: Define la estructura de los elementos de la matriz.
Propiedades:
- - Tipo de elementos de matriz (, , )
- - Para los elementos de objeto, define la estructura de campo anidada.

(para los tipos de objeto)

Descripción: Define la estructura de campos anidados dentro del objeto .

Example:

{
  "Address": {
    "type": "object",
    "properties": {
      "Street": { "type": "string" },
      "City": { "type": "string" },
      "State": { "type": "string" },
      "ZipCode": { "type": "string" }
    },
    "description": "Complete mailing address"
  }
}

Ejemplo completo del analizador

Este es un ejemplo completo de una configuración personalizada del analizador de facturas que muestra los conceptos clave que se describen en esta referencia:

{
  "analyzerId": "myCustomInvoiceAnalyzer",
  "name": "Custom Invoice Analyzer",
  "description": "Extracts vendor information, line items, and totals from commercial invoices",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "returnDetails": true,
    "enableOcr": true,
    "enableLayout": true,
    "tableFormat": "html",
    "estimateFieldSourceAndConfidence": true,
    "omitContent": false
  },
  "fieldSchema": {
    "name": "InvoiceFields",
    "fields": {
      "VendorName": {
        "type": "string",
        "description": "Name of the vendor or supplier, typically found in the header section",
        "method": "extract"
      },
      "VendorAddress": {
        "type": "object",
        "properties": {
          "Street": { "type": "string" },
          "City": { "type": "string" },
          "State": { "type": "string" },
          "ZipCode": { "type": "string" }
        },
        "description": "Complete vendor mailing address"
      },
      "InvoiceNumber": {
        "type": "string",
        "description": "Unique invoice number, often labeled as 'Invoice #' or 'Invoice No.'",
        "method": "extract"
      },
      "InvoiceDate": {
        "type": "date",
        "description": "Date the invoice was issued, in format MM/DD/YYYY",
        "method": "extract"
      },
      "DueDate": {
        "type": "date",
        "description": "Payment due date",
        "method": "extract"
      },
      "LineItems": {
        "type": "array",
        "items": {
          "type": "object",
          "properties": {
            "Description": {
              "type": "string",
              "description": "Item or service description"
            },
            "Quantity": {
              "type": "number",
              "description": "Quantity ordered"
            },
            "UnitPrice": {
              "type": "number",
              "description": "Price per unit"
            },
            "Amount": {
              "type": "number",
              "description": "Line total (Quantity × UnitPrice)"
            }
          }
        },
        "description": "List of items or services on the invoice, typically in a table format",
        "method": "generative"
      },
      "Subtotal": {
        "type": "number",
        "description": "Sum of all line items before tax",
        "method": "extract"
      },
      "Tax": {
        "type": "number",
        "description": "Tax amount",
      },
      "Total": {
        "type": "number",
        "description": "Total amount due (Subtotal + Tax)",
      },
      "PaymentTerms": {
        "type": "string",
        "description": "Payment terms and conditions (e.g., 'Net 30', 'Due upon receipt')",
        "method": "generative"
      }
    }
  },
  "supportedModels": {
    "completion": ["gpt-4o", "gpt-4o-mini", "gpt-4.1"],
    "embedding": ["text-embedding-3-large", "text-embedding-3-small"]
  },
  "models": {
    "completion": "gpt-4.1",
    "embedding": "text-embedding-3-large"
  }
}

Creación de un analizador personalizado

Para crear un analizador personalizado basado en la estructura de configuración descrita en este documento, use la API REST content Understanding para enviar la definición del analizador.

Punto de conexión de la API

Use el siguiente comando curl para crear un analizador personalizado mediante el envío de la configuración del analizador desde un archivo JSON:

curl -X PUT "https://{endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01-preview" \
  -H "Content-Type: application/json" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -d @analyzer-definition.json

Reemplace los marcadores de posición siguientes:

: el punto de conexión del recurso de Content Understanding
- Identificador único del analizador
- La clave de suscripción de Content Understanding
- Ruta de acceso al archivo de configuración del analizador

Cuerpo de la solicitud

El archivo de configuración del analizador debe ser un objeto JSON que contenga las propiedades descritas en esta referencia. Para obtener un ejemplo completo, consulte el tutorial Creación de analizadores personalizados.

Respuesta

La API devuelve una respuesta con un encabezado que puede usar para realizar un seguimiento del estado de la operación de creación del analizador.

Pasos siguientes

Para ver un tutorial completo con ejemplos de diferentes tipos de contenido (documentos, imágenes, audio, vídeo), consulte Creación de un analizador personalizado.

Configuración por tipo de contenido

Los distintos tipos de contenido admiten diferentes opciones de configuración. Esta es una referencia rápida:

Analizadores de documentos

Analizador base:

Opciones de configuración admitidas:

✅ returnDetails
✅ omitContent
✅ enableOcr
✅ enableLayout
✅ enableFormula
✅ enableBarcode
✅ tableFormat
✅ chartFormat
✅ enableFigureDescription
✅ enableFigureAnalysis
✅ enableAnnotations
✅ annotationFormat
✅ enableSegment
✅ segmentPerPage
(analizadores estructurados)
(analizadores de varias variantes)

Analizadores de audio

Analizador base:

Opciones de configuración admitidas:

✅ returnDetails
✅ locales

Analizadores de vídeo

Analizador base:

Opciones de configuración admitidas:

✅ returnDetails
✅ locales
✅ contentCategories
✅ enableSegment
✅ omitContent
✅ disableFaceBlurring

Analizadores de imágenes

Analizador base:

Opciones de configuración admitidas:

✅ returnDetails
✅ disableFaceBlurring

Obtenga información sobre los analizadores creados previamente disponibles en Content Understanding.
Explore las plantillas del analizador para comenzar rápidamente.
Cree su propio analizador siguiendo el tutorial del analizador personalizado.
Conozca los procedimientos recomendados para obtener resultados óptimos de extracción.
Revise los elementos de documento y los elementos de vídeo para obtener más información sobre el contenido extraído.
Empiece por crear y probar analizadores en Foundry.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-03-06

Compartir a través de

¿Qué es un analizador de Content Understanding?

Tipos de analizador

Estructura de configuración del analizador

Propiedades del analizador

analyzerId

name

description

baseAnalyzerId

Configuración del modelo

models

Configuración de procesamiento

Propiedades del objeto config

Opciones generales

returnDetails

Opciones de extracción de contenido de documentos

enableOcr

enableLayout

enableFormula

enableBarcode

Opciones de tabla y gráfico

tableFormat

chartFormat

Opciones de análisis de figuras e imágenes

enableFigureDescription

enableFigureAnalysis

Opciones de anotación

annotationFormat

Opciones de extracción de campos

estimateFieldSourceAndConfidence

Opciones de audio y vídeo

locales

disableFaceBlurring

Opciones de clasificación

contentCategories

enableSegment

segmentPerPage

omitContent

Configuración de campos

Intención de diseño: Extracción estructurada

Estructura de esquema de campo

Propiedades del esquema de campo

name

fields

Propiedades de definición de campo

type

description

method

estimateSourceAndConfidence

(para tipos de matriz)

(para los tipos de objeto)

Ejemplo completo del analizador

Creación de un analizador personalizado

Punto de conexión de la API

Cuerpo de la solicitud

Respuesta

Pasos siguientes

Configuración por tipo de contenido

Analizadores de documentos

Analizadores de audio

Analizadores de vídeo

Analizadores de imágenes

Contenido relacionado

Comentarios

Recursos adicionales

`analyzerId`

`name`

`description`

`baseAnalyzerId`

`models`

`returnDetails`

`enableOcr`

`enableLayout`

`enableFormula`

`enableBarcode`

`tableFormat`

`chartFormat`

`enableFigureDescription`

`enableFigureAnalysis`

`annotationFormat`

`estimateFieldSourceAndConfidence`

`locales`

`disableFaceBlurring`

`contentCategories`

`enableSegment`

`segmentPerPage`

`omitContent`

`name`

`fields`

`type`

`description`

`method`

`estimateSourceAndConfidence`