Compartir a través de


Compatibilidad con documentos nativos para el lenguaje de Azure en Foundry Tools (versión preliminar)

Importante

  • Las versiones preliminares públicas de Azure Language in Foundry Tools proporcionan acceso anticipado a las características que están en desarrollo activo.
  • Las características, los enfoques y los procesos pueden cambiar, antes de la disponibilidad general (GA), en función de los comentarios del usuario.

Language es un servicio basado en la nube que aplica características de procesamiento de lenguaje natural (NLP) a datos basados en texto. La funcionalidad de compatibilidad con documentos nativos permite enviar solicitudes de API de forma asincrónica, empleando un cuerpo de solicitud HTTP POST para enviar los datos y una cadena de consulta de solicitud HTTP GET para recuperar los resultados del estado. Los documentos procesados se encuentran en el contenedor de destino de Azure Blob Storage.

Un documento nativo hace referencia al formato de archivo usado para crear el documento original, como Microsoft Word (docx) o un archivo de documento portátil (pdf). La compatibilidad con documentos nativos elimina la necesidad de preprocesamiento de texto antes de usar las funcionalidades de recursos de lenguaje. Actualmente, la compatibilidad con documentos nativos está disponible para las siguientes funcionalidades:

  • Información de identificación personal (PII). La característica de detección de DCP puede identificar, clasificar y censurar información confidencial en texto no estructurado. La API PiiEntityRecognition admite el procesamiento nativo de documentos.

  • Resumen de documentos. El resumen de documentos usa el procesamiento de lenguaje natural para generar resúmenes mediante extracción (extracción de frases destacadas) o abstracción (extracción de palabras contextuales) para documentos. Las API AbstractiveSummarization y ExtractiveSummarization admiten el procesamiento nativo de documentos.

Formatos de documento admitidos

Las aplicaciones usan formatos de archivo nativos para crear, guardar o abrir documentos nativos. Actualmente, las funcionalidades de PII y resumen de documentos admiten los siguientes formatos de documento nativos:

Tipo de archivo Extensión de archivo Description
Mensaje de texto .txt Documento de texto sin formato
PDF de Adobe .pdf Un documento portátil con formato de archivo de documento.
Microsoft Word .docx Un archivo de documento de Microsoft Word.

Directrices de entrada

Formatos de archivo admitidos

Tipo Compatibilidad y limitaciones
PDF No se admiten archivos PDF totalmente digitalizados.
Texto dentro de imágenes No se admiten imágenes digitales con texto incrustado.
Tablas digitales No se admiten tablas en documentos digitalizados.

Tamaño del documento

Atributo Límite de entrada
Número total de documentos por solicitud ≤ 20
Tamaño total del contenido por solicitud ≤ 10 MB

Parámetros y encabezados de solicitud

parámetro Description
-X POST <endpoint> Especifica el punto de conexión del recurso de lenguaje para acceder a la API.
--header Content-Type: application/json Tipo de contenido para enviar datos JSON.
--header "Ocp-Apim-Subscription-Key:<key> Especifica la clave de recurso de lenguaje de Azure para acceder a la API.
-data Archivo JSON que contiene los datos que desea pasar con la solicitud.