Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Importante
- Las versiones preliminares públicas de Azure Language in Foundry Tools proporcionan acceso anticipado a las características que están en desarrollo activo.
- Las características, los enfoques y los procesos pueden cambiar, antes de la disponibilidad general (GA), en función de los comentarios del usuario.
Language es un servicio basado en la nube que aplica características de procesamiento de lenguaje natural (NLP) a datos basados en texto. La funcionalidad de compatibilidad con documentos nativos permite enviar solicitudes de API de forma asincrónica, empleando un cuerpo de solicitud HTTP POST para enviar los datos y una cadena de consulta de solicitud HTTP GET para recuperar los resultados del estado. Los documentos procesados se encuentran en el contenedor de destino de Azure Blob Storage.
Un documento nativo hace referencia al formato de archivo usado para crear el documento original, como Microsoft Word (docx) o un archivo de documento portátil (pdf). La compatibilidad con documentos nativos elimina la necesidad de preprocesamiento de texto antes de usar las funcionalidades de recursos de lenguaje. Actualmente, la compatibilidad con documentos nativos está disponible para las siguientes funcionalidades:
Información de identificación personal (PII). La característica de detección de DCP puede identificar, clasificar y censurar información confidencial en texto no estructurado. La API
PiiEntityRecognitionadmite el procesamiento nativo de documentos.Resumen de documentos. El resumen de documentos usa el procesamiento de lenguaje natural para generar resúmenes mediante extracción (extracción de frases destacadas) o abstracción (extracción de palabras contextuales) para documentos. Las API
AbstractiveSummarizationyExtractiveSummarizationadmiten el procesamiento nativo de documentos.
Formatos de documento admitidos
Las aplicaciones usan formatos de archivo nativos para crear, guardar o abrir documentos nativos. Actualmente, las funcionalidades de PII y resumen de documentos admiten los siguientes formatos de documento nativos:
| Tipo de archivo | Extensión de archivo | Description |
|---|---|---|
| Mensaje de texto | .txt |
Documento de texto sin formato |
| PDF de Adobe | .pdf |
Un documento portátil con formato de archivo de documento. |
| Microsoft Word | .docx |
Un archivo de documento de Microsoft Word. |
Directrices de entrada
Formatos de archivo admitidos
| Tipo | Compatibilidad y limitaciones |
|---|---|
| No se admiten archivos PDF totalmente digitalizados. | |
| Texto dentro de imágenes | No se admiten imágenes digitales con texto incrustado. |
| Tablas digitales | No se admiten tablas en documentos digitalizados. |
Tamaño del documento
| Atributo | Límite de entrada |
|---|---|
| Número total de documentos por solicitud | ≤ 20 |
| Tamaño total del contenido por solicitud | ≤ 10 MB |
Parámetros y encabezados de solicitud
| parámetro | Description |
|---|---|
-X POST <endpoint> |
Especifica el punto de conexión del recurso de lenguaje para acceder a la API. |
--header Content-Type: application/json |
Tipo de contenido para enviar datos JSON. |
--header "Ocp-Apim-Subscription-Key:<key> |
Especifica la clave de recurso de lenguaje de Azure para acceder a la API. |
-data |
Archivo JSON que contiene los datos que desea pasar con la solicitud. |