Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
La comprensión del lenguaje natural (NLU) está en el núcleo de cómo los agentes de Copilot Studio interpretan las consultas de los usuarios y proporcionan respuestas pertinentes y contextuales. Un enfoque bien definido para el reconocimiento de intenciones, la extracción de entidades y la gestión de respaldo garantiza que los agentes mantengan conversaciones eficientes y naturales que se ajusten a las necesidades del negocio.
Cuando un usuario introduce algo a un agente, se conoce como enunciado. El agente necesita descomponer esa expresión en intención y entidades, haciendo que su respuesta se sienta tanto natural como eficiente.
¿Qué es la comprensión del idioma?
La comprensión del lenguaje (LU) es una subdisciplina del Procesamiento del Lenguaje Natural (PLN) centrada en permitir que las máquinas comprendan el significado, la intención y el contexto detrás del lenguaje humano.
Diagrama que ilustra el procesamiento de la comprensión del lenguaje.
Diagrama que muestra cómo se desglosa el mensaje de un usuario en intención y entidades. Una persona escribe: "Quiero reservar un vuelo a París la semana que viene." El mensaje se etiqueta como una enunciación. La frase "quiero reservar un vuelo" se identifica como la intención, y "París" y "la próxima semana" se identifican como entidades. El sistema entonces solicita más detalles como la ciudad de salida y la clase de viaje. El diagrama ilustra cómo el agente utiliza la intención, las entidades y el contexto para determinar la mejor respuesta.
La comprensión del idioma implica:
- Reconocimiento de intención: Identificar lo que el usuario quiere lograr (por ejemplo, "Reservar un vuelo a París la próxima semana" corresponde a la intención de reservar un vuelo).
- Extracción de entidades: Extraer detalles clave como fechas, ubicaciones o nombres (por ejemplo, "París" como destino, "semana siguiente" como fecha de viaje).
- Conciencia del contexto: mantener la continuidad y resolver ambigüedades en la conversación (por ejemplo, entender pronombres o referencias).
- Manejo de ambigüedades: Utilizar el contexto para resolver palabras con múltiples significados (por ejemplo, "banco" como institución financiera o orilla de río).
Comprensión del lenguaje en Copilot Studio
Copilot Studio tiene un modelo flexible para language understanding, con varias opciones de configuración.
Orquestación generativa
La orquestación generativa utiliza modelos de lenguaje para encadenar inteligentemente temas, acciones y conocimientos. Esta capacidad permite el reconocimiento multi-intención, la extracción avanzada de entidades y la generación dinámica de planes para consultas complejas.
Este método es el valor predeterminado para Copilot Studio. Este enfoque reconoce múltiples intenciones o temas en una sola enunciación, encadena automáticamente acciones y fuentes de conocimiento, y genera respuestas unificadas. Es especialmente útil para gestionar conversaciones complejas que abarcan múltiples áreas de negocio. La orquestación generativa tiene límites, como cinco mensajes por tema o cadena de acciones, y 128 temas o acciones por orquestación, pero proporciona una forma poderosa de escalar la amplitud de la conversación.
Aprende más en Aplicar capacidades de orquestación generativa.
Orquestación clásica
La orquestación clásica utiliza frases desencadenantes y enrutamiento determinista de temas. Si la expresión de un usuario coincide con una frase desencadenante, se ejecuta el tema correspondiente. Si no hay coincidencia, los mecanismos de respaldo buscan fuentes de conocimiento o piden al usuario que aclare.
NLU integrado
Este enfoque era el estándar, pero ahora es el método de respaldo. Copilot Studio proporciona un modelo NLU listo para usar que admite frases desencadenantes, entidades predefinidas y entidades personalizadas. Este modelo permite a los agentes identificar la intención del usuario y extraer detalles clave como fechas, destinos o cantidades directamente de una consulta.
NLU+
Para mayor precisión, utiliza la opción NLU+. La opción NLU+ es ideal para aplicaciones de gran nivel empresarial. Estos tipos de aplicaciones normalmente constan de un gran número de temas y entidades, y usan un gran número de ejemplos de entrenamiento. Además, si tiene un agente habilitado para voz, los datos de entrenamiento de NLU+ también se usan para optimizar las funcionalidades de reconocimiento de voz.
integración de CLU de Azure
Para escenarios más avanzados en los que no se puede usar la orquestación generativa predeterminada, puede integrar Azure conversational Language Understanding (CLU). CLU ofrece una mayor personalización, soporte multilingüe y extracción de entidades complejas (por ejemplo, múltiples entidades "desde"). Debe mapear las intenciones de CLU a temas de Copilot Studio para mantenerlos sincronizados. Esta opción es particularmente valiosa para vocabularios específicos del sector, idiomas distintos del inglés o escenarios que requieren mayor precisión.
Características principales y limitaciones
En esta tabla se comparan los tres enfoques de comprensión del lenguaje en Copilot Studio. Destaca sus características clave y limitaciones para ayudarte a elegir el modelo adecuado para las necesidades de complejidad, escala y precisión de tu agente.
| Características y limitaciones | Orquestación generativa | Modelo NLU integrado | Modelo CLU de Azure personalizado |
|---|---|---|---|
| Características clave |
|
|
|
| Límites |
|
|
|
Aprende más en Resumen sobre el aprendizaje del lenguaje natural (NLU).
Estructura temática y respaldo
Los temas han pasado de un camino rígido basado en la intención hacia un enfoque más flexible y centrado en la orquestación. En lugar de depender únicamente de disparadores y caminos predefinidos, los temas ahora funcionan como instrucciones modulares a las que el agente puede recurrir para orquestar una conversación. La orquestación generativa gestiona la mayor parte del enrutamiento interpretando dinámicamente la entrada del usuario, y los temas proporcionan un respaldo estructurado cuando se necesita precisión.
El diseño más tradicional y estructurado de los temas hace que las conversaciones se sientan naturales y eficientes. Los temas pueden ser puntos de entrada activados por enunciados del usuario o subtemas reutilizables llamados por redirecciones o eventos del sistema. Los temas de desambiguación ayudan a evitar confusiones cuando se pueden activar múltiples temas, mientras que los temas de respaldo y de facilitación conversacional proporcionan redes de seguridad cuando el agente no puede identificar correctamente la intención. También puedes añadir respuestas generativas para extraer fuentes externas de conocimiento, asegurando que los usuarios rara vez se queden sin respuesta.
Aprende más en Aplicar las mejores prácticas a los temas de redacción.
Localización e idiomas
El idioma usado por un agente de Copilot Studio viene determinado por el valor de la variable del sistema: System.User.Language.
Esta variable actúa como punto de control central para todo comportamiento relacionado con el lenguaje en el agente. Puedes establecer su valor manualmente, programáticamente o detectarlo automáticamente.
¿Cómo funciona?
Search knowledge in the user's language: Copilot Studio usa el valor de
System.User.Languagepara buscar orígenes de conocimiento en el idioma especificado. Este enfoque significa que, incluso si un usuario hace una pregunta en un idioma, el agente traduce la consulta de búsqueda al idioma establecido en (traducción automática para consulta de búsqueda).Responder en el idioma del usuario: El agente genera respuestas en el idioma especificado por , independientemente del idioma usado en la pregunta o de los documentos originales (traducción automática para generación de respuestas).
Anulación manual: Puedes establecer manualmente el valor de para forzar al agente a operar en un lenguaje específico. Esta función es útil para pruebas o para escenarios en los que debes controlar explícitamente el lenguaje. Obtenga más información en Configuración y creación de agentes multilingües.
Detección automática de lenguaje hablado
Puede configurar Copilot Studio para detectar automáticamente el idioma hablado o escrito del usuario y establecer la variable System.User.Language en consecuencia. Esta función permite experiencias multilingües fluidas sin necesidad de especificar su preferencia lingüística.
Cómo funciona la autodetección
- Detección basada en activadores: Cuando el bot recibe un mensaje, un activador inicia un flujo de detección de idiomas.
- Establecer variable del sistema: El bot asigna el lenguaje detectado a .
- Respuesta dinámica: El agente continúa la conversación en el idioma detectado, tanto buscando conocimiento como generando respuestas en consecuencia.
Ventajas
- Experiencia personalizada: Los usuarios interactúan en su idioma preferido sin configuración manual.
- Experiencia consistente: Todas las respuestas y recuperaciones de conocimiento se alinean con el lenguaje detectado o establecido.
- Solución escalable: Soporta despliegues globales con configuración mínima.
Sugerencia
Revise la solución de ejemplo que muestra cómo habilitar los agentes de Copilot Studio para detectar automáticamente el idioma hablado de un usuario y cambiar a uno de los idiomas aprobados por el creador para el agente: Auto-detect language para respuestas generativas
Mejores prácticas para la localización
- Configurar lenguajes compatibles: Definir lenguajes primarios y secundarios para tu agente. Utiliza archivos de localización (JSON o ResX) para proporcionar traducciones de indicaciones, mensajes y temas.
- Prueba escenarios multilingües: Simula interacciones de usuario en diferentes idiomas para asegurar transiciones suaves y respuestas precisas.
- Use la traducción automática: confíe en la traducción integrada de Copilot Studio para la búsqueda de conocimientos y la generación de respuestas, pero proporcione traducciones personalizadas para contenido crítico o matizados.
- Monitorizar y refinar: Utilizar análisis para rastrear el uso del idioma y mejorar la cobertura de localización con el tiempo.
Enfoques de lenguaje del agente de Copilot Studio:
- Agentes separados por idioma.
- Agentes multilingües individuales con traducciones pre-redactadas.
- Agentes multilingües en tiempo real, utilizando servicios de traducción entre usuario y agente.
El enfoque adecuado depende del uso, las preocupaciones sobre la separación, la escala, la frecuencia de actualización y los recursos disponibles.
Desafíos técnicos identificados
Entre los desafíos típicos se incluye garantizar que los temas de Azure CLU y Copilot Studio permanezcan sincronizados, control de expresiones ambiguas y escalado de implementaciones multilingües. La identificación temprana de estos obstáculos permite planificar estrategias de mitigación, como configuraciones de respaldo, pruebas masivas de frases desencadenantes o servicios de traducción basados en retransmisores.
El objetivo de la comprensión del lenguaje es asegurar que cada agente pueda interpretar las consultas de los usuarios con precisión, adaptarse a diversos lenguajes y escenarios, y manejar con elegancia lo inesperado. Este objetivo crea una base sólida para construir conversaciones confiables, atractivas y eficaces en Copilot Studio.
Información relacionada
- Diseña frases de activación efectivas
- Implementar las mejores prácticas para llenar ranuras
- Copilot Studio admite idiomas
- Idiomas compatibles de Azure CLU
- Límites de Azure CLU
- precios de Azure CLU
- Orquestrar el comportamiento del agente con IA Generativa