Compartir a través de


Los datos no estructurados como fuente de conocimiento

Al utilizar Copilot Studio, puede mejorar sus agentes con conocimientos específicos del dominio, impulsados por los mismos orígenes de datos conocidos y de confianza que usted construye mediante conectores de Power Platform.

Al cargar contenido externo desde el dispositivo, OneDrive o SharePoint, puede enriquecer los agentes con conocimientos contextuales adaptados a su empresa. Microsoft Dataverse almacena estos archivos de forma segura y los procesa automáticamente en índices semánticos e incrustaciones vectoriales. Esta configuración permite a los agentes generar respuestas más precisas y basadas en la información que proporcione.

Los archivos cargados en Copilot Studio usan Microsoft Dataverse para ingerir archivos sin procesar y crear índices e incrustaciones vectoriales. Estos índices e incrustaciones ayudan a proporcionar respuestas de calidad para tus agentes. Puede cargar estos archivos desde el equipo o conectando a OneDrive o SharePoint.

Cuando subes archivos como fuentes de conocimiento, ayudas a enriquecer a tus agentes con datos adicionales, complementas el conocimiento del modelo de lenguaje y bases al agente en información específica que proporcionas. Puedes subir varios archivos, que se indexan semánticamente como incrustaciones vectoriales y luego se usan como conocimiento para los agentes. Puedes compartir el conocimiento que se utiliza en los agentes con los usuarios autenticados y no autenticados del agente.

Gráfico que muestra las interacciones entre los creadores de agentes y los usuarios de los agentes, y cómo recuperan los orígenes de conocimiento la información que se va a proporcionar al usuario.

Para mejorar las respuestas de un agente, el sistema subía fragmentos de archivos en piezas para un procesamiento más rápido y los indexaba vectorialmente para proporcionar coincidencias semánticas con la consulta del usuario. El sistema almacena los archivos de forma segura en Dataverse. Cuando un usuario consulta a través de un agente, Copilot Studio busca los fragmentos más relevantes que coinciden con la intención de la consulta del usuario y devuelve los resultados al usuario. 

De forma similar, Dataverse ingiere archivos OneDrive, archivos SharePoint (mediante las opciones de carga de archivos) y contenido no estructurado, como artículos de knowledge base de otros sistemas empresariales, como Salesforce, ServiceNow, Confluence y ZenDesk para proporcionar mejores resultados semánticos para el agente.

Nota

Para obtener más información sobre el uso de datos estructurados, consulte Uso del intérprete de código para analizar datos estructurados.

Conectores de Power Platform para datos no estructurados

Los siguientes conectores de Power Platform están configurados para trabajar con orígenes de datos no estructurados:

OneDrive

OneDrive permite a los creadores usar una interfaz de selector de archivos para elegir los archivos y carpetas que desean incluir. Una vez seleccionados, el sistema recupera los elementos en Dataverse y los indexa para su uso. Las carpetas que añades incluyen todos los archivos y subcarpetas compatibles dentro de esa carpeta hasta el límite total de archivos.

SharePoint

SharePoint permite a los creadores usar una interfaz de selector de archivos para elegir los archivos y carpetas que desean incluir. Una vez seleccionado, los elementos se recuperan en Dataverse e indexan para su uso. Las carpetas que añades incluyen todos los archivos y subcarpetas compatibles dentro de esa carpeta hasta el límite total de archivos. Actualmente, no hay soporte para Pages.

Salesforce

El conector de Salesforce para datos no estructurados admite la capacidad de recuperar bases de conocimiento que contienen artículos de conocimiento. Los creadores seleccionan una base de conocimientos y todos los artículos de esa base de conocimientos se indexan para su uso. No puedes seleccionar artículos o temas individuales. Al consultar datos, no puedes especificar un artículo o base de conocimiento específica. La lista de conocimientos muestra un único objeto para todos los objetos de conocimiento que seleccione al crear el origen.

ServiceNow

El conector de ServiceNow para datos no estructurados admite la capacidad de recuperar bases de conocimiento que contienen artículos de conocimiento. Las bases de conocimiento contienen artículos. Los creadores seleccionan una base de conocimientos y todos los artículos de esa base de conocimientos se indexan para su uso. No puedes seleccionar artículos individuales. Al consultar datos, no puedes especificar una base de conocimiento, una carpeta o un artículo individual. La lista de conocimientos muestra un único objeto para todos los objetos de conocimiento que seleccione al crear el origen.

Confluence

El conector Confluence para datos no estructurados permite recuperar los espacios que contienen páginas. El conector también soporta subcarpetas. No puedes seleccionar páginas individuales. Al consultar datos, no puedes especificar una página. La lista de conocimiento muestra un único objeto para todas las páginas del espacio.

Zendesk

El conector de Zendesk para datos no estructurados permite recuperar la base de conocimiento que contiene artículos de conocimiento. No puedes seleccionar artículos, categorías o secciones individuales. Al consultar datos, no puedes especificar un artículo, categoría o sección. La lista de conocimiento muestra un único objeto para todos los artículos de la base de conocimiento.

Seguridad

Cuando un usuario consulta a un agente que utiliza una fuente de Power Platform Connector, el sistema realiza algunas comprobaciones de autorización.

Acceso de conector

Cuando un fabricante utiliza por primera vez una fuente basada en conectores, el sistema le pide que seleccione un conector existente de Power Platform o que añada uno. Este proceso garantiza que los datos solo se compartan con los creadores que tengan los permisos adecuados y proporcione acceso al propio origen de datos.

Acceso al contenido

Cuando un usuario realiza una consulta, el sistema utiliza su información de conexión para comprobar la fuente de datos y verificar que tiene permiso para ver el contenido. Aunque el sistema almacena fragmentos e índices localmente en Dataverse, realiza una comprobación en tiempo real de las consultas para asegurarse de que el usuario actual tiene acceso a los datos antes de proporcionar un resumen o respuesta.

Nota

  • Si un usuario no tiene permiso para un conjunto específico de archivos o artículos de la base de conocimiento, el sistema no le devuelve un resultado. En su lugar, reciben un mensaje estándar que dice "no se han encontrado resultados." Si los usuarios creen que debe haber resultados para esa fuente, deben trabajar con sus administradores para asegurarse de que tienen permisos para los datos a los que intentan acceder. El usuario necesita asignarle un rol de seguridad adecuado en Dataverse, como el rol de Usuario Básico.
  • El sistema no almacena localmente la información de permisos de contenido. Realiza todas las comprobaciones de permisos en tiempo real con la fuente para asegurarse de que estén lo más actualizadas posible.

Frecuencia de sincronización y actualización de archivos

Un trabajo de sincronización programado mantiene actualizados los archivos conectados de OneDrive y SharePoint y artículos de conocimientos no estructurados. Este trabajo se ejecuta automáticamente en segundo plano, actualizando el contenido de los archivos y reindexando los cambios para proporcionar resultados precisos para las consultas. Las actualizaciones administran no solo los cambios en el contenido, sino que también garantizan que el contenido eliminado del origen ya no aparezca como parte de ninguna respuesta de consulta. Actualmente, no hay forma de activar manualmente una actualización.

Para obtener más información sobre el tiempo de frecuencia de actualización, consulte Copilot Studio límites de orígenes de conocimiento de datos no estructurados.

Licencias

Todas las solicitudes que requieren conocimiento se cobran con las tarifas de mensajería para respuestas generativas de Microsoft Copilot. Para más información, consulte Tarifas de facturación y gestión.

Si las fuentes de conocimiento requieren la ingestión de datos, el almacenamiento de los datos y los índices correspondientes para recuperarlos están sujetos a los derechos de almacenamiento que tiene el cliente. Para más información sobre la búsqueda en lenguaje natural de Dataverse, véase Mejorar experiencias impulsadas por IA con la búsqueda de Dataverse.

Límites y limitaciones

Cuando activas por primera vez el soporte de datos no estructurados, Dataverse puede tardar entre 5 y 30 minutos en configurarse e indexar antes de procesar los archivos añadidos. El período de tiempo depende del tamaño del entorno actual de Dataverse.

Cada agente puede tener un máximo de 500 objetos de conocimiento. Estos objetos pueden ser archivos, carpetas, artículos de conocimiento, sitios web u otras fuentes.

Actualmente, un agente solo puede usar cinco fuentes diferentes a la vez. Por ejemplo, SharePoint, Dataverse, OneDrive u otros orígenes.

Para obtener más información sobre los límites y limitaciones específicos de los orígenes de datos no estructurados admitidos, consulte la sección límites de las fuentes de conocimiento de datos no estructurados de Copilot Studio.

Nota

Los agentes de Copilot Studio requieren búsqueda de Dataverse para usar esta fuente de conocimiento. Si no puede agregar un archivo habilitado para Dataverse a un agente, pida al administrador que active la búsqueda de Dataverse en su entorno. Para obtener más información sobre la búsqueda de Dataverse y cómo administrarla, consulte ¿Qué es la búsqueda de Dataverse y Configurar la búsqueda de Dataverse para su entorno?

Para acceder a OneDrive y SharePoint contenido almacenado en Dataverse, los usuarios deben tener al menos una licencia de usuario básico para Power Apps o Dynamics 365. Además, los permisos de usuario Básico también deben incluir permisos de lectura para las siguientes tablas y entidades:

  • Ensamblado de complemento
  • Tipo de complemento
  • Mensaje del SDK
  • Paso de procesamiento de mensajes del SDK
  • Imagen del paso de procesamiento de mensajes del SDK

Puede configurar estos permisos en el Centro de administración de Power Platform o en el Centro de administración de Dynamics.

Preguntas frecuentes

En el cuadro de diálogo Agregar conocimiento, ¿cuál es la diferencia entre las dos opciones de SharePoint?

En el cuadro de diálogo Add knowledge, verá dos opciones de SharePoint.

La opción SharePoint en la sección de carga de archivos (1) es para cargar archivos o carpetas individuales de SharePoint en su agente. Esta opción carga una copia del archivo de SharePoint a Dataverse y mantiene una relación sincrónica para mantener el archivo actualizado. Durante las consultas, se accede a SharePoint para validar los permisos de usuario para el contenido. Los archivos almacenados de Dataverse sí consumen almacenamiento de datos, pero proporcionan una capacidad de búsqueda semántica completa de documentos y soporte para texto dentro de imágenes para ciertos tipos de documentos como PDFs.

Usa la opción (1) cuando quieras sincronización en tiempo real, y no archivos estáticos subidos a Dataverse. Proporciona actualizaciones automáticas cuando se modifican los archivos fuente.

La otra opción SharePoint (2) proporciona la integración completa de SharePoint en Copilot Studio mediante el conector SharePoint. Use esta opción cuando necesite funcionalidades completas del conector de SharePoint, configuraciones de autenticación personalizadas o opciones de consulta avanzadas.

Captura de pantalla del cuadro de diálogo Agregar conocimiento, resaltando las dos opciones de SharePoint.

El icono de SharePoint no se muestra en la sección Cargar archivos del cuadro de diálogo Agregar conocimiento?

Hay un ligero retraso entre instalar una solución y mostrarla en todas las organizaciones existentes. Para iniciar una actualización manual, siga estos pasos:

  1. Inicia sesión en el centro de administración de Power Platform usando credenciales de administrador.

  2. En el panel de navegación lateral, seleccione Administrar.

  3. En la lista de productos, seleccione Dynamics 365 Apps. Se abre un panel.

  4. Busque "PowerAIExtensions".

  5. Seleccione los tres puntos (... ) para Microsoft Dynamics 365 - PowerAIExtensions y seleccione Install.

  6. En el menú desplegable, seleccione el entorno y, a continuación, seleccione Instalar.

  7. Una vez completada la instalación, abra Power Apps en una nueva ventana.

  8. En el panel izquierdo, seleccione Soluciones.

  9. Seleccionar Ver historial.

  10. Busque "PowerAIExtensions_Anchor" y asegúrese de que está establecido en 1.01.688 o superior.

¿Qué ocurre cuando agrego más de 500 objetos de conocimiento a mi agente?

No puedes añadir más objetos a menos que primero elimines los anteriores.

¿Cada agente tiene su propio índice del origen de conocimiento?

Dataverse almacena fuentes de conocimiento para usarlas en el entorno donde las creas. Si varios agentes usan la misma carpeta SharePoint, todos los agentes usan una sola instancia de esa carpeta.

¿Qué ocurre si selecciono una carpeta que tenga más del número máximo de archivos, carpetas y subcarpetas al agregar un origen de SharePoint o OneDrive?

Copilot Studio recupera e indexa hasta el número máximo de archivos, carpetas y subcarpetas, y los indexa. El resto no se procesa. Actualmente, no hay ningún mensaje para indicar qué se ha procesado o no.

Uno de los archivos que agregó (o que formaba parte de una carpeta que agregó) se muestra como parte del origen de conocimiento, pero no puedo obtener respuestas de ella. ¿Por qué?

Este problema podría estar relacionado con una de las siguientes razones:

  • El archivo o la carpeta se establece en "Listo" en la página Conocimiento .
  • Asegúrese de que el nombre de archivo no incluya un carácter no admitido (específicamente para SharePoint archivos).
  • Asegúrese de que el archivo no tenga una configuración de confidencialidad de Confidencial o Extremadamente Confidencial, o que tenga protección con contraseña.
  • Asegúrese de que es un tipo de archivo compatible.
  • Si el archivo o la carpeta procede de un sitio de OneDrive o SharePoint de otro usuario, compruebe que se comparte con el creador.
  • Si el archivo es un archivo de base de conocimiento, asegúrese de que la cuenta tiene permisos para ver el contenido en el sistema de origen.