Compartir a través de


Mejorar las respuestas de IA utilizando la Generación Aumentada por Recuperación

La generación aumentada de recuperación (RAG) en Microsoft Copilot Studio combina las capacidades de razonamiento de los modelos de lenguaje con conocimientos específicos de la organización de confianza. Permite a los agentes producir respuestas precisas, contextuales y fundamentadas basadas en el contenido de la empresa en lugar de depender únicamente de la memoria del modelo.

En este artículo aprenderá a:

  • Entiende cómo RAG mejora la fiabilidad y la estabilidad de la IA.
  • Describir cómo Copilot Studio recupera y sintetiza el conocimiento.
  • Identifica las fuentes de conocimiento soportadas y sus limitaciones.
  • Reconoce las consideraciones de gobernanza, cumplimiento y seguridad en la IA.
  • Aplica los conceptos RAG al diseñar agentes en entornos empresariales.

Introducción a RAG

RAG es un patrón de diseño que mejora la precisión de la IA combinando dos capacidades:

  • Recuperación de información: Búsqueda de fuentes de datos empresariales.
  • Generación de texto: Síntesis de la información recuperada utilizando un modelo de lenguaje.

Este enfoque reduce la información incorrecta, aumenta la confianza y genera respuestas basadas en contenido organizativo real.

Arquitectura RAG en Copilot Studio

La canalización RAG de Copilot Studio se basa en los Servicios de Azure AI y se integra estrechamente con los límites de confianza, cumplimiento y seguridad de Microsoft.

Componentes principales:

  • Copilot Studio runtime: administra la canalización conversacional.
  • Motor de optimización de consultas: Reescribe e interpreta consultas
  • proveedores de Search: Bing, SharePoint, Graph, Dataverse, Azure AI Search
  • Motor de Sintetización: Crea respuestas citadas y fundamentadas
  • Capas de moderación: Valida mensajes y resúmenes
  • Almacén de estado: Memoria a corto plazo (menos de 30 días; no se usa para entrenamiento)
  • Almacenes de telemetría y retroalimentación: Proporcionan información y supervisión

Diagrama del flujo de trabajo RAG de Copilot Studio que muestra la moderación de mensajes, la optimización de consultas, la recuperación, el resumen y la validación.

Funcionamiento de RAG en Copilot Studio

RAG en Copilot Studio sigue un proceso de cuatro pasos:

  1. Reescritura de consultas
  2. Recuperación de contenido
  3. Resumen y generación de respuestas
  4. Validación de seguridad y gobernanza

1. Reescritura de consultas

Copilot Studio optimiza la pregunta del usuario antes de buscar:

  • Aclara el significado
  • Añade señales contextuales (últimos 10 turnos)
  • Mejora la coincidencia de palabras clave
  • Genera consultas fáciles de buscar

Este proceso aumenta la calidad de la extracción y reduce los resultados irrelevantes.

2. Recuperación de contenido

Después de reescribir la consulta, el sistema la ejecuta contra todas las fuentes de conocimiento que configuras. Copilot Studio obtiene los tres primeros resultados de cada origen, equilibrando la relevancia con el rendimiento. El comportamiento de cada fuente de conocimiento varía en función de factores como la autenticación, la indexación, los formatos de archivo y las limitaciones de almacenamiento.

La siguiente tabla resume todas las fuentes de conocimiento soportadas y sus capacidades, restricciones y requisitos de autenticación:

Fuente de conocimiento Description Autenticación Capacidades clave, límites y restricciones
Datos públicos (sitios web) Sitios web indexados por Bing Ninguno
  • Los sitios web deben ser indexados por Bing.
  • Bing no puede restringirse a una región.
  • Confirmar la propiedad del sitio web conduce a mejores resultados.
  • Sitios web públicos: profundidad máxima de dos subpáginas (/en/help/), no hay páginas directas.
  • Búsqueda personalizada de Bing: Un identificador de configuración, pero se puede establecer mediante una fórmula, los costos de Azure cubiertos por Microsoft, hasta 400 URL, posibilidades de clasificación personalizada, profundidad máxima de dos subpáginas (/en/help/), admite páginas directas.
SharePoint /OneDrive Contenido empresarial interno (solo interno) autenticación delegada Microsoft Entra ID
  • Requiere que el usuario se autentique con Microsoft Entra ID para realizar llamadas delegadas.
  • Se recuperan archivos coincidentes (máximo 15 MB) para obtener fragmentos detallados que resumir.
  • Recorte de seguridad: Los resultados devueltos solo incluyen contenido al que el usuario tiene permiso de lectura.
  • La característica premium "Resultados de Búsqueda Mejorada" utiliza la integración de Microsoft Graph para los mensajes de los inquilinos, aumentando así la calidad de los resultados y el tamaño máximo de archivo a 200 MB.
Archivos subidos Archivos subidos al almacenamiento de Dataverse Ninguno
  • Los archivos (máximo 512 MB) se almacenan en el almacenamiento de archivos de Dataverse, con un máximo de 500 archivos por agente.
  • Los archivos se indexan en Dataverse Search y se benefician del reconocimiento de imágenes/tablas en PDFs.
  • Por defecto, las citas no contienen un enlace al archivo, pero este enlace puede añadirse con personalizaciones.
Tablas de Dataverse Registros estructurados de negocio (solo internos) autenticación delegada Microsoft Entra ID
  • Las tablas Dataverse (máximo 15) pueden configurarse con sinónimos y un glosario para mejorar la búsqueda.
  • Las consultas en lenguaje natural se transforman en consultas analíticas sobre datos estructurados.
Conectores de grafo Aplicaciones empresariales indexadas en Microsoft Graph (solo interna) autenticación delegada Microsoft Entra ID
  • Requiere que el usuario se autentique mediante Microsoft Entra ID para realizar llamadas delegadas.
  • Conéctese a otros orígenes de conocimiento empresariales que se indexan en el índice de Microsoft Graph, como ServiceNow KB, Confluence, datos de sitios web de empresa personalizados, etc.
  • La característica premium "Resultados de búsqueda mejorados" utiliza el medio de conexión de Microsoft Graph del inquilino.
Conectores en tiempo real Datos en vivo de sistemas como Salesforce, Zendesk, SQL (solo interno) El usuario debe iniciar sesión
  • Los conectores de Copilot recuperan datos estructurados de Salesforce, ServiceNow, Zendesk, Azure SQL.
  • El usuario registrado debe crear conexiones con los sistemas objetivo.
Azure AI Search Búsqueda semántica basada en vectores Punto final configurado
  • Devuelve los resultados de un índice de Azure AI Search vectorizado vinculado.
  • La conexión no está delegada: no hay filtrado de seguridad, no se requiere autenticación para el usuario.
Datos personalizados Datos suministrados mediante APIs, flujos o lógica personalizada Ninguno
  • Requiere un paso previo para consultar la fuente (por ejemplo, usando flujos en la nube, conectores o solicitudes HTTP).
  • Los resultados se envían como entradas a las respuestas generativas para resumir una respuesta para la consulta.
  • Los datos de entrada deben estar en formato de tabla, con tres propiedades: Content (normalmente fragmentos de contenido relevante), ContentLocation (opcional, normalmente una URL) y Title (opcional).

3. Resumen y generación de respuestas

  • La IA sintetiza contenido recuperado
  • Aplica instrucciones personalizadas para tono, formato, seguridad o brevedad
  • Genera citas a los datos subyacentes
  • Personaliza las respuestas usando el contexto del usuario (como idioma, departamento o región)

4. Validación de seguridad y gobernanza

Cada respuesta pasa por capas de validación automatizadas:

  • Moderación de respuestas dañinas, maliciosas, no conformes o protegidas por derechos de autor
  • Validación de puesta a tierra y eliminación de información incorrecta

Los datos de clientes no se usan para entrenar modelos de lenguaje.

Consideraciones clave al usar RAG

RAG funciona mejor para preguntas y respuestas fácticas, no para análisis documentales profundos.

RAG es ideal para:

  • Respondiendo preguntas desde bases de conocimiento
  • Resumen de políticas, preguntas frecuentes y contenido procedimental
  • Recuperación de datos específicos de archivos o sistemas internos

RAG no está pensado para:

  • Comparación completa de documentos
  • Evaluación del cumplimiento de políticas
  • Razonamiento complejo sobre documentos largos y no estructurados

Consideraciones de seguridad y cumplimiento de la IA generativa

Las características de ia generativa en Microsoft Copilot Studio están diseñadas para ofrecer eficaces funcionalidades de conversación y razonamiento, a la vez que se mantienen controles de seguridad, privacidad y cumplimiento sólidos.

Modelos de base y alojamiento

  • Copilot Studio se basa en modelos fundamentales que entrena OpenAI.
  • Copilot Studio usa uno de los modelos de OpenAI más recientes para respuestas generativas.
  • Los modelos se ejecutan completamente en servicios Azure AI Foundry internos, alineados con el límite de confianza de los servicios de Microsoft.
  • Todo el uso del modelo se ajusta a los principios y políticas de Microsoft Responsible AI .

Instrucciones personalizadas

Los creadores pueden proporcionar instrucciones personalizadas para moldear el comportamiento del modelo, influir en el tono o añadir reglas de formato. Estas instrucciones ayudan a adaptar las respuestas generativas a las necesidades de la organización, respetando los filtros de seguridad y los controles de cumplimiento.

Procesamiento y almacenamiento de datos

  • Almacenamiento y procesamiento de datos en Copilot Studio podría mover datos a través de límites regionales cuando el hospedaje del modelo local no está disponible.
  • Cuando no se permite este movimiento de datos, los administradores pueden usar la configuración del entorno para deshabilitar características específicas, como Azure modelos de lenguaje o Bing Search.
  • Copilot Studio no recopila ni usa ningún dato de cliente para entrenar modelos de lenguaje.

Manejo operativo de datos

  • Durante el funcionamiento, el sistema almacena temporalmente las conversaciones en una tienda segura y operada por Microsoft.
  • El acceso autorizado al personal de Microsoft está restringido mediante estaciones de trabajo de acceso seguro (SAWs) con controles Just-In-Time (JIT).
  • Las organizaciones pueden controlar además el acceso a través de Customer Lockbox, requiriendo aprobación explícita antes de que los ingenieros de soporte de Microsoft puedan ver los datos.

Resolución de problemas de telemetría

  • Las funciones de IA generativa generan datos adicionales de solución de problemas, pero solo para acciones iniciadas por el creador en el panel de Prueba, especialmente cuando el creador da un pulgar arriba o hacia abajo a una respuesta.
  • No se registran datos adicionales de clientes fuera de este bucle explícito de retroalimentación.

Monitorización y seguridad del abuso

Dado que varias capas de seguridad ya protegen las características de IA generativa, la IA generativa de Copilot Studio deshabilita la supervisión de abuso de Azure IA para evitar el registro adicional de datos de los clientes.