Compartir a través de


Utiliza herramientas para agentes para ampliar, automatizar y mejorar tus agentes

Los agentes se vuelven más poderosos cuando los equipas con herramientas especializadas que amplían sus capacidades principales. Copilot Studio proporciona tres categorías principales de herramientas de agente:

  • Indicaciones de Inteligencia Artificial para generar respuestas inteligentes
  • Protocolo de Contexto de Modelo (MCP) para integraciones estandarizadas
  • Herramienta de uso de ordenadores para automatizar procesos de escritorio

Este artículo explora cómo funciona cada tipo de herramienta, cuándo usarlas y cómo pueden ayudarte a crear agentes más capaces y eficientes. También aprenderás sobre las diferencias entre máquinas alojadas y máquinas propias para escenarios de uso informático, además de guía para elegir entre los enfoques tradicionales de Automatización Robótica de Procesos (RPA) y Agentes Informáticos (CUA).

Genera una respuesta usando indicaciones de IA

Los prompts de IA utilizan un conjunto de instrucciones para generar una respuesta a partir de un modelo de IA. Puedes incluir variables para insertar más texto o documentos en estas instrucciones. La salida se proporciona normalmente en texto plano o en formato JSON. Puede seleccionar cualquier modelo de IA integrado en Copilot Studio o implementado a través de Microsoft Foundry para generar la respuesta.

Puedes invocar prompts como herramienta de agente o desde dentro de un tema. Todas las indicaciones se guardan en una biblioteca de prompts y admiten la gestión del ciclo de vida de la aplicación, el control de acceso basado en roles, y la compartición.

Infórmate más sobre cómo usar prompts para que tu agente realice tareas específicas.

Decide cuándo usar indicaciones de IA frente al orquestador

Cada agente integrado en Copilot Studio usa el orchestrator para determinar cómo responder seleccionando herramientas, temas y conocimientos en función de las instrucciones del sistema, la entrada del usuario y la información contextual. El orquestador es el motor detrás de la orquestación generativa, que planifica acciones y compone respuestas utilizando las herramientas y descripciones del agente.

Aunque las respuestas impulsadas por el orquestador puedan parecer similares a las indicaciones de IA, ambas capacidades cumplen propósitos diferentes. Los indicaciones de IA son acciones independientes, basadas en indicaciones, que otorgan a los usuarios un mayor control sobre la configuración del modelo.

Las indicaciones de IA admiten una gama más amplia de modelos, incluidos los disponibles a través de Microsoft Foundry. También admiten funciones como la integración con Dataverse, entradas de archivos e intérprete de código.

El orquestador utiliza una indicación fija del sistema y descripciones de herramientas para elegir los bloques de construcción adecuados para una solicitud determinada. Los creadores no pueden editar el prompt del sistema del orquestador, pero sí pueden influir en cómo se comporta mediante instrucciones del agente.

Los prompts de IA ofrecen control total sobre el formato, las restricciones y la lógica, convirtiéndolos en la elección adecuada para escenarios que requieren resultados finamente ajustados o altamente estructurados. Por ejemplo, si necesitas un control estilístico más allá del formato simple ("escribe un poema rimado en estructura ABAB usando estas palabras exactas"), un prompt es lo más adecuado.

El orquestrador funciona bien para tareas sencillas como extraer un solo nombre del texto. Para extracciones complejas, usa indicaciones de IA. Por ejemplo, extraer varias entidades de un informe largo y vincularlas a relaciones específicas de dominio (como extraer varios nombres de un informe de seguro e identificar al propietario del servicio de reparación de coches asociado solo a una de las partes del incidente).

La decisión entre indicaciones de orquestador y IA depende del nivel de personalización que requiera. Si necesitas un control preciso sobre el comportamiento o los resultados del modelo, elige indicaciones de IA. Para escenarios en los que el razonamiento general, la selección de herramientas y el formato ligero son suficientes, el orquestador es la elección adecuada.

Integra herramientas de agentes usando MCP

El Protocolo de Contexto del Modelo (MCP) es una interfaz universal que los modelos de IA utilizan para interactuar con herramientas externas, fuentes de datos y entornos de usuario de forma coherente y escalable.

En comparación, los conectores de Power Platform requieren que describas cada acción y sus entradas, y que actualices estas descripciones a medida que se dispongan de nuevas definiciones. La codificación personalizada y la integración para cada herramienta es más compleja y menos escalable.

Use los servidores MCP proporcionados con Copilot Studio para servicios de Microsoft, como Outlook, Dataverse y GitHub, o servicios de terceros como Salesforce y JIRA. Construye servidores MCP personalizados para servicios donde no existan.

Los beneficios del MCP incluyen:

  • Contexto estandarizado para modelos de IA
  • Integración perfecta con Copilot Studio
  • Mejora de la eficiencia de los desarrolladores y la experiencia del usuario
  • Gobernanza, supervisión y extensibilidad

Considera las siguientes limitaciones antes de implementar servidores MCP:

  • No puedes enriquecer las descripciones de herramientas con más contexto sobre cuándo invocar.
  • Los Topics no pueden llamar directamente a los servidores MCP.

Entiende cuándo usar MCP

Puede lograr los mismos resultados en Copilot Studio a través de varios enfoques de integración. Es importante entender cuándo usar servidores Model Context Protocol (MCP) frente a opciones más sencillas como conectores Power Platform o llamadas directas a la API REST.

Utiliza MCP cuando necesites una forma estandarizada y gestionada centralmente de exponer herramientas y recursos a múltiples agentes sin configuración por cliente. Los servidores MCP publican herramientas y recursos que los agentes pueden descubrir, versionar y usar automáticamente de forma consistente porque el servidor MCP define las descripciones de las herramientas y sus entradas. En cambio, añadir una API directamente requiere que describas manualmente su propósito y definas sus entradas por agente.

MCP es especialmente valioso cuando las APIs upstream cambian con frecuencia. En lugar de actualizar todos los agentes que consumen la API, modificas la definición una vez en el servidor MCP, y todos los agentes usan automáticamente la versión actualizada sin volver a publicar. Si no existe un servidor MCP, o estás prototipando rápidamente, llamar directamente a las APIs es más rápido y evita la sobrecarga de configuración necesaria para introducir todo el ciclo de vida del MCP.

La Orquestación generativa debe estar habilitada para usar MCP. Más información en ¿Cómo funciona el MCP?

Automatiza los procesos de escritorio utilizando la herramienta de uso del ordenador

Al utilizar la herramienta de uso de ordenadores, un agente puede operar un ordenador sin necesidad de scripts de automatización o APIs. En lugar de usar scripts o APIs, configuras el agente usando un prompt. El agente determina cómo alcanzar mejor sus objetivos. Durante el proceso, el agente toma una captura de pantalla en cada paso, la analiza para decidir la siguiente acción, ejecuta esa acción y repite este ciclo hasta que la tarea se completa. Las capturas de pantalla tomadas por el agente y los pasos de razonamiento están disponibles como parte del historial de partidas.

Los escenarios comunes en los que un agente puede beneficiarse de la herramienta de uso informático incluyen:

  • Entrada de datos: Para cada fila del archivo CSV entrante, crea la orden de venta en SAP y escribe el ID de pedido generado de nuevo en el archivo.
  • Extracción de datos: Accede a cada portal de proveedores, busca en el SKU listado, extrae el precio, el stock y el plazo de entrega, e inserta los resultados con una marca de tiempo en la base de datos.
  • En varias aplicaciones: exporta las transacciones del día desde el cliente financiero de escritorio, navega por QuickBooks y registra cada entrada en la cuenta correcta.

Entiende las máquinas alojadas vs. trae tu propia máquina

Los agentes pueden utilizar la herramienta de uso del ordenador en una máquina alojada por Microsoft o en una máquina "trae tu propio" (BYO). Las máquinas alojadas están disponibles para su uso inmediato sin necesidad de configuración o facturación de TI. Pertenecen a un grupo compartido de Windows 365 Cloud PCs previamente aprovisionados que no están unidos a la entidad del cliente en Entra. Las máquinas BYO deben provisionarse previamente dentro de la propia red virtual del cliente. Debe registrar y administrar máquinas BYO en Power Automate.

Usa máquinas BYO para escenarios de producción. Tienen soporte para Microsoft Entra ID, están inscritos en Intune y admiten casos de uso de automatización tanto web como de escritorio. Utiliza máquinas alojadas solo para prototipar debido a sus capacidades limitadas. Solo hay un PC en la nube disponible por usuario a la vez, y el uso puede limitarse según la demanda.

Obtenga más información en Configurar dónde se utiliza el equipo.

Automatización Robótica de Procesos (RPA) vs. Agentes que Usan Ordenadores (CUA)

La Automatización Robótica de Procesos (RPA) es la automatización de un ordenador utilizando un script. Puedes aplicarlo a muchos de los mismos escenarios que CUA. Sin embargo, es importante entender las diferencias entre RPA y CUA.

Aspecto Automatización Robótica de Procesos (RPA) CUA
Tipo de automatización Basado en reglas Impulsado por LLM
Método de interacción Árbol de interfaz de usuario Vision
Creación Guion, complejo Instrucciones en lenguaje natural
Toma de decisiones Reglas predefinidas Decisiones autónomas basadas en la imagen
Flexibilidad Flexibilidad limitada Alta flexibilidad
Control de errores Gestión de errores estáticos Autocorrección basada en retroalimentación visual

Utiliza RPA cuando:

  • Solo se permiten características de Disponibilidad Generalizada (GA).
  • La interfaz de usuario es estable. Las pantallas, campos y selectores rara vez cambian.
  • Las reglas son claras. Puedes capturar decisiones en reglas.
  • La velocidad importa. Alto volumen. Cada segundo cuenta.
  • Un equipo de RPA es el propietario. El equipo cuenta con conocimientos previos en desarrollo y gestión de RPA.

Utilizar CUA cuando:

  • Las interfaces de usuario cambian o varían ampliamente. Trabajas con varias aplicaciones y rediseños frecuentes.
  • Lo necesitas rápido. El pendiente de trabajo del equipo de RPA está lleno.
  • La interfaz de usuario importa. La tarea depende de lo que se vea en pantalla, como gráficos, colores y disposiciones dinámicas.
  • Las decisiones son confusas. El agente debe razonar, elegir el siguiente paso o corregirse a sí mismo.
  • Agrega herramientas a agentes personalizados
  • Extiende tu agente con el Protocolo de Contexto del Modelo
  • Automatice las aplicaciones web y de escritorio con el uso de la computadora