Compartir a través de


Análisis y automatización de datos empresariales con el SDK de Dataverse para Python

El SDK de Dataverse para Python es un kit de herramientas completo que permite a los desarrolladores profesionales y científicos de datos desbloquear análisis avanzados, automatización e innovación en Microsoft Dataverse. Los desarrolladores pueden usar el SDK para crear aplicaciones empresariales escalables y seguras y organizar flujos de trabajo agente. Los científicos y analistas de datos pueden usar herramientas de Python conocidas, como Pandas, cuadernos de Jupyter Notebook y bibliotecas de aprendizaje automático, para crear modelos de análisis y modelos de simulación y poner en marcha información basada en inteligencia artificial. Este SDK puentea la brecha entre la administración de datos de nivel empresarial y la flexibilidad de Python, lo que acelera el tiempo a valor y fomenta un ecosistema dinámico para desarrolladores.

Sugerencia

En este artículo se proporciona un escenario de ejemplo y una introducción a la arquitectura sobre cómo el SDK de Dataverse para Python habilita la innovación controlada por datos. Esta solución es un ejemplo generalizado que se puede adaptar a diversos sectores y casos de uso.

Empiece viendo el vídeo de introducción sobre usando el SDK de Dataverse para Python con datos empresariales.

Diagrama de arquitectura

Diagram del flujo de trabajo del SDK de Dataverse que muestra la extracción de datos en Pandas, tareas del modelo de lenguaje, Jupyter Notebook y visualización de salida.

Flujo de trabajo

El flujo de trabajo típico para aprovechar los datos empresariales de Dataverse mediante Python incluye:

  1. Conexión a Dataverse: Acceda de forma segura a los datos empresariales mediante el SDK.
  2. Extracción y transformación: Cargue tablas en DataFrames de Pandas para limpiar, ingeniería de características y análisis exploratorios.
  3. Modelado de evaluación: Aplique algoritmos de aprendizaje automático (por ejemplo, clasificación, regresión) para evaluar escenarios empresariales, predecir resultados e identificar tendencias.
  4. Escritura en Dataverse: publica evaluaciones generadas por IA en tablas de Dataverse para paneles e informes.
  5. Gobernanza: Asegúrese de que todos los flujos de trabajo cumplen los estándares de seguridad y gobernanza empresariales.

Detalles del escenario

Esta arquitectura admite una amplia gama de escenarios y casos de uso en todos los sectores.

Escenario para desarrolladores

Un desarrollador de Python crea un sistema de incorporación de empleados para Fabrikam Enterprises mediante la creación de tablas para los detalles de los empleados, la referencia del departamento y el estado de la solicitud de incorporación. Mediante el SDK, definen esquemas, agregan columnas y relaciones, y usan las API de creación, lectura y actualización para inicializar y modificar registros, a la vez que mantienen la seguridad y la gobernanza de nivel empresarial.

Escenario de científico de datos

Un científico de datos utiliza herramientas de Python como cuadernos Jupyter y Visual Studio Code para extraer datos empresariales de Dataverse y transformarlos en DataFrames de Pandas. El científico de datos usa los datos empresariales extraídos con modelos avanzados de análisis y aprendizaje automático para la evaluación de riesgos, la supervisión del Acuerdo de Nivel de Servicio (SLA) o los informes de cumplimiento. El científico de datos visualiza y comparte salidas para permitir una toma de decisiones rápida.

Caso de uso de IA generativa

Utiliza el análisis y los modelos de lenguaje de Python para resumir las tendencias de los clientes o clasificar segmentos, como alto valor o riesgo de abandono. Vuelva a escribir los resultados en Dataverse para habilitar paneles operativos y flujos de trabajo de cumplimiento. Este enfoque garantiza que las salidas de inteligencia artificial se almacenan y rigen de forma segura dentro de la plataforma de datos empresariales.

Prerrequisitos

  • Acceso a un entorno de Power Platform con Dataverse
  • Roles de seguridad adecuados
  • Python 3.13 o posterior
  • Acceso de red a PyPI para la instalación del SDK

Además:

  • Integración: Asegúrese de la compatibilidad con las canalizaciones existentes de extracción, transformación, carga (ETL), herramientas de automatización y directivas de gobernanza empresarial.
  • Escalabilidad: Diseñar flujos de trabajo para controlar grandes conjuntos de datos y tareas de análisis simultáneos.

Consideraciones

Estas consideraciones implementan los pilares de Power Platform Well-Architected, un conjunto de principios rectores que mejoran la calidad de una carga de trabajo. Obtenga más información en Microsoft Power Platform Well-Architected.

Reliability

  • Acceso sólido a datos: Admite operaciones confiables de creación, lectura, actualización y eliminación (CRUD) y administración de esquemas.

  • Automatización: Habilita flujos de trabajo repetibles y automatizados para la extracción, transformación y análisis de datos.

  • Eficiencia operativa: Reduce el esfuerzo manual y acelera la modernización del análisis.

Seguridad

  • Control de acceso basado en rol: Aplica las directivas y roles de seguridad de Dataverse para todas las operaciones de datos.

  • Gobernanza de datos: Garantiza el cumplimiento de los estándares empresariales para la privacidad de los datos, el registro de auditoría y el cifrado.

Pasos siguientes

  • Descargue e instale el SDK desde PyPI. Explore el repositorio GitHub source para obtener documentación, proyectos de ejemplo y contribuciones de la comunidad.
  • Empiece a crear flujos de trabajo de inteligencia artificial y análisis con tecnología Python con datos de Dataverse.
  • Comparta comentarios y únase a la comunidad para ayudar a dar forma al futuro de Dataverse para Python.

Colaboradores

Microsoft mantiene este artículo. Los colaboradores siguientes escribieron este artículo.

Autores principales:

  • Paul Liew, director principal de productos
  • Jeff Anderson, ingeniero de software asociado
  • Peter Hecke, escritor sénior de desarrollo