Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Puede usar Azure Synapse Link para conectar los datos de Microsoft Dataverse a Azure Synapse Analytics para explorar los datos y acelerar el tiempo de información. Este artículo muestra cómo realizar las siguientes tareas:
- Conecte los datos de Dataverse al área de trabajo de Azure Synapse Analytics con el servicio Azure Synapse Link.
- Administre las tablas de Dataverse incluidas en Azure Synapse Link.
- Supervise la Synapse Link de Azure.
- Desvincule el Synapse Link de Azure.
- Vuelva a vincular Azure Synapse Link.
- Vea los datos en Azure Synapse Analytics.
Nota
Azure Synapse Link para Microsoft Dataverse se conocía anteriormente como Export to Data Lake. El nombre del servicio se cambió a partir de mayo de 2021 y seguirá exportando datos a Azure Data Lake, así como a Azure Synapse Analytics.
Requisitos previos
- Para usar Dataverse, debe tener el rol de seguridad de administrador del sistema.
- Las tablas que desea exportar mediante Azure Synapse Link deben tener habilitada la propiedad Seguimiento de cambios. Más información: Opciones avanzadas
- El área de trabajo de Azure Synapse con la que se vincula no puede tener habilitada la protección contra filtración de datos. Más información: Creación de un área de trabajo con la protección contra filtración de datos habilitada
requisitos de Azure Data Lake Storage Gen2
Debe tener una cuenta de Azure Data Lake Storage Gen2 y los roles siguientes:
- Propietario
- Colaborador de datos de blobs de almacenamiento
- Propietario de datos de blobs de almacenamiento
Owner role requirement: El rol Propietario es necesario porque agregar la identidad administrada del servicio Azure Synapse Link a la cuenta de almacenamiento es una operación con privilegios. Esta identidad administrada permite al servicio realizar la sincronización desde Dataverse a Synapse. Actualmente, el rol Propietario es necesario y no se admiten roles personalizados con privilegios similares para este paso.
Privilegios para la identidad administrada:
- Propietario y colaborador de la cuenta de almacenamiento: Solo es necesario durante la configuración inicial para crear el sistema de archivos en la cuenta de almacenamiento y se asignan en la cuenta de almacenamiento. Después de la configuración, estos privilegios se pueden quitar sin afectar a las operaciones de sincronización.
- Colaborador de datos de Storage Blob: Necesario para las operaciones normales de blob durante la sincronización normal.
- Storage Blob Data Owner: Actualmente es necesario para administrar los permisos de datos y acceso en escenarios que implican Azure Data Lake Storage Gen2.
La cuenta de almacenamiento debe habilitar el espacio de nombres jerárquico para la configuración inicial y la sincronización diferencial.
Permitir el acceso a la clave de la cuenta de almacenamiento solo es necesario para la configuración inicial, ya que el servicio usa la autorización de clave compartida para realizar operaciones con privilegios, como crear el sistema de archivos y establecer el vínculo antes de cambiar a la autenticación de identidad administrada. Después de la instalación, ya no se necesita acceso basado en claves.
La cuenta de almacenamiento debe tener el ámbito permitido para las operaciones de copia establecidas en Desde cualquier cuenta de almacenamiento.
- Área de trabajo de Synapse: debe tener un área de trabajo de Synapse y acceso al rol de Synapse Administrator dentro del Synapse Studio. El área de trabajo de Synapse debe estar en la misma región que la cuenta de Azure Data Lake Storage Gen2. La cuenta de almacenamiento debe agregarse como un servicio vinculado dentro del Synapse Studio. Para crear un área de trabajo de Synapse, vaya a Crear un área de trabajo de Synapse.
Nota
- La cuenta de almacenamiento y el área de trabajo de Synapse deben crearse en el mismo tenant de Microsoft Entra que el tenant de Power Apps.
- Para establecer Enabled desde redes virtuales seleccionadas y direcciones IP para la cuenta de almacenamiento vinculada y el área de trabajo, debe crear una instancia de Azure Synapse Link con identidades administradas. Más información: Uso de identidades administradas para Azure con el almacenamiento de lago de datos de Azure (si no se configuran identidades administradas, debe habilitar el acceso a la red pública para los recursos de Azure tanto para la configuración inicial como para la sincronización delta).
- No se admiten espacios de trabajo de Synapse que tengan puntos de conexión privados administrados, protección contra filtración de datos o redes virtuales administradas.
- Debe tener el rol de acceso Lector en el grupo de recursos con la cuenta de almacenamiento y el espacio de trabajo de Synapse.
- Al agregar varios usuarios al área de trabajo de Synapse, deben tener el Synapse Administrator acceso de rol dentro de la Synapse Studio y el rol Storage Blob Data Contributor en la cuenta de Azure Data Lake Storage Gen2.
- La creación de perfiles de Synapse Link en un único entorno DV se limita a un máximo de 10.
Conectar Dataverse al área de trabajo de Synapse
Inicie sesión en Power Apps y seleccione su entorno preferido.
En el panel de navegación izquierdo, seleccione Azure Synapse Link. Si Azure Synapse Link no está visible en el panel lateral, seleccione ... Más y elija Discover all. Seleccione Azure Synapse Link en la sección Data Management.
En la barra de comandos, seleccione Nuevo enlace.
Seleccione la opción Conectar al área de trabajo de Azure Synapse.
Seleccione la Suscripción, el Grupo de recursos, el Nombre del área de trabajo y la Cuenta de almacenamiento. Asegúrese de que el área de trabajo y la cuenta de almacenamiento de Synapse cumplan con los requisitos especificados en la sección Requisitos previos. Seleccione Siguiente.
Nota
Como parte de la vinculación del entorno a un lago de datos, se concede al servicio Azure Synapse Link acceso a la cuenta de almacenamiento. Asegúrese de haber seguido los requisitos previos al crear y configurar la cuenta de almacenamiento de Azure Data Lake, concediéndole un rol de propietario en la cuenta de almacenamiento. Además, otorgue el acceso al servicio de flujo de datos de Power Platform a su cuenta de almacenamiento. Más información Preparación de los datos de autoservicio con flujos de datos.
Elija las tablas que desea exportar seleccionándolas una por una o introduciendo una lista de tablas separadas por comas en el cuadro de búsqueda y, a continuación, seleccione Guardar. Solo las tablas con la propiedad Control de cambios activada pueden exportarse. Más información: Opciones avanzadas.
Puede seguir los pasos anteriores para crear un vínculo de un entorno a varias áreas de trabajo de Azure Synapse Analytics y Azure Data Lake en la suscripción de Azure agregando un Azure Data Lake como servicio vinculado en un área de trabajo de Azure Synapse. Del mismo modo, puede crear un enlace desde varios entornos al mismo área de trabajo de Azure Synapse Analytics y Azure Data Lake, todo dentro del mismo tenant.
Nota
El servicio Azure Synapse Link para Dataverse se integra perfectamente en Power Platform como una característica integrada. Cumple con los estándares de seguridad y gobernanza establecidos para el almacenamiento y la gobernanza de datos de Power Platform. Más información: Almacenamiento y gobernanza de datos
Los datos exportados por el servicio Azure Synapse Link se cifran en tránsito mediante Seguridad de la Capa de Transporte (TLS) 1.2 o superior y se cifran en reposo en Azure Data Lake Storage Gen2. Además, los datos transitorios en el Blob Storage también se cifran en reposo. El cifrado en Azure Data Lake Storage Gen2 le ayuda a proteger los datos, a implementar directivas de seguridad empresariales y a cumplir los requisitos de cumplimiento normativo. Más información: Cifrado de datos en reposo de Azure Más información: Configurar firewalls y redes virtuales de Azure Storage
Administrar datos de tablas en el espacio de trabajo de Synapse
Después de configurar azure Synapse Link, puede administrar las tablas que se exportan de una de estas dos maneras:
En el área Power Apps (make.powerapps.com) Azure Synapse Link, seleccione Administrar tablas en la barra de comandos para agregar o quitar una o varias tablas vinculadas.
En el portal Power Apps maker Tables área, seleccione ... junto a una tabla y, a continuación, seleccione el lago de datos vinculado en el que desea exportar datos de tabla.
Supervise el Azure Synapse Link
Después de configurar Azure Synapse Link, puede supervisar Azure Synapse Link en la pestaña Tables.
- Habrá una lista de tablas que forman parte del Synapse Link de Azure seleccionado.
- Hay diferentes etapas por las que circula el estado de sincronización. NotStarted indica que la tabla está esperando ser sincronizada. Una vez que se ha Completado la sincronización inicial de la tabla, habrá una etapa de procesamiento posterior en la que no se realizarán actualizaciones incrementales. Puede tardar varias horas, en función del tamaño de los datos. A medida que comiencen a realizarse las actualizaciones incrementales, la fecha de la última sincronización se actualizará periódicamente.
- La columna Cuenta muestra el número de filas escritas. Cuando Solo anexar se establece en No, este es el número total de registros. Cuando Solo anexar se establece en Sí, este es el número total de cambios.
- Las columnas Anexar solo y Estrategia de partición muestran el uso de diferentes configuraciones avanzadas.
Desvincular un Synapse Link de Azure
Seleccione el Synapse Link de Azure deseado para desvincular.
Seleccione Desenlazar en la barra de comandos.
Para eliminar tanto el sistema de archivos de Data Lake como la base de datos de Synapse, escriba el nombre del enlace para confirmar.
Seleccione Sí y espere unos minutos para que todo se desvincule y elimine.
Importante
Los objetos de base de datos personalizados que cree en la base de datos de Azure Synapse Link se eliminan una vez completado el desvinculado.
Deberá implementar su propio control de versiones de sus scripts de objetos de base de datos personalizados para asegurarse de que tienen una copia de seguridad.
Restablecer el enlace Synapse de Azure
Si eliminó el sistema de archivos al desvincular, siga los pasos anteriores para volver a vincular el mismo espacio de trabajo y data lake de Synapse. Si no eliminó el sistema de archivos al desvincular, debe borrar los datos para volver a vincular:
Navegue en Azure Synapse Analytics.
Seleccione ... para la base de datos desvinculada y seleccione Nuevo cuaderno>Cuaderno vacío.
Adjunte el cuaderno a un grupo de Apache Spark seleccionando un grupo en el menú desplegable. Si no tiene un grupo de Apache Spark, seleccione Administrar grupos para crear uno.
Introduzca el siguiente script, reemplace <DATABASE_NAME> con el nombre de la base de datos para desvincular y ejecutar el cuaderno.
%%sql
DROP DATABASE <DATABASE_NAME> CASCADE
Después de ejecutar el cuaderno, actualice la lista de la base de datos desde el panel izquierdo. Si la base de datos aún existe, intente hacer clic derecho en la base de datos y seleccionar Borrar.
Vaya a Power Apps y vuelva a vincular el área de trabajo y el lago de datos de Synapse.
Acceda a datos casi en tiempo real y datos de instantáneas de solo lectura
Después de crear una vinculación de Azure Synapse, se sincronizarán dos versiones de los datos de tabla en Azure Synapse Analytics y/o Azure Data Lake Storage Gen2 en la suscripción de Azure por defecto para asegurarse de que pueda consumir datos actualizados de forma confiable en el lago de datos en cualquier momento dado.
- Datos casi en tiempo real: proporciona una copia de los datos sincronizados desde Dataverse a través de Azure Synapse Link de forma eficaz mediante la detección de los datos que han cambiado desde que se extrajo inicialmente o se sincronizó por última vez.
- Datos de instantánea: proporciona una copia de solo lectura de datos casi en tiempo real que se actualiza a intervalos regulares (en este caso, cada hora).
Nota
- El rendimiento de la sincronización casi en tiempo real depende de varios factores, como el tamaño de carga de datos inicial, la tasa de renovación de datos y el volumen de cambios. En situaciones con grandes volúmenes de transacciones, como los procesos de las aplicaciones Finance and Operations que generan millones de registros en poco tiempo, o procesos como la característica de planeación maestra incluida con Dynamics 365 Supply Chain Management que eliminan y vuelven a crear grandes volúmenes de registros. Synapse Link debe sincronizar todos los cambios, incluidas las eliminaciones. En estos escenarios de gran volumen, no se puede garantizar la disponibilidad de datos casi en tiempo real.
- Para crear datos de instantáneas de solo lectura, asegúrese de que la opción Ámbito permitido para operaciones de copia esté configurada en Desde cualquier cuenta de almacenamiento. Más información: Configurar el alcance permitido para las operaciones de copia
- Seleccione el Synapse Link de Azure deseado y, a continuación, seleccione Ir a área de trabajo de Azure Synapse Analytics en el panel superior.
- Expanda las Bases de datos Lake n el panel izquierdo, seleccione dataverse-environmentName-organizationUniqueName y expanda Tablas.
Todas las Tablas de datos casi en tiempo real se enumeran y están disponibles para su análisis con la convención de nomenclatura DataverseTableName. Todas las Tablas de datos instantáneas se enumeran y están disponibles para su análisis con la convención de nomenclatura DataverseTableName_partitioned.
¿Qué es lo próximo?
Después de usar correctamente Azure Synapse Link para el servicio Dataverse, descubra cómo puede analizar y consumir los datos con Discover Hub. Para acceder a Discover Hub, vaya a Power Apps>Azure Synapse Link. Seleccione su servicio vinculado y luego seleccione el centro de descubrimiento. Aquí puede encontrar herramientas recomendadas y documentación seleccionada para ayudarlo a aprovechar al máximo sus datos.
Vea también
Configura Azure Synapse Link para Dataverse con tu Azure Data Lake
Azure Synapse Link for Dataverse Advanced Configuration
preguntas más frecuentes sobre Azure Synapse Link