Compartir vía


Creación de reflejo de Copo de nieve en Microsoft Fabric

Mirroring en Fabric proporciona una experiencia fácil para evitar procesos complejos de ETL (Extracción, Transformación y Carga) e integrar tus datos de almacenamiento de Snowflake existentes con el resto de los datos en Microsoft Fabric. Puede replicar de manera continua sus datos existentes de Snowflake directamente en OneLake de Fabric. Dentro de Fabric, puede desbloquear potente inteligencia empresarial, inteligencia artificial, ingeniería de datos, ciencia de datos y escenarios de uso compartido de datos.

Para un tutorial sobre cómo configurar su base de datos de Snowflake para reflejo en Fabric, consulte Tutorial: Configuración de bases de datos de Microsoft Fabric reflejadas desde Snowflake.

¿Por qué usar el reflejo en Fabric?

Con la creación de reflejos en Fabric, no es necesario unir diferentes servicios de varios proveedores. En su lugar, puede disfrutar de un producto muy integrado, de un extremo a otro y fácil de usar diseñado para simplificar sus necesidades de análisis, y creado para abrir y colaborar entre Microsoft, Snowflake y las 1000 soluciones tecnológicas que pueden leer el formato de tabla delta Lake de código abierto.

¿Qué experiencias de análisis están integradas?

Las bases de datos reflejadas son un elemento en Fabric Data Warehousing distinto de Warehouse y del punto de conexión de SQL Analytics.

Diagrama de reflejo de base de datos de Fabric para Snowflake.

El reflejo crea elementos en el área de trabajo de Fabric:

  • Elemento de base de datos reflejado. Esto permite escenarios posteriores, como la ingeniería de datos, la ciencia de datos, y más. La gestión de reflejos gestiona
    • La replicación de los metadatos de las tablas de Iceberg en OneLake mediante accesos rápidos al almacenamiento que contiene tus tablas de Iceberg. OneLake convierte automáticamente estas tablas Iceberg en tablas con formato Delta Lake para utilizarlas en cargas de trabajo de Fabric.
    • La replicación de datos de tabla administrada en OneLake y la conversión a Parquet, en un formato listo para el análisis.
  • Un punto de conexión de SQL Analytics

Cada base de datos reflejada tiene un punto de conexión de SQL Analytics generado automáticamente que proporciona una experiencia analítica enriquecida sobre las *Delta Tables* creadas por el proceso de replicación. Los usuarios tienen acceso a comandos de T-SQL conocidos que pueden definir y consultar objetos de datos, pero no manipular los datos desde el punto de conexión de SQL Analytics, ya que es una copia de solo lectura. Puede realizar las siguientes acciones en el punto de conexión de SQL Analytics:

  • Explora las tablas que desde Snowflake hacen referencia a datos de tus tablas de Delta Lake.
  • No cree consultas ni vistas de código y explore los datos visualmente sin escribir una línea de código.
  • Desarrolle vistas SQL, funciones con valores de tabla en línea y procedimientos almacenados para encapsular la semántica y la lógica de negocio en T-SQL.
  • Administrar permisos en los objetos.
  • Consulte los datos de otros almacenes y lakehouses en la misma área de trabajo.

Además del editor de consultas SQL, hay un amplio ecosistema de herramientas que pueden consultar el punto de conexión de SQL Analytics, incluida SQL Server Management Studio (SSMS), la extensión MSSQL para Visual Studio Code e incluso GitHub Copilot.

Consideraciones de seguridad

Para habilitar la creación de reflejo de Fabric, necesitará permisos de usuario para la base de datos de Snowflake que contenga los permisos siguientes:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Para obtener más información, consulte la documentación de Snowflake sobre Privilegios de control de acceso para tablas de transmisión y Permisos requeridos para transmisiones.

Importante

Cualquier seguridad granular establecida en el almacén de Snowflake de origen debe volver a configurarse en la base de datos reflejada en Microsoft Fabric. Para obtener más información, consulte SQL granular permissions in Microsoft Fabric.

Reflejo de Snowflake detrás del firewall

Compruebe los requisitos de red para acceder al origen de datos de Snowflake. Si el origen de datos de Snowflake no es accesible públicamente y está dentro de una red privada, cree una puerta de enlace de datos de red virtual o instale una puerta de enlace de datos local para reflejar los datos. La Azure Virtual Network o la red de la máquina de puerta de enlace deben conectarse a la instancia de Snowflake a través de un punto de conexión privado o estar permitidas por la regla del firewall. Para empezar, consulte Tutorial: Configurar bases de datos espejo de Microsoft Fabric desde Snowflake.

Consideraciones sobre los costos de Snowflake reflejados

El servicio de computación de Fabric utilizado para replicar tus datos en Fabric OneLake es gratuito. El costo de almacenamiento de reflejo es gratuito hasta un límite determinado por la capacidad. Para obtener más información, vea Cost of mirroring and Microsoft Fabric Pricing. El cómputo para consultar datos mediante SQL, Power BI o Spark se cobra a precios estándar.

Fabric no cobra por las tarifas de entrada de datos de red en OneLake for Mirroring.

Hay costos de cálculo y consulta en la nube de Snowflake cuando se reflejan los datos: cálculo de almacén virtual y cálculo de servicios en la nube.

  • Cargos de cómputo del almacén virtual de Snowflake:
    • Los cobros de computación se aplicarán al lado de Snowflake si hay cambios en los datos que se están leyendo en Snowflake y luego se reflejan en Fabric.
    • Las consultas de metadatos que se ejecutan en segundo plano para verificar cambios en los datos no incurren en cargos por computación en Snowflake; sin embargo, las consultas que producen datos, como SELECT *, activarán el almacén de Snowflake y se les aplicará un cargo por computación.
  • Tarifas por el uso de servicios de cálculo de Snowflake
    • Aunque no hay cargos de proceso por tareas en segundo plano, como la creación, las consultas de metadatos, el control de acceso, la visualización de los cambios de datos e incluso las consultas DDL, hay costos en la nube asociados a estas consultas.
    • Dependiendo del tipo de edición de Snowflake que tenga, se le cobrarán los créditos correspondientes por los costos de los servicios en la nube.

En la captura de pantalla siguiente, puede ver los costos de cómputo del almacén virtual y de los servicios en la nube para la base de datos de Snowflake asociada que se está replicando en Fabric. En este escenario, la mayoría de los costos de proceso de los servicios en la nube (en amarillo) proceden de consultas de cambios de datos basadas en los puntos mencionados anteriormente. Los cargos por computación del almacén virtual (en azul) provienen exclusivamente de la lectura de cambios de datos de Snowflake que se reflejan en Fabric.

Captura de pantalla del gráfico de costos de Snowflake.

Para obtener más información sobre los costos específicos de las consultas en la nube de Snowflake, consulte la documentación de Snowflake: Descripción del costo general.

Paso siguiente