Compartir vía


Creación de reflejo de Google BigQuery en Microsoft Fabric (versión preliminar)

La creación de reflejos en Fabric ofrece una manera sencilla de evitar procesos ETL complejos (extracción, transformación, carga) e integrar sin problemas los datos de almacenamiento de Google BigQuery existentes con el resto de los datos en Fabric. Puede replicar continuamente los datos de Google BigQuery directamente en OneLake de Fabric. Una vez en Fabric, puede aprovechar las eficaces funcionalidades de inteligencia empresarial, inteligencia artificial, ingeniería de datos, ciencia de datos y uso compartido de datos.

Para ver un tutorial sobre cómo configurar su base de datos de Google BigQuery para el reflejamiento en Fabric, consulte Tutorial: Configurar bases de datos reflejadas de Microsoft Fabric desde Google BigQuery.

Importante

La creación de reflejo para Google BigQuery está ahora en versión preliminar. Las cargas de trabajo de producción no se admiten durante la versión preliminar.

¿Por qué usar espejado en Fabric?

El reflejo en Microsoft Fabric elimina la complejidad de coser herramientas de diferentes proveedores. No es necesario migrar los datos. Conéctese a los datos de Google BigQuery casi en tiempo real para usar la matriz de herramientas de análisis de Fabric. Fabric también funciona perfectamente con productos de Microsoft, Google BigQuery y una amplia gama de tecnologías que admiten el formato de tabla delta Lake de código abierto.

¿Qué experiencias de análisis están integradas?

El reflejo crea dos elementos en el espacio de trabajo de Fabric.

  • Elemento de base de datos reflejado. El reflejo administra la replicación de datos en OneLake y la conversión a Parquet, en un formato preparado para análisis. El reflejo permite escenarios posteriores, como la ingeniería de datos, la ciencia de datos y más. Las bases de datos reflejadas son distintas de los elementos del punto de conexión de SQL Analytics y almacén de datos.
  • Una Punto de conexión de SQL Analytics

Diagrama del reflejo de la base de datos Fabric para Google BigQuery.

Desde cada base de datos en espejo, un punto de conexión de SQL Analytics ofrece una experiencia analítica de solo lectura sobre las tablas Delta creadas durante el espejado. Este punto de conexión admite la sintaxis de T-SQL para definir y consultar objetos de datos, pero no permite cambios directos en los datos, ya que los datos son de solo lectura.

Puede hacer esto con el punto de conexión de SQL Analytics:

  • Examine las tablas que hacen referencia a los datos de Delta Lake reflejados desde BigQuery.
  • Cree consultas y vistas sin código y explore los datos visualmente, no es necesario sql.
  • Cree vistas SQL, funciones con valores de tabla insertados (TVF) y procedimientos almacenados para superponer la lógica de negocios con T-SQL.
  • Establezca y administre permisos en objetos.
  • Consultar datos en otros almacenes y lakehouses dentro de la misma área de trabajo.

Además del editor de consultas SQL, hay un amplio ecosistema de herramientas que pueden consultar el punto de conexión de SQL Analytics, incluida SQL Server Management Studio (SSMS), la extensión MSSQL para Visual Studio Code e incluso GitHub Copilot.

Consideraciones de seguridad

Hay requisitos de permisos de usuario específicos para habilitar Fabric Mirroring.

Fabric también proporciona características de protección de datos para administrar el acceso dentro de Microsoft Fabric. Para más información, consulte nuestra documentación sobre las características de protección de datos.

Consideraciones sobre los costos de BigQuery reflejados

El compute de Fabric utilizado para replicar tus datos en Fabric OneLake es gratuito. El costo de almacenamiento de reflejo es gratuito hasta un límite determinado por la capacidad. El cómputo para consultar datos mediante SQL, Power BI o Spark se cobra a precios estándar.

Fabric no cobra por las tarifas de entrada de datos de red en OneLake for Mirroring.

Hay costos de computación y consulta en la nube de Google BigQuery cuando se reflejan los datos: BigQuery Change Data Capture (CDC) utiliza la computación de BigQuery para el procesamiento de filas, la API de escritura de almacenamiento para la ingesta de datos, y el almacenamiento de BigQuery para el almacenamiento de datos, todo lo cual incurre en costos.

Para obtener más información sobre los costos de replicación de Google BigQuery, consulte los precios explicados.

Paso siguiente