Freigeben über


Schneeflake spiegeln in Microsoft Fabric

Mirroring in Fabric bietet eine einfache Oberfläche, um komplexe ETL (Extract Transform Load) zu vermeiden und Ihre vorhandenen Snowflake Warehouse-Daten mit den restlichen Daten in Microsoft Fabric zu integrieren. Sie können Ihre vorhandenen Snowflake-Daten kontinuierlich direkt in das OneLake von Fabric replizieren. In Fabric können Sie leistungsstarke Business Intelligence, Künstliche Intelligenz, Datenengineering, Data Science und Szenarien für die gemeinsame Nutzung von Daten freischalten.

Eine Anleitung zum Konfigurieren Ihrer Snowflake-Datenbank für die Spiegelung in Microsoft Fabric finden Sie in der Anleitung: Konfigurieren von Microsoft Fabric Mirroring-Datenbanken aus Snowflake.

Gründe für die Verwendung von Spiegeltechnik in Fabric

Mit Mirroring in Fabric müssen Sie keine verschiedenen Dienste von mehreren Anbietern zusammenfügen. Stattdessen können Sie ein hochgradig integriertes, end-to-End- und benutzerfreundliches Produkt genießen, das für die Vereinfachung Ihrer Analyseanforderungen konzipiert ist und für Offenheit und Zusammenarbeit zwischen Microsoft, Snowflake und den 1000er Technologielösungen entwickelt wurde, die das Open Source Delta Lake-Tabellenformat lesen können.

Welche Analyseerfahrungen sind integriert?

Gespiegelte Datenbanken sind ein Element in Fabric Data Warehouse , das sich vom Warehouse - und SQL-Analyseendpunkt unterscheidet.

Diagramm der Fabric-Datenbankspiegelung für Snowflake.

Die Spiegelung erstellt diese Elemente in Ihrem Fabric-Arbeitsbereich:

  • Das gespiegelte Datenbankelement. Dies ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und mehr. Die Spiegelung verwaltet Folgendes:
    • Die Replikation von Iceberg-Tabellenmetadaten in OneLake mithilfe von Verknüpfungen zum Speicher, der Ihre Iceberg-Tabellen enthält. OneLake konvertiert diese Iceberg-Tabellen automatisch in formatierte Delta Lake-Tabellen für die Verwendung über Fabric-Workloads hinweg.
    • Die Replikation von verwalteten Tabellendaten in OneLake und Konvertierung in Parquet, in einem für Analysen geeigneten Format.
  • Ein SQL-Analyseendpunkt

Jede gespiegelte Datenbank verfügt über einen automatisch generierten SQL-Analytik-Endpunkt, der eine umfassende Analytik-Erfahrung über die durch den Spiegelungsprozess erstellten Delta-Tabellen bietet. Benutzer haben Zugriff auf vertraute T-SQL-Befehle, die Datenobjekte definieren und abfragen können, aber die Daten nicht vom SQL-Analyseendpunkt bearbeiten können, da es sich um eine schreibgeschützte Kopie handelt. Sie können die folgenden Aktionen im SQL-Analyseendpunkt ausführen:

  • Erkunden Sie die Tabellen, die auf Daten in Ihren Delta Lake-Tabellen aus Snowflake verweisen.
  • Erstellen Sie keine Codeabfragen und -ansichten, und untersuchen Sie Daten visuell, ohne eine Codezeile zu schreiben.
  • Entwickeln Sie SQL-Ansichten, Inline-TVFs (Tabellenwertfunktionen) und gespeicherte Prozeduren, um Ihre Semantik und Geschäftslogik in T-SQL zu kapseln.
  • Berechtigungen für die Objekte verwalten.
  • Abfragen von Daten in anderen Warehouses und Lakehouses im selben Arbeitsbereich.

Zusätzlich zum SQL-Abfrage-Editor Es gibt ein breites Ökosystem von Tools, das den SQL-Analyseendpunkt abfragen kann, einschließlich SQL Server Management Studio (SSMS), die MSSQL-Erweiterung für Visual Studio Code und sogar GitHub Copilot.

Sicherheitsüberlegungen

Zum Aktivieren der Fabric-Spiegelung benötigen Sie Benutzerberechtigungen für Ihre Snowflake-Datenbank, die die folgenden Berechtigungen enthält:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Weitere Informationen finden Sie in der Snowflake-Dokumentation zu Access Control Privileges for Streaming tables and Required Permissions for Streams.

Von Bedeutung

Jede granulare Sicherheit im Quell-Snowflake-Lager muss in der gespiegelten Datenbank in Microsoft Fabric neu konfiguriert werden. Weitere Informationen finden Sie unter SQL granulare Berechtigungen in Microsoft Fabric.

Snowflake hinter der Firewall synchronisieren

Überprüfen Sie die Netzwerkanforderungen für den Zugriff auf Ihre Snowflake-Datenquelle. Wenn Ihre Snowflake-Datenquelle nicht öffentlich zugänglich ist und sich in einem privaten Netzwerk befindet, erstellen Sie ein Gateway für virtuelle Netzwerkedaten , oder installieren Sie ein lokales Datengateway , um die Daten zu spiegeln. Das Azure Virtual Network oder das Netzwerk des Gatewaycomputers muss über einen privaten Endpunkt eine Verbindung mit der Snowflake-Instanz herstellen oder von der Firewallregel zugelassen werden. Informationen zu den ersten Schritten finden Sie unter Tutorial: Konfigurieren von Microsoft Fabric gespiegelten Datenbanken aus Snowflake.

Gespiegelte Snowflake-Kostenüberlegungen

Fabric-Compute, die zum Replizieren Ihrer Daten in Fabric OneLake verwendet wird, ist kostenlos. Die Speicherkosten für Spiegelung sind bis zu einem nach Kapazität festgelegten Grenzwert kostenlos. Weitere Informationen finden Sie unter Cost of mirroring and Microsoft Fabric Pricing. Die Berechnung zum Abfragen von Daten mit SQL, Power BI oder Spark wird in regelmäßigen Tarifen berechnet.

Fabric erhebt keine Eingangsgebühren für Netzwerkdaten in OneLake für die Spiegelung.

Es gibt Snowflake-Rechen- und Cloudabfragekosten, wenn Daten gespiegelt werden: Rechenressourcen für virtuelle Lager und Cloud-Dienste.

  • Berechnungsgebühren für virtuelles Snowflake-Warehouse:
    • Rechenkosten fallen auf der Snowflake-Seite an, wenn Datenänderungen in Snowflake gelesen und in Fabric gespiegelt werden.
    • Alle Metadatenabfragen werden im Hintergrund ausgeführt, um Datenänderungen zu überprüfen, und sie werden nicht für Snowflake-Berechnungen berechnet. Abfragen, die Daten erzeugen, wie z. B. SELECT *, werden das Snowflake-Warehouse aufwecken und Berechnungen werden berechnet.
  • Snowflake Services berechnen Gebühren:
    • Obwohl im Hintergrund keine Berechnungsgebühren für Aufgaben wie Erstellen, Metadatenabfragen, Zugriffssteuerung, Anzeigen von Datenänderungen und sogar DDL-Abfragen anfallen, gibt es Cloudkosten für diese Abfragen.
    • Je nachdem, welche Art von Snowflake Edition Sie haben, werden Ihnen die entsprechenden Gutschriften für alle Clouddienstekosten in Rechnung gestellt.

Im folgenden Screenshot können Sie sehen, wie die Compute- und Clouddienste des virtuellen Lagers Kosten für die zugeordnete Snowflake-Datenbank berechnen, die in Fabric gespiegelt wird. In diesem Szenario stammen die meisten der Berechnungskosten der Clouddienste (gelb) aus Datenänderungsabfragen, basierend auf den zuvor genannten Punkten. Die Rechenkosten des virtuellen Lagers (in Blau) stammen ausschließlich aus den Datenänderungen, die von Snowflake gelesen und in Fabric gespiegelt werden.

Screenshot des Snowflake-Kostendiagramms.

Weitere Informationen zu snowflake spezifischen Cloud-Abfragekosten finden Sie unter Snowflake Docs: Grundlegendes zu den Gesamtkosten.

Nächster Schritt