Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Mirroring in Microsoft Fabric bietet eine nahtlose Integration ohne ETL-Prozess, um Ihre vorhandenen Azure Cosmos DB-Daten mit den restlichen Daten in Microsoft Fabric für ein echtes Hybrides Transaktions-Analytisches Processing (HTAP) mit vollständiger Isolation der Arbeitslast zwischen Transaktions- und Analysesystemen zu integrieren. Ihre Azure Cosmos DB Daten werden kontinuierlich direkt in Fabric OneLake in Echtzeit repliziert, ohne dass sich dies auf Ihre Transaktionsworkloads auswirkt oder Anforderungseinheiten (Request Units, RUs) verbraucht.
Daten in OneLake werden im Open-Source-Delta-Format gespeichert und automatisch allen Analysemodulen auf Fabric zur Verfügung gestellt.
Sie können integrierte Power-BI-Funktionen verwenden, um auf Daten in OneLake im DirectLake-Modus zuzugreifen. Mit Copilot Verbesserungen in Fabric können Sie die Leistungsfähigkeit der generativen KI nutzen, um wichtige Einblicke in Ihre Geschäftsdaten zu erhalten. Zusätzlich zu Power BI können Sie T-SQL verwenden, um komplexe Aggregatabfragen auszuführen oder Spark für die Datensuche zu verwenden. Sie können nahtlos auf die Daten in Notizbüchern zugreifen und Data Science verwenden, um Machine Learning-Modelle zu erstellen.
Von Bedeutung
Derzeit werden nur Azure Cosmos DB für NoSQL Konten unterstützt.
Warum Spiegelung in Fabric verwenden?
Mit Mirroring in Fabric müssen Sie keine verschiedenen Dienste von mehreren Anbietern zusammenfügen. Stattdessen können Sie ein hochgradig integriertes, end-to-End- und benutzerfreundliches Produkt genießen, das darauf ausgelegt ist, Ihre Analyseanforderungen zu vereinfachen und für Offenheit entwickelt zu werden.
Wenn Sie nach BI-Berichten oder Analysen zu Ihren Betriebsdaten in Azure Cosmos DB suchen, bietet die Spiegelung Folgendes:
- No-ETL, kostengünstiger Zugriff beinahe in Echtzeit auf Ihre Azure Cosmos DB-Daten, ohne den Verbrauch von Anforderungseinheiten zu beeinflussen
- Einfaches Bereitstellen von Daten über verschiedene Quellen in Fabric OneLake
- Delta-Tabellenoptimierungen mit v-Reihenfolge für blitzschnelle Lesevorgänge
- Ein-Klick-Integration für Power BI mit Direct Lake und Copilot
- Umfassende Geschäftseinblicke durch Verknüpfen von Daten über verschiedene Quellen hinweg
- Umfassendere App-Integration für den Zugriff auf Abfragen und Ansichten
OneLake-Daten werden im Open-Source-Delta Lake-Format gespeichert, sodass Sie sie mit verschiedenen Lösungen innerhalb und außerhalb von Microsoft verwenden können. Dieses Datenformat erleichtert das Erstellen einer einzelnen Datenstruktur für Ihre analytischen Anforderungen.
Welche Analyseerfahrungen sind integriert?
Gespiegelte Datenbanken sind ein Element in Fabric Data Warehouse , das sich vom Warehouse - und SQL-Analyseendpunkt unterscheidet.
Jedes gespiegelte Azure Cosmos DB-Element erstellt diese Elemente, mit denen Sie in Ihrem Fabric-Arbeitsbereich interagieren können:
- Das gespiegelte Datenbankelement. Die Spiegelung verwaltet die Replikation von Daten in OneLake und die Konvertierung in Parkett in einem analysefähigen Format. Dies ermöglicht nachgeschaltete Szenarien wie Data Engineering, Data Science und mehr.
- SQL-Analyseendpunkt, der automatisch generiert wird
Gespiegelte Datenbank
Die gespiegelte Datenbank zeigt den Replikationsstatus und die Steuerelemente zum Beenden oder Starten der Replikation in Fabric OneLake an. Sie können ihre Quelldatenbank auch im schreibgeschützten Modus mit dem Azure Cosmos DB-Daten-Explorer anzeigen. Mithilfe des Daten-Explorers können Sie Ihre Container in Ihrer Quelldatenbank Azure Cosmos DB anzeigen und abfragen. Diese Vorgänge verbrauchen Anforderungseinheiten (RUs) aus Ihrem Azure Cosmos DB Konto. Alle Änderungen an der Quelldatenbank werden sofort in der Datenbankansicht von Fabric widergespiegelt. Das Schreiben in die Quelldatenbank ist in Fabric nicht zulässig, da Sie die Daten nur anzeigen können.
SQL-Analyseendpunkt
Jede gespiegelte Datenbank verfügt über einen automatisch generierten SQL-Analyseendpunkt, der ein umfassendes Analyseerlebnis auf den durch den Spiegelungsprozess erstellten Delta-Tabellen von OneLake bietet. Sie haben Zugriff auf vertraute T-SQL-Befehle, die Datenobjekte definieren und abfragen können, aber die Daten nicht vom SQL-Analyseendpunkt bearbeiten können, da es sich um eine schreibgeschützte Kopie handelt.
Sie können die folgenden Aktionen im SQL-Analyseendpunkt ausführen:
- Erkunden Sie Delta Lake-Tabellen mit T-SQL. Jede Tabelle wird einem Container aus Ihrer Azure Cosmos DB Datenbank zugeordnet.
- Erstellen Sie No-Code-Abfragen und -Ansichten, und erkunden Sie sie visuell, ohne eine Codezeile zu schreiben.
- Verknüpfen und Abfragen von Daten in anderen gespiegelten Datenbanken, Warehouses und Lakehouses im selben Arbeitsbereich.
- Sie können BI-Berichte, die auf SQL-Abfragen oder -Ansichten basieren, ganz einfach visualisieren und erstellen.
Zusätzlich zum SQL-Abfrage-Editor gibt es ein breites Ökosystem von Tools. Zu diesen Tools gehören the MSSQL Extension für Visual Studio Code, SQL Server Management Studio (SSMS) und sogar GitHub Copilot. Beschleunigen Sie die Analyse und Erkenntnisgewinnung mit dem Tool Ihrer Wahl.
Semantikmodell
Sie können ein Power BI Semantikmodell für die Datenbank erstellen, um zu ermöglichen, dass Geschäftsmetriken erstellt, freigegeben und wiederverwendet werden können. Weitere Informationen finden Sie unter Create a Power BI semantic model.
Wie funktioniert die Nahezu-Echtzeitreplikation?
Wenn Sie die Replikation in Ihrer Azure Cosmos DB-Datenbank aktivieren, werden Einfüge-, Aktualisierungs- und Löschvorgänge auf Ihren OLTP-Daten kontinuierlich in Fabric OneLake für den Analyseverbrauch repliziert.
Die kontinuierliche Sicherungsfunktion ist eine Voraussetzung für die Spiegelung. Sie können eine fortlaufende Sicherung von 7 Tagen oder 30 Tagen auf Ihrem Azure Cosmos DB Konto aktivieren. Wenn Sie eine fortlaufende Sicherung speziell für die Spiegelung aktivieren, wird eine fortlaufende Sicherung von 7 Tagen empfohlen, da sie kostenlos ist.
Hinweis
Mirroring verwendet nicht den analytischen Speicher von Azure Cosmos DB, noch die Änderungsfeeds als Quelle für die Erfassung von Änderungsdaten. Sie können diese Funktionen weiterhin unabhängig verwenden, zusammen mit der Spiegelung.
Es kann einige Minuten dauern, Azure Cosmos DB Data in Fabric OneLake zu replizieren. Je nach der anfänglichen Momentaufnahme Ihrer Daten oder der Häufigkeit der Aktualisierungen/Löschungen kann die Replikation in einigen Fällen auch länger dauern. Die Replikation wirkt sich nicht auf die Anforderungseinheiten (RUs) aus, die Sie für Ihre Transaktionsworkloads zugewiesen haben.
Was Sie von der Spiegelung erwarten müssen
Es gibt einige Überlegungen und unterstützte Szenarien, die Sie vor der Spiegelung berücksichtigen sollten.
Überlegungen zur Konfiguration
Um eine Datenbank zu spiegeln, sollte sie bereits in Azure bereitgestellt werden. Sie müssen die fortlaufende Sicherung für das Konto als Voraussetzung aktivieren.
- Sie können jede Datenbank jeweils nur einzeln spiegeln. Sie können auswählen, welche Datenbank gespiegelt werden soll.
- Sie können dieselbe Datenbank mehrmals innerhalb desselben Arbeitsbereichs spiegeln. Als bewährte Methode kann eine einzelne Kopie der Datenbank über Seehäuser, Lagerhäuser oder andere gespiegelte Datenbanken wiederverwendet werden. Sie müssen nicht mehrere Spiegel für dieselbe Datenbank einrichten.
- Sie können dieselbe Datenbank auch in verschiedenen Fabric-Arbeitsbereichen oder Mandanten spiegeln.
- Sie können auswählen, welche Container in Ihrer Datenbank gespiegelt werden sollen.
- Änderungen an Azure Cosmos DB Containern, z. B. das Hinzufügen neuer Container und das Löschen vorhandener Container, werden nahtlos in Fabric repliziert. Sie können mit dem Spiegeln einer leeren Datenbank ohne Container beginnen, und die Spiegelung integriert nahtlos die Container, die zu einem späteren Zeitpunkt hinzugefügt werden.
Unterstützung für geschachtelte Daten
Geschachtelte Daten werden als JSON-Zeichenfolge in SQL Analytics-Endpunkttabellen angezeigt. Sie können die Daten selektiv mithilfe von OPENJSON, CROSS APPLY und OUTER APPLY in T-SQL-Abfragen oder -Ansichten erweitern. Wenn Sie Power Query verwenden, können Sie auch die funktion ToJson anwenden, um diese Daten zu erweitern.
Durch die automatische Schemaausleitung können geschachtelte Daten über OPENJSON abgeflacht werden, ohne das geschachtelte Schema explizit definieren zu müssen. Dies ist besonders nützlich für Workloads mit dynamischen oder unvorhersehbaren geschachtelten Schemas. Weitere Informationen finden Sie unter Abfragen geschachtelter Daten.
Schemaänderungen behandeln
Die Spiegelung repliziert automatisch Eigenschaften über Azure Cosmos DB Elemente hinweg mit Schemaänderungen. Alle in einem Element ermittelten neuen Eigenschaften werden als neue Spalten angezeigt, und falls vorhanden, werden die fehlenden Eigenschaften in Fabric als NULL dargestellt.
Wenn Sie eine Eigenschaft in einem Element umbenennen, behalten Fabric-Tabellen sowohl die alten als auch die neuen Spalten bei. In der alten Spalte wird NULL angezeigt, und die neue Spalte zeigt den neuesten Wert für alle Elemente an, die nach dem Umbenennungsvorgang repliziert werden.
Wenn Sie den Datentyp einer Eigenschaft in Azure Cosmos DB Elementen ändern, werden die Änderungen für kompatible Datentypen unterstützt, die konvertiert werden können. Wenn die Datentypen nicht für die Konvertierung in Delta kompatibel sind, werden sie als NULL-Werte dargestellt.
SQL Analytics-Endpunkttabellen konvertieren Delta-Datentypen in T-SQL-Datentypen.
Doppelte Spaltennamen
Azure Cosmos DB unterstützt Spaltennamen, die Groß-/Kleinschreibung ignorieren, basierend auf dem JSON-Standard. Die Spiegelung unterstützt diese doppelten Spaltennamen, indem _n zum Spaltennamen hinzugefügt wird, wobei n einen numerischen Wert darstellt.
Wenn das Azure Cosmos DB Element beispielsweise addressName und AddressName als eindeutige Eigenschaften verfügt, verfügen Fabric-Tabellen über entsprechende addressName und AddressName_1 Spalten. Weitere Informationen finden Sie unter Replikationseinschränkungen.
Unterstützung für KI-Workloads
Azure Cosmos DB-Spiegelung unterstützt Konten, die Vektorsuche und -indizierung verwenden, sodass KI- und Machine Learning-Workloads die leistungsstarke Analytik von Microsoft Fabric nutzen können, während sie weiterhin die leistungsstarken Vektorfunktionen von Azure Cosmos DB nutzen.
Weitere Details finden Sie in der Dokumentation zur Vektorsuche und Indizierung für Cosmos DBund Fabric Data Science und AI Experiences.
Sicherheit
Sie können eine Verbindung mit einem Quellkonto herstellen, indem Sie Microsoft Entra ID und rollenbasierte Zugriffssteuerung oder Schlüssel auf Kontoebene verwenden.
Wenn Sie Schlüssel verwenden und die Schlüssel drehen oder neu generieren, müssen Sie die Verbindungen aktualisieren, um sicherzustellen, dass die Replikation funktioniert. Weitere Informationen finden Sie unter "Verbindungen". Kontoschlüssel sind nicht direkt für andere Fabric-Benutzer sichtbar, nachdem die Verbindung eingerichtet wurde. Sie können einschränken, wer Zugriff auf die in Fabric erstellten Verbindungen hat. Schreibvorgänge sind weder über den Daten-Explorer noch über den Analyseendpunkt in einer gespiegelten Azure Cosmos DB-Datenbank erlaubt. Die Spiegelung unterstützt derzeit keine Authentifizierung mit schreibgeschütztem Kontoschlüssel.
Für Microsoft Entra ID Authentifizierung sind die folgenden RBAC-Berechtigungen erforderlich:
Tipp
Sobald Daten in Fabric OneLake repliziert wurden, sollten Sie auch sicheren Zugriff auf diese Daten herstellen.
Datenschutzfunktionen
Granulare Sicherheit kann in der gespiegelten Datenbank in Microsoft Fabric konfiguriert werden. Weitere Informationen finden Sie unter granularberechtigungen in Microsoft Fabric.
Sie können Spaltenfilter und prädikatbasierte Zeilenfilter für Tabellen für Rollen und Benutzer in Microsoft Fabric sichern:
- Sicherheit auf Zeilenebene in Fabric Data Warehousing
- Sicherheit auf Spaltenebene in Fabric Data Warehousing
Sie können vertrauliche Daten auch von Nichtadministratorbenutzern maskieren, indem Sie die dynamische Datenmaske verwenden:
Netzwerksicherheit
Azure Cosmos DB-Konten mit virtuellen Netzwerken oder privaten Endpunkten werden mit Fabric-Spiegelung mithilfe der Netzwerk-ACL-Bypass-Funktion unterstützt. Auf diese Weise kann Ihr autorisierter Fabric-Arbeitsbereich auf das Cosmos DB-Konto zugreifen, ohne dass ein Datengateway erforderlich ist, während die Netzwerksicherheit verbessert wird. Ausführliche Konfigurationsanweisungen finden Sie unter Konfigurieren Sie private Netzwerke für Microsoft Fabric gespiegelte Datenbanken von Azure Cosmos DB.
Derzeit unterstützt die Spiegelung in OneLake keine vom Kunden verwalteten Schlüssel (CMK).
Notfallwiederherstellung und Replikationslatenz
In Fabric können Sie Inhalte in Rechenzentren in anderen Regionen als der Heimregion des Fabric-Mandanten bereitstellen. Weitere Informationen finden Sie unter Multi-Geo-Unterstützung.
Bei einem Azure Cosmos DB Konto mit einem primären Schreibbereich und mehreren Lesebereichen wählt die Spiegelung den Azure Cosmos DB Lesebereich aus, der der Region am nächsten ist, in der die Fabric-Kapazität konfiguriert ist. Diese Auswahl verbessert die Replikation mit niedriger Latenz für das Spiegeln.
Wenn Sie Ihr Azure Cosmos DB Konto in einen Wiederherstellungsbereich wechseln, wählt die Spiegelung automatisch die nächste Azure Cosmos DB Region erneut aus.
Hinweis
Die Spiegelung unterstützt keine Konten mit mehreren Schreibbereichen.
Ihre cosmos DB-Daten, die in OneLake repliziert wurden, müssen so konfiguriert werden, dass regionsweite Ausfälle verarbeitet werden. Weitere Informationen finden Sie unter Notfallwiederherstellung in OneLake.
Erkunden Sie Ihre Daten mit Spiegelungstechnologie
Sie können gespiegelte Daten in OneLake direkt anzeigen und auf sie zugreifen. Sie können auch ohne weitere Datenverschiebung nahtlos auf gespiegelte Daten zugreifen.
Erfahren Sie mehr über den Zugriff auf OneLake mit ADLS Gen2-APIs oder SDK, dem OneLake-Datei-Explorer und Azure Storage Explorer.
Sie können über Tools wie SQL Server Management Studio (SSMS) eine Verbindung mit dem SQL-Analyseendpunkt herstellen oder Treiber wie Microsoft Open Database Connectivity (ODBC) und Java Database Connectivity (DLP) verwenden. Weitere Informationen finden Sie unter SQL Analytics-Endpunktkonnektivität.
Sie können auch auf gespiegelte Daten mit Diensten zugreifen, z. B.:
- Azure Dienste wie Azure Databricks, Azure HDInsight oder Azure Synapse Analytics
- Fabric Lakehouse mit Tastenkombinationen für Data Engineering- und Data Science-Szenarien
- Andere gespiegelte Datenbanken oder Lagerhäuser im Fabric-Arbeitsbereich
Sie können auch Medallion-Architekturlösungen erstellen, die Daten bereinigen und transformieren, die in gespiegelte Datenbank als Bronzeschicht landen. Weitere Informationen finden Sie unter Medallion-Architekturunterstützung in Fabric.
Pricing
Die Verwendung von Fabric Compute zur Replikation Ihrer Cosmos DB-Daten in Fabric OneLake ist kostenlos. Der Speicherplatz in OneLake ist kostenlos, basierend auf der Kapazitätsgröße. Weitere Informationen finden Sie unter OneLake-Preise für die Spiegelung. Die Berechnungsnutzung zum Abfragen von Daten über SQL, Power BI oder Spark wird basierend auf der Fabric-Kapazität noch in Rechnung gestellt.
Wenn Sie den Daten-Explorer in der Fabric-Spiegelung verwenden, fallen typische Kosten basierend auf der Nutzung von Anforderungseinheiten (Request Unit, RU) an, um die Container zu durchsuchen und die Elemente in der Azure Cosmos DB abzufragen. Die Azure Cosmos DB Funktionen für fortlaufende Sicherung sind eine Voraussetzung für die Spiegelung: Es gelten Standardgebühren für die kontinuierliche Sicherung. Es fallen keine zusätzlichen Gebühren für die Duplizierung bei der fortlaufenden Backup-Abrechnung an. Weitere Informationen finden Sie unter Azure Cosmos DB Pricing.