Fabric でのミラーリングは、さまざまなシステムのデータを 1 つの分析プラットフォームにまとめる、低コストで待機時間の短いソリューションです。 さまざまなAzure データベースや外部データ ソースから、既存のデータ資産を Fabric の OneLake に継続的にレプリケートできます。
OneLake でクエリ可能な形式で最も up-to-date データを使用すると、Spark での分析の実行、ノートブックの実行、データ エンジニアリング、Power BI レポートによる視覚化など、Fabric のすべての異なるサービスを使用できるようになりました。
Fabric でのミラーリングにより、ユーザーは、分析ニーズを簡素化するように設計された、高度に統合された、エンドツーエンドで使いやすい製品を楽しむことができます。 Microsoft とオープンソースの Delta Lake テーブル形式を読み取ることができるテクノロジ ソリューション間のオープン性とコラボレーションのために構築されたミラーリングは、すべての分析ニーズに使用できる OneLake でデータのレプリカを作成できる、低コストで待機時間の短いターンキー ソリューションです。
その後、Delta テーブルをあらゆる場所の Fabric で使用できるため、ユーザーは Fabric への移行を加速できます。
ミラーリングは、運用データ ソースへのセキュリティで保護された接続を作成することによって有効になります。 データベース全体または個々のテーブルをレプリケートするかどうかを選択すると、ミラーリングによってデータが自動的に同期されます。設定が完了すると、データは分析のために OneLake に継続的にレプリケートされます。
ファブリックでミラーリングを使用する理由
今日、多くの組織は、サイロに置かれているミッション クリティカルな運用または分析データを持っています。
現在、このデータにアクセスして操作するには、複雑な ETL (抽出変換読み込み) パイプライン、ビジネス プロセス、意思決定サイロが必要であり、次のものが作成されます。
- 重要で常に変化するデータへの制限付きアクセス
- 人、プロセス、テクノロジ間の摩擦
- 非常に重要なデータへのパイプラインとプロセスを作成するための長い待機時間
- 分析情報を快適に分析して共有するために必要なツールを自由に使用できない
- 人々がデータを共有し、共同作業するための適切な基盤がない
- BI、AI、統合、エンジニアリング、さらにはアプリなど、すべての分析シナリオに共通のオープン データ形式はありません
Fabric でのミラーリングを使用すると、分析情報と意思決定のための価値までの時間を短縮し、テクノロジ ソリューション間のデータ サイロを分解する簡単なエクスペリエンスが提供されます。
- BI と AI 用に組み込まれた組み込みの分析を使用した、SaaS データ レイクへのデータとメタデータのほぼリアルタイムのレプリケーション
Microsoft Fabric プラットフォームは、サービスとしてのソフトウェア (SaaS) の基盤上に構築されており、シンプルさと統合をまったく新しいレベルに引き上げます。 Microsoft Fabricの詳細については、「
ミラーリングの主要な教義を次に示します。
Fabric でミラーリングを有効にすることは、複雑な ETL パイプラインを作成したり、他のコンピューティング リソースを割り当てたり、データ移動を管理したりすることなく、シンプルで直感的です。
Fabric でのミラーリングはフル マネージド サービスであるため、ミラーリングされた接続のレプリケーションのホスト、保守、管理について心配する必要はありません。
オブジェクトのミラーリング
ミラーリングでは、Fabric ワークスペースに次の項目が作成されます。
- ミラーリングでは、データとメタデータの OneLake へのレプリケーションと Parquet への変換が、分析対応形式で管理されます。 これにより、データ エンジニアリング、データ サイエンスなどのダウンストリーム シナリオが可能になります。
- SQL 分析エンドポイント
SQL クエリ エディターに加えて、SQL Server Management Studio (SSMS)、 Visual Studio Code 用の MSSQL 拡張機能、GitHub Copilot など、ツールの広範なエコシステムがあります。
共有 により、アクセス制御と管理が容易になり、機密情報へのアクセスを確実に制御できます。 また、共有により、組織全体でセキュリティで保護され、民主化された意思決定が可能になります。
ミラーリングの種類
Fabric には、ミラーリングを通じて OneLake にデータを取り込むための 3 つの異なるアプローチが用意されています。
- Database ミラーリング – Microsoft Fabricのデータベース ミラーリングを使用すると、データベースとテーブル全体のレプリケーションが可能になり、さまざまなシステムのデータを 1 つの分析プラットフォームにまとめることができます。
- メタデータ ミラーリング – Fabric のメタデータ ミラーリングは、データを物理的に移動するのではなく、メタデータ (カタログ名、スキーマ、テーブルなど) を同期します。 この方法では ショートカットを利用し、データがソースに残り、Fabric 内で簡単にアクセスできるようにします。
- オープン ミラーリング – Fabric のオープン ミラーリングは、開いている Delta Lake テーブル形式に基づいてミラーリングを拡張するように設計されています。 この機能を使用すると、開発者は、オープン ミラーリング アプローチとパブリック API に基づいて、Microsoft Fabricのミラー化されたデータベース項目にアプリケーションの変更データを直接書き込みます。
現在、次の外部データベースを使用できます。
ほぼリアルタイムのレプリケーション
ほぼリアルタイムは、次のようなさまざまな要因によって異なります。
- ソースの場所/リージョン
- 宛先の場所/リージョン
- 変更の量
- 変更の頻度
- ソースからのネットワーク帯域幅と待機時間
- オンプレミス データ ゲートウェイに割り当てられたコンピューティング リソース
データベース ミラーリングのしくみ
デルタ ファイルは、データ ソースから Fabric に増分的に到着します。 増分変更されたデータを識別する方法は、データ ソースごとに異なります。 たとえば、SQL Server 2025 では、SQL データベース エンジンはソース データベースのトランザクション ログを高頻度でスキャンします。 SQL Serverは、各テーブルの変更を Fabric ランディング ゾーン内の対応するファイルに発行します。
Fabric 内では、レプリケーター エンジンは常に実行され、新しく発行されたファイルを高い頻度でスキャンします。 ファブリックは、受信した変更をターゲット デルタ テーブルにすぐにマージします。 変更は 15 秒ごとに発行できます。
アクティビティを低く検出するバックオフ ロジックは、Fabric の外部にあるデータ ソース エンジンに対する過剰なオーバーヘッドを回避し、受信データ変更の頻度に対応することで待機時間を短縮します。
Fabric データベース ミラーリングのしくみの図。
メタデータ ミラーリングのしくみ
ミラーリングでは、データ レプリケーションが可能になるだけでなく、完全なデータ レプリケーションではなく、ショートカットやメタデータ ミラーリングを使用して実現できるため、物理的に移動したり複製したりすることなくデータを使用できます。 このコンテキストでのミラーリングとは、実際のデータ自体ではなく、メタデータ (カタログ名、スキーマ、テーブルなど) のみをレプリケートすることを指します。 このアプローチにより、Fabric は、異なるソースのデータを複製することなくアクセス可能にし、データ管理を簡素化し、ストレージのニーズを最小限に抑えることができます。
たとえば、Unity カタログに登録されている data にアクセスする場合、Fabric は Azure Databricks からのカタログ構造のみをミラー化し、基になるデータにショートカットを使用してアクセスできるようにします。 この方法により、ソース データの変更がファブリックに即座に反映されます。データ移動を必要とせず、リアルタイム同期を維持し、up-to-date 情報へのアクセスの効率を高めます。
オープンミラーリングの仕組みはどういうものか?
データ ソースへのセキュリティで保護された接続を作成してデータ レプリケーションを有効にするミラーリングに加えて、既存のデータ プロバイダーを選択するか、独自のアプリケーションを作成して、ミラー化されたデータベースにデータを配置することもできます。 パブリック API または Fabric ポータルを使用して 、開いているミラー化されたデータベース を作成すると、OneLake でランディング ゾーンの URL を取得できます。この URL を使用すると、開いているミラーリングの仕様に従って変更データを配置できます。
データが適切な形式のランディングゾーンに入ると、レプリケーションが開始され、変更、更新、挿入、削除をマージして差分テーブルに反映する複雑なプロセスが管理されます。 この方法により、ランディングゾーンに書き込まれたデータは直ちに、Fabric内のデータを最新の状態に保つために更新されます。
共有
共有により、アクセス制御と管理が容易になりますが、行レベル セキュリティ (RLS) やオブジェクト レベル セキュリティ (OLS) などのセキュリティ制御が可能になり、機密情報へのアクセスをより確実に制御できます。 また、共有により、組織全体でセキュリティで保護され、民主化された意思決定が可能になります。
共有することで、ユーザーは、ワークスペースとその他の項目へのアクセス権を付与せずに、ミラー化されたデータベースへのアクセス権を他のユーザーまたはユーザーのグループに付与します。 他のユーザーがミラー化されたデータベースを共有すると、SQL 分析エンドポイントへのアクセスも許可されます。
詳細については、「 ミラー化されたデータベースの共有とアクセス許可の管理」を参照してください。
複数データベースにまたがるクエリ
ミラーリングされたデータベースのデータを OneLake に格納することで、データベース間クエリを記述し、ミラー化されたデータベース、ウェアハウス、Lakehouses の SQL 分析エンドポイントのデータを 1 つの T-SQL クエリで結合できます。 詳細については、「 データベース間クエリの記述」を参照してください。
たとえば、3 部構成の名前付けを使用して、ミラー化されたデータベースとウェアハウスからテーブルを参照できます。 次の例では、3 部構成の名前を使用して、倉庫のを参照します。 他のデータベースまたはウェアハウスから、標準の SQL 3 部構成の名前付け規則の最初の部分は、ミラー化されたデータベースの名前です。
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
ミラーリングのコスト
データベース ミラーリングとオープン ミラーリングの場合、Fabric コンピューティングと OneLake ストレージは容量ベースの制限まで解放されます。
- レプリカのストレージは、容量サイズに基づいて上限まで解放されます。 ミラーリングでは、購入したすべての容量ユニット (CU) に対して無料のテラバイトのミラーリング ストレージが提供されます。 たとえば、F64 容量を購入すると、ミラーリング専用の 64 テラバイト分の無料ストレージが得られます。 OneLake ストレージは、無料ミラーリング ストレージの制限を超えた場合、または容量が一時停止された場合に課金されます。 詳細については、「Microsoft Fabric 価格を参照してください。
- データを Fabric OneLake にレプリケートするために使用されるバックグラウンド ファブリック コンピューティングは無料であり、容量は消費されません。 ミラーリングされたデータに対する OneLake への直接要求では、通常の OneLake コンピューティング消費量と同様に容量が消費されます。 SQL、Power BI、または Spark を使用してデータを照会するためのコンピューティングは、通常の料金で課金されます。
- 実行中のファブリック容量は、ミラーリングの初期セットアップにのみ必要です。
ミラー化されたデータベース データを使用したデータ エンジニアリング
Microsoft Fabricには、データに簡単にアクセスでき、適切に整理され、高品質であることを確認するためのさまざまなデータ エンジニアリング機能が用意されています。 Fabric Data Engineering では、次のことができます。
- Lakehouse を使用して Spark としてデータを作成および管理する
- データをラケハウスにコピーするためのパイプラインを設計する
- Spark ジョブ定義を使用してバッチ/ストリーミング ジョブを Spark クラスターに送信する
- ノートブックを使用してデータ インジェスト、準備、変換のコードを記述する
データベースのミラー化データを使用して行うデータサイエンス
Microsoft Fabricは、データ エンリッチメントとビジネス分析情報を目的として、ユーザーがエンド ツー エンドのデータ サイエンス ワークフローを完了できるようにする Fabric Data Science を提供します。 データの探索、準備、クレンジングから実験、モデリング、モデルスコアリング、BI レポートへの予測分析情報の提供まで、データ サイエンス プロセス全体にわたる幅広いアクティビティを完了できます。
Microsoft Fabricユーザーは、Data Science ワークロードにアクセスできます。 そこから、さまざまな関連リソースを検出してアクセスできます。 たとえば、機械学習の実験、モデル、ノートブックを作成できます。 また、データ サイエンスのホーム ページで既存のノートブックをインポートすることもできます。
ミラーリングされたデータベースのデータを使用して Direct Lake します
Direct Lake モードをMicrosoft Fabricのミラー化されたデータベースと共に使用すると、データ移動や重複を必要とせずに、ミラー化されたデータに対して高パフォーマンスのクエリを実行できます。 ミラー化されたデータベースが作成されると、そのデータは OneLake 内の Delta Lake 形式で格納されます。 このネイティブ形式を使用すると、Power BIやその他の分析ツールを Direct Lake モードで接続でき、基になるファイルに直接アクセスすることで、ほぼリアルタイムの分析情報を提供できます。 この統合により、ミラーリングのシンプルさと Direct Lake の速度とスケーラビリティが組み合わさり、運用データに関する迅速で最新のレポートが可能になります。
ミラー化されたデータの保持
Fabric でのミラーリングでは、Delta Lake テーブル形式で既存のデータ資産が OneLake に継続的にレプリケートされます。 ミラーリングされたデータを効率的に保存し、常に分析の準備を行うために、ミラーリングは自動的にバキュームを実行して、Delta ログによって参照されなくなった古いファイルを削除します。
保持設定は、要件に応じてカスタマイズできます。 たとえば、ミラーリング ストレージの使用量を減らすには短いリテンション期間を選択するか、Delta のタイム トラベル機能を分析に利用するためにリテンション期間を延長することができます。
2025 年 6 月中旬以降にファブリック ポータルから作成されたミラー化されたデータベースの場合、既定のリテンション期間は 1 日です。 古いミラー化されたデータベースの場合、既定値は 7 日間です。 保持設定を確認または更新するには、ファブリック ポータルで、ミラー化されたデータベース -Settings -Delta テーブル管理 タブに移動し、保持しきい値を指定します。 パブリック API 経由でプロパティを指定して構成することもできます。
ファブリックのSQLデータベース
また、fabric ポータル内の Microsoft Fabric で
関連コンテンツ
- Microsoft Fabricとは
- レイクハウスの SQL 分析エンドポイントとは
- Direct Lake の概要