Microsoft Fabric の Data Factory は、よりシンプルで強力なアプローチで最も複雑なデータ統合の課題に対処するために構築された、次世代の Azure Data Factory です。
このガイドは、これら 2 つのサービスの主な違いを理解するのに役立ちます。これにより、企業に適した選択を行うことができます。 では、何が新しいのか、何が異なるのか、Fabric がどのような利点をもたらすのか、順を追って説明していきます。
移行オプションを調べる準備はできましたか? 移行ガイドをご覧ください。
特徴を並べて比較する
Azure Data Factory と Fabric Data Factory の間でコア機能がどのようにスタックされるかを次に示します。 変更された内容、新機能、および同じままの内容を強調しました。
| Azureデータファクトリー | Fabric の Data Factory | 相違点 |
|---|---|---|
| パイプライン | パイプライン | より優れた統合: Fabric のパイプラインは、Lakehouse、Data Warehouse、およびその他の Fabric サービスとシームレスに連携します。 ファブリック パイプラインには、より多くの SaaS ベースのアクティビティが含まれており、JSON 定義が異なります。 詳細については、 パイプライン機能の比較 を参照してください。 |
| マッピングデータフロー | データフロー Gen2 | 使いやすい: Dataflow Gen2 を使用すると、変換を構築するためのエクスペリエンスが簡単になります。 常に Gen2 にマッピング データフロー機能を追加しています。 |
| アクティビティ | アクティビティ | その他のアクティビティ: お気に入りの ADF アクティビティをすべて Fabric に取り入れる予定です。 さらに、ADF では利用できない Office 365 Outlook アクティビティなどの新しいアクティビティを取得できます。 詳細については、 アクティビティの比較 を参照してください。 |
| データセット | 接続のみ | より簡単なアプローチ: 複雑なデータセット構成は不要です。 Fabric の Data Factory では、接続を使用してデータ ソースにリンクし、作業を開始します。 Fabric はデータセットを排除し、アクティビティ内でデータ プロパティをインラインで定義します。 |
| リンクされたサービス | 接続 | より直感的: 接続はリンクされたサービスと同様に機能しますが、設定と管理が簡単です。 |
| トリガー | イベント トリガーのスケジュールとファイリング | 組み込みのスケジュール設定: Fabric のスケジューラ イベントと Reflection イベントを使用して、パイプラインを自動的に実行します。 ファイル イベント トリガーは、追加のセットアップなしで Fabric でネイティブに動作します。 Fabric は、ADF のスタンドアロン トリガーとは異なり、トリガーを Activator フレームワークに統合します。 |
| 公開 | 保存して実行する | 発行手順なし: Fabric では、発行手順を完全にスキップします。 [保存] を選択して作業を保存するか、[実行] を選択してパイプラインをすぐに保存して実行します。 |
| 自動解決とAzure Integration Runtime | 不要 | 簡略化されたアーキテクチャ: 統合ランタイムを管理する必要はありません。 Fabric がコンピューティングを自動的に処理します。 |
| セルフホステッド統合ランタイム | オンプレミス データ ゲートウェイ | 同じオンプレミス アクセス: 使い慣れたオンプレミス データ ゲートウェイを使用してオンプレミスのデータに接続します。 詳細については、 オンプレミスのデータ アクセス ガイドを参照してください。 |
| Azure-SSIS 統合ランタイム | 未定 | Fabric の今後の機能: 現在も Fabric での SSIS 統合の設計に取り組んでいます。 |
| マネージド仮想ネットワークとプライベート エンドポイント | 未定である。 | Fabric の今後の機能: 現在も、Fabric のマネージド仮想ネットワークとプライベート エンドポイントの統合に取り組んでいます。 |
| 式表現言語 | 式言語 | 同じ式: 既存の式の知識が直接転送されます。 構文はほぼ同じです。 |
| 認証のタイプ | 認証の種類 | その他のオプション: 一般的な ADF 認証方法はすべて Fabric で動作し、さらに新しい認証の種類が追加されました。 |
| CI/CD | CI/CD | ADF 以外の強化された機能には、簡単なチェリーピック、個別アイテムのプロモーション、Git リポジトリの有効化、および組み込みの SaaS CI/CD オプションが含まれます。 |
| ARM テンプレートのエクスポート/インポート | 名前を付けて保存 | クイック重複: Fabric では、"名前を付けて保存" を使用して、開発またはテスト用のパイプラインをすばやく複製します。 |
| 監視 | 監視ハブ + 実行履歴 | 高度な監視: 監視ハブは、ワークスペース間の分析情報とより優れたドリルダウン機能を備えた最新のエクスペリエンスを提供します。 |
| デバッグ | 対話型モード | デバッグの簡略化: Fabric は ADF のデバッグ モードを排除します。 常に対話型モードにいます。 |
| 変更データ キャプチャー (Change Data Capture, CDC) | コピー ジョブ | 増分データ移動: Fabric は、CDC アーティファクトではなく、コピー ジョブを介した増分データ移動を管理します。 |
| Azure Synapse Link | ミラーリング | データ レプリケーション: Fabric は、Azure Synapse Link をデータ レプリケーションのミラーリング機能に置き換えます。 |
| パイプラインの実行アクティビティ | Invoke パイプライン アクティビティ | クロスプラットフォーム呼び出し: Fabric は、クロスプラットフォーム呼び出しを使用して ADF の Execute パイプライン アクティビティを強化します。 |
パイプライン機能の比較
| カテゴリ | ADF パイプライン | ファブリック パイプライン |
|---|---|---|
| サービスの種類 | データ統合 PaaS サービス | データ統合 SaaS サービス |
| 作成環境 | Azure portal (ADF Studio) | ファブリック/PBI ワークスペース (Lakehouses、Warehouses などと統合されたユーザーエクスペリエンス) |
| パイプライン オーケストレーション | アクティビティ、トリガー、パラメーターを含むフル機能のパイプライン | Fabric UX 用に再想像された同じオーケストレーション モデル |
| データ移動 | コピー アクティビティ、マッピング データ フロー、オンプレミス IR のサポート、マネージド仮想ネットワーク | コピー アクティビティ、データフロー Gen2、OneLake および Fabric 項目への組み込み接続、オンプレミス データ ゲートウェイ、仮想ネットワーク ゲートウェイ |
| コンピューティング/IR | セルフホステッド、SSIS、Azure IR (移動 + 変換用) | クラウド接続、オンプレミス、仮想ネットワーク ゲートウェイ |
| データフロー | Azure Blob、Data Lake Storage、SQL、100 以上のコネクタ | 同じコネクタ + ネイティブ OneLake 統合、より厳密な Fabric ワークスペースの配置 |
| 監視 | 実行、トリガー、アラートを含む ADF Studio のパイプラインとデータ フロー | パイプライン、データフロー、ノートブック、データベースなどの統合ビューを使用したハブとワークスペースの監視 |
| トリガー | スケジュール、タンブリング ウィンドウ、イベント ベースのトリガー | スケジュール、イベント トリガー、タンブリング ウィンドウ トリガーを間隔スケジュールとして使用 |
| CI/CD | ARM テンプレート + Azure DevOps または GitHub リポジトリの統合 | Fabric の組み込みのデプロイ パイプライン。ワークスペース レベルの昇格 (Dev → Test → Production) と外部リポジトリの統合 |
| セキュリティ | マネージド ID, Key Vault 統合, プライベート エンドポイント | 同じセキュリティ モデルと Fabric ワークスペース RBAC。OneLake セキュリティ統合 |
| Pricing | Azure 使用率ベースの従量課金制 (アクティビティごとの実行、データ移動、コンピューティング) | 外部アクティビティまたはパイプライン アクティビティに対して課金されない容量ベース (Fabric F SKU)、アクティビティの実行とパイプライン のデータ移動のみ |
アクティビティの比較
Microsoft Fabric の Data Factory では、Azure Data Factory を使用して高度な継続性を維持し続けます。 ADF でアクセスできるアクティビティの約 90% は、ファブリックの Data Factory で既に利用できます。 Fabric の ADF と Data Factory の両方でのアクティビティとその可用性の内訳を次に示します。
| アクティビティ | ADF | Fabric の Data Factory |
|---|---|---|
| ADX/KQL | Y | Y |
| 変数の追加 | Y | Y |
| カスタム (Fabric の Azure Batch) | Y | Y |
| Azure Databricks | ノートブック アクティビティ • Jar アクティビティ • Python アクティビティ • ジョブ アクティビティ | Azure Databricks アクティビティ |
| Azure Machine Learning | Y | Y |
| Azure Machine Learning のバッチ実行 | Deprecated | N/A |
| Azure Machine Learning の更新リソース | Deprecated | N/A |
| コピーする | データのコピー | コピー作業 |
| データフロー Gen2 | N/A | Y |
| 削除 | Y | Y |
| パイプラインの実行/呼び出し | パイプラインの実行 | パイプラインの呼び出し |
| ファブリックノート | N/A | Y |
| 失敗 | Y | Y |
| Filter | Y | Y |
| 各要素に対して | Y | Y |
| Functions | Azure 関数 | 関数アクティビティ |
| [Get Metadata (メタデータの取得)] | Y | Y |
| HDInsight | Hive アクティビティ • Pig アクティビティ • MapReduce アクティビティ • Spark アクティビティ • ストリーミング アクティビティ | HDInsight アクティビティ |
| If 条件 | Y | Y |
| 参照 | Y | Y |
| マッピング データ フロー | Y | Dataflow Gen2 |
| Office 365 Outlook | N/A | Y |
| Power Query (ADF のみ - ラングリング データフロー) | Deprecated | N/A |
| スクリプト | Y | Y |
| セマンティック モデルの更新 | N/A | Y |
| 変数の設定 | Y | Y |
| Sproc | Y | Y |
| SSIS | Y | N/A |
| ストアド プロシージャ | Y | Y |
| スイッチ | Y | Y |
| Synapse Notebook と SJD アクティビティ | Y | N/A |
| チーム | N/A | Y |
| Until | Y | Y |
| Validation | Y | メタデータの取得 と 条件文 |
| Wait | Y | Y |
| Web | Y | Y |
| Webhook | Y | Y |
| データフローの調整 | Y | Dataflow Gen2 |
Fabric Data Factory の新しいアクティビティ
アクティビティの継続性を維持するだけでなく、Fabric の Data Factory では、より豊富なオーケストレーションニーズを満たすために新しいアクティビティがいくつか導入されています。 これらの新しいアクティビティは次のとおりです。
- Outlook: Fabric Data Factory で利用でき、Outlook サービスとの統合を容易にします。
- Teams: Microsoft Teams アクティビティのオーケストレーションを有効にするために Fabric Data Factory で使用できます。
- セマンティック モデルの更新: Power BI セマンティック モデルの更新機能を強化するために Fabric Data Factory で使用できます。
- データフロー Gen2: Fabric Data Factory で使用でき、高度なデータフロー機能を使用してデータ オーケストレーションを強化できます。
使用可能なすべての Fabric Data Factory アクティビティの一覧については、アクティビティの 概要を参照してください。
コネクタの比較
すべてのコネクタの比較と、Azure Data Factory と Fabric Data Factory での可用性については、 コネクタの比較に関する記事を参照してください。
セルフホステッド統合ランタイム (SHIR) とオンプレミス データ ゲートウェイ (OPDG)
注
SHIR と ODPG でサポートされるサービスは異なります。
- セルフホステッド統合ランタイム (SHIR): Azure Data Factory、Azure Synapse Analytics、Azure Machine Learning Studio、および Azure Purview をサポートします。
- オンプレミス データ ゲートウェイ (OPDG): Power BI、Power Apps、Power Automate、Azure Analysis Services、Logic Apps、Fabric Dataflow Gen2、ファブリック パイプライン、ファブリック コピー ジョブ、ファブリック ミラーリングをサポートします。
| カテゴリ | セルフホステッド統合ランタイム (SHIR) | オンプレミス データ ゲートウェイ (OPDG) |
|---|---|---|
| サポートされているサービス | - Azure Data Factory - Azure Machine Learning Studio - Azure Synapse Analytics - Azure Purview |
- Power BI - Power Apps - Power Automate - Azure Analysis Services - Logic Apps - Fabric Dataflow Gen2 - ファブリック パイプライン - ファブリックコピージョブ - ファブリック ミラーリング |
| インストールと登録 | - キーによって登録されます - サービス モードで実行されます |
- Microsoft Entra ID アカウントに登録されている - ユーザー モードをサポートします |
| プラットフォーム | -ウィンドウズ - コンテナーイメージ がサポートされている |
- Windows のみ - コンテナーのサポートなし |
| プロキシのサポート | - システム プロキシとカスタム プロキシの両方をサポートする | - カスタム プロキシをサポートする |
| リージョン バインド | - Data Factory リージョンに設定 - 既定のリージョンを変更できません |
- リージョンを変更できます |
| カスタム リレー | - サポートされていません | -サポート;顧客は独自のリレーを持ち込むことができます |
| サービス間での共有 | - 最大 120 個のデータ ファクトリと共有 - ADF、Synapse、Purview、または Synapse ワークスペース間で共有することはできません |
- テナント内でサポートされているすべてのサービスで使用可能 |
| 高可用性 (HA) | - 最大 8 ノード (既定値は 4) | - 最大 10 ノード |
| 回復 | - 再インストールが必要 | - サポートされている回復キー |
| ロードバランシング | - 使用可能なワーカー数 (CPU + メモリ) に基づくタスク レベルの負荷分散 | - クエリ レベルの負荷分散 - ラウンドロビンまたはランダム分散のオプション |
| 資格情報ストア | - SHIR ノードにローカルに格納される - Azure Key Vault がサポートされています |
- ゲートウェイ クラウド サービスに一元的に格納される - Key Vault の統合なし |
| 自動更新 | - サポートされています | - サポートされていません |
| コネクタの拡張性 | - サポートされていません | - サポートされています |
| 対話型の著作 | - サポートされています | - サポートされています |
| 制御フローのプライベート リンク | - サポートされています | - サポートされていません |
| バージョン管理 | - 1 か月あたり 2 つのリリース。1 つは autoupdate としてプッシュされます - 過去 12 か月間のリリースをサポート |
- 1 か月に 1 つのリリース - 過去 6 つのリリースをサポート |
| CPU とメモリのスロットリング | - サポートされていません | - サポートされています |
| スループットの制限 | - ハード制限なし。ネットワーク帯域幅に依存 | サービス固有の制限: Power Apps / Power Automate / Logic Apps: - 書き込み: 2 MB のペイロード制限 - 読み取り: 2 MB の要求制限、8 MB の圧縮された応答の制限 - GET 要求 URL の制限: 2,048 文字 Power BI ダイレクト クエリ: 16 MB の非圧縮応答の制限 |
ADF マネージド仮想ネットワークとファブリック仮想ネットワーク データ ゲートウェイ
Azure Data Factory (ADF) マネージド仮想ネットワークと Microsoft Fabric Virtual Network (仮想ネットワーク) Data Gateway はどちらも、パブリック インターネットに公開することなく、データ ソースに安全に接続するのに役立ちます。 どちらのオプションもクラウド ワークロードのプライベート接続をサポートしますが、設定方法、管理担当者、サポートするサービスが異なります。
ADF マネージド VNET
Microsoft は、ネットワーク環境を所有し、管理します。 セットアップは簡単ですが、ネットワーク設定やファイアウォール規則を制御することはできません。ファブリック VNET データ ゲートウェイ
ゲートウェイは、独自の Azure 仮想ネットワーク内にデプロイします。 これにより、ネットワーク、ファイアウォール、スケーリングを完全に制御できます。 ゲートウェイがリソースに接続する方法を決定し、すべてのネットワーク設定を管理します。
次の表を使用して主な違いを比較し、ワークロードとガバナンスのニーズに合ったオプションを選択します。
| カテゴリ | ADF マネージド仮想ネットワーク | ファブリック仮想ネットワーク データ ゲートウェイ |
|---|---|---|
| サポートされているサービス | Azure Data Factory と Synapse パイプライン。 | Microsoft Fabric Dataflow Gen2、Fabric データ パイプライン、ファブリック コピー ジョブ、ファブリック ミラーリング、Power BI セマンティック モデル、Power BI のページ分割されたレポート |
| VNET 所有権 | Microsoft が管理する仮想ネットワーク (お客様がネットワークを制御していません)。 | カスタマー マネージド仮想ネットワーク (顧客は完全に制御できます)。 |
| プライベート エンドポイント | サポートされているサービス (Azure Storage、SQL DB など) に対して ADF によって自動作成および管理されます。 | お客様は、ファブリック ワークロードを仮想ネットワーク内のリソースに接続するように仮想ネットワーク ゲートウェイを構成します。 |
| ネットワーク制御 | 制限付き— お客様は、プライベート エンドポイントへの仮想ネットワーク統合ランタイムのみを許可リストに登録できます。 | フル コントロール— お客様は、ファイアウォール、NSG ルール、独自の仮想ネットワークでのルーティングを構成します。 |
| インストール/展開 | インストールは必要ありません。非表示の仮想ネットワーク内で Microsoft によって完全に管理されています。 | 顧客の仮想ネットワークへの仮想ネットワーク データ ゲートウェイのデプロイが必要です。 |
| 高可用性 | Microsoft が管理する ADF の仮想ネットワーク内で自動的にスケーリングされる。 TTL を有効にするときに予約モードに切り替えます。 | スケーリングと HA (ノードベースのクラスター) をサポートしますが、カスタマー マネージド仮想ネットワーク内で実行されます。 最大 7 つのノードをサポートします。 |
Fabric Data Factory の主な機能
Fabric Data Factory では、Microsoft のゲームを変える AI 機能の共同パイロットとのネイティブ統合により、パイプライン、データフロー、その他の Data Factory 項目を非常に簡単かつ迅速に構築できます。 Data Factory 用の Copilot を使用すると、自然言語を使用して、データ統合プロジェクトを簡単に定義できます。
Native Lakehouse と Data Warehouse の統合
Fabric Data Factory の最大の利点の 1 つは、データ プラットフォームとの接続方法です。 Lakehouse と Data Warehouse はパイプラインのソースと宛先の両方として機能するため、統合データ プロジェクトを簡単に構築できます。
Office 365 でのスマート メール通知
チームに最新情報を共有しますか? Office 365 Outlook アクティビティを使用すると、パイプラインの実行、アクティビティの状態、結果に関するカスタマイズされた電子メール通知を、すべて簡単な構成で送信できます。 ダッシュボードを常にチェックしたり、カスタム通知コードを記述したりする必要はありません。
合理化されたデータ接続エクスペリエンス
Fabric の最新の データ取得 エクスペリエンスを使用すると、コピー パイプラインをすばやく設定し、新しい接続を作成できます。 構成に費やす時間を減らし、必要な場所にデータを取得する時間を増やすことができます。
CI/CD エクスペリエンスの使いやすさの向上
Fabric では、CI/CD エクスペリエンスは Azure Data Factory や Synapse よりもはるかに簡単で柔軟性が高くなります。 Fabric には CI/CD テンプレートと ARM テンプレートの間に接続がないため、チェックイン、チェックアウト、検証、コラボレーションのために Fabric ワークスペースの個々の部分を簡単に選択できます。 ADF と Synapse では、CI/CD の唯一のオプションは、独自の Git リポジトリを使用することです。 ただし、Fabric では、必要に応じて、独自の外部 Git リポジトリを持ち込む必要のない組み込みのデプロイ パイプライン機能を使用できます。
次のレベルの監視と分析情報
Fabric Data Factory の監視エクスペリエンスは、違いを実際に確認できる場所です。 監視ハブでは、すべてのワークロードの完全なビューが提供され、詳細な分析情報を得るための任意のアクティビティにドリルダウンできます。 クロスワークスペース分析が適切に組み込まれているため、組織全体の全体像を確認できます。
コピー アクティビティのトラブルシューティングを行う場合は、詳細な内訳ビューが必要です。 実行の詳細ボタン (眼鏡アイコン) を選択して、何が起こったかを正確に確認します。 期間の内訳には、各ステージの所要時間が表示され、パフォーマンスの最適化が容易になります。
パイプラインを迅速に複製
同様のパイプラインを作成する必要がありますか? [名前を付けて保存] 機能を使用すると、既存のパイプラインを数秒で複製できます。 開発バージョンの作成、バリエーションのテスト、同様のワークフローの設定に最適です。
関連コンテンツ
詳細については、次のリソースを参照してください。