グラフデータベースとは

注

現在、この機能はパブリックプレビュー段階にあります。このプレビュー版はサービスレベルアグリーメントなしで提供されています。運用環境のワークロードに使用することはお勧めできません。特定の機能はサポート対象ではなく、機能が制限されることがあります。詳細については、「Microsoft Azure プレビューの使用条件を参照してください。

グラフデータベースは、接続されたデータをモデル化してクエリを実行する強力な方法を提供します。テーブルにデータを格納する従来のリレーショナルデータベースとは異なり、グラフデータベースは情報をノード (エンティティ) とエッジ (リレーションシップ) として表し、複雑な接続やパターンをより柔軟に探索しやすくします。この記事では、グラフデータベースの主要な概念、グラフクエリのしくみ、ワークロードにグラフデータベースを使用することを検討するタイミングの概要について説明します。また、Fabric Graph とスタンドアロングラフデータベースのデプロイを比較します。

最も一般的に使用されるグラフデータベースの種類は、ラベル付きプロパティグラフ (LPG) モデルを実装します。エンティティ (ノード) とリレーションシップ (エッジ) には、ラベルとプロパティ (キーと値のペア) を含めることができます。この柔軟なモデルにより、スキーマオプションとスキーマ駆動設計の両方が可能になり、豊富なセマンティクスを表現できます。接続はエッジとして明示的に格納されるため、クエリでは、クエリ時に高価な結合を計算するのではなく、エッジに従ってリレーションシップを走査します。

Important

この記事では、ソーシャルネットワークのグラフデータセットの例のみを使用します。

Graph データベースのコア概念

ノードは、人、製品、場所などのエンティティを表します。ノードには、属性を記述するラベルとプロパティを含めることができます。たとえば、Person ノードには、firstName、lastName、age などのプロパティが含まれます。
エッジは、エンティティの接続方法 (FRIENDS_WITH、購入済み、LOCATED_INなど) を表します。エッジには、リレーションシップメタデータをエンコードするためのプロパティとラベルを含めることもできます。
プロパティは、ノードとエッジに詳細をアタッチします (たとえば、ユーザーの名前や日付以降のエッジ)。リレーションシップはエッジとして明示的に格納されるため、クエリでは、クエリ時に計算するのではなく、接続に従ってグラフ内を移動します。

リレーションシップのクエリのしくみ

グラフクエリでは、開始ノードから近隣ノード、その近隣ノードなどへ走査することで、接続された情報を取得します。トラバーサルが実行する作業は、データセットの合計サイズではなく、タッチするエッジの数 (ローカル近傍) に関連付けられています。この特性により、友人の友人、最短パス、マルチホップの依存関係など、パス、接続、パターンに関する質問が自然で効率的に表現されます。

グラフデータベースでは、ますます採用される Graph クエリ言語 (GQL) などのパターンベースのクエリ言語を使用して、これらのトラバーサルを簡潔に記述します。 SQL (ISO/IEC 39075) を監督する同じ国際作業グループは、グラフクエリを確立されたデータベース標準に合わせて調整する GQL を標準化しています。

例 (GQL でのパターンマッチング):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

このパターンは次のように解釈します: Annemarie の人物ノードから出発し、エッジに従って各フレンドノードへ進み、その後エッジに従って関連するノードに進む。作成日で並べ替えられたコメントの最新の 100 個を返します。

モデリングとスキーマ

グラフデータモデルはスキーマオプションです。強力なガバナンスが必要な場合は、固定スキーマを操作したり、新しいノードの種類、リレーションシップ、またはプロパティが表示されたときにモデルを進化させることができます。このアプローチにより、データの重複の必要性が軽減され、チームは事前に大量の再設計を行うことなく、複数のソースからのデータを統合できます。

グラフデータベースの一般的な用途

グラフデータベースは、次のような接続が値を駆動するドメインと密接に連携します。

ソーシャルネットワーク
ナレッジグラフ
レコメンデーションシステム
不正行為とリスクネットワーク
ネットワークと IT トポロジ
サプライチェーンの依存関係分析

これらのシナリオでは、個々のレコードについての質問が減り、複数のホップを介してどれだけのエンティティが関連し合い、相互作用するかが重要になります。

グラフデータベースを検討する場合

次の場合にグラフデータベースを選択します。

主な質問には、接続されたデータのパス、近隣、パターンが含まれます。
ホップの数は可変であるか、事前に不明です。
異なるデータセット間でリレーションシップを結合して移動する必要があります。

このような質問を定期的に行う場合、グラフモデルは自然に適合します。

Fabric Graph とスタンドアロングラフデータベースの比較

データをグラフとして表し、別のスタンドアロンのグラフデータベースに格納すると、ETL (抽出、変換、読み込み) とガバナンスのオーバーヘッドが発生することがよくあります。これに対し、Graph は OneLake で直接動作するため、個別の ETL パイプラインとデータ重複の必要性が軽減または排除されます。次のトレードオフについて考えてみましょう。

データ移動と重複: スタンドアロングラフデータベースでは、通常、データを抽出、変換、および別のストアに読み込む必要があり、複雑さが増し、データセットが重複する可能性があります。 Graph は OneLake で動作するため、接続されたデータを移動せずにモデル化およびクエリを実行できます。
運用コスト: スタンドアロングラフスタックは個別のクラスターまたはサービスとして実行され、多くの場合、アイドル容量の料金が発生します。 Graph の Graph ワークロードは、自動スケールダウンと一元化されたメトリックを使用してプールされた容量ユニット (CU) を使用します。これにより、操作が簡素化され、コストが削減されます。
スケーラビリティ: 一部のスタンドアロングラフデータベースは、スケールアップまたはベンダー固有のクラスタリングに依存します。 Graph は大規模なグラフ用に設計されており、複数のワーカー間でスケールアウトシャーディングを使用して、ビッグデータワークロードを効率的に処理します。
ツールとスキル: ベンダー固有のグラフシステムには、特殊な言語と個別の分析フレームワークが必要な場合があります。 Graph には、統合モデリング、標準ベースのクエリ (GQL)、組み込みのグラフ分析アルゴリズム、BI、AI 統合、およびロー/ノーコード探索ツールが用意されています。これらの機能を使用すると、より広範なユーザーが接続されたデータを操作できます。
ガバナンスとセキュリティ: 個別のグラフ展開には、独立したガバナンスとセキュリティのセットアップが必要です。 Graph では、OneLake のガバナンス、系列、ワークスペースのロールベースのアクセス制御 (RBAC) が使用されるため、コンプライアンス、監査、アクセス許可は Fabric 環境の残りの部分と一貫性を保ちます。

グラフデータベースとリレーショナルデータベースを比較する
Microsoft Fabricを無料で試す

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-03-06

次の方法で共有

グラフ データベースとは

Graph データベースのコア概念

リレーションシップのクエリのしくみ

モデリングとスキーマ

グラフ データベースの一般的な用途

グラフ データベースを検討する場合

Fabric Graph とスタンドアロン グラフ データベースの比較

関連コンテンツ

フィードバック

その他のリソース

グラフデータベースとは

グラフデータベースの一般的な用途

グラフデータベースを検討する場合

Fabric Graph とスタンドアロングラフデータベースの比較