適用対象:
SQL Server 2019 以前の Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
Important
データ マイニングは SQL Server 2017 Analysis Services で非推奨となり、現在は SQL Server 2022 Analysis Services で廃止されました。 非推奨および廃止された機能については、ドキュメントは更新されません。 詳細については、「 Analysis Services の下位互換性」を参照してください。
Microsoft アソシエーション アルゴリズムは、レコメンデーション エンジンでよく使用されるアルゴリズムです。 レコメンデーション エンジンは、既に購入したアイテム、または関心を示したアイテムに基づいて、顧客にアイテムを推奨します。 Microsoft アソシエーション アルゴリズムは、マーケット バスケット分析にも役立ちます。
関連付けモデルは、個々のケースとケースに含まれる項目の両方の識別子を含むデータセットに基づいて構築されます。 ケース内の項目のグループは、 アイテムセットと呼ばれます。 関連付けモデルは、一連のアイテムセットと、それらの項目がケース内でどのようにグループ化されるかを記述するルールで構成されます。 アルゴリズムによって識別されるルールは、顧客のショッピング カートに既に存在する項目に基づいて、顧客の将来の購入を予測するために使用できます。 次の図は、アイテムセット内の一連のルールを示しています。
図に示すように、Microsoft アソシエーション アルゴリズムは、データセット内の多くのルールを見つける可能性があります。 アルゴリズムでは、サポートと確率の 2 つのパラメーターを使用して、生成されるアイテムセットとルールを記述します。 たとえば、X と Y がショッピング カート内にある可能性のある 2 つの項目を表す場合、サポート パラメーターは、項目 X と Y の組み合わせを含むデータセット内のケースの数です。サポート パラメーターをユーザー定義パラメーター、 MINIMUM_SUPPORT 、MAXIMUM_SUPPORTと組み合わせて使用することで 、 生成されるアイテムセットの数がアルゴリズムによって制御されます。 確率パラメーター ( 信頼度とも呼ばれます) は、X を含み、Y も含むデータセット内のケースの割合を表します。確率パラメーターを MINIMUM_PROBABILITY パラメーターと組み合わせて使用することで、生成されるルールの数がアルゴリズムによって制御されます。
Example
Adventure Works Cycle 社は、Web サイトの機能を再設計しています。 再設計の目的は、製品の販売を増やすことです。 会社はトランザクション データベースに各販売を記録するため、Microsoft Association アルゴリズムを使用して、一緒に購入される傾向がある製品のセットを識別できます。 その後、顧客の買い物かごに既に含まれている項目に基づいて、顧客が関心を持つ可能性のある追加項目を予測できます。
アルゴリズムのしくみ
Microsoft アソシエーション アルゴリズムは、データセットを走査して、ケースで一緒に表示される項目を検索します。 その後、アルゴリズムは、 MINIMUM_SUPPORT パラメーターで指定されたケースの数で、少なくとも出現する関連項目をアイテムセットにグループ化します。 たとえば、アイテムセットは "Mountain 200=Existing, Sport 100=Existing" で、710 のサポートを持つことができます。 その後、アルゴリズムはアイテムセットからルールを生成します。 これらのルールは、アルゴリズムが重要と識別する他の特定の項目の存在に基づいて、データベース内の項目の存在を予測するために使用されます。 たとえば、ルールは「Touring 1000=存在し、Road bottle cage=存在する場合、Water bottle=存在する」と設定され、確率は0.812になります。 この例では、アルゴリズムがツーリング1000タイヤおよびウォーターボトルケージのバスケット内での存在を検出し、そこからウォーターボトルがバスケット内にも入っている可能性が高いと予測します。
アルゴリズムの詳細な説明と、アルゴリズムの動作をカスタマイズし、マイニング モデルの結果を制御するためのパラメーターの一覧については、「 Microsoft Association Algorithm Technical Reference」を参照してください。
関連付けモデルに必要なデータ
アソシエーション ルール モデルで使用するデータを準備するときは、必要なデータの量やデータの使用方法など、特定のアルゴリズムの要件を理解する必要があります。
関連付けルール モデルの要件は次のとおりです。
1 つのキー列 各モデルには、各レコードを一意に識別する数値列またはテキスト列が 1 つ含まれている必要があります。 複合キーは許可されません。
1 つの予測可能な列 関連付けモデルは、予測可能な列を 1 つだけ持つことができます。 通常は、入れ子になったテーブルのキー列 (購入した製品を一覧表示するファイルなど) です。 値は不連続または分離する必要があります。
入力列 。 入力列は不連続である必要があります。 アソシエーション モデルの入力データは、多くの場合、2 つのテーブルに含まれています。 たとえば、あるテーブルに顧客情報が含まれているのに対し、別のテーブルには顧客の購入が含まれている場合があります。 入れ子になったテーブルを使用して、このデータをモデルに入力できます。 入れ子になったテーブルの詳細については、「 入れ子になったテーブル (Analysis Services - データ マイニング)」を参照してください。
関連付けモデルでサポートされるコンテンツ タイプとデータ型の詳細については、「 Microsoft アソシエーション アルゴリズムテクニカル リファレンス」の「要件」セクションを参照してください。
アソシエーション モデルの表示
モデルを調べるには、 Microsoft アソシエーション ビューアーを使用できます。 関連付けモデルを表示すると、SQL Server Analysis Services によってさまざまな角度からの相関関係が表示されるため、データ内で見つかったリレーションシップとルールを理解しやすくなります。 ビューアーの [アイテムセット ] ウィンドウには、最も一般的な組み合わせ (アイテムセット) の詳細な内訳が表示されます。 [ ルール ] ウィンドウには、データから一般化されたルールの一覧が表示され、確率の計算が追加され、ルールが相対的な重要度でランク付けされます。 依存関係ネットワーク ビューアーを使用すると、個々の異なる項目がどのように接続されているかを視覚的に調べることができます。 詳細については、「 Microsoft クラスター ビューアーを使用したモデルの参照」を参照してください。
アイテムセットとルールの詳細を確認する場合は、 Microsoft 汎用コンテンツ ツリー ビューアーでモデルを参照できます。 モデルに格納されるコンテンツには、各アイテムセットのサポート、各ルールのスコア、およびその他の統計情報が含まれます。 詳細については、「 関連付けモデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。
予測の作成
モデルが処理されたら、ルールとアイテムセットを使用して予測を行うことができます。 関連付けモデルでは、予測は、指定された項目が存在する場合に発生する可能性のある項目を示し、予測には確率、サポート、重要度などの情報を含めることができます。 アソシエーション モデルに対してクエリを作成する方法の例については、「 アソシエーション モデル クエリの例」を参照してください。
データ マイニング モデルに対してクエリを作成する方法の一般的な情報については、「 データ マイニング クエリ」を参照してください。
Performance
アイテムセットを作成し、相関関係をカウントするプロセスには時間がかかる場合があります。 Microsoft アソシエーション ルール アルゴリズムでは、最適化手法を使用して領域を節約し、処理を高速化しますが、次のような条件下でパフォーマンスの問題が発生する可能性があることを理解しておく必要があります。
データ セットは、多数の個別の項目で大きくなります。
アイテムセットの最小サイズが低すぎます。
処理時間を最小限に抑え、アイテムセットの複雑さを軽減するために、データを分析する前に、関連する項目をカテゴリ別にグループ化してみてください。
注釈
マイニング モデルを作成するための予測モデル マークアップ言語 (PMML) の使用はサポートされていません。
ドリルスルーをサポートします。
OLAP マイニング モデルの使用をサポートします。
データ マイニング ディメンションの作成をサポートします。
こちらもご覧ください
データ マイニング アルゴリズム (Analysis Services - データ マイニング)
Microsoft アソシエーション ルール ビューアーを使用してモデルを参照する
関連付けモデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)
Microsoft アソシエーション アルゴリズムテクニカル リファレンス
アソシエーション モデル クエリの例