次の方法で共有


データ ソースの概要

Dynamics 365 Customer Insights - Dataを構成するには、最初にソース データを取り込んで処理します。 Customer Insights - Dataには、さまざまな種類のデータ コネクタが用意されており、さまざまなソースに接続してデータを取り込むことができます。

この記事では、データ取り込みのパフォーマンスに影響するオプションについて説明します。

Delta 形式

Delta データ形式は、Customer Insights – Data で使用するネイティブ処理形式です。 ソースデータを Delta 形式で提供できる場合、多くの利点があります。

  • Customer Insights - Data を使用した効率向上: Customer Insights - Data は内部で Delta 形式を使用します。
  • より高速なデータ インジェスト: Delta 形式は優れた圧縮を提供し、より高速なデータ転送を実現します。
  • 統合の迅速化: Delta タイム トラベル機能 を使用すると、Customer Insights – Data は変更されたデータのみを統合します。 データ セット全体が再処理されるわけではありません。 増分統合の場合、統合へのデータ入力はすべて Delta 形式である必要があります。
  • データ破損の問題が少ない: Delta 形式は、コンマ区切り値 (CSV) 形式などの古い形式によって引き起こされる破損したパーティションと一般的なデータ破損の問題を軽減します。
  • より信頼性の高いデータ管理設計: Delta 形式では、マニフェスト、スキーマ、パーティション ファイルを手動で更新する必要がありません。
  • より高いデータ有効性: Delta 形式は、Spark でアトミック性、一貫性、独立性、永続性 (ACID) トランザクションと独立性レベルを提供します。

次のコネクタで Delta 形式を使用できます。

Delta は、Databricks Lakehouse Platform のデータとテーブルを格納する基盤である Delta Lake で導入された用語です。 Delta Lake は、ビッグデータのワークロードに ACID (原子性、一貫性、分離、耐久性) トランザクションをもたらすオープンソースのストレージ レイヤーです。 詳細については、Delta Lake のドキュメントページ を参照してください。

データ ソース 添付またはインポート

データの取り込み方法を決定する際に重要なのは、データ コネクタがデータに添付するか、データのコピーを作成するかです。 Customer Insights - Dataを使用する場合は、データに接続するコネクタを使用することをお勧めします。 このようにして、データを処理するときにデータに直接アクセスされます。 データをコピーするコネクタを使用すると、データの更新時に遅延が発生する場合があります。

次のデータ コネクタがデータに接続されます:

データに接続するコネクタを使用できない場合は、Power Query コネクタのいずれかを使用してデータをコピーします。 Power Queryは、データを変換する便利な方法を提供します。

データプロファイリング

データが取り込まれると、Customer Insights – Data はいくつかの基本的なデータ プロファイリングを実行します。 たとえば、列で繰り返される値の頻度をプロファイルします。 プロファイル データを使用すると、データを理解し、問題に対処できます。 たとえば、 列でマッチングしている場合、データ プロファイリングによって、既定値の 名前を入力してください が 10,000 行に表示されていることを検出できます。 したがって、この値で一致する場合は、一致してはならない 10,000 行が一致します。 Azure データ レイク、デルタ テーブル、またはAzure Synapse データ ソースを追加すると、さらに多くの列のデータ プロファイルを有効にすることができます。

データを取り込んだ後、データ プロファイリングの結果を表示します。

  1. データテーブルに移動し、テーブルを選択します。 次に、フィールド ( など) の行の 概要 列で、概要 アイコンを選択します。

    DateOfBirth フィールドの Summary アイコンが強調表示されている Customer テーブルのページの Attributes タブのスクリーンショット。

  2. 詳細を確認して、エラーや欠損値がないか確認します。

    DateOfBirth フィールドの概要を示すスクリーンショット (カウント別の上位値のグラフを含む)。

注意

データ プロファイルは、データ準備タスクの一部として生成され、データ ソースごとに個別に実行されます。 データ準備タスクが正常に完了しない場合は、影響を受けるデータ ソースの [概要] 列を使用できません。 データ プロファイルの結果は、すべての列で使用できない場合があります。 データ準備タスクの最大実行時間は 3 時間です。 この制限の引き上げを要求するには、Microsoft サポートにお問い合わせください。

データ ソース ページ

データ ソース ページには、データソースが 2 つのセクションにリストされています。

  • 管理者としてのデータフロー: Microsoft Power Platform内で自分が作成し管理しているデータフロー。 他のユーザーは、これらのデータフローのみを表示できます。 編集、更新、削除はできません。
  • 他のユーザーによって管理: 他の管理者が作成したMicrosoft Power Platformのデータフロー。 これらのデータフローは閲覧のみ可能です。 このセクションには各データフローの所有者が表示され、何かサポートが必要な場合にサポートに連絡することができます。

注意

他のユーザーは、すべてのテーブルを表示、使用できます。 各data ソースは作成したユーザーによって所有されますが、Customer Insights - Dataのすべてのユーザーは、データ インジェストの結果として得られたすべてのtablesを使用できます。

データのソース ページのスクリーンショット。

次の手順