レイクハウスでのデータの検出とコラボレーション

Databricks を使用すると、Lakehouse 上のデータ、分析、AI ワークロード全体で、セキュリティで保護された管理されたコラボレーションが可能になります。 Unity カタログと Delta Sharing などのオープンプロトコルを使用すると、チームは、ユースケースやコラボレーター全体のガバナンス、監査可能性、プライバシーを維持しながら、大規模なデータの検出、共有、分析を行うことができます。

大規模なアクセス許可の管理

Unity カタログを使用すると、管理者は、カタログ、データベース、テーブル、ビューに対するアクセス許可をユーザーのグループに割り当てるための統合された場所が提供されます。特権とメタストアはワークスペース間で共有されるため、管理者は ID プロバイダーから同期されたグループに対してセキュリティで保護されたアクセス許可を 1 回設定でき、エンドユーザーは入力した Azure Databricks ワークスペース内の適切なデータにのみアクセスできます。

Unity カタログを使用すると、管理者はストレージ資格情報を定義することもできます。これは、クラウドストレージインフラストラクチャに対するアクセス許可を格納および共有するための安全な方法です。これらのセキュリティ保護可能なリソースに対する特権を付与して、組織内のユーザーがクラウドオブジェクトストレージの場所に対して外部の場所を定義できるようにすることができます。これにより、データエンジニアは、クラウドアカウントコンソールで昇格されたアクセス許可を提供することなく、新しいワークロードに対してセルフサービスできます。

Azure Databricks でデータを検出する

ユーザーは、カタログエクスプローラーのを使用して、Unity カタログで使用可能なデータオブジェクトを参照できます。カタログエクスプローラーは、Unity カタログ管理者によって構成された権限を使用して、ユーザーがクエリを実行するアクセス許可を持つカタログ、データベース、テーブル、およびビューのみを表示できるようにします。ユーザーが関心のあるデータセットを見つけたら、フィールド名と型を確認し、テーブルと個々のフィールドに関するコメントを読み取り、データのサンプルをプレビューできます。また、ユーザーはテーブルの完全な履歴を確認して、データがいつ、どのように変化したかを把握できます。また、系列機能を使用すると、特定のデータセットがアップストリームジョブから派生し、ダウンストリームジョブでどのように使用されるかを追跡できます。

ストレージ資格情報と外部の場所もカタログエクスプローラーに表示され、各ユーザーは、使用可能な場所とリソース全体のデータの読み取りと書き込みが必要な特権を表示できます。

レイクハウスで生産までの時間を短縮する

Azure Databricks では、SQL、Python、Scala、R のワークロードがサポートされており、多様なスキルセットと技術的背景を持つユーザーは、その知識を使用して分析分析情報を得ることができます。 Azure Databricks でサポートされているすべての言語を使用して運用ジョブを定義でき、ノートブックでは言語の組み合わせを使用できます。つまり、SQL アナリストが最後の 1 マイルの ETL 用に記述したクエリを、ほとんど手間をかからずに運用データエンジニアリングコードに昇格させることができます。組織全体のペルソナによって定義されたクエリとワークロードは同じデータセットを使用するため、コードと結果を他のチームと共有する前に、フィールド名を調整したり、ダッシュボードを最新の状態にしておく必要はありません。コード、ノートブック、クエリ、ダッシュボードを安全に共有できます。すべて同じスケーラブルなクラウドインフラストラクチャを利用し、同じキュレーションされたデータソースに対して定義できます。

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-12-19