Databricks を使用すると、Lakehouse 上のデータ、分析、AI ワークロード全体で、セキュリティで保護された管理されたコラボレーションが可能になります。 Unity カタログと Delta Sharing などのオープン プロトコルを使用すると、チームは、ユース ケースやコラボレーター全体のガバナンス、監査可能性、プライバシーを維持しながら、大規模なデータの検出、共有、分析を行うことができます。
大規模なアクセス許可の管理
Unity カタログを使用すると、管理者は、カタログ、データベース、テーブル、ビューに対するアクセス許可をユーザーのグループに割り当てるための統合された場所が提供されます。 特権とメタストアはワークスペース間で共有されるため、管理者は ID プロバイダーから同期されたグループに対してセキュリティで保護されたアクセス許可を 1 回設定でき、エンド ユーザーは入力した Azure Databricks ワークスペース内の適切なデータにのみアクセスできます。
Unity カタログを使用すると、管理者はストレージ資格情報を定義することもできます。これは、クラウド ストレージ インフラストラクチャに対するアクセス許可を格納および共有するための安全な方法です。 これらのセキュリティ保護可能なリソースに対する特権を付与して、組織内のユーザーがクラウド オブジェクト ストレージの場所に対して外部の場所を定義できるようにすることができます。これにより、データ エンジニアは、クラウド アカウント コンソールで昇格されたアクセス許可を提供することなく、新しいワークロードに対してセルフサービスできます。
Azure Databricks でデータを検出する
ユーザーは、カタログ エクスプローラーのを使用して、Unity カタログで使用可能なデータ オブジェクトを参照できます。 カタログ エクスプローラーは、Unity カタログ管理者によって構成された権限を使用して、ユーザーがクエリを実行するアクセス許可を持つカタログ、データベース、テーブル、およびビューのみを表示できるようにします。 ユーザーが関心のあるデータセットを見つけたら、フィールド名と型を確認し、テーブルと個々のフィールドに関するコメントを読み取り、データのサンプルをプレビューできます。 また、ユーザーはテーブルの完全な履歴を確認して、データがいつ、どのように変化したかを把握できます。また、系列機能を使用すると、特定のデータセットがアップストリーム ジョブから派生し、ダウンストリーム ジョブでどのように使用されるかを追跡できます。
ストレージ資格情報と外部の場所もカタログ エクスプローラーに表示され、各ユーザーは、使用可能な場所とリソース全体のデータの読み取りと書き込みが必要な特権を表示できます。
レイクハウスで生産までの時間を短縮する
Azure Databricks では、SQL、Python、Scala、R のワークロードがサポートされており、多様なスキル セットと技術的背景を持つユーザーは、その知識を使用して分析分析情報を得ることができます。 Azure Databricks でサポートされているすべての言語を使用して運用ジョブを定義でき、ノートブックでは言語の組み合わせを使用できます。 つまり、SQL アナリストが最後の 1 マイルの ETL 用に記述したクエリを、ほとんど手間をかからずに運用データ エンジニアリング コードに昇格させることができます。 組織全体のペルソナによって定義されたクエリとワークロードは同じデータセットを使用するため、コードと結果を他のチームと共有する前に、フィールド名を調整したり、ダッシュボードを最新の状態にしておく必要はありません。 コード、ノートブック、クエリ、ダッシュボードを安全に共有できます。すべて同じスケーラブルなクラウド インフラストラクチャを利用し、同じキュレーションされたデータ ソースに対して定義できます。