データの急激な増加に伴い、組織は、Azureの無限のコンピューティング、ストレージ、分析能力を利用して、データのスケーリング、ストリーミング、予測、および表示を行います。 分析ソリューションによって大量のデータが、レポートや視覚化などの有用なビジネス インテリジェンス (BI) や、機械学習に基づく予測などの独創的な人工知能 (AI) に変わります。
組織がクラウドベースの分析ツールの評価を始めたばかりの場合でも、現在の実装を拡張しようとしている場合でも、Azureには多くのオプションが用意されています。 このワークフローは、一般的なアプローチについて学習し、プロセスとロールをクラウドの考え方に合わせて調整する作業から始まります。
データは、バッチやリアルタイムで、オンプレミスやクラウドで処理できますが、すべての分析ソリューションの目的は、データを大規模に役立てられるようにすることです。 組織が人、マシン、モノのインターネット (IoT) によって生成されるすべてのリレーショナル データと非リレーショナル データに対して、信頼できる単一の情報源を構築する必要性はますます高まっています。 ビッグ データ アーキテクチャまたは IoT アーキテクチャを使用して生データを構造化された形式に変換し、分析データ ストアに移動するのが一般的です。 このストアは、多数の分析情報ソリューションに力を与える信頼できる単一の情報源になります。
アーキテクチャ
Azureの分析のためのソリューション体験を示す図。 学習と組織の準備から始まり、ワークロードの要件に基づいてストレージ ソリューションと Azure BI または AI テクノロジの選択に進みます。
上の図は、一般的な基本的/ベースライン分析の実装を示しています。 Azureで構築できる実際のソリューションについては、このセクションで提供されている architectures を参照してください。
分析のアーキテクチャとガイドを調べる
このセクションの記事には、Azureにデプロイし、運用グレードのソリューションとガイドに拡張できる、完全に開発されたアーキテクチャが含まれています。 これらは、Azureでの分析テクノロジの使用方法に関する重要な決定を下すのに役立ちます。 また、ソリューションのアイデアを確認することもできます。分析 POC 開発を計画する際に可能な内容を確認できます。
アーキテクチャ
Microsoft Fabric の分析 - Microsoft Fabricの統合機能を使用して最新の分析プラットフォームを構築します。- データ ウェアハウスと分析 - 複数のソースからの大量のデータを統合された分析プラットフォームに統合します。
- Microsoft Fabricを使用してエンタープライズ BI ソリューションを設計します - Microsoft Fabricを使用してエンタープライズ ビジネス インテリジェンス ソリューションを設計します。
- ほぼリアルタイムのレイクハウスデータ処理 - ほぼリアルタイムデータレイクハウス処理には、Azure Synapse AnalyticsとAzure Data Lake Storageを使用します。
MongoDB Atlas から Azure Synapse Analytics - MongoDB Atlas データをリアルタイムでAzure Synapse Analyticsに同期します。Azure Databricks - Azure Databricksを使用してエンドツーエンドのストリーム処理パイプラインを作成します。Azure Stream Analytics - データを取り込み、レコードを関連付け、ローリング平均を計算するストリーム処理パイプラインを構築します。- 中小企業向けの最新のデータ ウェアハウス - 中小企業向けに設計された最新のデータ ウェアハウス ソリューションを構築します。
ソリューションのアイデア
- Azure Databricks を使用した取り込み、ETL、およびストリーム処理パイプライン - データレイクへの取り込みを簡略化するために、バッチ データとストリーミング データ用の ETL パイプラインを作成します。
- Azure Databricks を使用したモダン分析アーキテクチャ - モダンなデータ アーキテクチャを使用してデータを収集、処理、分析、視覚化します。
- 中小企業向けのModern データ プラットフォーム - Microsoft FabricとAzure Databricksを使用して、中小企業向けの最新のデータ プラットフォーム アーキテクチャを構築します。
Azure Data Explorer - Azure Data ExplorerとAzure Service Busを使用してリアルタイムでデータを分析します。
Guides
テクノロジの選択
- 分析とレポート - Azureでのデータ分析と視覚化のオプションを比較します。
- バッチ処理 - ビッグ データ ワークロードのバッチ処理テクノロジを評価します。
- ストリーム処理 - リアルタイム分析のためのストリーム処理テクノロジを比較します。
- 分析データ ストアの選択 - 適切な分析データ ストアの選択に関するガイダンス。
Microsoft Fabric - Microsoft Fabric内のデータ ストアの選択に関するガイダンス。
Azure データ プラットフォームのディザスター リカバリー
- Overview - Azure データ プラットフォームのディザスター リカバリー戦略の概要。
- Architecture - Azure データ プラットフォームでのディザスター リカバリーのアーキテクチャ パターン。
- シナリオの詳細 - ディザスター リカバリーを実装するための詳細なシナリオ。
- 推奨事項 - ディザスター リカバリーに関するベスト プラクティスの推奨事項。
Azureの分析について学習する
Azureの分析を初めて使用する場合は、無料のオンライン トレーニング プラットフォームである Microsoft Learn を使用することをお勧めします。 特定の製品やサービスのビデオ、チュートリアル、対話型学習のほか、開発者やデータ アナリストなどの職務に基づくラーニング パスを見つけることができます。
利用を開始するときに役立つリソースを次に示します。
ロール別のラーニング パス
- データ アナリスト: Microsoft データ分析の概要
- データエンジニア: Azure Databricks を使用してデータ分析ソリューションを実装します
Data scientist :Azure Databricks
組織の準備
組織がクラウドを初めて使用する場合は、クラウド導入フレームワークを使用して作業を開始できます。 Microsoft が提供する実証済みのガイダンスであるドキュメントとベスト プラクティス オファーのコレクションであり、クラウド導入作業の時間が短縮されるように設計されています。 クラウド規模の分析の詳細については、 クラウド規模の分析に関するページを参照してください。
Azureで分析ソリューションの品質を確保するために、Azure Well-Architected Framework に従うことをお勧めします。 アーキテクチャの卓越性を求める組織に規範的なガイダンスを提供し、コスト最適化されたAzure ソリューションを設計、プロビジョニング、監視する方法について説明します。
Well-Architected Framework の柱に沿ったデータ ワークロードガイダンスについては、データ ワークロードのAzure Well-Architected Framework を参照してください。
運用へのパス
データを格納する方法は、Azureに関する分析の過程で行う必要がある最初の決定の 1 つです。 その後、シナリオに最適な Data Analytics テクノロジを選択できます。
重要な決定ポイントは次のとおりです。
データ ストレージ: データ構造とクエリ パターンに基づいて、データ レイク、データ ウェアハウス、またはレイクハウスのいずれかを選択します。 分析ワークロードを強化するデータベース ソリューションの選択と設計に関するガイダンスについては、「 データベース アーキテクチャの設計」を参照してください。
処理モデル: バッチ処理、ストリーム処理、または組み合わせがワークロードの要件に最も適しているかどうかを判断します。
分析ツール: チームのスキルとビジネス ニーズに合った BI および AI テクノロジを選択します。
分析ソリューションのさまざまなアーキテクチャ スタイルを表示するには、 アーキテクチャを参照してください。
ベスト プラクティス
高品質の分析は、堅牢で信頼性の高いデータから始まります。 最高レベルの情報セキュリティ プラクティスは、データが転送中および保存中に保護されるのを保証するのに役立ちます。 そのデータへのアクセスも信頼されている必要があります。 信頼できるデータとは、設計に次が実装されていることを意味します。
ガバナンス ポリシー - 明確なデータの所有権、分類、アクセス ポリシーを定義します。
ID とアクセス管理 - ロールベースのアクセス制御と最小特権の原則を実装します。
ネットワーク セキュリティ制御 - サービス間のデータ フローを保護し、承認されていないアクセスを防ぎます。
データ保護 - 保存データと転送中のデータを暗号化します。
プラットフォーム レベルでは、次のビッグ データのベスト プラクティスAzureの信頼できる分析に貢献します。
Orchestrate データ インジェスト - データ ワークフローまたはパイプライン ソリューション (Azure Data Factory またはMicrosoft Fabric パイプラインでサポートされているものなど) を使用します。
データのインプレース処理 - 分散データ ストアを使用します。ビッグ データ アプローチでは、大量のデータと幅広い形式をサポートします。
機密データを早期にスクラブ する - データ レイクに格納されないように、インジェスト ワークフローの一部として機密データを削除またはマスクします。
総コストを考慮 する - 必要なコンピューティング ノードのユニットごとのコストと、それらのノードを使用してジョブを完了する分単位のコストとのバランスを取る。
統合データ レイクの作成 - 構造化、半構造化、非構造化のいずれであっても、複数の形式のファイルのストレージを結合します。 Azure Data Lake Storage Gen2を単一の情報源として使用します。 たとえば、センター オブ エクセレンスの BI ソリューション アーキテクチャに関するページを参照してください。
分析を最新の状態に保つ
Azure分析サービスは、最新のデータの課題に対処するために進化しています。 最新の更新プログラムと計画された機能に関する最新情報を入手します。
Azure製品と機能の最新の更新プログラムを取得します。
次の主要な分析サービスを最新の状態に保ちます。
- Microsoft Fabric の新機能
- Azure Databricks リリース ノート
Azure Data Explorer Power BI
その他のリソース
Analytics は幅広いカテゴリであり、さまざまなソリューションを対象にしています。 次のリソースは、Azureの詳細を確認するのに役立ちます。
ハイブリッド
組織の大部分は、データがオンプレミスとクラウドの両方でホストされているので、分析に対するハイブリッドのアプローチを必要とします。 多くの場合、組織はオンプレミスのデータ ソリューションをクラウドに拡張します。 これらの環境を接続するには、組織はハイブリッド ネットワーク アーキテクチャを選択する必要があります。
主要なハイブリッド分析シナリオ:
- メインフレームの最新化: メインフレームとミッドレンジ のデータを最新化 する - 従来のデータ ソースを最新の分析プラットフォームと統合します。
- オンプレミス統合: 統合されたハイブリッド操作とマルチクラウド操作 - オンプレミスデータベースをクラウド分析に接続します。
- エッジ分析: エッジでデータを処理し、クラウドで分析情報を集計します。
リアルタイム分析
リアルタイム分析を使用すると、組織は到着したデータに対してアクションを実行できます。 Azureでのリアルタイム分析の開始に役立つリソースを次に示します。
- ビッグ データ アーキテクチャに関するリアルタイム分析 - ストリーミング データを大規模に処理および分析します。
- Azure Data Explorer を使用した
IoT 分析 - IoT テレメトリ データをリアルタイムで分析します。 Azure Stream Analytics - サーバーレス ストリーミング ソリューションを構築します。- Azure Databricks - Apache Spark を使用したエンタープライズ レベルの分析を使用して、最新の分析アーキテクチャを作成します。
AWS または Google Cloud プロフェッショナル
これらの記事は、Azure分析オプションを他のクラウド サービスと比較することで、迅速に立ち上げるのに役立ちます。