次の方法で共有


Copilot チューニングを使用して、Microsoft 365 Copilotで使用するモデルを微調整する (プレビュー)

この記事では、Copilotチューニングを使用して、Microsoft 365 Copilotの宣言型エージェントで使用できるCopilot Studio で微調整されたモデルを作成する方法について説明します。 微調整は、独自のテナント データで特定のタスクの事前トレーニング済みモデルをカスタマイズできるプロセスです。 これらの微調整されたモデルを使用して、ドメイン固有のタスクの実行に精通したエージェントを構築し、Microsoft 365 Copilotで提供することができます。

微調整は、組織に関連するタスクに対するモデルのパフォーマンス向上に役立ちます。 微調整されたモデルは、固有のデータや特殊な要件を持つ組織に特に役立ちます。

この記事では、Copilot Studio の Copilot チューニング プロセスの basic の概要について説明します。 組織とタスクの微調整から最良の結果を得るために役立つ、タスク固有の詳細なガイダンスについては、「Copilot チューニングの概要を参照してください。

Copilot チューニングの利点

モデルの微調整は、特定のニーズに合わせて大規模な言語モデルを調整するために使用される強力な手法です。 微調整は、検索拡張生成 (RAG とも呼ばれます) やプロンプトの最適化など、他の生成 AI 最適化手法を補完します。 微調整は、モデルの動作を厳密に指示する場合に適しています。

通常、微調整を行うには、エキスパート データ サイエンティストのチームがデータセットをキュレーションし、タスク固有のデータ準備とトレーニング パイプラインを構築する必要があります。

Copilot StudioのCopilot Tuningにより、このプロセスが大幅に簡素化され、ほとんどすべての専門家が使用できるツールになります。

Copilot Studio は、プロセスの複雑さの多くを抽象化します。 Copilot Studio Copilot チューニング プロセスはコードが少なく、リソースが多い複雑なプロジェクトから合理化されたセルフサービス エクスペリエンスに微調整を変換します。

AI を利用した自動化されたデータ準備により、ノイズの多いエンタープライズ コンテンツが最小限の労力で高品質のトレーニング セットに変わります。 この自動化により、モデルの信頼度が低い場合にのみ人間の入力を要求することで、手動でラベル付けする必要性が最小限に抑えられます。 自動化により、データのラベル付け作業を削減できます。

最後に、この機能により、特殊なデータ処理とトレーニング パイプラインを作成する手間が省けます。

セキュリティ

Copilot チューニングでは、既存の Microsoft Entra セキュリティ グループで定義された適切なアクセス制御を持つユーザーのみが、Microsoft 365 Copilot エージェントの構築時にモデルを使用できるようにすることで、従来の微調整手法と比較してセキュリティが強化されています。 管理者は、運用環境からモデルをすばやく削除して、セキュリティをさらに強化することもできます。

トレーニング中であっても、誰もデータを見ません。 すべてのトレーニングと推論は、テナント分離環境で行われます。

Copilot チューニングはどのようなタスクを実行できますか?

現時点では、次のタスクに対してCopilotチューニングを使用できます。

  1. Q&A: エキスパートの質問と回答は、HR やプロフェッショナル サービスのシナリオなど、RAG だけでは不十分な複雑なナレッジ ドメインの質問に正確に回答できます。
  2. ドキュメントの生成: ドキュメント生成は、契約、コントラクト、技術ドキュメントなど、特定の形式に従う必要がある複雑で構造化されたドキュメントを作成する場合に優れています。
  3. ドキュメントの要約: ドキュメント要約では、規制分析や立法分析などの複雑な情報が、調整された要約に正確に蒸留されます。

合格

Copilotチューニングは、早期アクセス プログラム (EAP) です。 EAP の適格性の詳細については、introducing Microsoft 365 Copilot Tuning を参照してください。

Copilotチューニングを使用できる組織では、Microsoft 365管理者がアクセスを制御します。 管理者は、組織レベルまたはテナント レベルのCopilotチューニングをアクティブ化できます。 管理者は、組織内の特定のユーザーに対してこの機能へのアクセスを制限することもできます。

Copilot Studio での Copilot チューニングへのアクセス

Microsoft 365管理者がテナントでCopilotチューニングを使用できるようにし、モデル作成のアクセス許可を付与すると、Microsoft Copilot Studioを使用して最初のモデルの構築を開始するように招待する電子メールが届きます。

Copilotチューニングにアクセスするには、次の操作を行います。

  1. Copilot StudioModel Maker ロールを持つユーザーアカウントでサインインします。

  2. サイド バーで、3 つのドット (...) を選択し、Copilot Tuning を選択します。

    Copilotチューニング ページが開きます。

    このオプションが表示されない場合、Copilotチューニングはテナントで使用できないか、微調整されたモデルを作成するアクセス許可がありません。

微調整されたモデルを作成する

Copilotチューニングは、複数ステップのトレーニング プロセスです。 機械学習のトレーニング プロセスと同様に、トレーニング データの品質と量は、モデルの成功に不可欠です。

Copilot チューニングは現在、Sharepoint ファイルのみをサポートしており、Wordドキュメント、PDF、テキスト ファイルに制限されています。

基本的なモデル パラメーターを構成する

まず、モデルの実行内容、動作方法、および使用する適切なデータ ソースに対して、高レベルのパラメーターを構成します。

  1. Copilotチューニング ページに移動し、新しいモデルの作成を選択します。 [ モデルをタスク ページに合わせてカスタマイズする ] に移動します。

  2. モデルのわかりやすい名前と説明を入力します。

    組織内のユーザーが自分の作業にどのように役立つかをすばやく理解できるように、モデルについて説明します。

  3. [ ナレッジ ソースの選択] で、[ ナレッジの追加] を選択します。

    [ モデルにナレッジを追加する] ページが表示されます。

    1. ナレッジの種類を選択します。 現在、SharePointを使用できます。

    2. ナレッジ ソースを選択します。 コンピューターでSharePoint ファイルを参照するか、ソースの URL を入力して、Add を選択します。

    3. 必要に応じて前の手順を繰り返して、ナレッジ ソースをさらに追加します。

    4. ナレッジ ソースの追加が完了したら、[ 追加 ] を選択して続行します。

  4. Permissions で、デプロイ時にモデルにアクセスできるMicrosoft Entraセキュリティ グループを指定します。

    Copilotチューニングでは、選択したセキュリティ グループがアクセスできないファイルのトレーニングから自動的に除外されます。 Copilot Studio では、モデルに安全に組み込むことができる知識の幅を最大化するために、他のセキュリティ グループも自動的に提案されます。

  5. [ タスクの種類] で、目的のタスクの種類を選択します。

  6. 表示される [ モデル命令 ] セクションで、指示に従って質問に回答します。 指示に従って指示情報を入力します。 詳細については、Microsoft 365 Copilotチューニングドキュメントの詳細なタスク固有のガイダンスを参照してください。

    モデルの指示は、Copilot Studio がナレッジ ソースから最も関連性の高いデータを特定して準備するのに役立ちます。 適切なモデル命令は、トレーニング プロセス中にデータを解釈する方法の手掛かりをモデルに提供します。

  7. [ 下書きの保存] を選択して進行状況を保存するか、微調整プロセスを続行する準備ができたら、[ ラベル付けデータの準備] を選択します。

    Copilot Studio では、ラベル付け用のデータの準備が開始されます。

    Copilot Studio は、選択したナレッジ ソースの一部が選択したセキュリティ グループで使用できないかどうかを通知します。 Copilot Studio は、モデルに安全に組み込むことができる知識の幅を最大化するために、他のセキュリティ グループを自動的に提案します。

  8. セキュリティ グループを調整して、必要に応じてカバレッジを展開し、[ 選択を続行] を選択します。

    Copilot Studio は、ラベル付けのためにデータを準備します。

    Von Bedeutung

    データのサイズによっては、準備が完了するまでに最大 24 時間かかることがあります。 準備が行われている間は、Copilot Studio で作業を続けるか、ブラウザー タブを閉じて後で戻ることができます。 この手順が完了すると、電子メール通知が届きます。 Copilot Studio に戻り、モデルの一覧を更新することで、いつでも状態を確認できます。

トレーニング サンプルにラベルを付ける

データが処理されると、Copilot Studio から、データのラベル付けの準備ができていることを示す電子メール通知が送信されます。

Copilot Studio には、タスクと指定したデータに関連する生成されたトレーニング例が表示されます。 サンプルを確認し、サンプル品質に関するフィードバックを提供する必要があります。

ラベル付けは、基本的にモデルに理想的なトレーニング例を識別する方法を教えるので、重要なステップです。 ドメインの専門知識を持つ個人がこのタスクを実行していることを確認します。 ドメインの専門家でない場合は、組み込みのラベル付け管理ワークフローを使用して、ラベル付けタスクを対象の専門家に委任できます。

ラベル付けプロセスは、通常、複数のバッチを経由します。 モデルのトレーニングには、最大 4 ~ 5 つのバッチのラベルが必要な場合があります。

ラベル付けが完了したら、モデルをトレーニングする準備ができました。 [ トレーニングの開始] を選択して続行します。

モデルをトレーニングする

Copilot Studio では、ラベル付きデータを使用してモデルをトレーニングします。 トレーニングは完全に自動化されたプロセスであり、それ以上の入力は必要ありません。

Von Bedeutung

データのサイズによっては、トレーニング プロセスに最大 24 時間かかることがあります。

トレーニングが完了すると、電子メール通知が届きます。 Copilot Studio に戻り、モデルの一覧を更新することで、いつでも状態を確認することもできます。

モデルを評価する

最後のフェーズでは、微調整されたモデル出力の結果とベースラインの微調整されていないモデルの結果との間で、一連の比較を行います。 モデルの応答の品質を引き続き向上させる場合は、新しいモデル トレーニングの実行を開始できます。

次のトレーニング実行でモデルの出力を向上させるには、データセットがモデルの特定のタスクに適切に揃っており、データにドメイン エキスパートによってラベルが付けられていることを確認します。

モデルを Microsoft 365 Copilot に発行する

モデルの出力に問題がなければ、モデルを Microsoft 365 テナント カタログに発行します。

これで、Copilotに対してテナントのエージェントがモデルを使用できるようになりました。

微調整プロセスの開始時に選択したセキュリティ グループのメンバーのみが、エージェントでモデルを使用できます。

Copilotのエージェントでモデルを使用する方法の詳細については、Microsoft 365 Copilotドキュメントを参照してください。

制限事項と制約事項

微調整されたモデルを作成する際に注意すべきいくつかの制限事項と制限があります。

  • モデルのトレーニング後にナレッジ ソースを追加する場合は、微調整プロセスを最初から再開する必要があります。
  • Copilot Studio では、モデルのバージョン管理はまだサポートされていません。
  • モデルのトレーニングでデータが使用されているユーザーが、GDPR (または同様の規制) に基づく有効な削除要求を送信する場合は、モデルを再トレーニングする必要があります。
  • モデルを微調整する際、モデルの重みは学習データに基づいて調整されます。 微調整されたモデルはいつでも削除できます。
  • テナント環境内でデータを収集、格納、および使用する方法については、お客様が責任を負います。
  • データ処理が透明性、同意、アクセス、削除に関する法的要件を満たしていることを確認する必要があります。
  • 使用する前に、このシステムから生成された出力の正確性、妥当性、コンプライアンスを確認する責任があります。 検証には、主題の専門家による確認が必要な場合があります。