次の方法で共有


ドキュメント検証エージェント テンプレートのCopilot チューニング (早期アクセス プレビュー)

Microsoft 365 Copilotのドキュメント検証エージェント テンプレートは、組織が内部ガイドライン、ポリシー、ブランド化基準、規制要件に準拠するためのドキュメントを確認するのに役立ちます。 非準拠コンテンツを特定し、違反をリスク別に分類し、ドキュメント内で実行可能な修復ガイダンスを直接提供することで、手動レビュー ワークフローを自動化します。

このエージェントは、正確性、一貫性、監査性が重要な、高い賭け金と反復可能なレビュー シナリオ用に設計されています。

重要

Microsoft 365 Copilot チューニングは、現在、早期アクセス プログラムを通じて、限られた一連の顧客が利用できます。 フロンティア経由のアクセスは、2026 年 4 月に予定されています。 機能と要件は変更される可能性があります。

ドキュメント検証エージェント テンプレートの機能

ドキュメント検証エージェント テンプレート:

  • 指定されたルールブックまたはガイドラインドキュメントからルールを自動的に抽出します。
  • これらのルールに対してドキュメントを検証します。
  • リスク レベル (クリティカルまたはアドバイザリ) によって違反を識別し、分類します。
  • 説明と推奨される修正プログラムを提供します。
  • 結果をコメントとしてWordドキュメントに挿入します。

ドキュメント レビューを標準化することで、エージェントはレビュー時間を短縮し、一貫性を向上させ、チーム全体のコンプライアンス リスクを軽減するのに役立ちます。

一般的なシナリオ

ドキュメントが厳密または反復可能な規則に従うことを要求するワークフローで、ドキュメント検証エージェント テンプレートを使用します。次に例を示します。

  • 契約レビュー (サプライヤー契約、作業明細書)
  • 法律とコンプライアンスのレビュー
  • 規制に関する開示
  • 財務または医療のコンプライアンスチェック
  • 顧客向けコンテンツのブランドとポリシーの遵守

サポートされている機能と制限事項

このテンプレートでは、次の機能がサポートされています。

  • ユーザー指定のルールブックに対する検証。
  • 人間のレビューを使用した自動ルール抽出。
  • リスクベースの分類と説明。
  • 推奨される修正プログラムを含むインライン コメント。
  • プロンプトごとに 1 つのドキュメント検証。

テンプレートでは、次の機能はサポートされていません。

  • マルチモーダル分析 (画像、グラフ、スキャンされたドキュメント)。
  • 1 つのプロンプトでの複数のドキュメントの検証。
  • 指定されたルールブックを使用しない検証。

このテンプレートでは、次のファイル形式がサポートされています。

  • .docx
  • .txt
  • .html

テンプレートでは、PowerPoint、画像、手書きドキュメント、スキャンされたファイルなど、他の形式はサポートされていません。

作業の開始

ドキュメント検証エージェント テンプレートを使用するには、検証するルールブックまたはガイドライン ドキュメント (.docx または .txt) が必要です。

  1. Microsoft 365 Copilot Chatで、ドキュメント検証エージェント テンプレートを使用して新しいチャットを開始します。

    Microsoft 365 Copilotでドキュメント検証エージェント テンプレートを使用して新しいチャットを開始するスクリーンショット。

  2. 推奨されるプロンプトの 1 つを使用するか、独自のプロンプトを入力して、検証するガイドラインまたはルールブック (.docx または .tst) とドキュメント (.docx または .tst) を指定します。

    検証するガイドラインまたはルールブックとドキュメントを提供するスクリーンショット。

  3. エージェントは残りの処理を行います。 ルールブックからルールを体系的に抽出し、各ルールに対してドキュメントを検証して、準拠していないを特定し、修正を提案します。

    ルールを抽出し、ドキュメントを検証するエージェントのスクリーンショット。

  4. エージェントは、コメントが挿入された強調表示違反を含むドキュメントで応答し、説明、各違反のリスク (クリティカル/アドバイザリ) レベル、推奨される修正プログラムを含みます。

    違反と推奨される修正プログラムを強調表示するコメントを含むエージェントの応答のスクリーンショット。

チューニング可能なエージェントの概要

ドキュメント検証エージェント テンプレートを調整して、organizationの特定のレビューとコンプライアンスのニーズに合わせて調整できます。 チューニングを使用すると、次のことができます。

  • ルールブックとガイドラインを埋め込んで、エージェントが独自の標準に従ってドキュメントを検証できるようにします。
  • コメントとサマリーのルールのトーンと重要性を制御します。
  • ドメイン固有の例でエージェントをトレーニングすることで、精度を向上させます。
  • シナリオの目標に基づいてエージェントの品質を評価します。

エージェントをチューニングすることで、次のことができます。

  • セッション間でルールとガイドラインを保持します。
  • フィードバックのトーンと重大度をカスタマイズします。
  • ドメイン固有の例を使用して精度を向上させます。
  • シナリオ固有の目標に対してエージェントの品質を評価します。

チューニングする理由

すべてのorganizationには、さまざまなルール、用語、リスクの優先順位があります。 チューニングにより、エージェントはルールを一貫して適用することで、organizationのレビュー担当者のように考えることができます。 チューニングは、高い懸念のあるドキュメントのエラーを減らし、時間を確認し、チームやワークフロー全体のコンプライアンス チェックをスケーリングするのに役立ちます。

エージェントは、次の 2 つの段階で調整できます。 シナリオに基づいて、エージェントに適したチューニング ステージを選択します。

  • コンテキストの調整: 完全なトレーニングを行わずに永続的なルールとトーンを簡単にカスタマイズできます。
  • モデルのチューニング: 最大限の精度と再現率を必要とするユース ケースの例を使用して高度な微調整を行います。

チューニング可能なエージェントは、目標ベースの評価をサポートしているため、一般的な精度スコアだけでなく、organizationの優先順位に合わせたメトリックを使用して成功を測定できます。 チューニングの各段階で、定義した目標に基づいてエージェントの品質を評価できます。

コンテキストの調整

モデルを完全に微調整することなく、 コンテキストの調整 を使用してエージェントの動作をカスタマイズします。 これは、最小限のセットアップで永続的なルールと一貫したレビュー動作を必要とするチームに最適です。

次の場合は、コンテキストのチューニングを使用します。

  • 繰り返し使用するためにエージェントにベイクされたルールが必要
  • 抽出されたルールを確認および編集する
  • トーン、詳細度、リスク レベルを構成する
  • モデルの微調整に十分なデータがまだない

Tune Context を使用すると、次のことができます。

  • ルールブック、ポリシー、またはガイドラインを永続的なコンテキストとして保存する
  • 抽出されたルールを確認、編集、追加、または削除する
  • リスク レベルの割り当て (クリティカルまたはアドバイザリ)
  • トーンを構成する (正式、フレンドリー、アドバイザリ)
  • 評価を再実行し、時間の経過と同時にコンテキストを更新する
  • すぐに使用できる検証エージェントをorganizationの他のユーザーと共有する

ルールブックのベスト プラクティス

最良の結果を得るには、ルールブックで次のプラクティスを使用します。

  • 明確で簡潔で明確なルールを使用する
  • あいまいなガイダンスやオープンエンドのガイダンスを避ける
  • 可能な限り明示的な条件を含める
  • 影響の大きいルールをクリティカルとしてマークする
  • 待機時間を短縮するために大きなルール セットを回避する

ドキュメント検証エージェント テンプレートでコンテキストの調整を使用する

ドキュメント検証エージェント テンプレートでコンテキストのチューニングを使用するには:

  1. エージェントの作成: ドキュメント検証 テンプレートを使用して、エージェント ストアから新しいエージェントを作成します。

  2. エージェントのチューニング: 新しいエージェントに移動し、[ エージェントのチューニング ] を選択して、右側のパネルでチューニング エクスペリエンスを開始します。 [ コンテキストの調整] を選択します

  3. 目標を指定します。 エージェント、ビジネス ドメイン、およびエージェントが検証する一般的なドキュメントを表す少なくとも 1 つのサンプル ドキュメントの主な目標について説明します。 この情報は、エージェントを固有のビジネス ニーズに合わせて調整するのに役立ちます。 最適な結果を得るために、明確な目標と高品質のサンプル ドキュメントを提供します。 作業が完了したら、[保存] を選びます。

    ドキュメント検証エージェント テンプレートの目標の指定のスクリーンショット。

  4. 目標とサブゴールを確認する: エージェントは、目標を正しく理解するための明確な推奨事項を生成します。 それらを確認して、エージェントがユース ケースの目的を正確に表していることを確認します。

    • このユース ケースでorganizationに従う一意のルールまたはガイドラインをキャプチャします。
    • 必要に応じて、目標またはサブゴールを追加、編集、または削除します。 作業が完了したら、[保存] を選びます。

    エージェントの目標とサブゴールを確認しているスクリーンショット。

  5. 評価基準を確認する: エージェントは、エージェントにとって優れたパフォーマンスの意味を定義する評価メトリックを生成します。 エージェントのパフォーマンスは、これらのメトリックで測定されます。

    • これらのメトリックは、定義した目標とサブゴールに基づいてカスタマイズされます。 それらを確認して、成功がどのように表示されるかを定義します。
    • このユース ケースのorganizationに必要な特定の期待を追加します。 これらの条件には、このエージェントの出力に従う必要がある特定の要件が含まれている必要があります。
    • 必要に応じて、追加、編集、または削除します。 完了したら、[保存] を選択します。

エージェントの評価基準の確認のスクリーンショット。

  1. ルールブックを指定します。 最後の手順として、検証エージェントのコンテキストを追加します。 ドキュメントの検証に使用するルールブックまたはガイドラインを指定し、[ ルールの生成] を選択します。

    検証エージェントのルールブックを提供するスクリーンショット。

  2. 生成されたルールを確認する: エージェントはルールブックまたはガイドライン ドキュメントからルールを抽出します。 これらのルールは、ルールとサブルールに分類されます。 それらを確認して、organizationのガイドラインを正確に表していることを確認します。 ルールまたはサブルールを追加、編集、または削除します。 作業が完了したら、[保存] を選びます。

ルールブックから生成されたルールを確認するスクリーンショット。

  1. カスタム評価: コンテキストのチューニング が完了すると、チューニング エクスペリエンスによって評価が自動的に開始されます。 このプロセスは非同期です。 右側のパネルを閉じて、チューニングされたエージェントの使用を開始できます。

    自動的に開始されるカスタム評価プロセスのスクリーンショット。

  2. 評価結果: 評価結果が使用可能になると、電子メール通知を受け取ります。 定義したすべての評価メトリックのスコアと説明の分析情報が表示されます。 詳細な評価結果を確認するには、結果ページの下部にある [ 評価ファイルの表示 ] を選択します。

    スコアと分析情報を含む評価結果のスクリーンショット。

  3. エージェントの共有: 新しく調整したエージェントをorganization内のユーザーと共有できます。 調整したエージェントを使用して、調整したガイドラインを使用してドキュメントを検証できます。

Context Tuned エージェントを使用する

Context Tuned エージェントを使用するには:

  • 調整されたエージェントとチャットして作業を開始し、検証するドキュメントを提供します。 チューニングされたエージェントを使用する場合は、チャットでルールブックを提供する必要はありません。
  • エージェントはドキュメントをスキャンし、コンテキスト調整ルールに照らしてドキュメントを検証して違反を特定します。
  • エージェントは、違反を強調表示し、説明、各違反のリスク (クリティカル/アドバイザリ) レベル、推奨される修正を提供するコメントが挿入されたドキュメントで応答します。
  • エージェントは無視され、検証のためにチャットにアップロードされたルールブックは使用されません。 コンテキスト内のルールを追加または編集するには、いつでもエージェントのコンテキストチューニングと評価を行うことができます。

使用例

  • 契約レビュー: Microsoft は、サプライヤーの契約チェックのために毎週 SOW プレイブックを保存します。
  • コンプライアンス: 迅速な開示検証のために規制ガイドラインの準備を整えます。
  • ポリシー レビュー: 複数のドキュメントに一貫性のあるトーンとリスク設定を適用します。

モデルの調整

モデルの調整 は、最も高度なカスタマイズ オプションです。 organizationのデータを使用して基になるモデルを微調整し、より高い精度と再現率を実現します。

次の場合は、モデルのチューニングを使用します。

  • ルールは複雑または微妙です。
  • このシナリオには、高い規制リスクまたは法的リスクが伴います。
  • コンテキストチューニングでは、十分な精度が得られません。
  • 十分なトレーニング データがあります。

必須データ

モデルのチューニングを使用するには、次のものが必要です。

  • ルールブック: トレーニングと評価に使用されるルールまたはポリシーをクリアします。 ルールブックは、.docx、.txt、または .html できます。
  • : 理想的なコンプライアンスを示す 50 以上の違反のないドキュメント。 ドキュメントは、.docx、.txt、または .html できます。

モデルのチューニングでは、次のことができます。

  • 目標で指定した設定に従って、リコールと精度のバランスが取れた高精度の検証レビューを提供します。
  • クリティカル違反とアドバイザリ違反のリスク認識を提供します。
  • トレーニング中に学習した知識に対して、単一のテキストベースのドキュメントを検証します。
  • 繰り返し使用するためのルールとトーン設定を保持します。 organization内のユーザーと共有して使用できます。

評価ルーブリック

次を使用して、モデル調整エージェントを評価します。

  • 重大な違反を思い出す: この評価では、モデルがすべての重大な違反をキャッチし、重大な違反が見つからないことを最小限に抑えます。
  • アドバイザリ違反の精度: この評価により、フラグが設定された違反が確実に関連し、推奨される問題と修正の有用性が最大化されます。
  • Tune Context からのユーザー定義の目標とメトリック。

モデルのチューニングに関するベスト プラクティス

  • ルールブック: ルールブックに明確で明確なルールが含まれていることを確認します。 複雑なルールの特定の評価基準を含めることを検討してください。 待機時間を最小限に抑えるために、過度に大きなルールブックを避けてください。
  • ドキュメントの例: ドキュメントの例の数が多いほど、モデルのトレーニングが向上します。 例がシナリオを代表し、異なるニュアンスを含むようにします。 たとえば、さまざまな種類のコントラクトのコンプライアンスを評価するモデルを構築する場合は、トレーニング用のすべての種類のコントラクト ドキュメントの十分な例を含めます。
  • ルールの重要度: チューニング プロセス中に抽出されたルールを確認するときに、重要なルールをクリティカルとしてマークします。 この手順では、重要なルールと他のルールとの間で正しくバランスを取ることで、モデルのパフォーマンスが向上します。
  • 検証: 微調整が完了したら、新しいモデルを保存する前に評価ルーブリックを検証します。 organization用に発行する前にサンプル ドキュメントを検証して、チューニングされたエージェントをテストします。

ドキュメント検証エージェントでモデルのチューニングを使用する

ドキュメント検証エージェントでモデルのチューニングを使用するには:

  1. エージェントを調整します。 ドキュメント検証エージェント テンプレートから作成した特殊なドキュメント検証エージェントで [ エージェントの調整 ] を選択します。 [モデルの 調整] オプションに移動します。

    注:

    [ モデルの調整] オプションのロックを解除するには、[コンテキストの 調整] ステップを完了する必要があります。

  2. データを提供します。 サンプル ドキュメントをアップロードします。 ルールブックのすべてのルールまたはポリシーに従い、違反を含めない理想的な例である、 少なくとも 50 個の高品質の代表的なドキュメントを提供します。

    • ファイルを含むフォルダーを選択してください。 個々のファイルを個別にアップロードすることはできません。 最大 20 個のフォルダーをアップロードできます。
    • ドキュメントの数が多いほど、モデルトレーニングの結果が向上します。
    • チューニングにより、ドキュメントが抽出され、モデル トレーニング用に準備されます。 このプロセスには 1 ~ 6 時間かかることがあります。
    • チューニング コンテキスト中に指定するルールブックは、モデルのチューニングにも使用されます。 モデルのチューニングを開始する前に、[ コンテキストの調整 ] ステップでルール ブックを編集できます。
  3. アクセス権を確認します。 微調整されたエージェントを使用できるユーザーを構成します。 前の手順で選択したファイルに基づいて、いくつかのセキュリティ グループを選択します。

    • 基になるファイルにアクセスできるユーザーは、微調整されたモデルにアクセスできます。
    • エージェントにアクセスできるユーザーとグループに推奨されるオプションのいずれかを選択します。
    • チューニングでは、選択したアクセス グループに基づいてトレーニング データが準備されます。 このプロセスには 1 ~ 6 時間かかる場合があります。
  4. 微調整を開始します。 手順に従って微調整を開始します。

    • [ 微調整の開始] を選択すると、プロセスが完了するまでに 24 時間から 72 時間かかることがあります。 モデルのトレーニングが完了すると、評価が自動的に開始されます。
    • モデルトレーニングが完了し、評価結果の準備ができたら、電子メール通知を受け取ります。
  5. 評価メトリックを確認し、公開することを決定します。 評価メトリックは、新しく微調整されたモデルで更新されます。

    • 微調整の前後からメトリックの比較を表示できます。
    • 結果を確認し、[ はい、満足した場合はチューニングされたモデルを使用する ] を選択し、[発行] を選択 します
    • このアクションは、新しく微調整されたモデルをデプロイし、新しい微調整されたモデルを使用するようにエージェントを更新します。

モデル調整エージェントを使用する

モデル調整エージェントを使用するには:

  • エージェントとチャットし、検証するドキュメントをアップロードします。 チューニングされたエージェントを使用する場合は、チャットでルールブックを提供する必要はありません。
  • エージェントはドキュメントをスキャンし、トレーニング中に学習したルールに照らしてドキュメントを検証し、違反を特定します。
  • エージェントは、説明、各違反のリスク (クリティカル/アドバイザリ) レベル、推奨される修正プログラムを含む違反を強調表示するコメントが挿入されたドキュメントで応答します。
  • エージェントは無視され、検証のためにチャットにアップロードされたルールブックは使用されません。

モデル調整エージェントの制限事項

モデル調整エージェントには、次の制限があります。

  • 微調整後にルールを変更することはできません。
  • 現在、エージェントは再トレーニングをサポートしていません。
  • エージェントはマルチモーダル検証をサポートしていません。
  • 検証できるドキュメントは、プロンプトごとに 1 つだけです。

チューニング可能なエージェントの評価

チューニングの各段階で、カスタマイズされた条件を使用してエージェントを評価できます。 organizationの期待に基づいて、これらのカスタム評価基準を定義します。

  • 目標

    • エージェントのタスクのチューニング目標について説明します。 1 つ以上の目標を持つことができます。
    • これらの目標を使用して、エージェントの動作を定義し、サブゴールと評価メトリックを生成します。
  • サンプル ファイル

    • エージェントが検証する一般的なドキュメントを表すサンプル ドキュメントを提供します。 少なくとも 1 つのドキュメントが必要です。
  • サブゴールとメトリック

    • サブゴールを含む推奨事項を明確にすることは、目標に基づいて生成されます。 エージェントの目的を正しく表しているかどうかを確認します。 目標またはサブゴールを追加、編集、または削除できます。
    • 評価メトリックは、サブゴールに基づいて生成されます。 メトリックの確認、追加、編集、または削除を行うことができます。
    • 指定したサブゴールとサンプル ファイルは、メトリックに対するエージェントの動作を評価する評価データの生成に使用されます。
  • ルールブック: ガイドラインまたは標準

    • ドキュメント検証エージェント テンプレートがドキュメントの検証に使用するルールブックまたはガイドラインを指定します。 [ モデルのチューニング] を選択する前に、いつでもルールブックを編集または追加できます。
  • 評価データ

    • 定義したサブゴール、サンプル ファイル、メトリックに基づいて、評価データが自動的に生成されます。
    • システムは、評価データを使用して調整されたエージェントを評価し、メトリックに対してスコアを付けます。
  • 評価結果

    • モデル調整エージェントを公開する前に、定義した評価メトリックのスコアを表示し、各チューニング ステージの後でデルタの改善点を確認します。 改善点を強調し、評価スコアの重要な結果を要約する簡単な説明の分析情報を確認できます。
    • システムは、各チューニング ステージの後に評価スコアを自動的に生成および更新します。 このプロセスは非同期です。 評価がバックグラウンドで実行されている間は、エージェントを使用できます。

評価結果は、チューニング ステージ間の品質スコアとデルタの改善を示し、エージェントを発行する準備ができているタイミングを決定するのに役立ちます。

エージェントの共有とガバナンス

チューニングされたドキュメント検証エージェントを特殊なエージェントとして保存し、organization全体で共有できます。

  • エージェントを調整または変更できるのは、エージェント所有者だけです。
  • 他のユーザーはエージェントを使用できますが、その構成を変更することはできません。
  • すべてのデータは、Microsoft 365 テナントの境界内に留まる。

FAQ

複数のドキュメントを一度に検証できますか?

複数のドキュメントを一度に検証することはできません。 各ドキュメントを個別のプロンプトで検証する必要があります。

チューニング後にルールを更新できますか?

コンテキスト調整されたエージェントを更新できます。 微調整後にモデル調整エージェントを変更することはできません。

エージェントは数値検証をサポートしていますか?

ドキュメント検証エージェント テンプレートでは、ルールに数値のしきい値が含まれている場合の数値検証がサポートされます。

ルールブックが大きい場合はどうなりますか?

大きなルールブックでは、ルールの抽出と検証中の待機時間が長くなる可能性があります。

コンテキストのチューニングとモデルのチューニングを使用する必要がある場合

  • 完全なモデル トレーニングを行わずに永続的なルールとトーンの基本設定を行う場合は、 コンテキストのチューニング を使用します。 これは、セッションとユーザー間での迅速なセットアップと再利用に最適です。

  • 特に規制やコンプライアンスのシナリオで、特にルールに対して高精度と再現が必要で、トレーニングの例が 50 以上ある場合は、モデルのチューニングを使用します。

サポートされているファイル形式は何ですか?

  • サポート対象: .docx、.txt、.html。
  • サポートされていません: .pptx、画像、スキャンされたドキュメント。

エージェントの出力が不正確に見える場合はどうすればよいですか?

次のことを確認します。

  • 正しいルールブックをアップロードしました。
  • ルールを確認し、重要度レベルを設定しました。
  • トーンの設定を正しく指定しました。

調整されたエージェントの場合は、評価メトリックを確認します。 微調整されたエージェントの場合は、トレーニング用の高品質なサンプル ドキュメントを必ず提供してください。 最適なパフォーマンスを実現するには、「コンテキストのチューニング」と「モデルのチューニング」に記載されているベスト プラクティスに従います。

データは安全ですか?

すべてのデータは Microsoft 365 テナント内に残り、安全です。 チューニングは完全に自動化され、ターンキー環境で行われます。