Azure Vision では、画像を処理し、関心のある視覚的特徴に基づいて情報を返す高度なアルゴリズムにアクセスできます。 次の表は、主要な製品カテゴリの一覧です。
注意事項
Foundry Tools の Azure Vision の Image Analysis 4.0 サービスは非推奨となり、2028 年 9 月 25 日に廃止され、その後、サービスへの呼び出しは失敗します。 移行ガイドで説明されている使用可能な代替手段のいずれかに切り替えるのをお勧めします。
| サービス | 説明 |
|---|---|
| 顔 | Face サービスは、画像に含まれている人の顔を検出、認識、分析する AI アルゴリズムを提供します。 顔認識ソフトウェアは、本人確認、タッチレス アクセス制御、プライバシーのための顔ぼかしなど、さまざまなシナリオで重要です。 使用を開始するには、Face のクイックスタートに従ってください。 |
| 画像分析 (レガシ) | 画像分析サービスは、物、顔、成人向けコンテンツ、自動生成されたテキストの説明など、さまざまな視覚的特徴を画像から抽出します。 使用を開始するには、画像分析のクイックスタートに従ってください。 |
| 光学式文字認識 (OCR) (レガシ) | 光学式文字認識 (OCR) サービスは、画像からテキストを抽出します。 Read API を使って、写真やドキュメントから印刷と手書きのテキストを抽出できます。 ディープラーニングベースのモデルを使用して、さまざまなサーフェスや背景のテキストを操作します。 これらの画面と背景には、ビジネス ドキュメント、請求書、領収書、ポスター、名刺、レター、ホワイトボードが含まれます。 OCR API では、複数の言語で印刷されたテキストの抽出がサポートされます。 使用を開始するには、OCR クイックスタートに従ってください。 |
デジタル資産管理のための Azure Vision
Azure Vision は、多くのデジタル資産管理 (DAM) シナリオに対応できます。 DAM は、リッチ メディア アセットの整理、保管、取得、およびデジタルの権利とアクセス許可の管理を行うビジネス プロセスです。 たとえば、会社では、表示されるロゴ、顔、オブジェクト、色などに基づいて画像をグループ化して識別したい場合があります。 または、画像のキャプションを自動的に生成し、キーワードを添付して検索できるようにする場合もあります。 Foundry Tools、Azure AI Search、インテリジェント レポートを使用したオールインワン DAM ソリューションについては、GitHub の ナレッジ マイニング ソリューション アクセラレータ ガイド を参照してください。 その他の DAM の例については、 Azure Vision ソリューション テンプレート リポジトリを 参照してください。
概要
アプリへの Azure Vision の構築を開始するには、クイック スタートに従います。
イメージの要件
Azure Vision では、次の要件を満たす画像を分析できます。
- 画像は JPEG、PNG、GIF、または BMP 形式である必要があります。
- イメージのファイル サイズは 4 メガバイト (MB) 未満である必要があります。
- 画像の寸法は、50 x 50 ピクセルを超える必要があります。
- Read API の場合、画像の寸法は、50 x 50 から 10,000 x 10,000 ピクセルの間である必要があります。
データのプライバシーとセキュリティ
すべての Foundry Tools と同様に、Azure Vision を使用する開発者は、顧客データに関する Microsoft のポリシーに注意する必要があります。 詳細については、Microsoft セキュリティ センターの Foundry Tools ページ を参照してください。
次のステップ
クイックスタートに従って、任意の開発言語でサービスを実装して実行します。