0章 全体概要紹介
Azure OpenAI Service 入門ハンズオンラボ V2 - AI Chat + 社内文書検索
このページの動画解説をご視聴される場合は、こちらをご活用ください。
概要
このデモは、ChatGPT ライクなインターフェースを使用して企業の社内文書を検索するアプリケーションの実装パターンです。デモアプリを利用するためには、Azure OpenAI Service の ChatGPT (gpt-4o-mini) モデルと、Azure AI Search、他にいくつかのリソースの作成が必要です。
このリポジトリでは、サンプルデータに 厚生労働省のモデル就業規則 を使用しています。
使用技術
このデモでは以下の Azure サービスを使用します:
| サービス | 役割 | バージョン/SKU |
|---|---|---|
| Azure OpenAI Service | gpt-4o-mini モデル | 2024-07-18 (Global Standard) |
| Azure AI Search | ドキュメント検索 | Basic/Standard |
| Azure Document Intelligence | PDF 解析 | v4.0 (2024-11-30 GA) |
| Azure Container Apps | アプリケーションホスティング | - |
| Azure Cosmos DB | チャット履歴保存 | - |
| Azure Storage Account | ドキュメントストレージ | - |
このシナリオの特徴
グローバルスタンダードデプロイメントの採用
このデモでは、Azure OpenAI Service にグローバルスタンダードデプロイメントを採用しています。これは、複数のリージョンにまたがって展開されたモデルで、高可用性とスケーラビリティを提供します。
| 項目 | 標準デプロイメント | グローバルスタンダードデプロイメント |
|---|---|---|
| リージョン | 特定リージョンに固定 | 複数リージョンに分散展開 |
| 可用性 | リージョン障害の影響を受ける | 高可用性(複数リージョンで冗長化) |
| スケーラビリティ | リージョン内の容量制限あり | グローバルな容量プール |
| レイテンシ | リージョンに依存 | 自動的に最適なリージョンにルーティング |
| 料金体系 | トークンベース(PTU) | トークンベース(グローバル価格) |
API バージョン 2025-04-01-preview の使用
このデモでは、最新の Preview 版 API 2025-04-01-preview を使用しています。
Preview 版を使用する理由:
- グローバルスタンダードデプロイメントの最新機能をサポート
- 新しいモデルバージョン(gpt-4o-mini 2024-07-18)との互換性
- 最新の機能拡張や改善を先行して利用可能
注意事項:
- Preview 版 API は本番環境での使用前に十分な検証が必要です
- 将来の GA 版リリース時に仕様変更の可能性があります
- 本番環境での利用前には最新の GA 版 API への移行を検討してください
Azure Document Intelligence v4.0 の採用
このデモでは、Azure Document Intelligence(旧 Azure Form Recognizer)の v4.0(最新 GA 版)を使用しています。v4.0 は以下の改善を提供します:
- より高精度なドキュメント解析
- 複雑なレイアウトへの対応改善
- 処理速度の向上
- 新しいドキュメントタイプのサポート
デモアプリは以下のように動作します。
Architecture
UI