【要約】Azure AI フル活用で作る自治体向け行政手続き案内チャットボット【第2回:RAG実装と設計ポイント】 [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
自治体の行政手続き案内において、LLMが誤った情報を生成するハルシネーションや、情報の鮮度不足が課題となっている。開発者は、正確な情報提供と、外国人住民を含む多様なユーザーへのアクセシビリティ確保を両立させる必要がある。
- ・LLMによる虚偽回答(ハルシネーション)のリスク。
- ・最新の行政情報の動的な反映。
- ・多言語ユーザーへの対応コスト。
- ・音声入力における操作性の欠如。
// Approach
開発チームは、Azure AIサービスを統合したRAGアーキテクチャを採用し、情報の正確性と操作性を向上させた。検索精度を高めるために、キーワード検索とベクトル検索を組み合わせたハイブリッド検索を実装している。
- ・RAGパイプラインの構築:Beautiful Soupによる収集、1,000文字単位のチャンキング、text-embedding-3-smallによるベクトル化を実施。
- ・ハイブリッド検索の採用:Azure AI Searchを用い、BM25とHNSWアルゴリズムをRRFで統合。
- ・多言語・音声対応:翻訳レイヤーの導入と、Azure Speech SDKによる連続音声認識(startContinuousRecognitionAsync)の実装。
- ・セキュアな運用:Azure Functionsによる短期トークン発行と、SWA組み込み認証によるアクセス制御を適用。
// Result
Azure AIの各機能を組み合わせることで、正確かつ多言語対応が可能な行政案内基盤を実現した。これにより、ユーザーは言語の壁を越えて、音声やテキストで迅速に手続き情報を取得できる。
- ・RAG導入による回答精度の向上とハルシネーションの抑制。
- ・連続音声認識による、途切れないスムーズな音声入力体験の提供。
- ・Azure PipelinesとSWAを用いた、セキュアで自動化されたデプロイ環境の構築。
Senior Engineer Insight
> 実戦的な構成である。特にハイブリッド検索とRRFの採用は、検索精度の担保において定石といえる。音声認識に『連続認識』を選択している点も、UXへの深い理解が伺える。ただし、大規模運用時にはAzure Functionsのコールドスタート対策や、スクレイピング後のデータ更新パイプラインの自動化が必須となるだろう。また、SWAの組み込み認証を利用したアクセス制御は、ハッカソン等の限定的な検証環境において極めて効率的な選択である。