【要約】【AWS】デジタル庁の生成AI基盤「源内(GenAI)」でRAG環境を構築してみた [Qiita_Trend] | Summary by TechDistill
> Source: Qiita_Trend
Execute Primary Source
// Problem
開発者が「源内」基盤上でRAG環境を構築しようとした際、既存のIaCコードがSSO環境を前提としているためにデプロイが困難な状況に直面した。具体的には以下の課題が存在する。
- ・IAMロールの信頼関係がSSO(IAM Identity Center)のパスを前提としている。
- ・AWSサービスのクォータ制限により、デフォルトのLambdaタイムアウト値では動作しない。
- ・OpenSearch Serverlessの名称制限によるエラーのリスクがある。
// Approach
開発者は、既存のCDKコードおよび設定ファイルを、IAMユーザー環境およびクォータ制限に合わせてカスタマイズした。以下のステップで環境を構築している。
- ・
switch-role-stack.tsを修正し、ARNを直接指定してSSOなしでAssumeRole可能にした。 - ・
cdk.jsonでAPI Lambdaのタイムアウトを29秒に短縮し、クォータ制限に対応した。 - ・
parameter.tsでNAT GatewayのEIPを指定し、ネットワーク経路を確保した。 - ・
qerag.tomlでモデルIDにjp.amazon.nova-2-lite-v1:0を指定した。
// Result
CDKによる一括デプロイにより、API Gateway、Lambda、Bedrock Knowledge Baseを含むRAG環境が構築された。これにより以下の成果が得られた。
- ・API EndpointとApiKeyIdの取得により、外部アプリからのRAG呼び出しが可能になった。
- ・S3に格納したドキュメントに基づき、Bedrockが正確な回答を生成する動作を確認した。
- ・
cdk destroyコマンドにより、環境の完全な削除も容易に実現した。
Senior Engineer Insight
> 基盤側の制約(SSO前提など)をコードレベルで回避する手法は、実戦において極めて重要である。IAMの信頼関係やネットワーク経路(EIP)の明示的な指定は、大規模環境の構築において必須のスキルだ。ただし、デプロイに20〜30分を要する点は、CI/CDパイプラインへの組み込み時に課題となる。また、クォータ制限への依存は、スケーラビリティの観点から運用設計時に慎重な検討が必要である。