【要約】VOICEVOX EngineとLambda Web Adapterでサーバレスずんだもんを開発した話 [Qiita_Trend] | Summary by TechDistill
> Source: Qiita_Trend
Execute Primary Source
// Problem
- ・常時起動による、リクエスト不在時の固定費発生。\n・Webサーバ(FastAPI)とLambdaの実行モデルの不整合。\n・Lambda環境におけるホームディレクトリの読み取り専用制約。\n・gosuユーザ実行時の権限エラー。
// Approach
1.LWAをLambda Extensionとして導入し、HTTPリクエストをWebサーバへ転送。\n2. Dockerfileで
HOME 等の環境変数を /tmp に設定し、書き込み権限問題を回避。\n3. AWS_LWA_INVOKE_MODE=response_stream を指定。\n4. API Gatewayの response-streaming-invocations URIを使用し、音声データをチャンク転送。\n5. ARM64 (Graviton) アーキテクチャを採用し、コストを最適化。// Result
従量課金モデルによる維持費の最小化を実現。AIエージェント(MCP等)との容易な統合が可能となった。音声合成のバックエンドとして、極めて低コストな運用基盤を構築した。
Senior Engineer Insight
>
コスト効率の観点で極めて合理的な設計である。LWAによるポータビリティ確保は、開発・テスト・本番の環境差異を埋める優れた手法だ。しかし、コンテナサイズが大きく、Cold Startが100秒を超える点は実用上の懸念。リアルタイム性が必須な用途では、プロビジョニング済みコンカレンシーの併用が不可欠となる。スケーラビリティとコストのトレードオフを考慮すべきである。