【要約】Cursor Composer 2.5 を Codens の executor lane に追加した話 (Opus の 1/10 コスト + [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
Codensの開発チームは、AIエージェントの運用コスト増大という課題に直面した。高コストなモデルの利用は、リトライ構造を持つエージェント運用において、総コストを指数関数的に増大させる。
- ・高コストなClaude Opus等の利用による、リトライ回数に比例した総コストの増大。
- ・ベンチマーク上の性能と、実際のコードベースにおける信頼性の乖離。
- ・既存の実行パスを変更することによる、本番環境へのデグレリスク。
// Approach
開発チームは、既存の実行構造を維持しつつ、新しいレーンを安全に追加する手法を採用した。既存パスへの影響を最小化し、ロールバックの容易性を最優先した設計を行っている。
- ・既存パスを触らず、新しいEnumとRunnerを追加する設計。
- ・ロールバックを容易にするため、DB定義とSDK実装を2フェーズに分離。
- ・SQLによる1プロジェクト限定のCanaryリリースによる段階的な展開。
- ・失敗時の差分を保存するSalvage機能や、詳細なエラー表示によるUX改善。
// Result
導入により、Opusの1/10という劇的なコスト削減の可能性が示された。検証を通じて、実運用特有の失敗モードを特定し、運用の継続性を高める改善を実現している。
- ・検証を通じて、Bridge drop等の特有の失敗モードを特定。
- ・失敗時の差分をPRとして救済する仕組みにより、運用の継続性を向上。
- ・マルチモデル構成の確立により、プロバイダー依存のリスク分散を実現。
Senior Engineer Insight
> コスト削減において、性能比較だけでなく「観察可能性」と「リカバリ」に注力した点が実戦的だ。特に、接続断による作業喪失を防ぐSalvageの実装は、現場の痛みを理解した判断である。マルチモデル構成を「リスク分散のオプション」と捉える視点は、SaaS運用におけるレジリエンスを高める上で不可欠な戦略だ。