【要約】MCPのProgressive DiscoveryとTOONでエージェントを自己進化させる【AI FinOps】 [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
AIエージェントの自律運用において、開発者はトークン消費の肥大化と推論精度の低下という二重の課題に直面している。エージェントが長時間稼働するにつれ、以下の問題が顕在化する。
- ・コスト増:毎ターンのコンテキスト固定費が無視できないレベルに達する。
- ・精度低下:コンテキストの肥大化により「Lost-in-the-middle」問題が発生する。
- ・データの冗長性:JSON形式による履歴管理では、キーの繰り返しによりトークンを浪費する。
- ・ツールの過剰ロード:MCPサーバー接続時に、未使用のツール定義までロードされ固定費を圧迫する。
// Approach
エージェントの運用効率を最大化するため、データ構造の圧縮とツールの動的ロードを組み合わせた最適化を行う。具体的には以下の手法を採用する。
- ・TOONの採用:冗長なJSONを廃止し、高圧縮な「TOON (Token-Optimized Object Notation)」で状態を管理する。
- ・Progressive Discovery:タスク進行に応じて、必要なツールのみを動的にロードするルールを適用する。
- ・最小権限の適用:
settings.jsonのincludeToolsを用い、ツール定義を最小限に絞り込む。 - ・自己進化パイプライン:Web検索、NotebookLMによる分析、ルールの自動書き換え、Codexによる検証、Gitへの適用というサイクルを回す。
// Result
本手法の導入により、エージェントのコンテキスト消費を抑制し、重要な推論にトークンを集中させる成果を得た。
- ・コスト削減:TOONの導入により、履歴蓄積時のトークン消費を大幅に低減した。
- ・精度維持:Progressive Discoveryにより、不要なツール定義による文脈の圧迫を回避した。
- ・今後の展望:NotebookLMの提案に基づき、RAG(検索ベースのメモリ)による動的な記憶管理の実装を目指す。
Senior Engineer Insight
> エージェントの自律性を「自己進化」として実装する設計は、AI FinOpsの観点から極めて合理的だ。特に、MCPツールの動的ロードは、実運用におけるトークンコスト管理の要となる。ただし、動的ロードに伴うレイテンシ増大や、自己書き換えによるシステムの不安定化リスクには注意が必要だ。RAGによるメモリ管理への移行は、スケーラビリティ確保のために不可欠なステップと言える。