【要約】MCPのProgressive DiscoveryとTOONでエージェントを自己進化させる【AI FinOps】 [Zenn_Python] | Summary by TechDistill

> Source: Zenn_Python

Execute Primary Source

// Problem

AIエージェントの自律運用において、開発者はトークン消費の肥大化と推論精度の低下という二重の課題に直面している。エージェントが長時間稼働するにつれ、以下の問題が顕在化する。

・コスト増：毎ターンのコンテキスト固定費が無視できないレベルに達する。
・精度低下：コンテキストの肥大化により「Lost-in-the-middle」問題が発生する。
・データの冗長性：JSON形式による履歴管理では、キーの繰り返しによりトークンを浪費する。
・ツールの過剰ロード：MCPサーバー接続時に、未使用のツール定義までロードされ固定費を圧迫する。

// Approach

エージェントの運用効率を最大化するため、データ構造の圧縮とツールの動的ロードを組み合わせた最適化を行う。具体的には以下の手法を採用する。

・TOONの採用：冗長なJSONを廃止し、高圧縮な「TOON (Token-Optimized Object Notation)」で状態を管理する。
・Progressive Discovery：タスク進行に応じて、必要なツールのみを動的にロードするルールを適用する。
・最小権限の適用：settings.jsonのincludeToolsを用い、ツール定義を最小限に絞り込む。
・自己進化パイプライン：Web検索、NotebookLMによる分析、ルールの自動書き換え、Codexによる検証、Gitへの適用というサイクルを回す。

// Result

本手法の導入により、エージェントのコンテキスト消費を抑制し、重要な推論にトークンを集中させる成果を得た。

・コスト削減：TOONの導入により、履歴蓄積時のトークン消費を大幅に低減した。
・精度維持：Progressive Discoveryにより、不要なツール定義による文脈の圧迫を回避した。
・今後の展望：NotebookLMの提案に基づき、RAG（検索ベースのメモリ）による動的な記憶管理の実装を目指す。

Senior Engineer Insight

> エージェントの自律性を「自己進化」として実装する設計は、AI FinOpsの観点から極めて合理的だ。特に、MCPツールの動的ロードは、実運用におけるトークンコスト管理の要となる。ただし、動的ロードに伴うレイテンシ増大や、自己書き換えによるシステムの不安定化リスクには注意が必要だ。RAGによるメモリ管理への移行は、スケーラビリティ確保のために不可欠なステップと言える。

TechDistill.dev

【要約】MCPのProgressive DiscoveryとTOONでエージェントを自己進化させる【AI FinOps】 [Zenn_Python] | Summary by TechDistill

// Problem

// Approach

// Result

Senior Engineer Insight

[ RELATED_KERNELS_DETECTED ]

mypyがしれっと2.xになっていた件

AI外部脳の設計——「記憶は生成するもの」という一つの解

[IBM Bob] Bob 2.0提供開始 - 最新版へのアップデート方法

Python で Excel を PDF に変換するシンプルな方法