【要約】🪡この春、マルチエージェントOSSをゼロから作ってApache-2.0で公開した話 [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
開発者は、エージェントの精度を左右する「ドメイン特化の知見」が、特定の個人のローカル環境に閉じ込められる問題に直面した。汎用フレームワークでは、知識の蓄積プロセスが実装者に丸投げされている。
- ・シニアエンジニアの暗黙知が、退職等に伴い蒸発するリスクがある。
- ・「効くプロンプト」が個人の引き出しに留まり、組織知にならない。
- ・既存ツールは設定が複雑で、評価のエビデンスも不足している。
// Approach
開発者は、個人のメモリを組織の共有メモリへ自動的に昇格させる「5層メモリスタック」と「3経路評価エンジン」を実装した。
- ・5層メモリ: L1(個人)からL4(Git管理の不変データ)まで階層化。
- ・3経路評価: 頻度(Z-score正規化)、成果相関、LLM自己評価を並行評価。
- ・拡張設計:
praxia.extensions.Registryにより、コアを汚さず拡張可能。 - ・機能同梱: SSO、RBAC、13種のOAuth、KMS暗号化をApache-2.0で提供。
// Result
開発者は、開発開始から約5週間で、v0.1.0をPyPIおよびGitHubで公開した。
- ・25,000 LoC、431件のテスト、100以上のLLMプロバイダをサポート。
- ・SSOやRBAC等の商用SaaSが有料化する機能をOSSとして提供。
- ・今後はTiDB Vectorやマルチテナント機能の実装を予定している。
- ・「個人の天才性 × 組織の継続性」をAIで結びつける基盤を目指す。
Senior Engineer Insight
> 知識の「昇格」を自動化する設計は、エージェント運用のボトルネックを突いた鋭いアプローチだ。特に、LLMの非決定性を考慮したN=3の中央値採用や、Z-scoreによる頻度の正規化など、実戦的な数値処理がなされている。ただし、Composite backendにおける書き込みの整合性や、メモリの重複排除(Fuzzy dedup)の閾値管理は、運用フェーズでの複雑性を増大させる。大規模環境では、これらメモリ層の整合性維持が新たな管理コストとなるだろう。