【要約】生成AIデバッグアシスタント「aidbg」— 手順書を差し替えればどんな検証にも、設計か検証環境かを切り分ける [Zenn_Python] | Summary by TechDistill

> Source: Zenn_Python

// Problem

SoC検証の現場において、エンジニアは不具合の原因が設計（Design）にあるのか、検証環境（Verification-env）にあるのかを特定するために膨大な時間を費やしている。\n・不具合の切り分け作業が属人的であり、解析に多大な工数がかかる。\n・従来のツールでは判断ロジックをPythonコードで実装する必要があり、新しい検証ドメインへの適応が困難であった。\n・大規模な波形データやログをLLMに直接入力することは、トークン制限等の制約から困難である。

// Approach

開発者は、判断ロジックをコードから「手順書」へと分離する3層アーキテクチャを採用した。\n・toolbox: エージェントが事実を取得するための、read-onlyなプリミティブ（aidbg query, blame等）を提供する。\n・profile: ペルソナやレポート様式、使用する手順書を定義し、主戦場を切り替える。\n・skills: Markdown形式で記述されたドメイン知識（手順書）により、LLMに調査手順と判断基準を指示する。\n・LLMは、提供された道具を用いて事実を集め、手順書に従って「設計か検証環境か」を推論する。

// Result

開発者は、低性能なLLMであっても手順書を用いることで、複雑なデバッグタスクを遂行できることを実証した。\n・APBレジスタのread不一致において、手順書なしでは誤判定していた無料モデルが、手順書適用により設計と検証環境を正しく判別した。\n・「設計か検証環境か」の切り分けを、git blameを用いたコミット特定まで含めて自動化できる。\n・今後は、高水準なプリミティブの拡充や、外部手順書パックの配布を目指している。

Senior Engineer Insight

> 本アーキテクチャの白眉は、知能（LLM）と知識（Markdown）を分離した点にある。判断ロジックをコードではなく手順書に寄せた設計は、検証ドメインの変遷が激しい半導体業界において極めてスケーラブルだ。また、read-onlyなプリミティブに徹することで、検証環境の整合性を担保している点も実戦的である。低コストなモデルでも手順書で精度を底上げできる点は、運用コスト抑制の観点からも高く評価できる。

TechDistill.dev

【要約】生成AIデバッグアシスタント「aidbg」— 手順書を差し替えればどんな検証にも、設計か検証環境かを切り分ける [Zenn_Python] | Summary by TechDistill

// Problem

// Approach

// Result

Senior Engineer Insight

[ RELATED_KERNELS_DETECTED ]

ローカルLLMでハルシネーションを見抜く

相手の声をローカルで字幕化して『返答案』まで出す通訳ツールを作った（Koe Interpreter）

【永久0円】人間LLMのすすめ

Gemini APIのGoogleマップ・グラウンディングを検証！あり・なしで回答を比べてみた