【要約】Gemini Groundingが高すぎた話。月1,000回無料のTavily APIで競合監視と営業DXを激安で実現した [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
開発者がAIによる最新情報の取得を自動化する際、コストと安定性の両立という課題に直面している。具体的には以下の問題が挙げられる。
- ・Gemini Groundingのコスト増:1回あたり約5.5円を要し、大量のデータ処理では費用が膨大になる。
- ・スクレイピングの不安定性:無料ライブラリを用いた手法は、サイト構造の変化や規約違反のリスクを伴う。
- ・既存APIの終了:Google Custom Search APIが2027年に廃止予定であり、新規導入の選択肢から外れている。
// Approach
検索と生成のプロセスを分離し、AI特化型検索APIを活用する構成を採用した。検索コストを抑えつつ、安定したデータ取得を実現するために以下のステップを踏んでいる。
- ・Tavily APIの導入:AIエージェント向けに設計された検索APIを利用し、検索結果のテキストを取得する。
- ・パイプラインの構築:SearchModelWrapperクラスを設計し、「Tavilyで検索 → 結果をプロンプトに埋め込む → Geminiで処理」という流れを実装した。
- ・プロンプトの最適化:出力フォーマットを厳密に固定し、後続のパースやExcel出力の自動化を容易にした。
// Result
検索コストを劇的に削減し、実用的な業務自動化を実現した。具体的な成果は以下の通りである。
- ・コストの大幅削減:100社の調査コストを、Gemini Groundingの約550円から、ほぼ無料(数円程度)まで圧縮した。
- ・業務の自動化:競合ニュースのSlack通知や、プロ仕様のExcelレポート生成をPythonで完結させた。
- ・運用の安定化:APIベースの構成により、スクレイピングのようなサイト変更による停止リスクを排除した。
Senior Engineer Insight
> コスト効率と安定性のバランスを重視した、極めて実戦的なアプローチである。Gemini Groundingのような「フルマネージドな利便性」をあえて捨て、APIを組み合わせることで、運用コストを1/100以下に抑えた点は評価できる。ただし、検索結果の質がLLMの回答精度に直結するため、Tavilyの検索パラメータ(Advanced検索等)の最適化が運用の鍵となる。スケーラビリティの観点では、API制限やレートリミットへの考慮が不可欠だ。