【要約】OBS WebSocket × mlx-whisper × ollama でつくる、完全ローカルのMTG議事録自動生成 [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
開発者は、既存の議事録ツールを利用する際、機密情報の流出リスクと運用の非効率性に直面した。
- ・会議音声や文字起こしデータを外部サービスへ送信することへのセキュリティ懸念。
- ・ファイル容量の制限や、手動でのアップロード作業に伴う手間。
- ・録画後に手動で文字起こしを実行しなければならない、作業フローの断絶。
// Approach
開発者は、外部依存を排除し、Apple Siliconの性能を最大限に引き出す設計を採用した。
- ・OBS WebSocketを用いて、録画停止イベントをリアルタイムに検知する。
- ・mlx-whisperにより、ローカルGPUで高速な文字起こしを実行する。
- ・ollamaによるローカル要約と、Claudeによる高精度要約を切り替え可能にする。
- ・長尺の会議に対応するため、Map-reduce手法で要約を行う。
// Result
開発者は、録画を停止するだけで議事録が完成する、極めて手離れの良い環境を実現した。
- ・録画停止からMarkdown形式の議事録出力までを完全に自動化した。
- ・音声データを端末外に出さず、高いセキュリティレベルを維持した。
- ・gemma3:4b等の軽量モデルを用い、実用的な要約精度を確保した。
Senior Engineer Insight
> Apple SiliconのMLXを活用し、ローカルでの推論性能を最大限に引き出している。設定一つでClaudeと切り替え、プライバシーと精度の両立を図った点は賢明だ。ただし、長尺会議ではMap-reduceの精度に依存するため、要約ロジックの堅牢性が運用の鍵となる。個人利用としては完成度が高いが、組織導入にはリソース管理の観点での検証が不可欠である。