【要約】Windows + RTX 5080 で faster-whisper を動かすまでの記録 [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
以下の技術的課題が発生した。
- ・CUDA 13.2環境では、CTranslate2が要求するCUDA 12系DLL(
cublas64_12.dll等)が存在しない。 - ・
pipでDLLを導入しても、WindowsのDLL検索順序によりC++バイナリから参照できない。 - ・Pythonの
os.add_dll_directory()では、CTranslate2内部のLoadLibraryを解決できない。
// Approach
以下の手順で解決を図った。
1.
nvidia-cublas-cu12 等のパッケージを pip で導入。2.
__import__ と __path__ を用い、名前空間パッケージから bin ディレクトリを動的に特定。3.
os.environ["PATH"] に特定したパスを先頭追加し、プロセスの検索パスを拡張。4.
os.add_dll_directory() を併用し、Python側からのロードも担保。// Result
RTX 5080にて、音声長に対し約9倍のリアルタイム速度を達成した。VRAM使用量はWhisper large-v3 (float16) で約4GBに抑制。JITコンパイルにより、2回目以降の推論速度が大幅に向上し、実用的な性能を確認した。
Senior Engineer Insight
> 最新のBlackwell世代GPUでも、ライブラリのABI互換性が開発の障壁となる。特にWindows環境では、Pythonの検索パスとOSの検索パスの乖離が致命的だ。本記事の解決策は、パッケージのインストール先を動的に特定しており、環境依存を最小化できる。VRAM効率も高く、ローカルLLMとの統合において極めて実用的な選択肢である。再現性を確保するため、環境変数への手動介入ではなく、スクリプト内でのパス解決を標準化すべきである。