【要約】Windows + RTX 5080 で faster-whisper を動かすまでの記録 [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
最新のBlackwell世代GPUとCUDA 13環境において、CTranslate2が要求するCUDA 12系のDLL(cublas64_12.dll等)がシステムに見つからず、推論開始時にRuntimeErrorが発生する。Pythonの`os.add_dll_directory()`だけでは、C++ネイティブバイナリによる動的ロードに対応できない点が課題である。
// Approach
`nvidia-*-cu12`パッケージの`__path__`属性を利用して、環境に依存せずDLLの所在を特定する。Windowsではプロセスの`PATH`環境変数と`os.add_dll_directory()`の両方にパスを追加することで、Python層とC++ネイティブ層の両方からライブラリを参照可能にする実装を行った。
// Result
スクリプト単体で環境構築を完結させることに成功。RTX 5080を用いた推論では、2回目以降の実行で約9倍のリアルタイム速度を達成し、VRAM使用量は約4GBに収まった。最新ハードウェアにおける音声認識パイプラインの実現可能性を示した。
Senior Engineer Insight
> 最新のBlackwell世代(sm_120)とCUDA 13という、ライブラリ側の対応が追いついていない「最先端の不整合」に対する極めて実践的なトラブルシューティングである。特に、PythonのDLLロード機構とC++の`LoadLibrary`の挙動の違いを正確に捉え、`PATH`への動的注入で解決するアプローチは、環境構築の自動化において極めて重要だ。実運用においては、こうした依存関係の不整合がCI/CDやコンテナ環境でのデプロイを阻害するため、本稿のような「パッケージの内部構造を利用したパス解決」は、開発体験(DX)と再現性を両立させる優れたパターンと言える。