【要約】VBAしか書けなかった会社員が、eラーニング動画制作をPythonで自動化してSaaS公開するまで [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
eラーニング動画制作における、スライド作成、音声生成、編集、字幕入れといった一連の手作業に伴う膨大な工数と、修正発生時の手戻りの大きさ。また、単なるスクリプト運用では、パラメータの微調整や非エンジニアへの提供、エラーハンドリングといった、実運用に必要な機能が不足するという課題。
// Approach
Google Cloud Text-to-Speechによる音声生成とFFmpegによる動画結合をPythonで自動化。その後、FastAPIとNext.jsを用いたWebアプリへ昇華させ、PowerPoint COM APIの利用を前提としたGCP上のWindows Server VMをインフラに採用。認証にFirebase、決済にStripeを導入した。
// Result
数時間要していた動画制作を数分に短縮。スクリプトからSaaSへの進化を通じて、認証、決済、エラーハンドリングといった「アプリケーションとしての周辺機能」の重要性を実証した。また、個人開発における月額約6,000〜7,000円という現実的な運用コストモデルも提示している。
Senior Engineer Insight
> 本事例は、単なる自動化スクリプトと、商用SaaSとしてのプロダクトの境界線を明確に示している。技術選定において、PowerPoint COMの制約からWindows Serverを選択する判断は、理想論に走らず実利を取る現場主義的なアプローチである。しかし、単一VMへの集約は単一障害点(SPOF)となり、スケーラビリティに課題を残す。実運用を拡大するならば、ジョブキューによる非同期処理の分離や、Windows環境の抽象化が次のフェーズとなるだろう。AIを『思考の補助』として使いこなし、設計の責務を自ら引き受ける姿勢は、現代のエンジニアが範とすべきものである。