【要約】Pythonでパレート図を自動生成 — 不良データの集計・ソート・累積%まで全コード [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
製造現場の品質管理担当者が、月次の品質会議に向けてExcelでパレート図を手作業で作成している。このプロセスは以下の課題を抱えている。
- ・データのソートや累積%の計算に多大な時間を要する。
- ・手計算や手動操作による計算ミスや描画ミスのリスクがある。
- ・毎月繰り返される定型業務であり、自動化によるコスト削減の余地が大きい。
// Approach
Pythonを用いて、データの読み込みからグラフ保存までを一貫して行う自動化スクリプトを実装する。具体的な手法は以下の通りである。
- ・pandasでCSVまたはExcelを読み込み、データの集計を行う。
- ・データを降順にソートし、累積パーセンテージを算出する。
- ・matplotlibのtwinx()を利用し、件数と累積%の2軸グラフを作成する。
- ・しきい値を示す水平線と、境界を示す垂直線を自動で描画する。
// Result
品質管理担当者が、データを差し替えて実行するだけで正確なパレート図を即座に生成できる。これにより以下の成果が得られる。
- ・Excelでの手作業(10〜20分)を、数秒の実行に短縮できる。
- ・生データから直接グラフ化でき、集計工程のミスを排除できる。
- ・しきい値の可視化により、重点対策項目の特定が容易になる。
Senior Engineer Insight
> 定型業務の自動化として、極めて実用的かつ低コストな解決策である。pandasとmatplotlibの組み合わせは、データの柔軟性と描画の精密さを両立している。実運用では、日本語フォントの管理や、複数ファイルを一括処理するバッチ機能の追加が望ましい。単なるスクリプトに留めず、データパイプラインの一部として組み込むことで、真の運用効率化が実現する。