【要約】大阪のカフェ市場を分析して出店診断アプリを作ってみた [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
開発者が、大阪のカフェ市場における供給の偏りや店舗特性をデータに基づき明らかにすることを目的として、以下の課題を設定した。都市部でのカフェ難民発生や、エリア特性と店舗タイプの不一致といった構造的な問題を解決したいと考えた。具体的には、以下の2点に焦点を当てている。
- ・供給の偏りを可視化し、どのエリアにどのような店舗が集中しているかを把握する。
- ・店舗の設備や立地、営業スタイルから、カフェを類型化し、出店者の戦略立案を支援する。
// Approach
開発者が、Pythonを用いてAPIから取得した非構造化データを数値化し、教師なし学習による類型化を行った。まず、Hotpepper APIから約1,150件のデータを取得した。次に、正規表現を用いて、自由記述形式の徒歩時間や定休日などの情報を数値データへ変換した。その上で、以下のステップで分析を進めた。
- ・K-Meansクラスタリングによる5つの店舗タイプへの分類。
- ・PCAを用いたクラスタ間の関係性の可視化。
- ・Streamlitを用いた、ユーザー入力に基づく診断アプリの開発。
// Result
開発者が、大阪のカフェを特性の異なる5つのタイプに分類し、出店支援ツールを完成させた。これにより、出店予定者が自身の計画を客観的に評価できる環境を構築した。具体的な成果は以下の通りである。
- ・「駅近ランチ」「大衆コンセプト」「大人向け」「郊外ランチ」「都市部大規模」の5分類を特定。
- ・入力値から想定タイプや出店戦略、エリア内の競合傾向を提示するアプリを実現。
- ・供給密度の数値化により、地域名に依存しない店舗分類を可能にした。
Senior Engineer Insight
> データクレンジングにおける正規表現の活用が極めて実用的である。APIの自由記述を数値化する泥臭い処理が、分析の精度を支えている。ただし、本件は供給データのみの分析である。実ビジネスの意思決定に用いるには、人口統計等の需要データとの結合が必須となる。スケーラビリティの観点では、APIの取得制限やデータの鮮度管理が運用上の課題となるだろう。