【要約】SEOをデータパイプラインで解いた話 — GA4・Trends・GSCを繋いで「次に書くべき記事」を出す [Zenn_Python] | Summary by TechDistill
> Source: Zenn_Python
Execute Primary Source
// Problem
技術ブログの運営者が、コンテンツ制作における「需要予測」と「実績分析」の乖離という課題に直面している。ネタの検索需要が不明、あるいは既存データとトレンドが分断されていることが原因だ。具体的には以下の問題がある。
- ・ネタの検索需要が不明で、書いた後に需要がないことが判明する。
- ・GA4は過去の実績を示すが、次の一手を示さない。
- ・Google Trendsはトレンドを示すが、自社サイトのデータと紐付かない。
// Approach
筆者は、3つのデータソースをJSONインターフェースで繋ぐ、疎結合な3段パイプラインを構築した。これにより、各工程を独立して動作・テストできる設計を実現している。
1.ga-analyzer: GA4 Data APIから実績を取得し、正規表現でキーワードを前処理する。
2.trends-analyzer: pytrendsを用い、トレンドの方向性を3値に分類する。
3.seo-content-planner: 各指標に重み付けを行い、最大130点のスコアで提案する。
// Result
このパイプラインにより、次に書くべき記事の優先順位を定量的に算出できるようになった。トレンド感度やビジネスファネルを考慮したスコアリングが可能だ。
- ・トレンドの変動を反映した配点設計の実現。
- ・検討層の記事を促すファネルボーナスの導入。
- ・実運用を通じた、キャッシュ実装やIPブロック対策の確立。
Senior Engineer Insight
> 設計思想として、JSONを介した疎結合なパイプラインを採用している点が極めて実践的だ。これにより、各モジュールの独立したテストや、段階的な機能追加が可能になっている。マーケティングの定性的な判断を、重み付けという計算式に落とし込んだ点も評価できる。ただし、pytrendsのIPブロック対策など、外部APIの制約に対する運用設計が運用の成否を分けるだろう。