サーバーログに二つの request が並んでいるとします。ひとつは GPTBot/1.0 が /products/solar-panel-400w を取得したもの。もうひとつは ChatGPT-User/1.0 が同じページを取得したもの。どちらも OpenAI 系の IP range から来ています。
GA4 ではどちらも見えません。GA4 は client-side JavaScript に依存しており、AI crawler は JavaScript を実行しないからです。GSC でも見えません。GSC の AI report は Google 自社の AI features における表示を扱うだけです。多くの analytics tool では、これらは単に bot traffic として捨てられます。
しかし商業的な意味はまったく違います。
GPTBot はモデル学習のためにページを読む可能性があります。これは長期的な知識基盤への貢献です。将来の AI response があなたのブランドを知るかもしれませんが、今すぐ誰かが買おうとしているとは限りません。
ChatGPT-User は、実際のユーザーが会話の中であなたのブランドや商品について質問し、ChatGPT が最新情報を得るためにページを取得している可能性があります。これはリアルタイムで高意図の商業シグナルです。前者の直接的な商業価値は低く(長期的なブランド知識への間接貢献)、後者は高意図の見込み顧客シグナルです。
五つの AI crawler intent
公式ドキュメントや User-Agent 標準に基づくと、AI crawler の訪問は大きく五つの intent に分類できます。
1. Training。 代表例は GPTBot、ClaudeBot、Meta-ExternalAgent、GoogleOther、Bytespider、CCBot です。目的はモデル学習データの収集です。高頻度、広範囲、リアルタイム性への関心が低いという特徴があります。商業価値は長期基盤価値です。ブランドがやるべきことは、学習させたい情報を正確に整え、robots.txt と llms.txt を適切に使うことです。誤った価格や古い製品情報が学習されると、将来の AI response に誤りが残ります。
2. Indexing。 AI search engine が検索用 index を構築するための crawling です。従来の Googlebot に近い役割ですが、Schema、title、description、Open Graph など機械可読な構造を強く参照します。商業価値はインフラ価値です。index されなければ推薦候補になりませんが、index されたこと自体は推薦を意味しません。
3. Search。 OAI-SearchBot、PerplexityBot、Claude-SearchBot、Google-CloudVertexBot などが、ユーザーの検索 query に応答するために関連ページをリアルタイムで取得します。これは市場需要シグナルです。誰かがそのカテゴリーを AI search で調べています。Answer-First 構造、FAQ、価格・在庫・仕様の鮮度が重要になります。
4. User Fetch。 ChatGPT-User、Claude-User、Perplexity-User などは、ユーザーの会話に基づいて特定ページをリアルタイム取得します。これは人間訪問に最も近い AI 行動です。ユーザーが比較、返品確認、価格確認、仕様確認をしている可能性があります。商業価値は高く、conversion page の正確性、CTA、policy 情報が重要です。
5. User Action。 Google-Agent、Manus-User、NovaAct などは、ユーザーの代理でフォーム入力、比較、問い合わせ、購入準備などの行動を実行し始めています。まだ初期段階ですが、Agentic Commerce が進むほど価値は高まります。構造化データ、programmatic form、pricing/inventory API が基礎になります。
意図の価値は training から user_action へ上がりますが、単純な直線ではありません。特に search から user_fetch への変化は大きい。これは「AI ecosystem があなたに注目している」から「特定ユーザーが今あなたを学んでいる」への質的変化です。
なぜ GA4 と GSC は区別できないのか
GA4 は browser session の分析ツールです。crawler を見ないため、intent classification もできません。GSC は Google 自社 AI features の impressions を扱いますが、第三者 AI crawler の訪問や意図は扱いません。
intent classification には三つの条件が必要です。第一に server-side log analysis。HTTP request の User-Agent を直接読む必要があります。第二に official UA library。OpenAI、Anthropic、Google などが公開する公式 UA と照合します。第三に behavioral analysis。標準 UA を使わない crawler について、frequency、path pattern、header characteristics で補助分類します。CitationGraph はこの分類を、複数 AI platform に対して継続的に行うための仕組みです。
Intent-based GEO strategy
Intent | やるべきこと | やめてもよいこと |
|---|---|---|
Training | 正確なブランド事実を提供し、llms.txt を整備 | training crawler 向けに page speed だけを最適化すること |
Indexing | Schema、meta、Open Graph を完全にする | indexing crawler にリアルタイム在庫を無理に提供すること |
Search | Answer-First と FAQ を最適化する | search crawler の頻度だけを気にすること |
User Fetch | 価格、policy、CTA を最新に保つ | user_fetch が多いページを無視すること |
User Action | 構造化データと API/フォームを準備する | Agentic Commerce 準備を後回しにすること |
実務では、この分類を月次レポートではなく週次の運用表に落とす必要があります。Training が多いページは事実情報と brand knowledge を整える。Search が増えたページは Answer-First、FAQ、比較情報を強化する。User Fetch が増えたページは価格、返品、保証、CTA の正確性を優先する。User Action が見え始めたら、フォーム、在庫、API、認証フローを点検する。
また、intent の信頼度を明示することも重要です。公式 User-Agent と検証済み IP で確認できたものは confirmed、行動パターンから推定したものは probable、判定不能なものは unknown と分ける。これにより、経営側は bot volume を過信せず、どの signal が予算判断に使えるかを理解できます。AI crawler data は技術ログではなく、GEO の優先順位を決める入力になります。
次回は実践編です。GA4 で AI traffic が 0.5% に見える DTC ブランドが、四段階の monitoring architecture によって 8-12% の full-view AI impact を見えるようにする方法を扱います。
FAQ
Q1: crawler intent はどう識別しますか?
A: User-Agent matching が基本です。OpenAI なら GPTBot、OAI-SearchBot、ChatGPT-User、Anthropic なら ClaudeBot、Claude-SearchBot、Claude-User のように公式 UA を照合します。
Q2: Training crawler の実務価値は何ですか?
A: 長期価値です。AI モデルが将来あなたのブランドを知るかどうかに影響します。誤情報を学習させないことが重要です。
Q3: user_fetch は人間訪問とどう違いますか?
A: GA4 session は発生しませんが、背後には実際の人間の質問があります。商業的には高品質な near-human visit と扱うべきです。
Q4: user_action crawler はもう一般的ですか?
A: まだ初期段階です。ただし UCP/ACP などの protocol が成熟すると急速に重要になります。
Q5: 中国系 AI crawler も分類できますか?
A: UA 標準は欧米 platform より透明性が低い場合があります。UA matching と behavior analysis の併用が必要です。