AI crawler は全部同じではない：五つの意図が五つの商業価値を決める

サーバーログに二つの request が並んでいるとします。ひとつは GPTBot/1.0 が /products/solar-panel-400w を取得したもの。もうひとつは ChatGPT-User/1.0 が同じページを取得したもの。どちらも OpenAI 系の IP range から来ています。

GA4 ではどちらも見えません。GA4 は client-side JavaScript に依存しており、AI crawler は JavaScript を実行しないからです。GSC でも見えません。GSC の AI report は Google 自社の AI features における表示を扱うだけです。多くの analytics tool では、これらは単に bot traffic として捨てられます。

しかし商業的な意味はまったく違います。

GPTBot はモデル学習のためにページを読む可能性があります。これは長期的な知識基盤への貢献です。将来の AI response があなたのブランドを知るかもしれませんが、今すぐ誰かが買おうとしているとは限りません。

ChatGPT-User は、実際のユーザーが会話の中であなたのブランドや商品について質問し、ChatGPT が最新情報を得るためにページを取得している可能性があります。これはリアルタイムで高意図の商業シグナルです。前者の直接的な商業価値は低く（長期的なブランド知識への間接貢献）、後者は高意図の見込み顧客シグナルです。

五つの AI crawler intent

公式ドキュメントや User-Agent 標準に基づくと、AI crawler の訪問は大きく五つの intent に分類できます。

1. Training。 代表例は GPTBot、ClaudeBot、Meta-ExternalAgent、GoogleOther、Bytespider、CCBot です。目的はモデル学習データの収集です。高頻度、広範囲、リアルタイム性への関心が低いという特徴があります。商業価値は長期基盤価値です。ブランドがやるべきことは、学習させたい情報を正確に整え、robots.txt と llms.txt を適切に使うことです。誤った価格や古い製品情報が学習されると、将来の AI response に誤りが残ります。

2. Indexing。 AI search engine が検索用 index を構築するための crawling です。従来の Googlebot に近い役割ですが、Schema、title、description、Open Graph など機械可読な構造を強く参照します。商業価値はインフラ価値です。index されなければ推薦候補になりませんが、index されたこと自体は推薦を意味しません。

3. Search。 OAI-SearchBot、PerplexityBot、Claude-SearchBot、Google-CloudVertexBot などが、ユーザーの検索 query に応答するために関連ページをリアルタイムで取得します。これは市場需要シグナルです。誰かがそのカテゴリーを AI search で調べています。Answer-First 構造、FAQ、価格・在庫・仕様の鮮度が重要になります。

4. User Fetch。 ChatGPT-User、Claude-User、Perplexity-User などは、ユーザーの会話に基づいて特定ページをリアルタイム取得します。これは人間訪問に最も近い AI 行動です。ユーザーが比較、返品確認、価格確認、仕様確認をしている可能性があります。商業価値は高く、conversion page の正確性、CTA、policy 情報が重要です。

5. User Action。 Google-Agent、Manus-User、NovaAct などは、ユーザーの代理でフォーム入力、比較、問い合わせ、購入準備などの行動を実行し始めています。まだ初期段階ですが、Agentic Commerce が進むほど価値は高まります。構造化データ、programmatic form、pricing/inventory API が基礎になります。

意図の価値は training から user_action へ上がりますが、単純な直線ではありません。特に search から user_fetch への変化は大きい。これは「AI ecosystem があなたに注目している」から「特定ユーザーが今あなたを学んでいる」への質的変化です。

なぜ GA4 と GSC は区別できないのか

GA4 は browser session の分析ツールです。crawler を見ないため、intent classification もできません。GSC は Google 自社 AI features の impressions を扱いますが、第三者 AI crawler の訪問や意図は扱いません。

intent classification には三つの条件が必要です。第一に server-side log analysis。HTTP request の User-Agent を直接読む必要があります。第二に official UA library。OpenAI、Anthropic、Google などが公開する公式 UA と照合します。第三に behavioral analysis。標準 UA を使わない crawler について、frequency、path pattern、header characteristics で補助分類します。CitationGraph はこの分類を、複数 AI platform に対して継続的に行うための仕組みです。

Intent-based GEO strategy

Intent	やるべきこと	やめてもよいこと
Training	正確なブランド事実を提供し、llms.txt を整備	training crawler 向けに page speed だけを最適化すること
Indexing	Schema、meta、Open Graph を完全にする	indexing crawler にリアルタイム在庫を無理に提供すること
Search	Answer-First と FAQ を最適化する	search crawler の頻度だけを気にすること
User Fetch	価格、policy、CTA を最新に保つ	user_fetch が多いページを無視すること
User Action	構造化データと API/フォームを準備する	Agentic Commerce 準備を後回しにすること

実務では、この分類を月次レポートではなく週次の運用表に落とす必要があります。Training が多いページは事実情報と brand knowledge を整える。Search が増えたページは Answer-First、FAQ、比較情報を強化する。User Fetch が増えたページは価格、返品、保証、CTA の正確性を優先する。User Action が見え始めたら、フォーム、在庫、API、認証フローを点検する。

また、intent の信頼度を明示することも重要です。公式 User-Agent と検証済み IP で確認できたものは confirmed、行動パターンから推定したものは probable、判定不能なものは unknown と分ける。これにより、経営側は bot volume を過信せず、どの signal が予算判断に使えるかを理解できます。AI crawler data は技術ログではなく、GEO の優先順位を決める入力になります。

次回は実践編です。GA4 で AI traffic が 0.5% に見える DTC ブランドが、四段階の monitoring architecture によって 8-12% の full-view AI impact を見えるようにする方法を扱います。

FAQ

Q1: crawler intent はどう識別しますか？

A: User-Agent matching が基本です。OpenAI なら GPTBot、OAI-SearchBot、ChatGPT-User、Anthropic なら ClaudeBot、Claude-SearchBot、Claude-User のように公式 UA を照合します。

Q2: Training crawler の実務価値は何ですか？

A: 長期価値です。AI モデルが将来あなたのブランドを知るかどうかに影響します。誤情報を学習させないことが重要です。

Q3: user_fetch は人間訪問とどう違いますか？

A: GA4 session は発生しませんが、背後には実際の人間の質問があります。商業的には高品質な near-human visit と扱うべきです。

Q4: user_action crawler はもう一般的ですか？

A: まだ初期段階です。ただし UCP/ACP などの protocol が成熟すると急速に重要になります。

Q5: 中国系 AI crawler も分類できますか？

A: UA 標準は欧米 platform より透明性が低い場合があります。UA matching と behavior analysis の併用が必要です。

Intent

やるべきこと

やめてもよいこと

Training

正確なブランド事実を提供し、llms.txt を整備

training crawler 向けに page speed だけを最適化すること

Indexing

Schema、meta、Open Graph を完全にする

indexing crawler にリアルタイム在庫を無理に提供すること

Answer-First と FAQ を最適化する

search crawler の頻度だけを気にすること

User Fetch

価格、policy、CTA を最新に保つ

user_fetch が多いページを無視すること

User Action

構造化データと API/フォームを準備する

Agentic Commerce 準備を後回しにすること

FAQ

Q1: crawler intent はどう識別しますか？

A: User-Agent matching が基本です。OpenAI なら GPTBot、OAI-SearchBot、ChatGPT-User、Anthropic なら ClaudeBot、Claude-SearchBot、Claude-User のように公式 UA を照合します。

Q2: Training crawler の実務価値は何ですか？

A: 長期価値です。AI モデルが将来あなたのブランドを知るかどうかに影響します。誤情報を学習させないことが重要です。

Q3: user_fetch は人間訪問とどう違いますか？

A: GA4 session は発生しませんが、背後には実際の人間の質問があります。商業的には高品質な near-human visit と扱うべきです。

Q4: user_action crawler はもう一般的ですか？

A: まだ初期段階です。ただし UCP/ACP などの protocol が成熟すると急速に重要になります。

Q5: 中国系 AI crawler も分類できますか？

A: UA 標準は欧米 platform より透明性が低い場合があります。UA matching と behavior analysis の併用が必要です。

AI crawler は全部同じではない：五つの意図が五つの商業価値を決める

五つの AI crawler intent

なぜ GA4 と GSC は区別できないのか

Intent-based GEO strategy

FAQ

Q1: crawler intent はどう識別しますか？

Q2: Training crawler の実務価値は何ですか？

Q3: user_fetch は人間訪問とどう違いますか？

Q4: user_action crawler はもう一般的ですか？

Q5: 中国系 AI crawler も分類できますか？

関連記事

Google が AI Overview 流入を Organic Search に残す理由：検索広告価格をめぐる商業的選択

GA4 AI Assistant と GSC AI レポートの本当の範囲：できること、できないこと

GA4 が見ている AI 流入は約20%にすぎない：五層アイスバーグモデル

もっと知りたいですか？

AI crawler は全部同じではない：五つの意図が五つの商業価値を決める

五つの AI crawler intent

なぜ GA4 と GSC は区別できないのか

Intent-based GEO strategy

FAQ

Q1: crawler intent はどう識別しますか？

Q2: Training crawler の実務価値は何ですか？

Q3: user_fetch は人間訪問とどう違いますか？

Q4: user_action crawler はもう一般的ですか？

Q5: 中国系 AI crawler も分類できますか？

関連記事

Google が AI Overview 流入を Organic Search に残す理由：検索広告価格をめぐる商業的選択

GA4 AI Assistant と GSC AI レポートの本当の範囲：できること、できないこと

GA4 が見ている AI 流入は約20%にすぎない：五層アイスバーグモデル

もっと知りたいですか？