Nem todo crawler de IA é igual: cinco intenções, cinco valores comerciais

Dois requests aparecem no servidor. GPTBot/1.0 acessa uma página de produto. ChatGPT-User/1.0 acessa a mesma página. GA4 não vê nenhum porque crawlers não executam JavaScript. GSC também não vê, pois seus relatórios IA cobrem recursos do Google. Tratar tudo como bot traffic apaga sinais importantes.

GPTBot pode coletar dados para treinamento: valor de longo prazo. ChatGPT-User pode acontecer porque uma pessoa pediu ao ChatGPT informações sobre você: sinal comercial de alta intenção.

Cinco intenções

Training: GPTBot, ClaudeBot, Meta-ExternalAgent, GoogleOther, Bytespider, CCBot. Coletam dados para modelos. Ação: fatos corretos, robots.txt, llms.txt.

Indexing: constroem índices para AI search. Schema, meta tags e Open Graph são centrais.

Search: OAI-SearchBot, PerplexityBot, Claude-SearchBot. Buscam páginas para responder queries. Sinal de demanda.

User Fetch: ChatGPT-User, Claude-User, Perplexity-User. A IA busca a página por pedido de um usuário em conversa. Valor alto.

User Action: Google-Agent, Manus-User, NovaAct. Executam tarefas pelo usuário. Ainda cedo, mas relevante para Agentic Commerce.

Por que GA4/GSC não resolvem

GA4 não vê crawlers. GSC não classifica terceiros. É preciso log server-side, biblioteca oficial de User-Agents e análise comportamental. CitationGraph transforma essa base em classificação por intenção.

Estratégia GEO por intenção

Intent	O que fazer	O que não supervalorizar
Training	Fatos corretos, llms.txt	Page speed só para training
Indexing	Schema, meta, Open Graph	Dados em tempo real para indexação pura
Search	Answer-First e FAQ	Frequência isolada
User Fetch	Preço, políticas, CTA atualizados	Ignorar páginas com user_fetch
User Action	Dados estruturados, APIs, forms	Adiar Agentic Commerce

A diferença operacional é grande. Se o time olha apenas volume de bots, pode confundir aumento de GPTBot com demanda comercial imediata. Mas quando distingue User Fetch, passa a saber quais páginas estão sendo consultadas por usuários dentro de conversas com IA. Pricing, políticas de devolução, comparativos, FAQs e páginas de categoria deixam de ser só conteúdo SEO: viram ativos expostos a agentes.

Um dashboard útil precisa de três níveis: volume por plataforma, mix de intenção e análise por página. O volume mostra atenção do ecossistema. O mix separa training de intenção de compra. A análise por página transforma sinal em tarefa: atualizar policy, melhorar resposta, adicionar Schema ou reforçar CTA.

A qualidade da classificação também precisa ficar explícita. User-Agents oficiais são sinais fortes, mas nem todas as plataformas documentam crawlers com a mesma transparência. Algumas visitas exigem validação de IP, headers, frequência, profundidade e contexto de página. Um bom sistema deve separar "confirmado", "provável" e "desconhecido". Caso contrário, a cegueira do GA4 vira falsa certeza em logs.

Na organização, isso cruza várias equipes. SEO estrutura páginas, Engineering dá acesso a logs, Data define o modelo de intenção, Legal revisa robots.txt e termos, e Growth transforma user_fetch ou user_action em prioridades comerciais. Crawler Intent não é relatório técnico secundário; é uma camada operacional de AI Search.

A interpretação precisa ser prudente. Um request user_fetch isolado não prova compra. Mas aumento recorrente em páginas de preço, comparativos, política de devolução e disponibilidade indica que usuários assistidos por IA avançam na avaliação. Por isso é melhor olhar tendências semanais, grupos de páginas e eventos competitivos, não eventos soltos. A direção ao longo do tempo transforma dado em sinal acionável.

Também muda a prioridade de conteúdo. Em SEO tradicional, a página mais importante costuma ser a que ranqueia. Em AI Search, a página decisiva pode ser a que o agente consulta para validar confiança: shipping, warranty, return policy, reviews, certifications. Essas páginas podem ter pouco tráfego humano, mas influenciar se a IA recomenda ou descarta a marca.

Por isso, a leitura executiva deve separar volume, intenção e página. Volume responde "quem está olhando". Intenção responde "por quê". Página responde "qual ativo precisa melhorar". Sem essas três perguntas, crawler data continua sendo ruído técnico e não inteligência de crescimento.

Essa separação também ajuda a definir dono. SEO ajusta a estrutura da página, Growth decide prioridades comerciais, Engineering libera logs, Data define confidence level e Legal revisa limites de crawling. Sem dono claro, intent classification vira relatório curioso. Com dono claro, vira fila de melhorias semanais.

O próximo artigo mostra uma arquitetura prática de monitoramento para DTC.

FAQ

Q1: Como identificar intent nos logs?

A: User-Agent matching e análise comportamental.

Q2: Qual o valor de Training?

A: Longo prazo: o que os modelos aprendem sobre a marca.

Q3: User Fetch é visita humana?

A: Não no GA4, mas comercialmente é próximo de uma visita de alta intenção.

Q4: User Action já é comum?

A: Ainda não, mas deve crescer com Agentic Commerce.

Q5: E plataformas chinesas?

A: Exigem UA matching e comportamento, pois há menos padronização pública.

Nem todo crawler de IA é igual: cinco intenções, cinco valores comerciais

Cinco intenções

Por que GA4/GSC não resolvem

Estratégia GEO por intenção

FAQ

Q1: Como identificar intent nos logs?

Q2: Qual o valor de Training?

Q3: User Fetch é visita humana?

Q4: User Action já é comum?

Q5: E plataformas chinesas?

Artigos relacionados

Por que o Google mantém AI Overview dentro de Organic Search: uma escolha comercial

Canal AI Assistant do GA4 e relatórios de IA do GSC: o que fazem e o que não fazem

O GA4 vê apenas cerca de 20% do tráfego de IA: o iceberg de cinco camadas

Quer ir mais longe?