Dois requests aparecem no servidor. GPTBot/1.0 acessa uma página de produto. ChatGPT-User/1.0 acessa a mesma página. GA4 não vê nenhum porque crawlers não executam JavaScript. GSC também não vê, pois seus relatórios IA cobrem recursos do Google. Tratar tudo como bot traffic apaga sinais importantes.
GPTBot pode coletar dados para treinamento: valor de longo prazo. ChatGPT-User pode acontecer porque uma pessoa pediu ao ChatGPT informações sobre você: sinal comercial de alta intenção.
Training: GPTBot, ClaudeBot, Meta-ExternalAgent, GoogleOther, Bytespider, CCBot. Coletam dados para modelos. Ação: fatos corretos, robots.txt, llms.txt.
Indexing: constroem índices para AI search. Schema, meta tags e Open Graph são centrais.
Search: OAI-SearchBot, PerplexityBot, Claude-SearchBot. Buscam páginas para responder queries. Sinal de demanda.
User Fetch: ChatGPT-User, Claude-User, Perplexity-User. A IA busca a página por pedido de um usuário em conversa. Valor alto.
User Action: Google-Agent, Manus-User, NovaAct. Executam tarefas pelo usuário. Ainda cedo, mas relevante para Agentic Commerce.
GA4 não vê crawlers. GSC não classifica terceiros. É preciso log server-side, biblioteca oficial de User-Agents e análise comportamental. CitationGraph transforma essa base em classificação por intenção.
Intent | O que fazer | O que não supervalorizar |
|---|---|---|
Training | Fatos corretos, llms.txt | Page speed só para training |
Indexing | Schema, meta, Open Graph | Dados em tempo real para indexação pura |
Search | Answer-First e FAQ | Frequência isolada |
User Fetch | Preço, políticas, CTA atualizados | Ignorar páginas com user_fetch |
User Action | Dados estruturados, APIs, forms | Adiar Agentic Commerce |
A diferença operacional é grande. Se o time olha apenas volume de bots, pode confundir aumento de GPTBot com demanda comercial imediata. Mas quando distingue User Fetch, passa a saber quais páginas estão sendo consultadas por usuários dentro de conversas com IA. Pricing, políticas de devolução, comparativos, FAQs e páginas de categoria deixam de ser só conteúdo SEO: viram ativos expostos a agentes.
Um dashboard útil precisa de três níveis: volume por plataforma, mix de intenção e análise por página. O volume mostra atenção do ecossistema. O mix separa training de intenção de compra. A análise por página transforma sinal em tarefa: atualizar policy, melhorar resposta, adicionar Schema ou reforçar CTA.
A qualidade da classificação também precisa ficar explícita. User-Agents oficiais são sinais fortes, mas nem todas as plataformas documentam crawlers com a mesma transparência. Algumas visitas exigem validação de IP, headers, frequência, profundidade e contexto de página. Um bom sistema deve separar "confirmado", "provável" e "desconhecido". Caso contrário, a cegueira do GA4 vira falsa certeza em logs.
Na organização, isso cruza várias equipes. SEO estrutura páginas, Engineering dá acesso a logs, Data define o modelo de intenção, Legal revisa robots.txt e termos, e Growth transforma user_fetch ou user_action em prioridades comerciais. Crawler Intent não é relatório técnico secundário; é uma camada operacional de AI Search.
A interpretação precisa ser prudente. Um request user_fetch isolado não prova compra. Mas aumento recorrente em páginas de preço, comparativos, política de devolução e disponibilidade indica que usuários assistidos por IA avançam na avaliação. Por isso é melhor olhar tendências semanais, grupos de páginas e eventos competitivos, não eventos soltos. A direção ao longo do tempo transforma dado em sinal acionável.
Também muda a prioridade de conteúdo. Em SEO tradicional, a página mais importante costuma ser a que ranqueia. Em AI Search, a página decisiva pode ser a que o agente consulta para validar confiança: shipping, warranty, return policy, reviews, certifications. Essas páginas podem ter pouco tráfego humano, mas influenciar se a IA recomenda ou descarta a marca.
Por isso, a leitura executiva deve separar volume, intenção e página. Volume responde "quem está olhando". Intenção responde "por quê". Página responde "qual ativo precisa melhorar". Sem essas três perguntas, crawler data continua sendo ruído técnico e não inteligência de crescimento.
Essa separação também ajuda a definir dono. SEO ajusta a estrutura da página, Growth decide prioridades comerciais, Engineering libera logs, Data define confidence level e Legal revisa limites de crawling. Sem dono claro, intent classification vira relatório curioso. Com dono claro, vira fila de melhorias semanais.
O próximo artigo mostra uma arquitetura prática de monitoramento para DTC.
A: User-Agent matching e análise comportamental.
A: Longo prazo: o que os modelos aprendem sobre a marca.
A: Não no GA4, mas comercialmente é próximo de uma visita de alta intenção.
A: Ainda não, mas deve crescer com Agentic Commerce.
A: Exigem UA matching e comportamento, pois há menos padronização pública.
Receba uma auditoria gratuita de busca com IA para entender a visibilidade da sua marca no Brasil.
Diagnóstico gratuito de busca IA