Tous les crawlers IA ne se valent pas : cinq intentions, cinq valeurs business

Deux requêtes apparaissent dans vos logs. GPTBot/1.0 charge une page produit. ChatGPT-User/1.0 charge la même page. GA4 ne voit aucune des deux, car elles n'exécutent pas JavaScript. GSC ne les voit pas non plus, car ses rapports IA concernent surtout les fonctionnalités Google. Les traiter comme simple bot traffic revient à perdre une information essentielle.

GPTBot peut venir pour l'entraînement du modèle : valeur long terme. ChatGPT-User peut venir parce qu'un vrai utilisateur demande à ChatGPT de consulter votre page : signal commercial immédiat et fort.

Cinq intentions

Training : GPTBot, ClaudeBot, Meta-ExternalAgent, GoogleOther, Bytespider, CCBot. Objectif : données d'entraînement. Valeur : connaissance de marque à long terme. Action : faits exacts, robots.txt, llms.txt.

Indexing : constitution d'index pour moteurs IA. L'enjeu est Schema, meta tags, Open Graph. Être indexé est nécessaire, mais ne veut pas dire être recommandé.

Search : OAI-SearchBot, PerplexityBot, Claude-SearchBot. Ils récupèrent des pages pour répondre à une requête utilisateur. Valeur : demande de marché. Action : Answer-First, FAQ, données produit à jour.

User Fetch : ChatGPT-User, Claude-User, Perplexity-User. L'IA récupère votre page pour un utilisateur précis dans une conversation. Valeur : élevée, proche d'une visite humaine de forte intention.

User Action : Google-Agent, Manus-User, NovaAct. Les agents exécutent des tâches pour l'utilisateur. Encore tôt, mais crucial pour l'Agentic Commerce.

Pourquoi les outils classiques échouent

GA4 ne voit pas les crawlers. GSC ne classe pas les crawlers tiers. Il faut des logs server-side, une bibliothèque d'User-Agent officiels et une analyse comportementale pour les cas non standard. CitationGraph sert à transformer des logs bruts en signaux business classés par intention.

Stratégie GEO par intention

Intent	À faire	À ne pas survaloriser
Training	Faits de marque exacts, llms.txt	Vitesse de page uniquement pour training
Indexing	Schema, meta, Open Graph	Données temps réel pour indexation pure
Search	Answer-First, FAQ	Fréquence seule des crawlers
User Fetch

La différence opérationnelle est majeure. Si une équipe ne voit que le volume de bots, elle peut interpréter une hausse de GPTBot comme une hausse d'intention commerciale immédiate. Ce n'est pas nécessairement vrai. En revanche, si elle distingue User Fetch, elle sait quelles pages sont activement consultées dans des conversations IA. Les pages pricing, comparatifs, politiques de retour, FAQ et catégories deviennent alors des actifs directement exposés aux agents.

Un dashboard sérieux doit donc avoir trois niveaux : volume par plateforme, mix d'intention, et analyse par page. Le volume seul montre l'attention de l'écosystème. Le mix d'intention montre la qualité du signal. L'analyse par page transforme l'observation en action : quelle page corriger, quelle FAQ renforcer, quel contenu rendre plus factuel, quelle donnée structurer.

La qualité de classification doit aussi être visible. Les User-Agents officiels sont des signaux forts, mais toutes les plateformes ne documentent pas leurs crawlers avec le même niveau de transparence. Certaines requêtes exigent validation IP, examen des headers, fréquence, profondeur de crawl et contexte de page. Un bon système doit donc distinguer "confirmé", "probable" et "inconnu". Sans cela, on remplace l'aveuglement de GA4 par une fausse certitude dans les logs.

Organisationnellement, l'enjeu traverse plusieurs équipes. Le SEO structure les pages, l'ingénierie donne accès aux logs, la data définit le modèle d'intention, le juridique valide robots.txt et conditions d'accès, et Growth traduit user_fetch ou user_action en priorités commerciales. Crawler Intent n'est donc pas un rapport technique secondaire ; c'est une couche opérationnelle pour AI Search.

L'interprétation doit rester prudente. Une requête user_fetch isolée ne prouve pas une intention d'achat. Mais une hausse répétée sur les pages prix, comparatifs, politiques de retour et disponibilité produit indique que des utilisateurs assistés par IA avancent dans la phase d'évaluation. Il faut donc regarder des tendances hebdomadaires, des groupes de pages et des événements concurrents plutôt que des événements isolés. C'est la tendance qui rend le signal exploitable.

Le prochain article passe à l'architecture pratique de monitoring pour les marques DTC.

FAQ

Q1 : Comment reconnaître l'intention ?

A : Par User-Agent matching, puis analyse de comportement.

Q2 : Quelle valeur a Training ?

A : Long terme : ce que les modèles apprennent sur votre marque.

Q3 : User Fetch vaut-il une visite humaine ?

A : Pas dans GA4, mais commercialement c'est proche d'une visite de forte intention.

Q4 : User Action est-il déjà courant ?

A : Encore émergent, mais stratégique pour l'Agentic Commerce.

Q5 : Les plateformes chinoises sont-elles classables ?

A : Oui, mais avec moins de transparence UA ; l'analyse comportementale est nécessaire.

Tous les crawlers IA ne se valent pas : cinq intentions, cinq valeurs business

Cinq intentions

Pourquoi les outils classiques échouent

Stratégie GEO par intention

FAQ

Q1 : Comment reconnaître l'intention ?

Q2 : Quelle valeur a Training ?

Q3 : User Fetch vaut-il une visite humaine ?

Q4 : User Action est-il déjà courant ?

Q5 : Les plateformes chinoises sont-elles classables ?

Articles associés

Pourquoi Google garde le trafic AI Overview dans Organic Search : un choix commercial

Canal AI Assistant de GA4 et rapports IA de GSC : ce qu'ils font vraiment

GA4 ne voit qu'environ 20% du trafic IA : le modèle iceberg en cinq couches

Vous voulez aller plus loin ?