Nicht alle AI Crawler sind gleich: fünf Intent-Typen, fünf Business-Werte

Zwei Requests erscheinen im Serverlog. GPTBot/1.0 ruft eine Produktseite ab. ChatGPT-User/1.0 ruft dieselbe Seite ab. Beide kommen aus OpenAI-nahen IP-Bereichen. In GA4 sind beide unsichtbar, weil Crawler kein JavaScript ausführen. In GSC sind sie ebenfalls unsichtbar, weil die AI Reports nur Google-eigene AI Features erfassen. Viele Tools werfen beides als Bot Traffic weg.

Kommerziell sind sie aber völlig verschieden. GPTBot kann Inhalte für Training sammeln. Das ist langfristiger Markenwissenswert. ChatGPT-User kann auftreten, weil ein echter Nutzer ChatGPT gerade bittet, Informationen über Ihr Produkt zu holen. Das ist ein unmittelbares High-Intent-Signal.

Fünf Intent-Typen

Training umfasst GPTBot, ClaudeBot, Meta-ExternalAgent, GoogleOther, Bytespider und CCBot. Ziel ist Datensammlung für Modelltraining. Wert: langfristige Grundlage. Marken sollten korrekte Fakten, robots.txt und llms.txt pflegen.

Indexing baut AI-Search-Indexes auf. Es ähnelt traditionellem Crawling, betont aber Schema, Meta Tags und Open Graph. Indexiert zu sein ist Voraussetzung für Empfehlungen, aber keine Empfehlung selbst.

Search umfasst OAI-SearchBot, PerplexityBot, Claude-SearchBot und ähnliche. Diese Crawler holen Seiten in Echtzeit für Nutzerqueries. Wert: Marktnachfrage-Signal. Answer-First Content, FAQ und aktuelle Produktinformationen sind entscheidend.

User Fetch umfasst ChatGPT-User, Claude-User und ähnliche. Ein Nutzer fragt im AI-Dialog nach Informationen, die Plattform holt Ihre Seite. Wert: hoch, weil ein realer Mensch aktiv recherchiert.

User Action umfasst Google-Agent, Manus-User und NovaAct. Diese Agents führen Aufgaben im Auftrag von Nutzern aus: Formulare, Vergleiche, Kaufvorbereitung. Noch früh, aber im Agentic Commerce potenziell am wertvollsten.

Der Wert steigt von Training zu User Action. Der größte qualitative Sprung liegt zwischen Search und User Fetch: von "AI beachtet Ihre Kategorie" zu "ein konkreter Nutzer lernt gerade über Sie".

Warum GA4 und GSC das nicht leisten

GA4 sieht keine Crawler. GSC klassifiziert keine Drittanbieter-Crawler. Intent Classification braucht serverseitige Logs, eine offizielle UA-Bibliothek und Verhaltensanalyse für nicht standardisierte Bots. CitationGraph verbindet diese Ebenen, um nicht nur Bot-Volumen, sondern kommerzielle Bedeutung zu messen.

Intent-basierte GEO-Strategie

Intent	Was tun	Was nicht überbewerten
Training	Korrekte Brand Facts, llms.txt	Page Speed nur für Training Crawler
Indexing	Schema, Meta, Open Graph	Echtzeitdaten für reine Indexer
Search	Answer-First und FAQ	Nur Crawler-Frequenz beobachten

Der operative Unterschied ist erheblich. Ein SEO-Team, das nur Bot-Volumen sieht, könnte steigende GPTBot-Zahlen als kurzfristige Nachfrage interpretieren und Budget falsch verschieben. Ein Growth-Team, das User Fetch erkennt, kann dagegen sehen, welche Produktseiten in AI-Konversationen aktiv geprüft werden. Das verändert Prioritäten: Pricing Pages, Return Policies, Comparison Pages und Category Pages werden zu AI-facing Assets. Sie müssen nicht nur für Menschen lesbar sein, sondern auch für Agents präzise, aktuell und zitierfähig.

Für das Reporting sollte jedes Crawler-Dashboard deshalb drei Ebenen haben. Erstens Volumen nach Plattform, damit man erkennt, welche AI-Systeme Aufmerksamkeit zeigen. Zweitens Intent-Mix, damit Training nicht mit Kaufabsicht verwechselt wird. Drittens Page-Level-Analyse, damit Teams sehen, welche Seiten in Search, User Fetch oder User Action auftauchen. Erst diese Kombination macht Crawler-Daten budgetfähig.

Auch die Qualität der Klassifikation muss explizit ausgewiesen werden. Offizielle User-Agents sind starkes Signal, aber nicht jede Plattform dokumentiert gleich sauber. Einige Requests brauchen IP-Validierung, Header-Prüfung, Frequenzmuster und Pfadkontext. Ein gutes System sollte deshalb zwischen "confirmed", "probable" und "unknown" unterscheiden. Sonst entsteht der nächste Messfehler: Man ersetzt GA4-Blindheit durch übertriebene Sicherheit in Bot-Logs.

Für die Zusammenarbeit im Unternehmen bedeutet das: SEO pflegt strukturierte Inhalte, Engineering liefert Log-Zugriff und Bot-Erkennung, Data definiert Intent-Modelle, Legal prüft robots.txt und Nutzungsbedingungen, Growth übersetzt user_fetch und user_action in Prioritäten. Crawler Intent ist damit kein Nebenbericht der IT, sondern ein gemeinsamer Operating Layer für AI Search.

Ein weiterer Punkt ist die Trend-Interpretation. Ein einzelner User-Fetch-Request beweist keinen Kauf. Aber ein wiederholter Anstieg auf Pricing, Comparison und Return Policy Pages zeigt, dass AI-gestützte Nutzer tiefer in die Kaufprüfung gehen. Deshalb sollten Teams nicht einzelne Events überinterpretieren, sondern rollierende Wochenwerte, Seitengruppen und Wettbewerbsereignisse betrachten. Erst die Richtung über Zeit macht das Signal belastbar.

Im nächsten Artikel zeigen wir, wie DTC-Marken von 0,5% sichtbarem AI Traffic in GA4 zu einer vollständigen AI-Monitoring-Sicht kommen.

FAQ

Q1: Wie erkennt man Intent im Log?

A: Über User-Agent Matching und ergänzende Verhaltensanalyse.

Q2: Welchen Wert haben Training Crawler?

A: Langfristigen Wissenswert. Sie beeinflussen, was Modelle über die Marke lernen.

Q3: Ist User Fetch ein echter Visit?

A: Nicht in GA4, aber kommerziell nahe daran, weil ein Mensch die Anfrage auslöst.

Q4: Sind User Action Crawler schon häufig?

A: Noch nicht, aber mit Agentic Commerce werden sie wichtiger.

Q5: Was ist mit chinesischen AI Plattformen?

A: UA-Standards sind oft weniger transparent; Behavior Analysis ist wichtiger.

Nicht alle AI Crawler sind gleich: fünf Intent-Typen, fünf Business-Werte

Fünf Intent-Typen

Warum GA4 und GSC das nicht leisten

Intent-basierte GEO-Strategie

FAQ

Q1: Wie erkennt man Intent im Log?

Q2: Welchen Wert haben Training Crawler?

Q3: Ist User Fetch ein echter Visit?

Q4: Sind User Action Crawler schon häufig?

Q5: Was ist mit chinesischen AI Plattformen?

Ähnliche Artikel

Warum Google AI Overview Traffic in Organic Search belässt: eine kommerzielle Entscheidung

GA4 AI Assistant und GSC AI Reports erklärt: Was sie leisten und was nicht

GA4 sieht nur rund 20% des AI-Traffics: Das Fünf-Schichten-Eisbergmodell

Möchten Sie mehr erfahren?