Zwei Requests erscheinen im Serverlog. GPTBot/1.0 ruft eine Produktseite ab. ChatGPT-User/1.0 ruft dieselbe Seite ab. Beide kommen aus OpenAI-nahen IP-Bereichen. In GA4 sind beide unsichtbar, weil Crawler kein JavaScript ausführen. In GSC sind sie ebenfalls unsichtbar, weil die AI Reports nur Google-eigene AI Features erfassen. Viele Tools werfen beides als Bot Traffic weg.
Kommerziell sind sie aber völlig verschieden. GPTBot kann Inhalte für Training sammeln. Das ist langfristiger Markenwissenswert. ChatGPT-User kann auftreten, weil ein echter Nutzer ChatGPT gerade bittet, Informationen über Ihr Produkt zu holen. Das ist ein unmittelbares High-Intent-Signal.
Training umfasst GPTBot, ClaudeBot, Meta-ExternalAgent, GoogleOther, Bytespider und CCBot. Ziel ist Datensammlung für Modelltraining. Wert: langfristige Grundlage. Marken sollten korrekte Fakten, robots.txt und llms.txt pflegen.
Indexing baut AI-Search-Indexes auf. Es ähnelt traditionellem Crawling, betont aber Schema, Meta Tags und Open Graph. Indexiert zu sein ist Voraussetzung für Empfehlungen, aber keine Empfehlung selbst.
Search umfasst OAI-SearchBot, PerplexityBot, Claude-SearchBot und ähnliche. Diese Crawler holen Seiten in Echtzeit für Nutzerqueries. Wert: Marktnachfrage-Signal. Answer-First Content, FAQ und aktuelle Produktinformationen sind entscheidend.
User Fetch umfasst ChatGPT-User, Claude-User und ähnliche. Ein Nutzer fragt im AI-Dialog nach Informationen, die Plattform holt Ihre Seite. Wert: hoch, weil ein realer Mensch aktiv recherchiert.
User Action umfasst Google-Agent, Manus-User und NovaAct. Diese Agents führen Aufgaben im Auftrag von Nutzern aus: Formulare, Vergleiche, Kaufvorbereitung. Noch früh, aber im Agentic Commerce potenziell am wertvollsten.
Der Wert steigt von Training zu User Action. Der größte qualitative Sprung liegt zwischen Search und User Fetch: von "AI beachtet Ihre Kategorie" zu "ein konkreter Nutzer lernt gerade über Sie".
GA4 sieht keine Crawler. GSC klassifiziert keine Drittanbieter-Crawler. Intent Classification braucht serverseitige Logs, eine offizielle UA-Bibliothek und Verhaltensanalyse für nicht standardisierte Bots. CitationGraph verbindet diese Ebenen, um nicht nur Bot-Volumen, sondern kommerzielle Bedeutung zu messen.
Intent | Was tun | Was nicht überbewerten |
|---|---|---|
Training | Korrekte Brand Facts, llms.txt | Page Speed nur für Training Crawler |
Indexing | Schema, Meta, Open Graph | Echtzeitdaten für reine Indexer |
Search | Answer-First und FAQ | Nur Crawler-Frequenz beobachten |
Der operative Unterschied ist erheblich. Ein SEO-Team, das nur Bot-Volumen sieht, könnte steigende GPTBot-Zahlen als kurzfristige Nachfrage interpretieren und Budget falsch verschieben. Ein Growth-Team, das User Fetch erkennt, kann dagegen sehen, welche Produktseiten in AI-Konversationen aktiv geprüft werden. Das verändert Prioritäten: Pricing Pages, Return Policies, Comparison Pages und Category Pages werden zu AI-facing Assets. Sie müssen nicht nur für Menschen lesbar sein, sondern auch für Agents präzise, aktuell und zitierfähig.
Für das Reporting sollte jedes Crawler-Dashboard deshalb drei Ebenen haben. Erstens Volumen nach Plattform, damit man erkennt, welche AI-Systeme Aufmerksamkeit zeigen. Zweitens Intent-Mix, damit Training nicht mit Kaufabsicht verwechselt wird. Drittens Page-Level-Analyse, damit Teams sehen, welche Seiten in Search, User Fetch oder User Action auftauchen. Erst diese Kombination macht Crawler-Daten budgetfähig.
Auch die Qualität der Klassifikation muss explizit ausgewiesen werden. Offizielle User-Agents sind starkes Signal, aber nicht jede Plattform dokumentiert gleich sauber. Einige Requests brauchen IP-Validierung, Header-Prüfung, Frequenzmuster und Pfadkontext. Ein gutes System sollte deshalb zwischen "confirmed", "probable" und "unknown" unterscheiden. Sonst entsteht der nächste Messfehler: Man ersetzt GA4-Blindheit durch übertriebene Sicherheit in Bot-Logs.
Für die Zusammenarbeit im Unternehmen bedeutet das: SEO pflegt strukturierte Inhalte, Engineering liefert Log-Zugriff und Bot-Erkennung, Data definiert Intent-Modelle, Legal prüft robots.txt und Nutzungsbedingungen, Growth übersetzt user_fetch und user_action in Prioritäten. Crawler Intent ist damit kein Nebenbericht der IT, sondern ein gemeinsamer Operating Layer für AI Search.
Ein weiterer Punkt ist die Trend-Interpretation. Ein einzelner User-Fetch-Request beweist keinen Kauf. Aber ein wiederholter Anstieg auf Pricing, Comparison und Return Policy Pages zeigt, dass AI-gestützte Nutzer tiefer in die Kaufprüfung gehen. Deshalb sollten Teams nicht einzelne Events überinterpretieren, sondern rollierende Wochenwerte, Seitengruppen und Wettbewerbsereignisse betrachten. Erst die Richtung über Zeit macht das Signal belastbar.
Im nächsten Artikel zeigen wir, wie DTC-Marken von 0,5% sichtbarem AI Traffic in GA4 zu einer vollständigen AI-Monitoring-Sicht kommen.
A: Über User-Agent Matching und ergänzende Verhaltensanalyse.
A: Langfristigen Wissenswert. Sie beeinflussen, was Modelle über die Marke lernen.
A: Nicht in GA4, aber kommerziell nahe daran, weil ein Mensch die Anfrage auslöst.
A: Noch nicht, aber mit Agentic Commerce werden sie wichtiger.
A: UA-Standards sind oft weniger transparent; Behavior Analysis ist wichtiger.
Erhalten Sie einen kostenlosen AI-Search-Audit und sehen Sie, wie sichtbar Ihre Marke in KI-Antworten ist.
Kostenloser AI-Search-AuditUser Fetch
Pricing, Policies, CTA aktuell halten |
User-Fetch-Seiten ignorieren |
User Action | Strukturierte Daten, APIs, Forms | Agentic Commerce Vorbereitung verschieben |