上一篇我们分析了 MMP 的结构性盲区——AI 的影响发生在广告触点之前,MMP 天然看不见。这一篇,我们把镜头对准 GA4——大多数品牌唯一的 Web 端分析工具——看看它对 AI 流量的覆盖到底有多少。
结论先行:GA4 看到的 AI 流量大约只有真实 AI 触达的 10-15%。 这是我们在 CitationGraph 平台上对比客户端和服务器端数据得出的一致结论。
#### 冰山模型
上一篇我们分析了 MMP 的结构性盲区——AI 的影响发生在广告触点之前,MMP 天然看不见。这一篇,我们把镜头对准 GA4——大多数品牌唯一的 Web 端分析工具——看看它对 AI 流量的覆盖到底有多少。
结论先行:GA4 看到的 AI 流量大约只有真实 AI 触达的 10-15%。 这是我们在 CitationGraph 平台上对比客户端和服务器端数据得出的一致结论。
#### 冰山模型
把 AI 对品牌的触达想象成一座冰山。水面之上是 GA4 可见的部分——有 referrer 的人类 AI 点击,大约占总触达的 10-15%。水面之下是看不见的部分——AI 爬虫请求、referrer 被剥离的访问、零点击引用、跨端断链——占据了 85-90%。
让我们逐层分析水面之下的部分。
#### 第一层:AI 爬虫请求(GA4 覆盖率:0%)
GPTBot、ClaudeBot、PerplexityBot、GoogleOther、DeepSeekBot、Grok-DeepSearch……AI 爬虫的种类还在快速增加。2026 年上半年就新增了数种新 Agent,包括来自主流科技公司的全新 AI 检索系统。
这些爬虫每天可能请求你的网站数千次。它们抓取的内容决定了 AI 系统是否理解你的产品、是否在回答中推荐你。
但 GA4 对此完全盲目。 原因极简单:爬虫不执行 JavaScript。GA4 的 gtag.js 永远不会触发。这些请求在 GA4 中一条记录都没有。
为什么这很重要:AI 爬虫的抓取模式直接影响 AI 答案的质量。如果 AI 爬虫高频抓取你的产品页但从不抓取你的定价页,AI 可能无法在价格比较场景中推荐你——即使你的价格最有竞争力。一条爬虫日志 = 一个内容优先级信号。而 GA4 没有给你任何一条。
#### 第二层:Referrer 被剥离的 AI 访问(GA4 覆盖率:部分)
即使 AI 推荐带来了真实的人类点击,referrer 传递也不可靠。
结果:估计有 30-60% 的 AI 来源人类点击在到达网站时已丢失来源标记。GA4 把它们归入 Direct 或 (not set)——与手动输入 URL 的访问混在一起,完全无法区分。
#### 第三层:GA4 的渠道分类问题(GA4 覆盖率:有,但混杂)
GA4 的默认 Channel Grouping 会把 chatgpt.com 归入 Referral——与所有其他 referral 来源混在一起。要独立看 AI 渠道的数据,需要手动创建自定义 Channel Group 并持续维护 AI referral 域名列表。
GA4 在 2025-2026 年开始引入 AI Assistants 默认渠道组。但覆盖不完整——只识别部分 AI 平台,且命名不一致。大多数团队不会做这种精细维护,AI 来源的流量就淹没在 Referral 噪声中。
#### 第四层:零点击引用(GA4 覆盖率:0%)
AI 搜索正在创造一种全新的品牌触达形式:你的品牌被提及、被引用、被推荐——但用户没有点击任何链接。
当用户问 AI "best project management tool for remote teams",AI 在回答中详细比较了 5 个工具,包括你的品牌。用户读完回答,形成了品牌认知——但他没有点击任何链接。
这次品牌触达的价值是真实的。但 GA4 的数据里不会有任何记录。因为没有发生任何 Web 请求。
2026 年约 60% 的 AI 搜索以零点击结束。AI 对你品牌最大规模的推广行为可能发生在完全没有任何 Web 分析工具能看到的地方。
#### 第五层:跨端 Web-to-App 断链(GA4 覆盖率:0%)
对于有 App 的品牌,最关键的盲区在这里。用户从 AI 推荐到品牌官网(GA4 可能看到),然后下载 App(MMP 看到 Install)。但 GA4 的 session 在 Web→App 跳转时结束,MMP 的归因开始——两者之间没有连接。AI 驱动的 App Install 被归类为"自然安装"。
#### 解决方案:多层级 AI 流量可见度
要让冰山浮出水面,需要在 GA4 之外建立多层级的 AI 流量可见度体系。CitationGraph 采用的是我们称之为"证据层级"的渐进式架构:
基线层:GA4 / GSC / Shopify 原生数据。覆盖有 referrer 的人类 AI 点击,约 10-15%。
一方追踪层:在品牌自己的域名下运行的 AI 来源识别,精确分类 AI 渠道——比 GA4 的默认渠道分组更准确。
服务器端可见度层:在 CDN / Edge 层获取所有 HTTP 请求的 AI 来源信号——包括 AI 爬虫在内的全量请求可见。这是覆盖率从 10-15% 跳到 80-90% 的关键层。
企业遥测层:针对大型企业的深度集成,接入企业级可观测性基础设施。
关键原则:每个层级都是独立有价值的。 不需要一步到位。从基线层升级到服务器端可见度层就能让 AI 流量覆盖率提升 5-8 倍——而且通常可以在一周内完成部署、看到第一批数据。
#### 实战对比:部署前后
以一个 CitationGraph 客户站点为例(不披露名称):
指标 | 仅客户端追踪 | 启用服务器端可见度后 | 倍数 |
|---|---|---|---|
可见 AI 请求 | ~90/天 | ~1,200/天 | 14x |
可识别 AI Agent 种类 | 3 | 8+ | 2.7x |
AI 爬虫请求占比 | 不可见 | > 90% | ∞ |
AI referral 识别率 | ~40% | ~95% | 2.4x |
启用服务器端可见度不增加客户端代码、不影响页面性能。对终端用户完全透明。
#### 与 MMP 的协同
多层级可见度解决了 Web 侧的 AI 活动监测问题。但对于有 App 的品牌,还需要一个额外的步骤:把 Web 侧的 AI 来源信号传递给 MMP。
这就是下一篇的主题——AI-MMP 信号桥:如何让 MMP 自动识别 AI 来源,不需要修改 MMP 的任何配置。
#### 核心论点
GA4 看到的 AI 流量是冰山尖。水面之下——AI 爬虫请求、referrer 被剥离的访问、零点击引用、跨端断链——占据了 85-90% 的真实 AI 触达。要让冰山浮出水面,不需要替换 GA4——需要在服务器端建立独立的 AI 来源可见度层。CitationGraph 的证据层级体系正是为此设计。
A: 可以做,也建议做。但这只解决了 referrer 成功传递的 AI 人类点击的分类问题——大约只占总触达的 10-15%。爬虫请求、referrer 被剥离的访问、零点击引用——这些都不在 GA4 能解决的范围内。
A: 会有重叠。在 CitationGraph 中我们区分"客户端可识别 AI 活动"和"服务器端 AI 请求",避免简单相加导致双计。
A: 间接但关键。爬虫抓取模式决定了 AI 系统对你内容的理解深度——这是 AI 答案质量的领先指标,就像搜索引擎的收录量是 SEO 排名的领先指标一样。
A: CitationGraph 支持纯服务器端部署——零客户端代码注入。对于安全要求极高的客户,这意味着安全团队的审批阻力大幅降低。同时,服务器端检测不受 Adblock 影响——加密行业用户的 Adblock 使用率估计在 30-50%——数据完整度远超客户端方案。