上一篇我们讨论了 Shopify 13 倍增长中,如何区分"真增长"和"可见度提升"。这篇文章回答一个更底层的问题:为什么你当前的分析工具只能看到 AI 活动的冰山一角?
答案在于 AI Agent 和浏览器 JavaScript 追踪之间的根本架构冲突。
为什么 GA4 看不到 AI 的大部分活动
Google Analytics 4(以及几乎所有基于浏览器 JavaScript 的分析工具——Amplitude、Mixpanel、Segment 前端 SDK)工作原理是:
- 网页加载时,浏览器执行一段 JS 追踪代码
- JS 代码读取 referrer、URL 参数、cookie,生成一个会话记录
- 会话记录被发送到分析服务器
问题在于,大多数 AI Agent 不通过浏览器访问你的网站。
GPTBot(OpenAI 的爬虫)直接发 HTTP 请求到你的服务器,拿到 HTML 内容,不执行任何 JS。没有 JS 执行,GA4 的追踪代码就不会运行。没有追踪代码运行,GA4 就不知道这次访问发生过。
PerplexityBot、ClaudeBot、GoogleOther——同样的逻辑。它们是服务端 HTTP 客户端,不是浏览器。
BrightEdge 2026 年 4 月的数据说明了这个盲区的规模:AI Agent 活动占网站总流量约 15%。但这 15% 的绝大部分对 GA4 完全不可见。GA4 能观测到的 AI 活动——用户通过 AI 推荐链接在浏览器中访问你的网站——大约只占总流量的 1%(Adobe 数据)。
这意味着你的 GA4 仪表板可能只展示了 AI 影响的 6-7%(1% 中有 GA4 能识别的比例 / 15%+1% 总 AI 活动)。
Evidence Ladder:四级观测能力
我们定义了一个四级 Evidence Ladder,帮助团队理解自己目前的观测能力在哪里、升级到下一级能看到什么。
L0:GA4 基线(Baseline)
数据来源:GA4 默认配置 + 2026 年 3 月上线的"AI Assistants"渠道组
可观测的 AIAA 层级:
- Visit 层(部分):只有被 GA4 的 referrer 匹配规则识别的 AI 来源会话
- Commerce 层(部分):如果你配置了电商事件追踪(view_item, add_to_cart, purchase),可以看到 AI 来源会话的转化数据
看不到什么:
- Request 层完全不可见(AI Agent 的服务端请求不触发 GA4)
- Answer 层完全不可见(AI 系统回答中提及你的品牌不触发任何追踪)
- Visit 层中大量"假直接流量"——用户通过 AI 点击但 referrer 被丢失的访问
- 一些 AI 来源的 referrer 不在 GA4 识别列表中,被归类到"Direct"或"Organic Search"
典型指标覆盖率:AI 总活动的 5-10%
适合对象:刚开始关注 AI 影响的团队。L0 不需要任何额外部署,但它提供的 AI 画面严重不完整。
L1:一方 JS 增强(First-Party JS Enhancement)
数据来源:在 GA4 之上部署一段一方 JS 脚本,执行更精细的 AI 来源识别
升级内容:
- 扩展 AI referrer 识别列表(覆盖更多 AI 平台:Perplexity、You.com、Phind、Kagi、各区域 AI 搜索引擎)
- 通过 document.referrer + URL 参数 + navigator.userAgent 组合识别更多 AI 来源会话
- 标记 AI 来源会话的行为数据:着陆页、页面浏览路径、停留时间、互动事件
- 将 AI 来源标签写入一方 cookie,使后续回访也能关联到初次 AI 来源
可观测的 AIAA 层级:
- Visit 层(较完整):比 GA4 多捕获 30-80% 的 AI 来源会话
- Commerce 层(较完整):通过一方标签实现更准确的 AI 来源 → 电商行为归因
看不到什么:
- Request 层仍然完全不可见(一方 JS 只在浏览器环境中运行)
- Answer 层仍然不可见
- 不执行 JS 的 AI Agent 仍然不可见
典型指标覆盖率:AI 总活动的 8-15%
升级成本:低。通常是一段 2-5KB 的 JS 脚本,部署到你的网站模板中。
L1.5:Edge Lite Bridge(边缘轻量桥接)
数据来源:在 CDN/Edge 层(Cloudflare Workers、Vercel Edge Functions、AWS CloudFront Functions)部署一个轻量脚本
升级内容:
- 在 HTTP 请求到达你的服务器之前,在 Edge 层捕获 User-Agent、IP、请求路径、请求头
- 用 User-Agent 模式匹配和反向 DNS 来识别已知的 AI Agent(GPTBot、PerplexityBot、ClaudeBot、GoogleOther 等)
- 将 Agent 请求记录到日志流中,即使这些请求不执行 JS
可观测的 AIAA 层级:
- Request 层(首次可见!):能看到 AI Agent 的服务端请求——它们在抓取什么页面、频率多高、来自哪个 AI 平台
- Visit 层(与 L1 相同)
- Commerce 层(与 L1 相同)
看不到什么:
- Answer 层仍然不可见
- 无法识别伪装 User-Agent 的爬虫
- 无法区分同一 AI 平台的不同访问模式(如 GPTBot 爬虫 vs ChatGPT-User 浏览模式)
典型指标覆盖率:AI 总活动的 25-45%
升级效果:"灯泡时刻"。大多数团队在部署 Edge Lite 后,第一天就会看到 AI 活动指标跳升 200-500%。不是因为 AI Agent 突然变多了,而是因为你终于看到了一直在发生但从未被记录的 Agent 请求。这就是上一篇讨论的"Coverage Expansion Lift"。
升级成本:中低。Cloudflare Workers 或 Vercel Edge Functions 通常免费或成本极低。主要工作是编写 Agent 识别逻辑和日志管道。
L2:服务器日志分析(Server Log Analysis)
数据来源:Web 服务器(Nginx/Apache/Caddy)或应用服务器的访问日志
升级内容:
- 访问原始的 HTTP 请求日志:每个请求的完整 User-Agent、IP、请求路径、状态码、响应大小、时间戳
- 用反向 DNS 验证 AI Agent 的 IP 归属(如确认 GPTBot 的 IP 确实解析到 openai.com 的域名)
- 分析 Agent 的抓取模式:抓取频率、抓取路径分布、404/403 错误率、抓取深度
- 识别 Edge 层遗漏的 Agent(一些 Agent 用非标准的 User-Agent 字符串)
可观测的 AIAA 层级:
- Request 层(更完整):比 Edge Lite 多捕获 20-40% 的 Agent 请求
- Visit 层(与 L1 相同)
- Commerce 层(与 L1 相同)
新增能力:
- robots.txt 合规性分析:哪些 Agent 尊重你的 robots.txt 规则,哪些忽略
- 抓取健康度监控:Agent 是否遇到大量 404/5xx 错误(意味着你的网站对 AI 不友好)
- 带宽影响分析:AI Agent 消耗了多少服务器带宽
典型指标覆盖率:AI 总活动的 40-65%
升级成本:中。需要日志存储、解析管道和分析工具。对已有 ELK/Grafana/Datadog 栈的团队来说成本较低。
L3:企业遥测 + AI 应答采样(Enterprise Telemetry + Answer Sampling)
数据来源:全栈遥测(Edge + 服务器 + 一方 JS + 电商平台 + CRM)+ AI 应答采样系统
升级内容:
- 跨所有数据层的统一 AIAA 仪表板
- 电商平台数据集成:Shopify/WooCommerce/自建系统的订单数据与 AI 来源会话的 join
- CRM/ERP 集成:AI 归因订单到客户的 LTV 跟踪
- AI 应答采样系统:定期在多个 AI 平台(ChatGPT、Perplexity、Gemini、Claude)上测试品牌相关 prompt,记录品牌是否被提及、如何被描述、是否被推荐
- Share of Voice 追踪:在关键品类 prompt 中,你的品牌 vs 竞品的出现频率和推荐位置
可观测的 AIAA 层级:
- 全部五层:Answer、Request、Visit、Commerce、Attribution
- Answer 层首次可见!
- Attribution 层首次完整!(会话到订单的 join)
典型指标覆盖率:AI 总活动的 75-95%
升级成本:高。需要数据工程资源、多平台集成、AI 采样基础设施。
从 L0 到 L3 的关键洞察
级别 / 可见 AI 活动 / 新增 AIAA 层 / 首次部署的"跳升"
L0 / 5-10% / Visit(部分), Commerce(部分) / 基线
L1 / 8-15% / Visit(增强) / +30-80% Visit
L1.5 / 25-45% / Request / +200-500% 总活动
L2 / 40-65% / Request(增强) / +20-40% Request
L3 / 75-95% / Answer, Attribution / 首次完整画面
每次升级都会让你的"AI 指标"数字显著增长。但这是可见度提升,不是 AI 活动增长。上一篇讨论的"Coverage Expansion Lift"就是这个效应。团队必须在每次 Evidence Ladder 升级后,重新计算可比增长基线。
升级路径建议
- L0 → L1:几乎所有团队都应该立即做。成本极低(一段 JS),收益立竿见影。
- L1 → L1.5:推荐给所有认真对待 AI 影响的团队。Edge Lite 是"灯泡时刻"——你第一次看到 AI Agent 活动的真实规模。
- L1.5 → L2:推荐给有 DevOps 能力的团队。服务器日志提供最细粒度的 Agent 行为分析。
- L2 → L3:推荐给把 AI 视为战略渠道的企业。完整的 AIAA 五层覆盖需要数据工程投入,但它是唯一能产生 Attribution 层数据的级别。
Gravity CitationGraph 在 Evidence Ladder 中的位置
Gravity 的 CitationGraph 平台覆盖 L1.5 到 L3 的全部层级:
- Edge Lite Bridge(L1.5):预置的 Agent 识别逻辑,一键部署到 Cloudflare/Vercel,自动识别 50+ 已知 AI Agent
- 日志分析引擎(L2):解析 Nginx/Apache/CDN 日志,自动生成 Agent 行为报告
- 一方追踪 JS(L1):精细的 AI 来源识别和行为追踪
- AI 应答采样(L3 Answer 层):多平台、多语言的品牌 SOV 监测
- 电商归因桥接(L3 Attribution 层):Shopify/WooCommerce 订单数据与 AI 来源会话的自动 join
- 统一 AIAA Dashboard:五层 AIAA 指标在一个仪表板中,支持可比增长/覆盖扩展自动分离
对中国出海企业的启示
中国出海企业在 Evidence Ladder 上面临特殊挑战:
- 多市场异构:北美站可能用 Cloudflare(适合 Edge Lite),东南亚站可能用阿里云 CDN(需要不同的 Edge 策略),日本站可能用 AWS CloudFront。每个市场需要独立的 Edge 部署方案。
- 多 AI 生态:北美市场以 ChatGPT/Perplexity/Gemini 为主;日本市场要加上 Yahoo! JAPAN 的 AI 搜索;国内市场要监测 DeepSeek、豆包、Kimi。Agent 识别列表需要按市场定制。
- 数据合规:不同市场的 cookie 和追踪法规不同(GDPR、CCPA、PIPL)。一方 JS 追踪需要符合各市场的合规要求。
建议:先在主力市场(通常是北美)完成从 L0 到 L1.5 的升级,积累经验后复制到其他市场。不要试图同时在所有市场部署 L3——复杂度和成本不成正比。
下一篇预告
最后一篇我们把视野拉到行业层面:UCP、ACP、AP2 三大 Agentic Commerce 协议正在定义 AI 时代的商业基础设施。但它们之间存在一个巨大的"证据缺口"——从 AI 发现到 AI 结账之间的度量链路,以及为什么 AIAA 框架是连接这些协议的缺失层。
FAQ
Q1: 为什么 GA4 看不到大部分 AI Agent 活动?
A: 因为 GA4 依赖浏览器 JavaScript 来追踪访问。大多数 AI Agent(GPTBot、PerplexityBot、ClaudeBot 等)以服务端 HTTP 客户端的方式访问你的网站,不执行 JavaScript。没有 JS 执行,GA4 的追踪代码就不会运行,这些访问就完全不可见。BrightEdge 数据显示这类"暗 AI 流量"占总流量约 15%。
Q2: 从 L0 升级到 L1.5 需要多长时间?
A: L0 → L1(一方 JS 部署):通常 1-3 天。需要编写 AI 来源识别脚本并添加到网站模板。L1 → L1.5(Edge Lite 部署):通常 3-7 天。需要在 Cloudflare Workers 或 Vercel Edge Functions 中编写 Agent 识别逻辑和日志管道。总共约 1-2 周可以从 L0 到 L1.5。
Q3: 每次升级后指标都会跳升,如何向管理层解释?
A: 明确区分"Coverage Expansion Lift"和"Comparable Growth"。升级后的第一份报告应该包含这样的说明:"本周 AI 活动指标增长 350%。其中约 300% 来自 Edge Lite 部署带来的可见度提升(Coverage Expansion Lift),约 50% 为可比增长。之前有大量 AI Agent 请求一直在发生但我们无法观测到。"
Q4: Edge Lite Bridge 和 WAF/Bot 管理工具有什么区别?
A: WAF/Bot 管理工具(如 Cloudflare Bot Management、AWS WAF)的目标是阻止恶意机器人。Edge Lite Bridge 的目标是识别和记录 AI Agent 的访问,理解它们的行为模式。两者可以共存:WAF 阻止恶意爬虫,Edge Lite 记录合法 AI Agent 的活动数据。关键区别是目的不同——安全 vs 分析。
Q5: L3 的 AI 应答采样如何运作?
A: 定义一组与你的品牌、产品和品类相关的 prompt(如"最好的户外跑鞋品牌"、"[品牌名] vs [竞品名] 哪个更好")。在多个 AI 平台(ChatGPT、Perplexity、Gemini、Claude)上定期测试这些 prompt,记录你的品牌是否被提及、排在第几位、描述是否准确、是否被推荐。这构成 AIAA 的 Answer 层数据。Gravity 的 CitationGraph 已内置这个能力。