Evidence Ladder：从浏览器 JS 到企业遥测的四级 AI 观测能力

上一篇我们讨论了 Shopify 13 倍增长中，如何区分"真增长"和"可见度提升"。这篇文章回答一个更底层的问题：为什么你当前的分析工具只能看到 AI 活动的冰山一角？

答案在于 AI Agent 和浏览器 JavaScript 追踪之间的根本架构冲突。

为什么 GA4 看不到 AI 的大部分活动

Google Analytics 4（以及几乎所有基于浏览器 JavaScript 的分析工具——Amplitude、Mixpanel、Segment 前端 SDK）工作原理是：

网页加载时，浏览器执行一段 JS 追踪代码
JS 代码读取 referrer、URL 参数、cookie，生成一个会话记录
会话记录被发送到分析服务器

问题在于，大多数 AI Agent 不通过浏览器访问你的网站。

GPTBot（OpenAI 的爬虫）直接发 HTTP 请求到你的服务器，拿到 HTML 内容，不执行任何 JS。没有 JS 执行，GA4 的追踪代码就不会运行。没有追踪代码运行，GA4 就不知道这次访问发生过。

PerplexityBot、ClaudeBot、GoogleOther——同样的逻辑。它们是服务端 HTTP 客户端，不是浏览器。

BrightEdge 2026 年 4 月的数据说明了这个盲区的规模：AI Agent 活动占网站总流量约 15%。但这 15% 的绝大部分对 GA4 完全不可见。GA4 能观测到的 AI 活动——用户通过 AI 推荐链接在浏览器中访问你的网站——大约只占总流量的 1%（Adobe 数据）。

这意味着你的 GA4 仪表板可能只展示了 AI 影响的 6-7%（1% 中有 GA4 能识别的比例 / 15%+1% 总 AI 活动）。

Evidence Ladder：四级观测能力

我们定义了一个四级 Evidence Ladder，帮助团队理解自己目前的观测能力在哪里、升级到下一级能看到什么。

L0：GA4 基线（Baseline）

数据来源：GA4 默认配置 + 2026 年 3 月上线的"AI Assistants"渠道组

可观测的 AIAA 层级：

Visit 层（部分）：只有被 GA4 的 referrer 匹配规则识别的 AI 来源会话
Commerce 层（部分）：如果你配置了电商事件追踪（view_item, add_to_cart, purchase），可以看到 AI 来源会话的转化数据

看不到什么：

Request 层完全不可见（AI Agent 的服务端请求不触发 GA4）
Answer 层完全不可见（AI 系统回答中提及你的品牌不触发任何追踪）
Visit 层中大量"假直接流量"——用户通过 AI 点击但 referrer 被丢失的访问
一些 AI 来源的 referrer 不在 GA4 识别列表中，被归类到"Direct"或"Organic Search"

典型指标覆盖率：AI 总活动的 5-10%

适合对象：刚开始关注 AI 影响的团队。L0 不需要任何额外部署，但它提供的 AI 画面严重不完整。

L1：一方 JS 增强（First-Party JS Enhancement）

数据来源：在 GA4 之上部署一段一方 JS 脚本，执行更精细的 AI 来源识别

升级内容：

扩展 AI referrer 识别列表（覆盖更多 AI 平台：Perplexity、You.com、Phind、Kagi、各区域 AI 搜索引擎）
通过 document.referrer + URL 参数 + navigator.userAgent 组合识别更多 AI 来源会话
标记 AI 来源会话的行为数据：着陆页、页面浏览路径、停留时间、互动事件
将 AI 来源标签写入一方 cookie，使后续回访也能关联到初次 AI 来源

可观测的 AIAA 层级：

Visit 层（较完整）：比 GA4 多捕获 30-80% 的 AI 来源会话
Commerce 层（较完整）：通过一方标签实现更准确的 AI 来源 → 电商行为归因

看不到什么：

Request 层仍然完全不可见（一方 JS 只在浏览器环境中运行）
Answer 层仍然不可见
不执行 JS 的 AI Agent 仍然不可见

典型指标覆盖率：AI 总活动的 8-15%

升级成本：低。通常是一段 2-5KB 的 JS 脚本，部署到你的网站模板中。

L1.5：Edge Lite Bridge（边缘轻量桥接）

数据来源：在 CDN/Edge 层（Cloudflare Workers、Vercel Edge Functions、AWS CloudFront Functions）部署一个轻量脚本

升级内容：

在 HTTP 请求到达你的服务器之前，在 Edge 层捕获 User-Agent、IP、请求路径、请求头
用 User-Agent 模式匹配和反向 DNS 来识别已知的 AI Agent（GPTBot、PerplexityBot、ClaudeBot、GoogleOther 等）
将 Agent 请求记录到日志流中，即使这些请求不执行 JS

可观测的 AIAA 层级：

Request 层（首次可见！）：能看到 AI Agent 的服务端请求——它们在抓取什么页面、频率多高、来自哪个 AI 平台
Visit 层（与 L1 相同）
Commerce 层（与 L1 相同）

看不到什么：

Answer 层仍然不可见
无法识别伪装 User-Agent 的爬虫
无法区分同一 AI 平台的不同访问模式（如 GPTBot 爬虫 vs ChatGPT-User 浏览模式）

典型指标覆盖率：AI 总活动的 25-45%

升级效果："灯泡时刻"。大多数团队在部署 Edge Lite 后，第一天就会看到 AI 活动指标跳升 200-500%。不是因为 AI Agent 突然变多了，而是因为你终于看到了一直在发生但从未被记录的 Agent 请求。这就是上一篇讨论的"Coverage Expansion Lift"。

升级成本：中低。Cloudflare Workers 或 Vercel Edge Functions 通常免费或成本极低。主要工作是编写 Agent 识别逻辑和日志管道。

L2：服务器日志分析（Server Log Analysis）

数据来源：Web 服务器（Nginx/Apache/Caddy）或应用服务器的访问日志

升级内容：

访问原始的 HTTP 请求日志：每个请求的完整 User-Agent、IP、请求路径、状态码、响应大小、时间戳
用反向 DNS 验证 AI Agent 的 IP 归属（如确认 GPTBot 的 IP 确实解析到 openai.com 的域名）
分析 Agent 的抓取模式：抓取频率、抓取路径分布、404/403 错误率、抓取深度
识别 Edge 层遗漏的 Agent（一些 Agent 用非标准的 User-Agent 字符串）

可观测的 AIAA 层级：

Request 层（更完整）：比 Edge Lite 多捕获 20-40% 的 Agent 请求
Visit 层（与 L1 相同）
Commerce 层（与 L1 相同）

新增能力：

robots.txt 合规性分析：哪些 Agent 尊重你的 robots.txt 规则，哪些忽略
抓取健康度监控：Agent 是否遇到大量 404/5xx 错误（意味着你的网站对 AI 不友好）
带宽影响分析：AI Agent 消耗了多少服务器带宽

典型指标覆盖率：AI 总活动的 40-65%

升级成本：中。需要日志存储、解析管道和分析工具。对已有 ELK/Grafana/Datadog 栈的团队来说成本较低。

L3：企业遥测 + AI 应答采样（Enterprise Telemetry + Answer Sampling）

数据来源：全栈遥测（Edge + 服务器 + 一方 JS + 电商平台 + CRM）+ AI 应答采样系统

升级内容：

跨所有数据层的统一 AIAA 仪表板
电商平台数据集成：Shopify/WooCommerce/自建系统的订单数据与 AI 来源会话的 join
CRM/ERP 集成：AI 归因订单到客户的 LTV 跟踪
AI 应答采样系统：定期在多个 AI 平台（ChatGPT、Perplexity、Gemini、Claude）上测试品牌相关 prompt，记录品牌是否被提及、如何被描述、是否被推荐
Share of Voice 追踪：在关键品类 prompt 中，你的品牌 vs 竞品的出现频率和推荐位置

可观测的 AIAA 层级：

全部五层：Answer、Request、Visit、Commerce、Attribution
Answer 层首次可见！
Attribution 层首次完整！（会话到订单的 join）

典型指标覆盖率：AI 总活动的 75-95%

升级成本：高。需要数据工程资源、多平台集成、AI 采样基础设施。

从 L0 到 L3 的关键洞察

级别	可见 AI 活动	新增 AIAA 层	首次部署的"跳升"
L0	5-10%	Visit(部分), Commerce(部分)	基线
L1	8-15%	Visit(增强)	+30-80% Visit
L1.5	25-45%	Request	+200-500% 总活动
L2	40-65%	Request(增强)	+20-40% Request
L3	75-95%	Answer, Attribution	首次完整画面

每次升级都会让你的"AI 指标"数字显著增长。但这是可见度提升，不是 AI 活动增长。上一篇讨论的"Coverage Expansion Lift"就是这个效应。团队必须在每次 Evidence Ladder 升级后，重新计算可比增长基线。

升级路径建议

L0 → L1：几乎所有团队都应该立即做。成本极低（一段 JS），收益立竿见影。
L1 → L1.5：推荐给所有认真对待 AI 影响的团队。Edge Lite 是"灯泡时刻"——你第一次看到 AI Agent 活动的真实规模。
L1.5 → L2：推荐给有 DevOps 能力的团队。服务器日志提供最细粒度的 Agent 行为分析。
L2 → L3：推荐给把 AI 视为战略渠道的企业。完整的 AIAA 五层覆盖需要数据工程投入，但它是唯一能产生 Attribution 层数据的级别。

Gravity CitationGraph 在 Evidence Ladder 中的位置

Gravity 的 CitationGraph 平台覆盖 L1.5 到 L3 的全部层级：

Edge Lite Bridge（L1.5）：预置的 Agent 识别逻辑，一键部署到 Cloudflare/Vercel，自动识别 50+ 已知 AI Agent
日志分析引擎（L2）：解析 Nginx/Apache/CDN 日志，自动生成 Agent 行为报告
一方追踪 JS（L1）：精细的 AI 来源识别和行为追踪
AI 应答采样（L3 Answer 层）：多平台、多语言的品牌 SOV 监测
电商归因桥接（L3 Attribution 层）：Shopify/WooCommerce 订单数据与 AI 来源会话的自动 join
统一 AIAA Dashboard：五层 AIAA 指标在一个仪表板中，支持可比增长/覆盖扩展自动分离

对中国出海企业的启示

中国出海企业在 Evidence Ladder 上面临特殊挑战：

多市场异构：北美站可能用 Cloudflare（适合 Edge Lite），东南亚站可能用阿里云 CDN（需要不同的 Edge 策略），日本站可能用 AWS CloudFront。每个市场需要独立的 Edge 部署方案。
多 AI 生态：北美市场以 ChatGPT/Perplexity/Gemini 为主；日本市场要加上 Yahoo! JAPAN 的 AI 搜索；国内市场要监测 DeepSeek、豆包、Kimi。Agent 识别列表需要按市场定制。
数据合规：不同市场的 cookie 和追踪法规不同（GDPR、CCPA、PIPL）。一方 JS 追踪需要符合各市场的合规要求。

建议：先在主力市场（通常是北美）完成从 L0 到 L1.5 的升级，积累经验后复制到其他市场。不要试图同时在所有市场部署 L3——复杂度和成本不成正比。

下一篇预告

最后一篇我们把视野拉到行业层面：UCP、ACP、AP2 三大 Agentic Commerce 协议正在定义 AI 时代的商业基础设施。但它们之间存在一个巨大的"证据缺口"——从 AI 发现到 AI 结账之间的度量链路，以及为什么 AIAA 框架是连接这些协议的缺失层。

FAQ

Q1: 为什么 GA4 看不到大部分 AI Agent 活动？

A: 因为 GA4 依赖浏览器 JavaScript 来追踪访问。大多数 AI Agent（GPTBot、PerplexityBot、ClaudeBot 等）以服务端 HTTP 客户端的方式访问你的网站，不执行 JavaScript。没有 JS 执行，GA4 的追踪代码就不会运行，这些访问就完全不可见。BrightEdge 数据显示这类"暗 AI 流量"占总流量约 15%。

Q2: 从 L0 升级到 L1.5 需要多长时间？

A: L0 → L1（一方 JS 部署）：通常 1-3 天。需要编写 AI 来源识别脚本并添加到网站模板。L1 → L1.5（Edge Lite 部署）：通常 3-7 天。需要在 Cloudflare Workers 或 Vercel Edge Functions 中编写 Agent 识别逻辑和日志管道。总共约 1-2 周可以从 L0 到 L1.5。

Q3: 每次升级后指标都会跳升，如何向管理层解释？

A: 明确区分"Coverage Expansion Lift"和"Comparable Growth"。升级后的第一份报告应该包含这样的说明："本周 AI 活动指标增长 350%。其中约 300% 来自 Edge Lite 部署带来的可见度提升（Coverage Expansion Lift），约 50% 为可比增长。之前有大量 AI Agent 请求一直在发生但我们无法观测到。"

Q4: Edge Lite Bridge 和 WAF/Bot 管理工具有什么区别？

A: WAF/Bot 管理工具（如 Cloudflare Bot Management、AWS WAF）的目标是阻止恶意机器人。Edge Lite Bridge 的目标是识别和记录 AI Agent 的访问，理解它们的行为模式。两者可以共存：WAF 阻止恶意爬虫，Edge Lite 记录合法 AI Agent 的活动数据。关键区别是目的不同——安全 vs 分析。

Q5: L3 的 AI 应答采样如何运作？

A: 定义一组与你的品牌、产品和品类相关的 prompt（如"最好的户外跑鞋品牌"、"[品牌名] vs [竞品名] 哪个更好"）。在多个 AI 平台（ChatGPT、Perplexity、Gemini、Claude）上定期测试这些 prompt，记录你的品牌是否被提及、排在第几位、描述是否准确、是否被推荐。这构成 AIAA 的 Answer 层数据。Gravity 的 CitationGraph 已内置这个能力。

级别

可见 AI 活动

新增 AIAA 层

首次部署的"跳升"

5-10%

Visit(部分), Commerce(部分)

基线

8-15%

Visit(增强)

+30-80% Visit

L1.5

25-45%

Request

+200-500% 总活动

40-65%

Request(增强)

+20-40% Request

75-95%

Answer, Attribution

首次完整画面

FAQ

Q1: 为什么 GA4 看不到大部分 AI Agent 活动？

Q2: 从 L0 升级到 L1.5 需要多长时间？

Q3: 每次升级后指标都会跳升，如何向管理层解释？

Q4: Edge Lite Bridge 和 WAF/Bot 管理工具有什么区别？

Q5: L3 的 AI 应答采样如何运作？

Evidence Ladder：从浏览器 JS 到企业遥测的四级 AI 观测能力

为什么 GA4 看不到 AI 的大部分活动

Evidence Ladder：四级观测能力

L0：GA4 基线（Baseline）

看不到什么：

L1：一方 JS 增强（First-Party JS Enhancement）

看不到什么：

L1.5：Edge Lite Bridge（边缘轻量桥接）

看不到什么：

L2：服务器日志分析（Server Log Analysis）

新增能力：

L3：企业遥测 + AI 应答采样（Enterprise Telemetry + Answer Sampling）

从 L0 到 L3 的关键洞察

升级路径建议

Gravity CitationGraph 在 Evidence Ladder 中的位置

对中国出海企业的启示

下一篇预告

FAQ

Q1: 为什么 GA4 看不到大部分 AI Agent 活动？

Q2: 从 L0 升级到 L1.5 需要多长时间？

Q3: 每次升级后指标都会跳升，如何向管理层解释？

Q4: Edge Lite Bridge 和 WAF/Bot 管理工具有什么区别？

Q5: L3 的 AI 应答采样如何运作？

相关文章

Paid + Organic 双轨策略：AI 搜索时代的品牌可见性架构

GEO 窗口期还有多久：为什么现在是建立自然可见性的最佳时机

OpenAI 的 IPO 与千亿美元广告野心：市场在赌什么

继续查看 AI 证据图

想了解更多？

Evidence Ladder：从浏览器 JS 到企业遥测的四级 AI 观测能力

为什么 GA4 看不到 AI 的大部分活动

Evidence Ladder：四级观测能力

L0：GA4 基线（Baseline）

看不到什么：

L1：一方 JS 增强（First-Party JS Enhancement）

看不到什么：

L1.5：Edge Lite Bridge（边缘轻量桥接）

看不到什么：

L2：服务器日志分析（Server Log Analysis）

新增能力：

L3：企业遥测 + AI 应答采样（Enterprise Telemetry + Answer Sampling）

从 L0 到 L3 的关键洞察

升级路径建议

Gravity CitationGraph 在 Evidence Ladder 中的位置

对中国出海企业的启示

下一篇预告

FAQ

Q1: 为什么 GA4 看不到大部分 AI Agent 活动？

Q2: 从 L0 升级到 L1.5 需要多长时间？

Q3: 每次升级后指标都会跳升，如何向管理层解释？

Q4: Edge Lite Bridge 和 WAF/Bot 管理工具有什么区别？

Q5: L3 的 AI 应答采样如何运作？

相关文章

Paid + Organic 双轨策略：AI 搜索时代的品牌可见性架构

GEO 窗口期还有多久：为什么现在是建立自然可见性的最佳时机

OpenAI 的 IPO 与千亿美元广告野心：市场在赌什么

继续查看 AI 证据图

想了解更多？