让我们用一个合成场景来说明。下面的数字是为了说明测量口径而构造的示例,不代表 Gravity 客户或任何单一品牌的真实数据。
一个中型 DTC 品牌在 GA4 中看到的 AI 流量不到 1%。CMO 的第一反应是:这个渠道太小,不需要专项投入。
后来,团队部署了更完整的 AI 流量监测体系。新的数据画面不是一个更大的单一数字,而是五层信号:
- Layer 1(可追踪 AI 引荐):GA4 能看到一部分,但会受 referrer 丢失影响
- Layer 2(AI Overview 影响):GSC 能看到部分展示,但无法直接给出点击和转化
- Layer 3(Dark AI Traffic):服务端分析能发现一部分被归入 Direct 的 AI 来源访问
- Layer 4(AI 爬虫意图信号):服务器日志能区分训练、搜索、用户代取、实时验证和 agent action 等不同意图
- Layer 5(Citation SOV):主动采样能看到品牌在 AI 回答中的提及、位置和上下文
总结:这个合成场景要说明的不是某个固定 benchmark,而是测量口径的变化。CMO 的问题从「GA4 里 AI 是否足够大」变成了「哪一层 AI 影响正在被低估,哪一层需要运营动作」。以下是实现这个转变的四级路径。
Level 0:GA4 原生配置(5 分钟,零成本)
要做什么:
- 确认你的 GA4 property 已上线 AI Assistant 频道。进入 Reports → Acquisition → Traffic acquisition,查看是否有「AI Assistant」行。如果没有,可能还没有推到你的 property——等待即可。
- 不要删除之前的自定义 AI 频道组(如果有的话),保留它作为历史数据基线。
- 审计自定义频道组和原生频道的优先级,避免双重计算。
补充配置——自定义频道组覆盖更多 AI 平台:
GA4 原生识别范围有限,而且不同市场的 AI 平台生态差异很大。建议在 Admin → Data Display → Channel Groups 中创建或更新自定义频道组,用 referrer regex 补充 GA4 未原生归类的平台:
deepseek\.com perplexity\.ai kimi\.moonshot\.cn doubao\.com tongyi\.aliyun\.com|tongyi\.com|qwenlm\.ai zhipu\.ai|zhipuai\.cn|chatglm\.cn|bigmodel\.cn ernie\.baidu\.com|yiyan\.baidu\.com yuanbao\.tencent\.com poe\.com you\.com phind\.com grok\.x\.ai chat\.mistral\.ai|mistral\.ai iask\.ai
预期效果:
- 从「完全不可见」到「部分可见」
- 你开始能看到 ChatGPT、Gemini、Claude 的引荐流量
- 加上自定义配置后,你还能看到 DeepSeek、Kimi、豆包等中国 AI 平台的流量
- 但仍然看不到 Dark AI Traffic、AI Overview 流量、爬虫活动和零点击影响力
Level 1:GSC AI 报告 + 交叉分析(30 分钟/周)
要做什么:
- 检查 GSC 是否已上线 Search Generative AI 报告(正在分批推出)
- 建立周报模板:每周记录 AI impressions 的总量和趋势
- 交叉分析:将 GSC AI impressions 数据和 GA4 Organic Search 数据放在一起看
关键分析维度:
AI impressions 趋势 vs Organic clicks 趋势: 如果 AI impressions 在涨但 Organic clicks 在跌或持平,你正在经历「大脱钩」——用户在 AI 回答中得到了答案,不需要点击你的网站。这不一定是坏事——你的品牌在 AI 搜索中的可见度在提升——但你需要在其他地方(如 Direct 流量的增长、品牌搜索量的增长)寻找 AI 影响的间接证据。
哪些页面在 AI 中被引用最多: GSC AI 报告可以按页面查看 impressions。找出 AI 最常引用的页面,检查这些页面的内容是否准确、是否反映最新的产品信息。这些页面是你在 AI 搜索中的「门面」。
国家和设备分布: 不同市场的 AI 渗透率不同。美国市场可能 ChatGPT 主导,东南亚可能有更多的 Google AI Overview。了解分布才能制定差异化策略。
预期效果:
- 你开始理解「大脱钩」对自己品牌的影响程度
- 你知道了哪些页面是 AI 搜索中的核心资产
- 你有了 AI 可见度的趋势基线
Level 2:服务端分析 + 爬虫意图分类(技术投入中等)
这一级是质变——从客户端分析到服务端分析,从「只看人类点击」到「看到 AI 爬虫活动的全貌」。
要做什么:
- 部署服务端分析中间件,直接在服务器层面捕获所有 HTTP 请求
- 启用 AI 爬虫识别和意图分类
- 启用全 AI 平台引荐检测(覆盖 GA4 识别不了的平台)
- 配置 GEO Score 评分和 AI Discoverability Index
服务端分析 vs 客户端分析的核心区别:
维度 | GA4(客户端) | 服务端分析 |
|---|---|---|
AI 爬虫可见性 | ❌ 不可见 | ✅ 全量可见 |
referrer 丢失流量 | 归入 Direct | 可通过 UA + IP 识别 |
AdBlocker 影响 | ❌ 被屏蔽 | ✅ 不受影响 |
AI 平台覆盖 | 原生范围有限 | 可扩展到多平台覆盖 |
爬虫意图分类 | ❌ | ✅ 按意图智能分类 |
数据延迟 | 24-48 小时 | 实时 |
GDPR 合规 | 需配置 | 可内置 IP 匿名化 |
服务端中间件的选择:
部署方式取决于你的技术栈:
- Express / Node.js 应用:中间件直接嵌入请求处理链
- Next.js / Nuxt.js:在 middleware 或 server route 中集成
- Shopify / 无自建服务器:通过 Cloudflare Workers 或 Vercel Edge Functions 部署在 CDN 层
- WordPress:通过服务器端插件或 Nginx 日志分析
Level 2 解锁的新数据:
AI 爬虫画像: 你会看到完整的 AI 爬虫访问画面——哪些 AI 平台在关注你、关注的频率如何变化、关注的是哪些页面。爬虫请求的趋势和页面分布,能帮助你判断 AI 生态对你品牌和内容资产的关注度是否在变化。
意图分类: 你开始能区分 training 爬虫(长期价值)和 user_fetch 爬虫(高意图)。如果上个月 ChatGPT-User 的访问量翻了一倍,意味着有更多用户在 ChatGPT 对话中主动了解你的产品。
Dark AI Traffic 识别: 通过 User-Agent 和 IP 分析,你可以识别出一部分被 GA4 归入 Direct 的 AI 流量。
GEO Score 和 AI Discoverability Index: 你的网站在 AI 搜索中的可发现性得分——从 Schema 完整度、llms.txt 配置、爬虫覆盖率、引荐多样性到交互质量的综合评分。
预期效果:
- 你看到的 AI 活动量不再局限于 GA4 的可追踪引荐,而是包含被归入 Direct 的访问和爬虫活动层面的完整视图
- 你开始能用数据回答「AI 对我的品牌有多重要」这个问题
- 你有了按意图分类的爬虫数据,可以制定差异化的 GEO 策略
Level 3:Citation SOV 采样(持续运营)
这是最高阶的一级——测量零点击层的 AI 影响力。
要做什么:
- 定义与品牌相关的查询集(如「最好的户外储能产品」「便携式太阳能充电器推荐」等)
- 定期向主流 AI 平台发送这些查询
- 记录品牌是否被提及、提及的位置(第几个推荐)、提及的上下文(正面/中性/负面)、竞品对比情况
- 计算 Citation SOV(引用声量占比)和平均引用位置
Citation SOV 的核心指标:
指标 | 含义 |
|---|---|
Citation Rate | 品牌在相关查询中被 AI 提及的比例 |
Average Position | 被提及时在推荐列表中的平均位置(越小越好) |
Platform Coverage | 品牌在多少个 AI 平台中被提及 |
Sentiment Distribution | 提及的语调分布(正面/中性/负面) |
Competitive SOV | 相对于竞品的引用份额 |
采样频率建议:
- 核心查询(品牌词 + 品类词):每周
- 扩展查询(长尾词 + 场景词):每月
- 竞品比较查询:每两周
预期效果:
- 你第一次看到了 Layer 5 的数据——AI 在零点击场景下对你品牌的提及情况
- 你能量化「AI 认为我是这个品类的前几名」
- 你有了跨平台、跨时间的 AI 声量趋势数据
- 你的 AI 影响全景从单一 GA4 指标扩展为 Layer 1-5 的组合视图
投入产出对照
Level | 投入 | 新增覆盖 | 预期效果 |
|---|---|---|---|
L0 | 5 分钟配置 | Layer 1(部分) | AI 引荐流量从不可见到部分可见 |
L1 | 30 分钟/周 | Layer 2(仅 impressions) | 理解「大脱钩」程度 |
L2 | 中等技术投入 | Layer 1(100%)+ Layer 3 + Layer 4 | AI 活动全量可见,爬虫意图可分类 |
L3 | 持续运营投入 | Layer 5 | 零点击影响力可测量,完整 AI 影响画面 |
推荐升级路径:
- 所有品牌:立即完成 L0
- 月活 > 10,000 的品牌:1-2 个月内上 L1
- 认真对待 AI 增长的品牌:3 个月内上 L2
- 品类领导者 / 头部 DTC:6 个月内上 L3
下一篇预告
从具体的监测实践,我们回到更大的图景。GA4 代表的是「流量归因」范式——但 AI 时代需要一个全新的「可发现性」范式。最后一篇,我们讨论这个度量范式的根本转移。
FAQ
Q1: Level 0 的自定义频道组配置会和 GA4 原生 AI Assistant 频道冲突吗?
A: 可能会。如果自定义频道组匹配了 GA4 原生已识别的 AI 平台(如 chatgpt.com),可能出现双重计算。建议将自定义频道组限定为只匹配 GA4 原生不识别的平台(如 DeepSeek、Kimi 等),或者调整频道组优先级。
Q2: 没有自建服务器的 Shopify 品牌能做到 Level 2 吗?
A: 可以。通过 Cloudflare Workers、Vercel Edge Functions 或其他 CDN 层的边缘计算,可以在不修改 Shopify 应用代码的情况下部署服务端分析。Gravity 的 CitationGraph 平台提供即插即用的集成方案。
Q3: Citation SOV 采样需要多少样本量才可靠?
A: 不建议使用一个固定的通用样本量。可靠性取决于品类复杂度、市场数量、关键词分层、平台覆盖和监测周期。样本量过小时,单次查询的随机性(AI 回答的非确定性)会导致数据不稳定。更大的查询集、更广的平台覆盖和更长的连续观测会显著提高数据可靠性。
Q4: 这四级升级路径的总成本大约是多少?
A: L0 是零成本(GA4 原生功能)。L1 是时间成本(每周约 30 分钟人工分析)。L2 取决于技术方案选择——自建约需要 1-2 名工程师投入 2-4 周,使用 SaaS 平台(如 CitationGraph)则是月费模式。L3 是持续运营成本,取决于采样频率和覆盖范围。
Q5: 如果只能做一级,应该选哪个?
A: Level 2(服务端分析)。它是性价比最高的一级——一次部署、持续收益,让你从 GA4 的部分捕获率跳到接近 100%,同时解锁爬虫意图分类这个 GA4 完全不具备的能力。L0 虽然免费但增量有限,L3 虽然最有战略价值但投入也最大。