B2A 인프라는 AI가 상품을 읽게 만듭니다. 그러나 더 중요한 질문은 읽은 뒤에 무엇이 일어났는가입니다. 사용자가 ChatGPT에서 상품을 묻고, AI가 카탈로그를 조회하고, 세 브랜드를 추천하고, 사용자가 클릭하고, Shopify에서 주문하는 전체 흐름을 한 참여자가 모두 보지는 못합니다.
ChatGPT는 추천 내용을 알지만 구매 여부는 모릅니다. Shopify는 주문을 알지만 어떤 AI 추천이 출발점이었는지 모릅니다. GA4는 일부 referrer를 보지만 질문 맥락과 경쟁 후보를 보지 못합니다. UCP는 카탈로그 요청을 보지만 사이트 행동을 보지 못합니다. 이것이 증거 공백입니다.
이 공백은 설계 실수가 아니라 구조적 결과입니다. 프로토콜은 상호운용성을 해결하고, AI 플랫폼은 외부 이동 후 행동을 추적하지 않으며, 판매자 분석 도구는 AI 상류 맥락을 이해하지 못합니다. 그래서 AI 매출 기여가 과소평가됩니다.
CitationGraph는 AIAA 5계층으로 이 중간을 채웁니다. Answer는 AI 답변, Request는 Agent 요청, Visit은 AI 유입, Commerce는 사이트 행동, Attribution은 주문 연결입니다. GEO 도구가 상류만 보고 attribution 도구가 하류만 본다면 CitationGraph는 둘을 증거 체인으로 연결합니다.
브랜드는 프로토콜 성숙을 기다릴 필요가 없습니다. 먼저 first-party JS로 AI 유입을 식별하고, Edge Lite로 서버 요청을 관찰하고, session-to-order join으로 매출까지 연결해야 합니다.
실무 관점에서 AI 추천부터 주문까지의 증거 공백는 단발성 콘텐츠 과제가 아닙니다. 상품 데이터, AI 답변에서의 표현, Agent 요청, 유입 이후 행동, 주문 연결을 하나의 증거선으로 봐야 합니다. 그렇지 않으면 팀은 “AI 쪽에서 뭔가 늘고 있다”는 말 이상으로 예산과 우선순위를 결정할 수 없습니다.
또 하나 중요한 점은 과도한 단정을 피하는 것입니다. AI 검색과 Agentic Commerce 측정은 아직 성숙 중입니다. prompt sampling, referrer, server log, Shopify order는 각각 장단점이 있습니다. 여러 약한 신호를 단순히 합산하기보다 계층별 신뢰도를 명확히 두고 개선 순서를 정해야 합니다.
FAQ
Q1: 증거 공백이란 무엇인가요?
A: AI 추천부터 주문까지 이어지는 중간 측정 체인의 공백입니다.
Q2: 프로토콜이 성숙하면 해결되나요?
A: 아닙니다. 프로토콜은 상호운용성이고 측정 시스템이 아닙니다.
Q3: 어디서 시작해야 하나요?
A: Visit 계층, Edge Lite, session-to-order join 순서가 현실적입니다.
Q4: 광고팀에는 어떤 의미인가요?
A: AI 기여가 Direct나 Organic으로 흡수되어 예산 경쟁에서 저평가됩니다.