AI 검색과 AI 에이전트는 커머스와 B2B 구매 여정을 바꾸고 있습니다. Shopify는 AI 검색에서 발생한 주문이 큰 폭으로 증가했다고 밝혔고, BrightEdge는 AI 에이전트 활동이 전체 웹사이트 트래픽의 의미 있는 비중에 도달했다고 보고했습니다. 이런 숫자를 보면 많은 팀은 자연스럽게 묻습니다. “우리 사이트에는 몇 개의 AI 에이전트가 들어오고 있나?”
질문은 그럴듯합니다. 하지만 경영 지표로는 위험합니다. AI 에이전트의 “수”는 안정적인 단위가 아니기 때문입니다.
에이전트 정체성은 고정된 사람이 아니다
ChatGPT 하나만 보더라도 뒤에는 여러 접근 방식이 있습니다. GPTBot이 상품 페이지를 크롤링하고, ChatGPT-User가 사용자의 질문에 따라 정책 페이지를 가져오며, 또 다른 서버 측 호출이 가격이나 재고 정보를 확인할 수 있습니다. Gemini, Claude, Perplexity도 비슷하게 크롤러, 브라우징 모드, 검색 인덱스, API 호출이 분리되어 움직입니다.
이것을 하나의 에이전트로 봐야 할까요, 세 개로 봐야 할까요? User-Agent 기준인지, IP 기준인지, 리퍼러 기준인지, 역DNS 기준인지에 따라 답이 달라집니다. 더 중요한 문제는 따로 있습니다. 기업이 알고 싶은 것은 “몇 개였나”가 아니라 “그 접촉이 추천, 방문, 장바구니, 구매, 상담 중 어디까지 갔나”입니다.
숫자는 가치를 설명하지 못한다
한 개의 봇이 하루에 상품 카탈로그를 천 번 읽어도, 사람의 방문이나 주문으로 이어지지 않으면 상업적 가치는 제한적입니다. 반대로 한 사용자가 Perplexity에서 제품을 비교하다가 링크를 클릭해 사이트에 들어오고, 세 개의 상품 페이지를 읽은 뒤 문의나 구매를 남겼다면 기록상으로는 한 번의 AI 유입일 뿐이지만 비즈니스 가치는 분명합니다.
따라서 “Active Agents = 5” 같은 지표는 회의실에서는 간단해 보이지만 의사결정에는 약합니다. OpenAI, Gemini, Claude, Perplexity, 검색 크롤러, 서버 측 fetcher를 한 줄로 세어도 브랜드가 실제로 얼마나 발견되고, 추천되고, 전환되는지는 알 수 없습니다.
성숙한 표준은 에이전트 수가 아니라 행동을 본다
OpenTelemetry의 GenAI semantic conventions는 invoke_agent, execute_tool, tool call, handoff 같은 실행 단위를 관측합니다. OpenAI Agents SDK도 trace, span, tool call을 추적합니다. Agentic Commerce 논의에서도 마지막에 중요한 것은 checkout, purchase, refund, subscription 같은 거래 이벤트입니다.
방향은 명확합니다. AI의 상업적 가치는 “누가 존재했나”가 아니라 “무슨 일이 일어났나”로 측정됩니다. 광고에서도 노출만으로는 부족했고, 검색에서도 순위만으로는 부족했습니다. 클릭, 체류, 문의, 구매, LTV로 내려갈수록 지표는 강해집니다. AI에서도 같은 전환이 필요합니다.
AIAA: AI의 비즈니스 가치를 행동으로 측정하기
Gravity가 제안하는 AIAA, 즉 AI-Attributed Active Actions는 AI의 머릿수를 세는 지표가 아닙니다. AI 경로에서 증거로 확인할 수 있는 유효 행동을 측정합니다.
예를 들어 AI 답변이 브랜드를 언급했는가. AI 에이전트가 상품 정보나 가격 페이지를 읽었는가. AI 리퍼러에서 실제 사용자가 방문했는가. 그 방문이 상품 조회, 장바구니, 상담, 구매로 이어졌는가. 주문이 리퍼러, 세션, 주문 데이터와 연결되는가. 이 다섯 단계는 모두 “AI 트래픽”이지만 같은 의미가 아닙니다. 증거의 강도와 사업 가치가 다릅니다.
Active Agents를 완전히 버리자는 말은 아닙니다. 분석 차원으로는 유용합니다. 어떤 플랫폼이나 크롤러가 어떤 행동을 만들어내는지 볼 수 있기 때문입니다. 다만 북극성 지표가 되어서는 안 됩니다.
경영진에게 필요한 것은 AI 방문자 명단이 아니라, AI가 어느 단계에서 브랜드와 접촉했고 어떤 접촉이 사람의 행동과 매출에 가까워졌는지 보여주는 증거 체인입니다. AI 시대의 가시성은 순위표에서 행동 장부로 이동하고 있습니다. AIAA는 그 전환을 위한 언어입니다.
FAQ
Q1: AI 에이전트 수는 아예 보지 말아야 하나요?
A: 볼 수는 있습니다. 하지만 핵심 KPI로 두면 안 됩니다. 에이전트 수는 식별 기준에 따라 쉽게 달라지고, 비즈니스 가치를 직접 설명하지 못합니다.
Q2: AIAA는 기존 AI 유입 분석과 무엇이 다른가요?
A: AI 답변, 기계 요청, 사람 방문, 상업 행동, 매출 귀속을 분리합니다. 서로 다른 증거 수준을 하나의 “AI 트래픽”으로 섞지 않습니다.
Q3: GA4만으로 측정할 수 있나요?
A: 일부만 가능합니다. GA4는 사람 방문의 일부를 볼 수 있지만 JavaScript를 실행하지 않는 크롤러나 서버 측 요청은 놓칩니다.
Q4: 한국 B2B 팀은 무엇부터 해야 하나요?
A: Naver, Google, ChatGPT, Perplexity 등에서 브랜드가 어떻게 발견되는지와 웹사이트 로그, 상담 전환, CRM 데이터를 분리해서 보는 기본 체계를 먼저 만들어야 합니다.
Q5: Gravity의 관점은 무엇인가요?
A: AI 검색 가시성, 웹사이트 증거 레이어, 로그, 어트리뷰션을 하나의 성장 인프라로 설계해야 한다는 것입니다.