AI 에이전트 수는 허영 지표다: AIAA가 더 정확한 측정 방식인 이유

AI 검색과 AI 에이전트는 커머스와 B2B 구매 여정을 바꾸고 있습니다. Shopify는 AI 검색에서 발생한 주문이 큰 폭으로 증가했다고 밝혔고, BrightEdge는 AI 에이전트 활동이 전체 웹사이트 트래픽의 의미 있는 비중에 도달했다고 보고했습니다. 이런 숫자를 보면 많은 팀은 자연스럽게 묻습니다. “우리 사이트에는 몇 개의 AI 에이전트가 들어오고 있나?”

질문은 그럴듯합니다. 하지만 경영 지표로는 위험합니다. AI 에이전트의 “수”는 안정적인 단위가 아니기 때문입니다.

에이전트 정체성은 고정된 사람이 아니다

ChatGPT 하나만 보더라도 뒤에는 여러 접근 방식이 있습니다. GPTBot이 상품 페이지를 크롤링하고, ChatGPT-User가 사용자의 질문에 따라 정책 페이지를 가져오며, 또 다른 서버 측 호출이 가격이나 재고 정보를 확인할 수 있습니다. Gemini, Claude, Perplexity도 비슷하게 크롤러, 브라우징 모드, 검색 인덱스, API 호출이 분리되어 움직입니다.

이것을 하나의 에이전트로 봐야 할까요, 세 개로 봐야 할까요? User-Agent 기준인지, IP 기준인지, 리퍼러 기준인지, 역DNS 기준인지에 따라 답이 달라집니다. 더 중요한 문제는 따로 있습니다. 기업이 알고 싶은 것은 “몇 개였나”가 아니라 “그 접촉이 추천, 방문, 장바구니, 구매, 상담 중 어디까지 갔나”입니다.

숫자는 가치를 설명하지 못한다

한 개의 봇이 하루에 상품 카탈로그를 천 번 읽어도, 사람의 방문이나 주문으로 이어지지 않으면 상업적 가치는 제한적입니다. 반대로 한 사용자가 Perplexity에서 제품을 비교하다가 링크를 클릭해 사이트에 들어오고, 세 개의 상품 페이지를 읽은 뒤 문의나 구매를 남겼다면 기록상으로는 한 번의 AI 유입일 뿐이지만 비즈니스 가치는 분명합니다.

따라서 “Active Agents = 5” 같은 지표는 회의실에서는 간단해 보이지만 의사결정에는 약합니다. OpenAI, Gemini, Claude, Perplexity, 검색 크롤러, 서버 측 fetcher를 한 줄로 세어도 브랜드가 실제로 얼마나 발견되고, 추천되고, 전환되는지는 알 수 없습니다.

성숙한 표준은 에이전트 수가 아니라 행동을 본다

OpenTelemetry의 GenAI semantic conventions는 invoke_agent, execute_tool, tool call, handoff 같은 실행 단위를 관측합니다. OpenAI Agents SDK도 trace, span, tool call을 추적합니다. Agentic Commerce 논의에서도 마지막에 중요한 것은 checkout, purchase, refund, subscription 같은 거래 이벤트입니다.

방향은 명확합니다. AI의 상업적 가치는 “누가 존재했나”가 아니라 “무슨 일이 일어났나”로 측정됩니다. 광고에서도 노출만으로는 부족했고, 검색에서도 순위만으로는 부족했습니다. 클릭, 체류, 문의, 구매, LTV로 내려갈수록 지표는 강해집니다. AI에서도 같은 전환이 필요합니다.

AIAA: AI의 비즈니스 가치를 행동으로 측정하기

Gravity가 제안하는 AIAA, 즉 AI-Attributed Active Actions는 AI의 머릿수를 세는 지표가 아닙니다. AI 경로에서 증거로 확인할 수 있는 유효 행동을 측정합니다.

예를 들어 AI 답변이 브랜드를 언급했는가. AI 에이전트가 상품 정보나 가격 페이지를 읽었는가. AI 리퍼러에서 실제 사용자가 방문했는가. 그 방문이 상품 조회, 장바구니, 상담, 구매로 이어졌는가. 주문이 리퍼러, 세션, 주문 데이터와 연결되는가. 이 다섯 단계는 모두 “AI 트래픽”이지만 같은 의미가 아닙니다. 증거의 강도와 사업 가치가 다릅니다.

Active Agents를 완전히 버리자는 말은 아닙니다. 분석 차원으로는 유용합니다. 어떤 플랫폼이나 크롤러가 어떤 행동을 만들어내는지 볼 수 있기 때문입니다. 다만 북극성 지표가 되어서는 안 됩니다.

경영진에게 필요한 것은 AI 방문자 명단이 아니라, AI가 어느 단계에서 브랜드와 접촉했고 어떤 접촉이 사람의 행동과 매출에 가까워졌는지 보여주는 증거 체인입니다. AI 시대의 가시성은 순위표에서 행동 장부로 이동하고 있습니다. AIAA는 그 전환을 위한 언어입니다.

실무에서 먼저 바꿔야 할 것은 보고서의 구조입니다. 첫 줄에 “이번 달 AI 에이전트가 몇 개였나”를 두기보다, AI 답변에서의 브랜드 언급, 기계 요청, 사람 방문, 상업 이벤트, 주문 연결률을 분리해 놓아야 합니다. 예를 들어 ChatGPT 답변에서 브랜드가 비교 후보에 들어간 횟수, Perplexity에서 발생한 세션, AI 유입으로 추정되는 상품 조회, 상담 신청, 구매를 한 표 안에 놓고 각각의 증거 수준을 표시합니다. 관측 사실과 추정을 분리해야 숫자가 경영 의사결정에 쓰일 수 있습니다.

한국 시장에서는 이 구분이 더 중요합니다. 사용자는 AI 답변에서 브랜드를 처음 보고, Naver나 Google에서 다시 검색하고, 블로그 리뷰, 쇼핑 검색, 공식 사이트 FAQ, 유튜브 비교 영상을 거친 뒤 문의하거나 구매합니다. 마지막 유입만 보면 AI의 역할은 사라지고, 에이전트 수만 보면 구매 의도와 매출 근접도를 알 수 없습니다. AIAA는 AI가 만든 상류 관심을 CRM, 광고, 커머스 데이터와 연결하는 공통 언어가 됩니다.

또한 모든 AI 활동에 같은 점수를 줄 수 없습니다. 사이트맵을 읽은 crawler 요청과 사용자의 질문에 따라 가격 페이지를 가져온 요청은 다릅니다. AI 답변에서 브랜드명이 한 번 언급된 것과 경쟁사 비교 문맥에서 추천된 것은 다릅니다. AIAA는 Answer, Request, Visit, Commerce, Attribution을 하나의 “AI traffic”으로 섞지 않고, 증거 수준과 비즈니스 가치에 따라 따로 관리합니다.

Gravity가 보려는 것은 단순한 노출이 아닙니다. AI가 무엇을 읽었는지, 어떤 문맥에서 추천했는지, 어떤 사람이 들어왔는지, 어떤 행동을 했는지, 그 행동이 매출이나 상담으로 이어졌는지입니다. 이 구조가 있어야 콘텐츠 개선, 기술 SEO, 광고 예산, 상품 데이터 정비, 영업 follow-up의 우선순위를 제대로 정할 수 있습니다.

월간 리뷰에서는 AIAA를 다섯 층으로 읽는 것이 가장 실용적입니다. Answer에서는 AI 답변에 브랜드가 등장했는지, 설명이 정확한지, 경쟁사와 어떤 문맥에서 비교되는지 봅니다. Request에서는 AI 계열 crawler나 fetcher가 상품, 가격, 배송, FAQ, 사례 페이지를 읽었는지 봅니다. Visit에서는 사람이 AI 경유로 들어왔는지, 어느 페이지에 도착했는지, 바로 이탈했는지 확인합니다. Commerce에서는 상품 조회, 비교, 장바구니, 문의, 데모 예약 같은 행동을 봅니다. Attribution에서는 세션, CRM, 주문, 광고 접촉과 연결해 매출이나 파이프라인에 얼마나 가까운지 판단합니다.

이렇게 나누면 개선 작업도 달라집니다. Answer가 약하면 인용 가능한 정보원, 구조화 데이터, FAQ, 리뷰, 외부 신뢰 신호를 보강해야 합니다. Request는 많은데 Visit가 약하면 AI가 읽는 페이지에 명확한 링크, 상품 정보, 가격 설명, canonical, next action이 있는지 봐야 합니다. Visit는 있는데 Commerce가 약하면 landing page, 비교표, 신뢰 요소, 사례, CTA를 점검해야 합니다. Commerce는 있는데 Attribution이 약하면 session-to-order join, CRM 필드, UTM, server log 보존 기간을 손봐야 합니다. 에이전트 수만 보면 이런 진단이 불가능합니다.

한국 기업의 경영진에게 설명하자면, AIAA는 AI 시대의 영업 활동 장부에 가깝습니다. 영업 보고서에서 방문 횟수만 보면 수주 가능성을 알 수 없습니다. 누구를 만났는지, 어떤 니즈가 있었는지, 다음 단계는 무엇인지, 계약 가능성이 어느 정도인지 봐야 합니다. AI도 마찬가지입니다. 몇 개의 에이전트가 왔는지가 아니라, AI가 어떤 정보를 확인했고 어떤 고객 행동을 만들었으며 어떤 매출 결과에 가까워졌는지를 봐야 합니다.

또한 AIAA는 과장된 attribution을 막는 장치이기도 합니다. AI 답변에 브랜드가 언급됐다고 해서 그 달 매출을 모두 AI에 귀속할 수는 없습니다. 반대로 GA4에서 AI referrer가 적다고 해서 AI가 수요 형성에 영향을 주지 않았다고 단정할 수도 없습니다. AIAA는 강한 증거와 약한 증거를 분리하고, 어떤 숫자를 KPI로 볼지, 어떤 숫자를 진단 지표로 볼지 정하게 해 줍니다.

결국 AIAA는 마케팅 용어가 아니라 운영 설계입니다. 로그 보존 기간, bot 판정 규칙, AI referrer 정규화, GA4 이벤트명, CRM 필드, Shopify 주문 연결 방식까지 정해야 매월 같은 기준으로 비교할 수 있습니다. AI 검색 시대에 필요한 것은 화려한 대시보드보다 일관된 정의와 반복 가능한 증거 장부입니다.

FAQ

Q1: AI 에이전트 수는 아예 보지 말아야 하나요?

A: 볼 수는 있습니다. 하지만 핵심 KPI로 두면 안 됩니다. 에이전트 수는 식별 기준에 따라 쉽게 달라지고, 비즈니스 가치를 직접 설명하지 못합니다.

Q2: AIAA는 기존 AI 유입 분석과 무엇이 다른가요?

A: AI 답변, 기계 요청, 사람 방문, 상업 행동, 매출 귀속을 분리합니다. 서로 다른 증거 수준을 하나의 “AI 트래픽”으로 섞지 않습니다.

Q3: GA4만으로 측정할 수 있나요?

A: 일부만 가능합니다. GA4는 사람 방문의 일부를 볼 수 있지만 JavaScript를 실행하지 않는 크롤러나 서버 측 요청은 놓칩니다.

Q4: 한국 B2B 팀은 무엇부터 해야 하나요?

A: Naver, Google, ChatGPT, Perplexity 등에서 브랜드가 어떻게 발견되는지와 웹사이트 로그, 상담 전환, CRM 데이터를 분리해서 보는 기본 체계를 먼저 만들어야 합니다.

Q5: Gravity의 관점은 무엇인가요?

A: AI 검색 가시성, 웹사이트 증거 레이어, 로그, 어트리뷰션을 하나의 성장 인프라로 설계해야 한다는 것입니다.

FAQ

Q1: AI 에이전트 수는 아예 보지 말아야 하나요?

A: 볼 수는 있습니다. 하지만 핵심 KPI로 두면 안 됩니다. 에이전트 수는 식별 기준에 따라 쉽게 달라지고, 비즈니스 가치를 직접 설명하지 못합니다.

Q2: AIAA는 기존 AI 유입 분석과 무엇이 다른가요?

A: AI 답변, 기계 요청, 사람 방문, 상업 행동, 매출 귀속을 분리합니다. 서로 다른 증거 수준을 하나의 “AI 트래픽”으로 섞지 않습니다.

Q3: GA4만으로 측정할 수 있나요?

A: 일부만 가능합니다. GA4는 사람 방문의 일부를 볼 수 있지만 JavaScript를 실행하지 않는 크롤러나 서버 측 요청은 놓칩니다.

Q4: 한국 B2B 팀은 무엇부터 해야 하나요?

Q5: Gravity의 관점은 무엇인가요?

A: AI 검색 가시성, 웹사이트 증거 레이어, 로그, 어트리뷰션을 하나의 성장 인프라로 설계해야 한다는 것입니다.

AI 에이전트 수는 허영 지표다: AIAA가 더 정확한 측정 방식인 이유

에이전트 정체성은 고정된 사람이 아니다

숫자는 가치를 설명하지 못한다

성숙한 표준은 에이전트 수가 아니라 행동을 본다

AIAA: AI의 비즈니스 가치를 행동으로 측정하기

FAQ

Q1: AI 에이전트 수는 아예 보지 말아야 하나요?

Q2: AIAA는 기존 AI 유입 분석과 무엇이 다른가요?

Q3: GA4만으로 측정할 수 있나요?

Q4: 한국 B2B 팀은 무엇부터 해야 하나요?

Q5: Gravity의 관점은 무엇인가요?

관련 글

Paid + Organic 듀얼 트랙: AI 검색 시대의 브랜드 가시성 아키텍처

GEO 창은 얼마나 남았는가: 지금 자연 AI 가시성을 구축해야 하는 이유

OpenAI IPO와 1000억 달러 광고 야심: 시장은 무엇에 베팅하는가

AI 증거 그래프로 이어서 보기

더 자세히 알고 싶으신가요?

AI 에이전트 수는 허영 지표다: AIAA가 더 정확한 측정 방식인 이유

에이전트 정체성은 고정된 사람이 아니다

숫자는 가치를 설명하지 못한다

성숙한 표준은 에이전트 수가 아니라 행동을 본다

AIAA: AI의 비즈니스 가치를 행동으로 측정하기

FAQ

Q1: AI 에이전트 수는 아예 보지 말아야 하나요?

Q2: AIAA는 기존 AI 유입 분석과 무엇이 다른가요?

Q3: GA4만으로 측정할 수 있나요?

Q4: 한국 B2B 팀은 무엇부터 해야 하나요?

Q5: Gravity의 관점은 무엇인가요?

관련 글

Paid + Organic 듀얼 트랙: AI 검색 시대의 브랜드 가시성 아키텍처

GEO 창은 얼마나 남았는가: 지금 자연 AI 가시성을 구축해야 하는 이유

OpenAI IPO와 1000억 달러 광고 야심: 시장은 무엇에 베팅하는가

AI 증거 그래프로 이어서 보기

더 자세히 알고 싶으신가요?