AI Search Visibility · Measurement Infrastructure

AI 답변에서 우리 회사가
어떻게 보이는지 측정합니다.

AIO KOREA는 ChatGPT · Claude · Perplexity · Google AI 검색형 답변과 네이버 AI 브리핑에서 한국 기업이 어떻게 발견·언급·인용되는지를 측정하고, 공개 웹 근거와 콘텐츠 구조를 개선해 AI 검색 가시성을 높이는 B2B 측정·모니터링 인프라입니다.

측정합니다. 보장하지 않습니다. 모든 점수에는 신뢰구간 · 산식 버전 · 측정일이 함께 표시됩니다.

audit_run · sample.kr
v1.0 · n=30 · 4 engines

AIO Score

76

±2.4 · 95% CI

신뢰도

High

n≥30 · 4 engines

변화

+6.1

전월 대비

노출도
78·28%
AI 점유율
64·22%
출처 품질
71·22%
엔티티 정확도
92·11%
신뢰성
88·6%
감성 안전
95·6%
위치
60·5%
OpenAIClaudePerplexityNaver*
* 사람 수동 측정

Core Engineering

측정의 정확도와 재현성을 위한 4가지 기술 축

단일 LLM 응답이 아니라 다엔진·다회차·증거 보존을 전제로 설계된 측정 인프라입니다. 점수가 아닌 측정값의 신뢰도까지 함께 제공합니다.

01 · multi-engine

4개 엔진 · 독립 측정

OpenAI Responses · Claude Messages · Perplexity Sonar · 네이버 AI 브리핑(수동)을 같은 프롬프트로 측정해 단일 엔진 편향을 제거합니다.

  • 엔진 다양성 = Reliability 15%
  • Gemini Grounding은 약관상 코어 제외
02 · aio-score-v1

8 컴포넌트 AIO Score

노출도 · AI 점유율 · 출처 품질 · 엔티티 정확도 · 신뢰성(환각) · 기술 준비도 · 감성 안전 · 위치 — 8개 차원의 가중 합산.

  • 산식 버전 명시 (v1.0)
  • 신뢰구간 (95% CI) 함께 제공
03 · reliability

Reliability Score · 분리

점수 자체와 별개로 "이 측정값을 얼마나 믿을 수 있는가"를 표본·다양성·일관성·증거 보존 5개 축으로 정량화합니다.

  • n<10 = Low (참고용)
  • n≥30 + 4엔진 = High (랭킹 가능)
04 · evidence-log

원본 증거 영구 보존

모든 LLM 응답·인용 URL·스크린샷·모델 버전·프롬프트셋 버전을 R2에 저장. 점수에 의문이 생기면 원본까지 거슬러 검증 가능.

  • Cloudflare R2 + AI Gateway 캐시
  • 감사 가능 (Audit Log)

Scoring · v1.2

무엇을, 어떤 비중으로 측정하는가

AIO Score는 측정 가능한 7개 컴포넌트의 가중 평균(0~100)으로 산출됩니다. 점수와 별개로 Reliability Score는 그 값을 얼마나 신뢰할 수 있는지를 나타냅니다.

가중치는 산식 버전(v1.2)에 고정되며, 변경 시 새 버전으로 명시됩니다. 산정 제외 컴포넌트는 자동 점검 구현 후 차후 산식에서 재활성됩니다.

AIO Score · 7 활성 컴포넌트합계 100%
28%
22%
22%
11%
  • 노출도

    브랜드가 등장한 응답 비율

    28%
  • AI 점유율

    우리 vs 경쟁사 언급 점유

    22%
  • 출처 품질

    권위 도메인 가중 평균

    22%
  • 엔티티 정확도

    fact 일치 비율

    11%
  • 신뢰성

    환각 발생률 역지수

    6%
  • 감성 안전

    부정 신호 역지수

    6%
  • 위치

    응답 내 평균 등장 순위

    5%

산정 제외 (v1.2)

  • 기술 준비도

    robots/sitemap/schema/SSR — 자동 점검 미구현으로 v1.2에서 산정 제외

    0%
Reliability · 7 축측정 신뢰도
표본 크기20%엔진 다양성15%응답 일관성20%출처 확보율15%원본 증거 로그10%사람 검수10%약관 준수10%

같은 회사라도 표본·엔진·일관성에 따라 동일 점수의 신뢰도가 다릅니다. 저희는 두 점수를 분리해 보고합니다.

Principles

방법론 4원칙

한국 시장에서 신뢰할 수 있는 측정값을 만들기 위해 처음부터 약관·재현성·증거 보존을 전제로 설계했습니다.

방법론 전문 보기 →
PRINCIPLE · 01

측정합니다, 보장하지 않습니다

"1위 보장" 같은 단정적 표현은 사용하지 않습니다. 모든 점수에는 신뢰구간(95% CI)과 산식 버전이 함께 표시됩니다.

PRINCIPLE · 02

약관 준수 우선

Gemini Grounding with Google Search는 약관상 점수 산출 코어에서 제외합니다. 네이버 AI 브리핑은 사람의 수동 측정만 사용합니다.

PRINCIPLE · 03

재현 가능한 측정

프롬프트셋·산식·모델 버전은 frozen 후 측정에 사용되며 변경 시 새 버전으로 명시됩니다. 같은 입력은 같은 출력 신뢰구간을 제공합니다.

PRINCIPLE · 04

원본 증거 영구 보존

응답 본문 · 인용 URL · 스크린샷 · 모델 버전을 R2에 저장합니다. 의문이 생기면 원본까지 거슬러 검증 가능합니다.

Packages

측정 규모에 맞춰 단계별로

무료 Snapshot부터 엔터프라이즈 모니터링까지, 표본 크기와 신뢰도(Reliability)에 따라 패키지를 분리했습니다.

표시된 가격은 검증 가설입니다. 실제 가격은 상담 후 확정됩니다.
free검증 가설

Free Snapshot

무료

리드 확보

  • AIO Score 1회
  • 신뢰도 Low (n=1)
  • 경쟁사 1곳
  • 핵심 문제 1개
  • PNG 카드

상담/상세 리포트 전환

상담 신청
solo검증 가설

Solo

월 30~50만원 (예상)

개인사업자·소형 로컬

  • 월 1회 리포트
  • 10~20개 프롬프트
  • 경쟁사 1~2곳
  • 기본 웹 점검

낮은 진입장벽

상담 신청
Recommended
starter검증 가설

Starter

월 60~120만원 (예상)

병원·학원·로컬 B2B

  • 월 1~2회 측정
  • n≥10 공식 점수
  • 경쟁사 3곳
  • 개선 과제 3~5개

초기 매출 엔진

상담 신청
growth검증 가설

Growth

월 150~300만원 (예상)

마케팅사·SaaS·프랜차이즈

  • 주간/월간 모니터링
  • 경쟁사 5곳
  • 40~100개 프롬프트
  • 콘텐츠/스키마 개선안

반복 수익과 락인

상담 신청
enterprise검증 가설

Enterprise

월 500만원+ (예상)

대기업·글로벌·플랫폼

  • 대시보드, API
  • 부서/국가별 측정
  • 엔티티 DB, RAG/Trust DB
  • SLA

고객별 고도화 매출

상담 신청

Free Snapshot

무료 AIO Snapshot

n=1, Reliability Low의 참고용 리포트입니다. 공식 점수가 필요한 경우 Starter 이상 패키지를 이용해주세요.

신청 즉시 측정이 시작됩니다. 동일 도메인은 월 1회로 제한될 수 있습니다.