GEO·AI 검색

지식 그래프

지식 그래프(Knowledge Graph)는 사람·장소·사물 같은 엔티티와 그 사이의 관계를 노드와 엣지로 구조화한 지식 베이스로, 구글이 키워드 문자열이 아니라 '개념(엔티티)'을 이해해 검색 결과를 만드는 기반이 됩니다. 구글은 2012년 'Things, not strings(문자열이 아닌 사물)'라는 슬로건과 함께 이를 공개했습니다.

지식 그래프는 엔티티(사람·장소·사물 등)와 그 관계를 노드·엣지로 연결해 구조화한 지식 베이스로, 구글 검색이 단어 매칭을 넘어 '의미'를 이해하도록 돕습니다.
구글은 2012년 5월 16일 'Things, not strings(문자열이 아닌 사물)'라는 개념으로 지식 그래프를 공개했고, 출시 7개월 만에 5억 7천만 엔티티·180억 팩트로 확장됐습니다.
2024년 5월 기준 구글 지식 그래프는 약 540억 개 엔티티에 대한 1조 6천억 개 이상의 팩트를 보유한 것으로 보고됩니다.
지식 그래프는 '데이터 구조(지식 베이스)'이고, 검색 결과 옆에 뜨는 지식 패널은 그 데이터를 보여 주는 SERP 표시 UI로 서로 다른 개념입니다.
SEO·GEO 관점에서는 schema.org 구조화 데이터(JSON-LD), sameAs, @id로 엔티티를 명확히 정의해 그래프에 인식·연결시키는 '엔티티 최적화'가 핵심입니다.

개요·맥락

지식 그래프(Knowledge Graph)는 사람·장소·사물·개념 같은 엔티티를 노드로, 엔티티 사이의 관계를 엣지로 표현해 지식을 그물망처럼 구조화한 지식 베이스입니다. 검색엔진은 이 구조 덕분에 질의에 포함된 단어를 문자 그대로 매칭하는 대신, 그 단어가 가리키는 '대상(thing)'과 맥락을 이해해 답을 내놓을 수 있습니다. 예를 들어 '에펠탑의 높이는?' 같은 질문에 곧바로 사실을 제시하는 것이 지식 그래프의 작동 방식입니다.

구글은 2012년 5월 16일, 당시 검색 책임자 Amit Singhal의 블로그 글 'Introducing the Knowledge Graph: things, not strings'를 통해 이를 공개했습니다. 핵심 메시지는 검색이 '문자열(strings)' 매칭에서 '사물(things)' 이해로 전환된다는 것이었습니다. 구글은 지식 그래프를 '웹 전반에서 공유된 자료로부터 엔티티에 관한 사실과 정보를 이해하는 시스템'이자 '사실로 이루어진 거대한 가상 백과사전'이라고 설명합니다.

작동·활용 — 엔티티와 시맨틱 검색

지식 그래프의 단위는 키워드가 아니라 엔티티입니다. 각 엔티티는 고유하게 식별되며, '~의 감독이다', '~에 위치한다', '~의 저자이다' 같은 관계(엣지)로 다른 엔티티와 연결됩니다. 이렇게 구조화된 데이터는 검색엔진이 동음이의어를 구분(disambiguation)하고, 질의의 의도를 의미 단위로 파악하는 시맨틱 검색의 토대가 됩니다.

활용 영역은 다음과 같습니다.

사실형 질의 응답: '2016 하계 올림픽 개최지는?'처럼 사실을 묻는 질문에 직접 답변을 제시합니다.
지식 패널 생성: 검색 결과 화면 우측 등에 표시되는 정보 박스(지식 패널)는 지식 그래프의 데이터를 끌어와 자동 생성됩니다.
음성·어시스턴트 응답: 음성 비서가 사실 질의에 답할 때도 지식 그래프를 참조합니다.
AI 검색의 엔티티 이해: 생성형 검색·AI 답변이 주제와 개체를 식별하고 연결하는 기반 데이터로도 작동합니다.

지식 그래프 vs 지식 패널

두 개념은 자주 혼동되지만 층위가 다릅니다. 지식 그래프는 데이터를 담는 '구조이자 지식 베이스'이고, 지식 패널은 그 데이터를 검색 결과 화면에 보여 주는 'SERP 표시 UI'입니다.

구분	지식 그래프 (Knowledge Graph)	지식 패널 (Knowledge Panel)
본질	데이터 구조 / 지식 베이스	검색 결과 표시 UI
형태	엔티티(노드)와 관계(엣지)의 그래프	SERP에 뜨는 정보 박스
역할	엔티티·사실을 저장하고 의미를 이해	그래프의 사실을 사용자에게 요약 제시
가시성	내부 데이터(직접 보이지 않음)	사용자에게 직접 노출

근거·사례

구글이 밝힌 규모의 변화는 지식 그래프가 검색의 핵심 인프라로 성장했음을 보여 줍니다(출처: Wikipedia 'Knowledge Graph (Google)', 구글 공식 블로그 및 지식 패널 도움말).

시점	엔티티	팩트(사실)
2012년 (출시 7개월 후)	약 5억 7천만	약 180억
2016년경	—	약 700억 (월 검색의 약 1/3에 응답)
2020년 5월	약 50억	약 5천억
2024년 5월	약 540억	약 1조 6천억 이상

데이터 출처도 다양합니다. 구글은 지식 그래프가 위키백과, (2026년 2월 중단된) CIA World Factbook, 초기 그래프의 기반이 됐던 Freebase 등 공개 자료와, 스포츠 점수·주가·날씨 같은 라이선스 데이터, 그리고 콘텐츠 소유자가 제출한 구조화 데이터 등 '웹 전반의 수백 개 출처'에서 정보를 끌어온다고 설명합니다. 한편 지식 그래프 기반 답변이 출처 표기나 인용 없이 제시되는 경우가 많다는 점은 검증 가능성 측면에서 비판을 받기도 합니다.

SEO·GEO 시사점 — 엔티티 최적화

검색이 키워드에서 엔티티로 이동하면서, 최적화의 초점도 '특정 키워드를 노리는 것'에서 '브랜드·제품·인물 같은 엔티티를 검색엔진이 명확히 이해하고 지식 그래프에 연결하도록 만드는 것'으로 옮겨 갑니다. 이를 엔티티 SEO라고 부릅니다. 구조화 데이터는 직접적인 순위 요소는 아니지만, 리치 결과·AI 답변 인용·지식 그래프 엔티티 인식의 핵심 지렛대가 됩니다.

실행 체크리스트는 다음과 같습니다.

schema.org 어휘로 핵심 콘텐츠(조직·인물·제품 등)에 구조화 데이터를 마크업하고, 구글이 권장하는 JSON-LD 형식을 사용합니다.
@id로 사이트 내부 엔티티를 일관되게 참조하고, sameAs로 위키백과·위키데이터 등 권위 있는 외부 출처와 연결해 엔티티를 명확히 식별·중의성 해소합니다.
엔티티의 정체성·관계가 일관되도록 NAP(이름·주소·전화) 등 핵심 사실을 여러 채널에서 통일합니다.
E-E-A-T(경험·전문성·권위·신뢰)에 부합하는 신뢰 가능한 정보로 엔티티의 권위를 축적합니다.

아래는 조직 엔티티를 명확히 정의하고 외부 출처와 연결하는 JSON-LD 예시입니다.

{
  "@context": "https://schema.org",
  "@type": "Organization",
  "@id": "https://example.com/#organization",
  "name": "Example",
  "url": "https://example.com",
  "sameAs": [
    "https://www.wikidata.org/wiki/Q12345",
    "https://en.wikipedia.org/wiki/Example"
  ]
}