구조화 데이터
구조화 데이터는 검색엔진이 페이지의 내용을 정확히 이해하도록 schema.org 어휘로 페이지 정보를 표준화해 표기한 마크업입니다. 이렇게 표준화된 데이터는 별점, 가격, 레시피 정보 같은 리치 결과(Rich Results)가 검색결과에 노출되는 근거가 됩니다.
- 구조화 데이터는 검색엔진이 페이지 내용을 명확히 이해하도록 schema.org 어휘로 정보를 표준화해 표기한 마크업입니다.
- 구글은 JSON-LD, Microdata, RDFa 세 가지 형식을 지원하며, 구현·유지가 가장 쉬운 JSON-LD를 공식 권장합니다.
- 구조화 데이터는 별점·가격·FAQ·레시피 같은 리치 결과(Rich Results)가 검색결과에 노출되는 직접적인 근거가 됩니다.
- 구글 공식 사례에서 Nestlé는 리치 결과 페이지의 클릭률이 일반 페이지보다 82% 높았다고 측정했습니다.
- '구조화 데이터'는 개념 전반을 가리키고, JSON-LD는 그 개념을 표현하는 하나의 형식이라는 점을 구분해 이해하셔야 합니다.
구조화 데이터란 무엇인가요
구조화 데이터(Structured Data)는 검색엔진이 페이지에 무엇이 담겨 있는지 정확히 파악하도록, 페이지의 정보를 표준화된 형식으로 분류해 표기한 마크업입니다. 구글은 이를 "페이지에 대한 정보를 제공하고 페이지 콘텐츠를 분류하는 표준화된 형식"이라고 정의합니다. 사람이 보는 화면에는 자연어와 이미지로 표현되는 내용을, 기계(검색엔진·AI)가 오해 없이 읽을 수 있도록 명시적인 단서로 다시 적어 주는 것이라고 이해하시면 됩니다.
예를 들어 레시피 페이지에는 요리 이름, 작성자, 조리 시간, 칼로리, 별점이 사람 눈에는 자연스럽게 보이지만, 검색엔진 입장에서는 어느 텍스트가 '조리 시간'이고 어느 숫자가 '별점'인지 확정하기 어렵습니다. 구조화 데이터로 각 요소에 schema.org 어휘의 라벨을 붙이면, 검색엔진이 이를 정확히 인식해 검색결과에 조리 시간·별점 같은 정보를 함께 표시할 수 있게 됩니다.
schema.org 어휘가 표준입니다
구조화 데이터의 핵심 어휘 표준은 schema.org입니다. schema.org는 2011년 6월 Bing·Google·Yahoo가 공동으로 시작했고 이후 Yandex가 합류한 개방형 표준으로, 800종이 넘는 엔티티 타입과 1,400개가 넘는 속성을 제공합니다. 즉 'Article(글)', 'Product(상품)', 'Recipe(레시피)', 'FAQPage(자주 묻는 질문)', 'Organization(조직)' 같은 타입과 각 타입에 딸린 속성을 미리 정의해 두었고, 페이지 제작자는 이 공통 어휘를 가져다 자신의 콘텐츠를 분류하기만 하면 됩니다. 검색엔진들이 같은 어휘를 함께 지원하기 때문에, 한 번 표준에 맞춰 표기하면 여러 엔진과 AI 도구가 동일하게 해석할 수 있다는 점이 가장 큰 장점입니다.
구조화 데이터와 JSON-LD는 어떻게 다른가요
현장에서 구조화 데이터는 '스키마 마크업(Schema Markup)'과 거의 같은 뜻으로 쓰이지만, JSON-LD와는 층위가 다릅니다. 구조화 데이터는 '페이지 정보를 기계가 읽도록 표준 어휘로 표기한다'는 개념 전반을 가리키고, JSON-LD는 그 개념을 실제 코드로 표현하는 여러 형식 중 하나입니다. schema.org 어휘를 표현하는 형식은 다음 세 가지가 있으며, 구글은 이 가운데 JSON-LD를 권장합니다.
| 형식 | 표기 방식 | 구글 권장 여부 |
|---|---|---|
| JSON-LD | <script> 태그 안에 JavaScript 객체로 별도 표기. 보이는 콘텐츠와 분리됨 | 권장 (구현·유지가 가장 쉬움) |
| Microdata | HTML 태그에 itemprop 등 속성을 덧붙여 본문과 함께 표기 | 지원하나 비권장 |
| RDFa | HTML5 확장으로, 태그 속성을 통해 링크드 데이터를 표기 | 지원하나 비권장 |
구글이 JSON-LD를 권장하는 이유는 "대규모로 구현하고 유지하기 가장 쉬워 사용자 오류가 적기 때문"입니다. JSON-LD는 화면에 보이는 마크업과 분리되어 별도 블록으로 들어가므로, 디자인을 건드리지 않고 추가·수정할 수 있고 관리도 편합니다. 참고로 LLM 분야에서 말하는 '구조화된 출력(Structured Output)'은 모델이 JSON 같은 형식으로 응답을 내도록 강제하는 별개의 개념이며, 여기서 말하는 검색용 구조화 데이터와는 관련이 없습니다.
JSON-LD 예시 코드
다음은 글(Article) 페이지에 적용하는 JSON-LD 구조화 데이터의 예시입니다. 보이는 본문은 그대로 두고, head 또는 body에 아래 스크립트 블록만 추가하면 됩니다.
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "구조화 데이터 완벽 가이드",
"author": {
"@type": "Person",
"name": "홍길동"
},
"datePublished": "2026-06-10",
"publisher": {
"@type": "Organization",
"name": "SearchOS"
}
}
</script>상품 페이지라면 @type을 Product로 바꾸고 가격(offers), 별점(aggregateRating), 리뷰(review) 속성을 채우는 식으로, 콘텐츠 유형에 맞는 타입과 속성을 선택해 표기합니다.
리치 결과 사례와 근거
구조화 데이터를 표기한다고 검색결과에 항상 리치 결과가 표시되는 것은 아니지만, 표기는 리치 결과 노출의 필수 전제 조건입니다. 구글 Search Central이 공식 문서에 게재한 사례는 다음과 같습니다.
- Nestlé는 리치 결과로 표시되는 페이지의 클릭률이 리치 결과가 아닌 페이지보다 82% 더 높았다고 측정했습니다(출처: Google Search Central).
- Rotten Tomatoes는 100,000개 페이지에 구조화 데이터를 적용해, 적용하지 않은 페이지 대비 클릭률이 25% 더 높았습니다(출처: Google Search Central).
- Food Network는 검색 기능을 활성화하도록 전체 페이지의 80%를 전환한 결과 방문이 35% 증가했습니다(출처: Google Search Central).
이처럼 구조화 데이터는 순위 자체를 직접 올리는 신호라기보다, 검색결과에서 페이지를 더 풍부하게 표현해 클릭률과 방문을 끌어올리는 방식으로 효과를 냅니다. 또한 schema.org 어휘로 정리된 명시적 정보는 검색엔진뿐 아니라 AI 어시스턴트와 LLM이 콘텐츠를 빠르고 정확하게 이해하는 데에도 활용됩니다.
실행 체크리스트
- 콘텐츠 유형(글·상품·FAQ·레시피·조직 등)에 맞는 schema.org 타입을 먼저 정합니다.
- 가능하면 JSON-LD 형식으로 작성합니다. 구글 권장 형식이며 유지가 가장 쉽습니다.
- 화면에 실제로 보이는 콘텐츠와 일치하는 정보만 표기합니다. 보이지 않는 내용을 마크업에만 넣는 것은 정책 위반입니다.
- 각 타입의 필수 속성(required)을 빠짐없이 채우고, 권장 속성(recommended)도 가능한 한 채웁니다.
- 구글 리치 결과 테스트(Rich Results Test)로 유효성을 검증하고, 가능한 경우 검색 미리보기를 확인합니다.
- 배포 후 Search Console의 '개선사항' 리포트에서 오류·경고와 리치 결과 노출 추이를 모니터링합니다.