용어집
SEO

Soft 404

Soft 404는 실제로는 콘텐츠가 없거나 '페이지가 존재하지 않는다'는 안내를 보여주면서도 서버가 200(성공) 상태 코드를 반환하는 페이지를 가리킵니다. 구글은 이런 페이지를 콘텐츠 기준으로 사실상 오류로 판단해 색인에서 제외하며, 정상 응답으로 오인된 빈 URL이 크롤링 자원을 낭비하는 문제를 일으킵니다.

  • Soft 404는 실제 콘텐츠가 없는데도 200(성공) 상태 코드를 반환해서, 구글이 페이지 내용을 보고 '사실상 오류'로 판단하는 상태를 말합니다.
  • 구글 검색 콘솔의 페이지 색인 생성 보고서에 'Soft 404'로 표시되며, 해당 URL은 검색 색인에서 제외됩니다.
  • 빈 검색 결과 페이지, 깨진 DB 연결, 누락된 서버 사이드 인클루드, 로드되지 않은 자바스크립트가 흔한 원인입니다.
  • 페이지가 사라졌다면 404 또는 410을, 다른 곳으로 옮겼다면 301 리다이렉트를, 콘텐츠가 실제로 있다면 렌더링 문제를 점검하는 것이 올바른 처리입니다.
  • 200으로 오인된 빈 URL은 고유 콘텐츠가 있는 페이지 대신 크롤링되어 크롤링 자원을 낭비합니다.

개요

Soft 404는 사용자에게 '페이지를 찾을 수 없음' 또는 빈 화면을 보여주면서도 서버가 HTTP 200(성공) 상태 코드를 반환하는 페이지입니다. 상태 코드만 보면 정상이지만 실제 콘텐츠는 오류이므로, 구글은 페이지 내용을 분석해 이를 사실상 존재하지 않는 페이지로 판단합니다. 구글 검색 콘솔은 이런 URL을 페이지 색인 생성 보고서에서 'Soft 404'로 표시하고 검색 색인에서 제외합니다.

문제의 핵심은 상태 코드와 실제 콘텐츠의 불일치입니다. 진짜 없는 페이지라면 서버가 404(찾을 수 없음)나 410(영구 삭제)을 반환해야 크롤러가 명확하게 인식하는데, 200을 반환하면 크롤러는 그 URL을 정상 페이지로 오인합니다. 그 결과 고유 콘텐츠를 가진 다른 페이지 대신 빈 URL이 반복 크롤링되어 사이트의 크롤링 커버리지가 낭비됩니다.

흔한 원인

구글 문서는 Soft 404가 발생하는 대표적인 상황을 다음과 같이 제시합니다.

  • 검색 결과가 없는데도 '검색 결과 없음' 안내를 200으로 반환하는 빈 검색 결과 페이지
  • 데이터베이스 연결이 끊겨 본문이 비어 있는 페이지
  • 서버 사이드 인클루드(SSI) 파일이 누락되어 주요 콘텐츠가 출력되지 않는 페이지
  • 자바스크립트가 로드되지 않거나 렌더링에 실패해 본문이 비어 보이는 페이지
  • 삭제된 상품·게시물 URL이 '없는 상품입니다' 같은 안내를 200으로 표시하는 경우

올바른 처리

구글은 상황에 따라 세 가지 처리 방법을 권장합니다.

상황권장 응답이유
페이지를 영구 삭제했고 대체 페이지가 없음404(찾을 수 없음) 또는 410(영구 삭제)검색엔진에 해당 URL이 존재하지 않으니 색인하지 말라고 명확히 전달
페이지가 이동했거나 명확한 대체 페이지가 있음301(영구 리다이렉트)사용자 탐색을 끊지 않고 새 위치를 검색엔진에 알림
콘텐츠가 실제로 존재함URL 검사 도구로 렌더링 점검리소스 누락·렌더링 오류로 빈 페이지처럼 보이는지 진단

핵심은 '없는 페이지'에는 200 대신 404/410을 정확히 반환하는 것입니다. 예를 들어 빈 검색 결과나 삭제된 상품 페이지가 200을 돌려주고 있다면, 서버 설정에서 적절한 상태 코드로 바꿔야 합니다.

# Apache .htaccess — 삭제된 경로에 410 반환
Redirect 410 /old-product/

# Nginx — 특정 경로에 410 반환
location = /old-product/ {
    return 410;
}

근거

구글 검색 센트럴(Google Search Central) 공식 문서는 Soft 404를 'URL이 페이지가 존재하지 않는다는 내용을 보여주면서 동시에 200(성공) 상태 코드를 반환하는 경우'로 정의합니다. 또한 알고리즘이 콘텐츠 기준으로 오류 페이지를 감지하면 해당 URL을 검색에서 제외하며, 이런 중복·빈 URL이 고유 콘텐츠 페이지 대신 크롤링되어 사이트의 크롤링 커버리지를 제한할 수 있다고 설명합니다. 진단에는 검색 콘솔의 URL 검사 도구로 실제 반환 상태 코드와 렌더링된 콘텐츠를 확인하라고 안내합니다.

실행 체크리스트

  • 검색 콘솔 '페이지 색인 생성' 보고서에서 'Soft 404' 항목을 확인합니다.
  • 해당 URL을 URL 검사 도구로 열어 실제 반환 상태 코드와 렌더링된 본문을 점검합니다.
  • 없는 페이지인데 200을 반환한다면 서버에서 404 또는 410으로 변경합니다.
  • 이동·대체된 페이지라면 301 리다이렉트로 새 위치를 연결합니다.
  • 자바스크립트로 본문을 렌더링하는 페이지는 크롤러가 콘텐츠를 볼 수 있는지 확인합니다.
  • 빈 검색 결과·필터 페이지가 색인 대상이 되지 않도록 상태 코드와 색인 정책을 정리합니다.

참고·출처

관련 용어