고아 페이지
고아 페이지(Orphan Page)는 사이트 내 어떤 페이지로부터도 내부 링크가 연결되지 않아, 크롤러가 링크를 따라 발견·접근하기 어려운 페이지입니다. 직접 URL이나 외부 백링크로만 도달할 수 있어 크롤·색인·내부 권위 전달에서 불이익을 받습니다.
- 고아 페이지는 사이트 내 어떤 페이지에서도 내부 링크가 연결되지 않은 페이지를 의미합니다.
- 크롤러가 링크 경로를 따라 도달할 수 없어 발견·크롤·색인에서 누락되기 쉽습니다.
- 내부 링크가 없으므로 PageRank(내부 권위)도 전달받지 못해 순위 잠재력이 약해집니다.
- 진단의 핵심은 크롤러가 발견한 URL과 사이트맵·로그·애널리틱스 URL 목록을 비교하는 것입니다.
- 해결은 가치 있는 페이지에는 내부 링크를 추가하고, 불필요한 페이지는 사이트맵에서 정리하는 방향으로 진행합니다.
개요
고아 페이지는 사이트 내 다른 어떤 페이지로부터도 들어오는 내부 링크가 하나도 없는 페이지를 가리킵니다. 검색 크롤러는 기본적으로 링크를 따라 이동하며 페이지를 발견하므로, 내부 링크가 없는 고아 페이지는 사이트 구조 안에서 사실상 고립됩니다. Ahrefs는 고아 페이지를 "사이트에 들어오는 내부 링크가 없는 웹 페이지"로 정의하며, 이러한 페이지는 직접 URL 입력이나 외부 백링크를 통해서만 접근할 수 있다고 설명합니다.
발생 원인
고아 페이지는 의도와 무관하게 운영 과정에서 자연스럽게 발생합니다. Ahrefs가 정리한 주요 원인은 다음과 같습니다.
- 사이트 마이그레이션·리뉴얼 과정에서 기존 내부 링크가 이전되지 않은 경우
- 내비게이션·메뉴 구조 변경으로 특정 페이지가 연결에서 빠진 경우
- 품절·단종 상품 페이지가 목록에서 제외되며 링크가 끊긴 경우
- 테스트·임시 페이지를 발행한 뒤 링크를 걸지 않은 경우
- 내부 링크를 실수로 삭제한 경우
SEO 문제
고아 페이지가 SEO에 불리한 이유는 크게 세 층위로 정리됩니다. 첫째, 발견·크롤 측면입니다. 크롤러는 내부 링크라는 경로를 통해 페이지를 찾는데, 그 경로가 없으면 페이지에 도달하기 어렵습니다. 둘째, 색인 측면입니다. 크롤러가 도달하지 못하면 색인되지 않고, 색인되지 않으면 검색 결과에 노출될 수 없습니다. 셋째, 권위 전달 측면입니다. 내부 링크가 없으면 사이트의 다른 페이지로부터 PageRank를 전달받지 못합니다. Ahrefs는 "구글은 여전히 PageRank를 가장 중요한 랭킹 신호 중 하나로 사용한다"고 언급하며, 내부 링크가 이 권위 프로필을 강화한다고 설명합니다.
다만 사이트맵이나 외부 백링크 같은 다른 발견 경로가 있으면 고아 페이지도 색인될 수 있습니다. Screaming Frog 역시 "고아 페이지는 과거에 링크되었거나 XML 사이트맵·외부 링크 같은 경로 덕분에 여전히 색인되어 있을 수 있으나, 내부 링크가 없으면 내부 PageRank를 전달받지 못한다"고 설명합니다. 즉 색인 자체보다 권위 단절이 더 본질적인 손실인 경우가 많습니다.
진단 방법
고아 페이지 진단의 핵심 원리는 크롤러가 링크를 따라 발견한 URL 집합과 실제로 존재하는 전체 URL 집합을 비교하는 것입니다. 후자는 XML 사이트맵, 서버 로그, 애널리틱스, 백링크 데이터 등에서 수집합니다. 두 집합의 차집합(존재하지만 크롤에서 발견되지 않은 URL)이 고아 페이지 후보입니다.
| 도구 | 진단 원리 |
|---|---|
| Screaming Frog | 'Config > Spider > Crawl'에서 XML 사이트맵 크롤을 켜고 크롤 후 'Crawl Analysis'를 실행해, 'Sitemaps' 탭의 'Orphan URLs' 필터로 확인합니다. 또는 'Internal' 탭에서 크롤 깊이(crawl depth)가 비어 있는 URL을 필터링합니다. |
| Ahrefs | Site Audit의 'URL Sources' 탭에서 사이트맵·Google Analytics·Search Console·백링크 데이터까지 함께 크롤해 내부 링크로 연결되지 않은 페이지를 보고합니다. |
| Semrush | Site Audit에서 사이트맵에 있으나 내부 링크가 없는 페이지, 그리고 Google Analytics 방문 기록은 있으나 내부 링크가 없는 페이지를 함께 식별합니다. |
Screaming Frog는 고아 URL을 "XML 사이트맵에만 존재하고 크롤 중에는 발견되지 않은 URL"로 정의하며, 사이트맵과 크롤 결과를 교차 비교해 식별합니다. 무료 버전에서도 List 모드로 사이트맵 URL을 올린 뒤 'Inlinks' 값이 0인 페이지를 점검할 수 있습니다.
해결 방법
발견된 고아 페이지는 가치 판단에 따라 두 방향으로 처리합니다. 검색 가치가 있는 페이지라면 내부 링크를 추가해 사이트 구조에 다시 편입합니다. 관련 카테고리·허브 페이지, 콘텐츠 본문, 내비게이션 등 맥락에 맞는 위치에서 연결하는 것이 좋습니다. 반대로 불필요하거나 더 이상 운영하지 않는 페이지라면 사이트맵에서 항목을 제거하고, 필요 시 적절한 페이지로 리다이렉트하거나 삭제합니다. Screaming Frog는 이 외에도 사이트맵 URL이 200 응답을 반환하는지, robots.txt나 noindex로 차단되지 않았는지 확인하고, 사이트맵을 현재 사이트 구조와 동기화할 것을 권장합니다.
다만 모든 고아 페이지가 문제는 아닙니다. Ahrefs는 게이트형 광고 랜딩 페이지처럼 의도적으로 내부 링크 없이 운영하는 페이지도 있으며, 이런 경우 별도 조치가 필요 없다고 설명합니다.
실행 체크리스트
- 전체 URL 목록을 XML 사이트맵·서버 로그·애널리틱스·백링크 데이터에서 수집합니다.
- 크롤러로 사이트를 크롤한 뒤 크롤 분석을 실행해 발견된 URL과 전체 URL 목록을 비교합니다.
- 크롤 깊이가 비어 있거나 내부 인링크가 0인 URL을 고아 페이지 후보로 추립니다.
- 각 페이지의 검색 가치·운영 의도를 판단해 유지·연결할지, 정리할지 결정합니다.
- 유지할 페이지에는 맥락에 맞는 내부 링크를 추가하고, 폐기할 페이지는 사이트맵에서 제거하거나 리다이렉트·삭제합니다.
- 사이트맵 URL이 200 응답을 반환하고 robots.txt·noindex로 차단되지 않았는지 점검합니다.
- 마이그레이션·리뉴얼 이후에는 내부 링크 이전 여부를 재점검해 신규 고아 페이지 발생을 예방합니다.