테크정보
목록
검색엔진 수집정보 SITEMAP XML 형식과 샘플규칙 안내
sitemap.xmlXML링크모음SEO
SEO 2024.04.09 103 회 읽음
SEO 24.04.09 103

검색로봇이 컨텐츠를 효과적으로 수집할 수 있도록 XML 형식의 사이트맵 제공이 필요합니다.


검색 로봇이 홈페이지 정보를 자동 수집하기는 하지만 자주 방문하지는 않아서 실제 검색에는 늦게 반영하는 이유가 있습니다. 그 외에도 수집이 안되는 페이지가 있는가 하면 변경 또한 안되기도 합니다. 홈페이지 제작 툴도 다르고 사용하는 태그가 다르기 때문에 수집이 어렵게 됩니다.

사이트맵이라는 XML 형식을 통해 검색 로봇에서 제공하면 페이지 변경 빈도와 수정한 날짜 등의 정보를 제공해서 빠른 검색 로봇 반영 외에도 효과적인 노출이 가능합니다.


XML 테그 정의
속성옵션설명
< urlset >필수현재 프로토콜 표준을 참조하여 그룹화
< url >필수
그룹 테그로 아래 테그를 포함
< loc >필수
페이지 URL이며 http 여부 필요하며 끝에 슬래시(/) 표시
< lastmod >옵션마지막 수정날짜 W3C Datetime 형식
< changefreq >옵션
해당 페이지 변경빈도를 지정
< priority >옵션
우선순위 0.0-1.0 표기

※ W3C Datetime 형식은 https://www.w3.org/TR/NOTE-datetime 에서 확인할 수 있으며 PHP 에서는 date(c) 값으로 처리가 가능합니다.
※ changefreq는 always, hourly, daily, weekly, monthly, yearly, never 로 사용되며 업데이트 빈도가 높아질경우 트레픽이 증가하므로 적절하게 사용하는게 필요합니다.
※ priority에서 대 메뉴나 인덱스의 경우는 1.0으로 표기하여 서브페이지는 하위 값으로 조정하여 사용합니다.


특수문자 처리

Sitemap은 UTF-8 인코딩이 필요하며 표시할 때에도 아래 특수문자는 이스케이프 코드를 사용해야 합니다.

문자이스케이프 코드
앤퍼샌드 &&
작은 따옴표 ''
쌍 따옴표 ""
보다 크다 >>
보다 작다 <<


샘플 XML Sitemap

아래 샘플소스를 복사해서 작성하시면 어렵지 않게 작성할 수 있습니다. 이 사이트에서 사용하는 /sitemap.xml 링크를 클릭하면 참조가 가능합니다.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>/</loc>
      <lastmod>2023-01-27</lastmod>
      <changefreq>weekly</changefreq>
      <priority>0.8</priority>
   </url>
   <url>
      <loc>/board/openlog</loc>
      <changefreq>daily</changefreq>
   </url>
   <url>
      <loc>/board/techlog</loc>
      <lastmod>2023-01-27</lastmod>
      <changefreq>daily</changefreq>
   </url>
   <url>
      <loc>/board/business</loc>
      <lastmod>2023-01-27T18:00:15+00:00</lastmod>
      <priority>0.3</priority>
   </url>
   <url>
      <loc>/board/seo</loc>
      <lastmod>2023-01-27</lastmod>
   </url>
</urlset>

위와 같이 사이트맵을 xml 형태로 제작하였다면 네이버는 서치어드바이저에서 해당 URL을 추가 해 주고 구글은 웹마스터도구를 이용하여 등록하면 해당 url의 xml 파일은 주기적으로 수집하게 됩니다.

목록