⬆️ Победители в номинации Search Innovation
Google Partner

Карта сайта в формате XML (sitemap.xml)

Автор:
Оптимизатор
Рецензент: Олег Гаврилюк
Руководитель оптимизаторов
4,60 5 оценок
3 комментария
Карта сайта в формате XML (sitemap.xml)

Карта сайта в формате XML (sitemap.xml) — файл в формате XML, в котором перечислены все основные страницы сайта. Файл sitemap.xml необходим для указания поисковым системам всех главных страниц сайта, которые необходимо проиндексировать.

Различают два вида:

  1. Статическая — создается самостоятельно либо в ручном режиме, либо при помощи дополнительных сервисов.
  2. Динамическая — внедряется в рамках CMS и позволяет автоматически обновлять карту сайта.

Для чего нужна XML-карта сайта

Правильно сформированная XML-карта позволяет:

  • формировать актуальный список страниц сайта;
  • облегчать поиск новых страниц и их индексацию;
  • указывать частоту и приоритетность индексации;
  • отслеживать дату изменений.

Синтаксис формирования карты сайта в формате XML

Карта сайта должна начинается строками:

<?xml version=«1.0″ encoding=«UTF-8″?>

<urlset xmlns=«http://www.sitemaps.org/schemas/sitemap/0.9″>

Дальше идет перечисления страниц сайта по схеме:

<url>

<loc>https://site.com.ua</loc>

<lastmod>2020-01-10T18:00:15+00:00</lastmod>

<priority>1.00</priority>

<changefreq>daily</changefreq>

</url>

Закачивается карта сайта тегом, который указывает о завершении списка страниц сайта

</urlset>

Где:

Тэг

Описание тега

<url>

Тг, указывающий на начало блока страницы и ее описания, является обязательным атрибутом карты сайта

<loc>

Тег, указывающий адрес страницы, является обязательным атрибутом карты сайта

<lastmod>

Тег, указывающий дату последнего изменения страницы, является желательным атрибутом карты сайта

<priority>

Тег, указывающий приоритет страницы, диапазон от 1.00 до 0.1, 1.00 — самый высокий приоритет, 0.1 — самый низкий приоритет.

<changefreq>

Тег, указывающий частоту обновления страницы, возможные значения:

always — всегда

hourly — ежечасно

daily — ежедневно

weekly — еженедельно

monthly — ежемесячно

yearly — раз в год

never — никогда

Все основные поисковые системы имеют функционал добавления адреса файла sitemap.xml, который необходимо указать поисковой системе. В поисковой системе Google файл карты сайта в формате XML добавляется в настройках в Google Webmaster Tools, а в поисковой системе Яндекс существует аналогичный инструмент для вебмастеров Яндекс. Вебмастер, другие поисковые системы имеют инструменты аналогичные высшее указанным.

После формирования карты нужно добавить следующий код в файл robots.txt:

User-Agent: *

Sitemap: https://site.com.ua/sitemap.xml

Общие правила составления XML-карты сайта

  1. Основной файл карты сайта должен иметь имя sitemap, разрешение xml, располагаться в корне сайта по адресу https://site.com.ua/sitemap.xml и быть доступным с интернета.

  2. При использовании сторонних модулей для формирования, карта сайта может генерироваться по другому адресу, в таком случае нужно настроить, 301 серверный редирект с https://site.com.ua/sitemap.xml на нужный URL.

  3. В начале документа sitemap.xml следует сначала размещать ссылки на страницы категорий, после них на страницы товаров.

  4. В sitemap.xml не должны включатся страницы, которые закрыты в robots.txt или на которых размещен мета тег <meta name=”robots” content=”noindex, follow” />

  5. Файл Sitemap не должен содержать более чем 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. В случаях, когда размер файла Sitemap превышает допустимый, выделяют несколько вариантов решения:

    • разбить его на несколько частей, например, sitemap1.xml и sitemap2.xml

    • файл sitemap.xml может быть заархивирован и иметь формат sitemap.xml.gz с целью уменьшения трафика на сайте.

Пример файла sitemap.xml

<?xml version=«1.0″ encoding=«UTF-8″?>

<urlset xmlns=«http://www.sitemaps.org/schemas/sitemap/0.9″>

<url> <loc>https://site.com.ua</loc>

<lastmod>2020-01-10T08:12:32+00:00</lastmod>

<changefreq>weekly</changefreq>

<priority>1.0</priority> </url>

<url> <loc>https://site.com.ua/other/standart-banners-sizes.html </loc>

<lastmod>2020-01-10T08:12:32+00:00</lastmod>

<changefreq>weekly</changefreq>

<priority>0.9</priority> </url>

<url> <loc>https://site.com.ua/htmlcss/dataurl.html </loc>

<lastmod>2020-01-10T11:19:49+00:00</lastmod>

<changefreq>weekly</changefreq>

<priority>0.9</priority> </url>

<url> <loc>https://site.com.ua/htmlcss/internet-shop-gallery.html </loc>

<lastmod>2020-01-10T14:38:43+00:00</lastmod>

<changefreq>weekly</changefreq>

<priority>0.9</priority> </url>

</urlset>

Пример файла содержащего перечисление под-карт

Если сайт имеет сложную структуру и много разделов, для удобства анализа, допускается разбиение карты сайта на под-карты, каждая из которых содержит перечисления страниц подраздела.

<?xml version=«1.0» encoding=«UTF-8»?>

<sitemapindex xmlns=«http://www.sitemaps.org/schemas/sitemap/0.9»>

<sitemap> <loc>https://site.com.ua/sitemaps/sections.1935.xml.gz </loc>

<lastmod>2020-01-10</lastmod> </sitemap>

<sitemap> <loc>https://site.com.ua/sitemaps/gallery.2258.xml.gz </loc>

<lastmod>2020-01-13</lastmod> </sitemap>

<sitemap> <loc>https://site.com.ua/sitemaps/gallery.2259.xml.gz </loc>

<lastmod>2020-01-19</lastmod> </sitemap>

</sitemapindex>

XML sitemap для изображений

Для добавления картинок в карту сайта следует использовать дополнительные теги, для указания подробной информации об изображении, где используются следующие теги:

Тэг

Описание тега

<image:image>

Тег, указывающий информацию об одной картинке, является обязательным атрибутом. Можно использовать до 1000 тегов <image:image> в рамках одного тега <loc>

<image:loc>

Тег, указывающий адрес изображения, является обязательным атрибутом

<image:title>

Тег, указывающий название

<image:caption>

Тег, указывающий описание

<image:geo_location>

Тег, указывающий геолокацию

<image:license>

Тег, указывающий лицензию

Пример карты сайта для изображений:

<?xml version=»1.0″ encoding=»UTF-8″?>

<urlset xmlns=»http://www.sitemaps.org/schemas/sitemap/0.9«

xmlns:image=»http://www.google.com/schemas/sitemap-image/1.1″>

<url>

<loc>https://site.com.ua</loc>

<image:image>

<image:loc>https://site.com.ua/photo1.jpg </image:loc>

</image:image>

<image:image>

<image:loc>https://site.com.ua/photo2.jpg </image:loc>

</image:image>

</url>

</urlset>

XML-карта для Google Новостей

При формировании используются следующие обязательные теги

Тэг

Описание тэга

<publication>

Тэг, указывающий на издательство публикации. Должен содержать два обязательных тега <name> — название издательства, и <language> — язык издания согласно формата ISO 639.

<publication_date>

Тэг, указывающий дату и время публикации статьи на сайте согласно формата W3C

<title>

Тэг, указывающий название статьи

Пример карты сайта для новостей:

<?xml version=»1.0″ encoding=»UTF-8″?>

<urlset xmlns=»http://www.sitemaps.org/schemas/sitemap/0.9«

xmlns:news=»http://www.google.com/schemas/sitemap-news/0.9″>

<url>

<loc>https://site.com.ua/news </loc>

<news:news>

<news:publication>

<news:name>Название издательства</news:name>

<news:language>ru</news:language>

</news:publication>

<news:publication_date>2020-01-10</news:publication_date>

<news:title>Название статьи</news:title>

</news:news>

</url>

</urlset>

Карта сайта для видео

Если сайт содержит большое количество видео-материалов, следует создавать отдельную карту сайта в формате XML для видео. Подробнее о том, как создать карту сайта для видео-материалов читайте в справочном центре Google.

Файл карты сайта в формате XML можно формировать вручную используя программы и сервисы которые формируют файл карты сайта, просканировав страницы сайта, или формировать автоматически используя программную реализацию которая автоматически обновляет карту сайта при добавлении, или изменении страниц сайта.

В случае изменения, файла карты сайта его следует пинговать для поисковой системы Google, то есть уведомлять поисковую систему о обновлении файла с целью ускорения индексации новых страниц.

Ссылка для пингования карты сайта для Google:

http://www.google.com/ping?sitemap=https://site.com.ua/sitemap.xml

Где https://site.com.ua/sitemap.xml адрес карты сайта

Сервис генерации карты сайта

Для небольших проектов, где новый контент добавляется редко, более рационально единоразово самому сгенерить карту сайта и не тратить ресурсы на реализацию автогенерируемой карты.

Для этого можно использовать XML-Sitemaps — cервис позволяющий сформировать карту сайта на основе структуры сайта с заданием параметров приоритета страниц, частоты обновления.

Среди других сервисов, можно выделить:

Или использовать функционал таких программ как

Готовые модули генерации карты сайта для распространенных движков

Для дополнительных возможностей и генерации большого объема страниц лучше использовать готовые модули. Ниже приведен список для популярных платформ:

Google XML Sitemaps — модуль автоматической генерации карты сайта и ее пингования для движка WordPress.

Sitemap Generator — модуль генерации карты сайта для движка Joomla.

GoogleSitemap0.9 — модуль генерации для движка ModX.

Simple Google Sitemap — модуль генерации для движка OpenCart.

Do something to stop this war! Russians are killing our children and civilians!