Создание sitemap очень важна для поисковых систем, но что это такое? Карта сайта — это специфический файл в формате XML, находящийся в корне интернет-ресурса. Многие вебмастера задаются вопросом: “Надо ли устанавливать sitemap.xml на свой веб-сайт, и какое влияние она оказывает на раскрутку сайта в поисковиках? Или карту сайта вообще не обязательно добавлять?”
Для того, чтобы ответить на все эти вопросы, мы разберем структуру sitemap и попытаемся ответить, для чего нужен этот файл.
Sitemap.xml представляет собой список всех веб-страниц вашего сайта в xml-формате. Наличие данного файла позволяет поисковым системам значительно ускорить индексацию страниц, но она не является обязательным условием при создании и продвижении сайта! Просто при отсутствии карты сайта страницы могут долго не попадать в индекс поисковиков, особенно если их очень много или на портале глубокий уровень вложенности.
В файл sitemap.xml следует добавлять только те страницы, которые по вашему мнению должны быть в индексе поисковых систем. Не стоит включать страницы, закрытые от индексации в robots.txt, с динамическим URL, страницы авторизации, профилей и прочие технические веб-страницы. Заголовок сервера, отдаваемый всеми документами, которые находятся в файле sitemap.xml, должен быть 200.
В случае, если на вашем сайте более 10 000 страниц, то следует составить несколько карт сайта. Дело в том, что максимально допустимый размер sitemap.xml — 10 MB, хотя Search Console, например, допускает возможность добавления карты сайта с максимальным размером 50 MB.
В самом начале нужно указать версию xml и используемую кодировку, а именно — UTF-8.
Обязательные теги:
“urlset” — этот тег открывается вначале вашей карты (тег парный, соответственно, в конце документа его следует закрыть);
“url” — парный тег, являющийся основным тегом для каждой гиперссылки в вашем документе;
“loc” — парный тег, содержит ссылку на страницу.
Необязательные теги:
“lastmod” — показывает дату, когда в последний раз были внесены изменения в документе;
“changefreq” — указывает, как часто планируется изменения документа (приблизительно);
“priority” — отображает приоритет сканирования страницы, принимает значения от 0 до 1.
Обратите внимание! Тег “priority” поисковой системой Google больше не поддерживается.
В случае, когда файлов sitemap.xml несколько (на сайте более 10 000 страниц), используются следующие теги:
“sitemapindex” — этот тег открывается в самом начале вашей карты (тег парный, соответственно, в конце документа его следует закрыть);
“sitemap” — парный тег, он является основным для каждой гиперссылки в документе;
“loc” — парный тег, который содержит гиперссылку на sitemap.xml;
“lastmod” — необязательный тег, указывающий дату последнего изменения веб-страницы.
Чтобы создать карту сайта, можно воспользоваться специальными сервисами — автоматическими генераторами, например:
1. Mysitemapgenerator.com. В бесплатной версии он позволяет просканировать до 500 страниц, что идеально подходит для небольших информационных порталов. Используя платные пакеты (2,5$ и 4$), можно проиндексировать от 1 млн. страниц до полного безлимита, настраивая обновление sitemap по расписанию (полезно для порталов, на которых часто появляются новые веб-страницы).
2. Gensitemap.ru. Здесь можно бесплатно просканировать уже до 1000 страниц. Платные пакеты варьируются в зависимости от количества страниц, которые нужно добавить в карту сайта.
Если ваш веб-сайт разработан на какой-либо из распространенных CMS, например на WordPress, то вы можете воспользоваться любым из существующих плагинов — не обязательно использовать сторонние сервисы.
Плагинов, генерирующих карту сайта, огромное количество, например, Google XML Sitemaps, WP Realtime Sitemap.
Для начала определите те страницы вашего веб-сайта, которые по вашему мнению являются полезными для пользователей и должны быть добавлены в индекс поисковиков. Также следует определить канонические URL для выбранных веб-страниц.
Выберите наиболее подходящий вид sitemap и создайте его, воспользовавшись сторонним сервисом или плагином.
Впишите ссылку на карту сайта в robots.txt и добавьте ее в панель Гугл вебмастера.
Гугл работает с такими расширениями:
XML;
RSS;
TXT;
HTML.
Независимо от разновидности карты сайта, ей будут характерны нижеуказанные ограничения:
sitemap не может включать в себя более 50 000 URL;
размер файла не может быть больше 50 МБ.
Если при составлении sitemap.xml вы видите, что файл весит больше, чем 50 МБ, нужно создать 2 или более карты сайта. Сделать это достаточно просто:
Разработайте индексный файл Sitemap.
В индексном файле карты веб-сайта укажите ссылки на все остальные ваши sitemap.
Добавьте индексный документ карты сайта в панель Search Console.
Чтобы добавить карту сайта в Search Console, нужно в разделе “Индекс” выбрать вкладку “Файлы Sitemap” и добавить адрес карты. Затем запустится сканирование вашей Sitemap на ошибки, а результаты будут выведены в таблице ниже.
В случае с вебмастером Яндекса алгоритм действий тот же (показано на скриншоте). Вам остается только вставить ссылку на карту — и готово.
Перед добавлением файл можно проверить на предмет ошибок. Для этого выберите раздел “Инструменты»”, затем “Анализ файлов Sitemap”.
битых ссылок в файл (URL выдает ошибку 404);
веб-документов с 301, 302 редиректом;
веб-страниц с динамическим URL.
XML карта сайта действительно ускоряет индексацию web-страниц, что быть полезно для многостраничных сайтов, например, интернет-магазинов. Чтобы данный файл как можно скорее попал в руки Яндекса или Google, нужно добавить его в панели для вебмастеров.
Создавать карту вручную не стоит, потому что при этом сохраняется высокий риск опечаток и всевозможных ошибок, в то время как бесплатные генераторы и плагины работают по налаженному алгоритму.
Для некоторых интернет-порталов sitemap.xml попросту не нужен, поэтому рациональность создания и добавления данного файла определяется SEO-специалистом после детальной аналитики вашего портала. Если вы самостоятельно занимаетесь составлением структуры сайта, рекомендуем прочитать статью о том, что такое юзабилити сайта.