Файл sitemap.xml необходим для проведения внутренней оптимизации сайта. Его использование позволяет поисковым роботам Google и Яндекс индексировать расположенную на веб-страницах информацию. При этом до-пускается отсутствие файла, что не является критичным, но может приводить к проблемам с выдачей этих страниц в Яндексе, Гугле и других поисковиках. Попробуем разобраться, что из себя представляет этот файл, как устроен, алгоритм создания и добавления.
Содержание
- Что такое техническая карта и зачем нужна
- Как создать и найти
- Требования к файлу
- Добавление карты в Google Search Console и Яндекс.Вебмастер
- Заключение
Что такое техническая карта и зачем нужна
Для понимания, что это, требуется разобраться с понятием краулингового бюджета. Под ним понимают число страниц, которые поисковый робот индексирует за одно посещение сайта. Поэтому важно создать карту, облегчающую работу краулера и включить в нее важные с точки зрения продвижения страницы. Пользователям для удобной навигации важна html-карта, роботам — xml.
При создании одностраничного ресурса создания файла не требуется. Он нужен для сайтов, имеющих:
- навигационные цепочки;
- глубокую вложенность;
- большое число страниц.
При его расположении в корне робот легко доберется до 7 и более уровня.
Как выглядит xml карта сайта.
Как создать и найти
Возможно создать файл sitemap.xml вручную, но проще использовать различные генераторы, расположенные в интернете или встроенные в CMS-системы. Использование онлайн-режима лучше всего подходит для ресурсов с небольшим числом страниц. Однако он не предполагает автоматического включения в карту новых страниц. В качестве них могут использоваться различные приложения, имеющие в названиях «sitemap(s)», «generator», «XML».
Другим, можно сказать, основным способом создания файла, является использование CMS. При этом при создании новых вложений на своем ресурсе будет автоматически обновляться и создаваемый файл. Подобный функционал присутствует в:
- «1С: Битрикс» через раздел «Маркетинг»;
- WordPress через использование различных плагинов, среди которых наиболее популярным является Google XML Sitemaps;
- Joomla — плагины jSitemap и OSMap;
- Magento — при помощи настройки Site Map Configuration;
- и другие в иных CMS.
Пример создания карты в CMS Битрикс.
Системный администратор сам подбирает способ, подходящий ему для формирования карты сайта. Необходимо учитывать, что битриксовый генератор по умолчанию создает xml-файл из инфоблоков с множеством файлов, что во многих случаях нецелесообразно. В Битриксе есть генератор, расположенный в настройках по пути «Поиск» — «Google Sitemap», работающий более адекватно. Сформированный различным образом файл скачивают и помещают в корень сайта (там, где расположен index с разрешением html или php).
Его нахождение определяется набором адресов, возможных для включения в него. Все адреса располагаются по одному пути, используется один же протокол (нельзя, например, приводить адреса, начинающиеся и с http, и с https) и располагаются на том же хосте, где и сам файл.
Требования к файлу
Он создается в формате xml или txt. В случае использования txt в нем вводятся просто ссылки с конкретными адресами. Для формирования xml-файла роботу указывают:
- адрес;
- время последнего апгрейда;
- частоту изменения;
- приоритет.
При этом последние 3 — рекомендуемые атрибуты, необязательные для включения. При формировании карты используется кодировка UTF8. Максимальный размер установлен в 50 МБ. В файле допускается перечисление до 50 тыс. страниц. При этом возможно создать ряд файлов, которые перечисляются в файле индекса Сайтмап (с таким же ограничением, как по числу страниц в одном файле). Для сжатия (для улучшения пропускной способности канала) может использоваться утилита gzip. Формат индекса аналогичен файлу sitemap.xml.
Они начинаются и заканчиваются тегом (и соответственно). Между ними указывается область имен. Адреса приводятся с тега-ми . В них присутствуют дочерние теги.
Доступные XML-теги
Атрибут | Его характеристика |
Обязательные | |
<urlset> | Инкапсуляция файла с приведением стандарта протокола |
<url> | Тег (родитель) для адресов |
<loc> | Тег (дочка) для <url> с длиной до 2048 символов, начинающийся с префикса (http, https и т.д.) и заканчивающийся слэшем (при необходимости) |
Необязательные | |
<lastmod> | Число последнего изменения (ГГГГ-ММ-ДД с возможностью ввода времени) |
<changefreq> | Потенциальная частота изменения страницы, не эквивалентная точной частоте сканирования. Может принимать значения:
|
<priority> | Приоритетные адреса в сравнении со страницами сайта, для которых установлено меньшее значение. Устанавливается величина от 0 до 1,0, дефолтная — 0,5. Чем больше, тем выше вероятность выдачи в топе поисковиков. |
В xml-файле индекса sitemap используются те же самые атрибуты.
Добавление карты в Google Search Console и Яндекс.Вебмастер
Простое ее создание и размещение в корне не поможет поисковикам в индексации, если не указать им его место расположения. В сервисе Google Search Console слева нужно нажать на кнопку «Файлы Sitemap», добавить адрес его расположения и кликнуть по кнопке «Отправить».
Отправка на переобход в сервисе Google Search Console.
В сервисе Яндекс.Вебмастер действия похожие: производится переход в расположенный слева пункт «Индексирование» и далее перемещение в «Файлы Sitemap», в верхнем поле указывается адрес расположения созданного файла. Аналогично сервису Google подтверждение осуществляется нажатием на одноименную кнопку. Перед его добавлением правильность со-здания карты проверяется при помощи утилиты «Анализ файлов Sitemap». Сообщения о возникших неполадках можно просмотреть в «Диагностике сайта».
Отправка на переобход в сервисе Яндекс.Вебмастер.
Проверка файла sitemap.xml в Яндекс.Вебмастер.
Заключение
XML-файл карты сайта необходим для настройки оптимальной его индексации в поисковиках, пользующихся наибольшей популярностью. Она требуется как для ведущих блоги, так и для компаний, создающих официальные интернет-страницы. При небольшом количестве вложенных страниц этот файл может создаваться вручную, при значительном числе вложений его настраивать проще с использованием CMS, имеющих встроенный функционал или специализированные плагины.
При его создании необходимо учитывать ограничение по размеру, количеству записей, возможность формирования нескольких файлов при большом числе записей. Простое создание файла карты без его размещения в со-ответствующих службах поисковиков не даст результата, на который рассчитывает владелец сайта.