Файл sitemap.xml - это инструмент, который позволяет вебмастерам информировать поисковые системы о страницах сайта, доступных к индексации. Также, в XML карте можно указывать дополнительные параметры страниц: дата последнего обновления, частота обновлений и приоритет относительно других страниц. Информация в sitemap.xml может влиять на поведение поискового краулера и, в целом, на процесс индексации новых документов. Sitemap содержит в себе директивы включения страниц в очередь на обход и дополняет robots.txt, содержащий директивы исключения страниц.
В этом руководстве вы найдете ответы на все вопросы, касающиеся использования sitemap.xml.
Поисковые системы используют sitemap для поиска новых документов на сайте (это могут быть html-документы или медиа-контент), которые недоступны через навигацию, но их необходимо просканировать. Наличие ссылки на документ в sitemap.xml не гарантирует его сканирование или индексацию, но чаще всего файл помогает большим сайтам индексироваться лучше. К тому же, данные из XML карты используются при определении канонических страниц, если это специально не указано в теге rel=canonical.
Sitemap.xml важен для сайтов, где:
Если это не ваши случаи, то скорей всего sitemap.xml вам не нужен. Для сайтов, где каждая важная для индексации страница доступна в пределах 2х кликов, где для отображения контента не используются технологии JavaScript или Flash, где при необходимости используются канонические и региональные теги, и свежий контент появляется не чаще, чем на сайт заходит робот, в файле sitemap.xml нет необходимости.
Для небольших проектов при наличии проблемы лишь большого уровня вложенности документов, ее легко решить с помощью HTML карты сайта, не прибегая к использованию XML карты. Но если вы решили, что sitemap.xml вам все-таки нужен, то прочитайте это руководство полностью.
Поисковые системы поддерживают простой текстовый формат карты сайта, где просто списком перечислены URL-адреса страниц без дополнительных параметров. В таком случае файл должен иметь кодировку UTF-8 и иметь расширение .txt .
Также поисковиками поддерживается стандартный XML-протокол . Google дополнительно поддерживает сайтмапы для изображений, видео и новостей.
Пример файла Sitemap, содержащий только один адрес.
XML-теги
urlset
url
(обязательный) - родительский тег для каждого URL-адреса.
loc
(обязательный) - URL-адрес документа, должен быть абсолютным.
lastmod
- дата последнего изменения документа в формате Datetime .
changefreq
- частота изменения страницы (always, hourly, daily, weekly, monthly, yearly, never). Значение этого тега является рекомендацией поисковым системам, а не командой.
priority
- приоритетность URL относительно других адресов (от 0 до 1) для очередности сканирования. Если не указывается, то по умолчанию равна 0.5.
Некоторые оптимизаторы вставляют в sitemap.xml ссылки на изображения аналогично ссылкам на html-документы. Так можно делать, но лучше для Google использовать расширение стандартного протокола и вместе с урлами отправлять дополнительную информацию об изображениях. Создавать XML карты изображений полезно, если картинки необходимо сканировать и индексировать, и при этом, они напрямую не доступны боту (например, используется JavaScript).
Пример карты сайта, содержащей одну страницу и принадлежащие ей изображения
XML-теги
image:image
(обязательно) - информация об одном изображении. Максимум может использоваться 1000 изображений.
image:loc
(обязательно) - путь к файлу изображения. Если используется CDN, то допустимо ссылаться на другой домен, если он подтвержден в панели для вебмастеров.
image:caption
- подпись к изображению (может содержаться длинный текст).
image:title
- название изображение (обычно короткий текст).
image:geo_location
- место съемки.
image:license
- URL лицензии изображения. Используется при расширенном поиске по картинкам.
Подобно карте для изображений, Google также имеет расширение sitemap протокола для видео, где можно указывать подробную информацию о видео-контенте, влияющую на отображение в поиске по видео. Видео-сайтмап необходим, когда на сайте используются видео, которые хостятся локально, и когда индексация этих видео затруднена из-за используемых технологий. Если вы на сайте внедряете видео из YouTube, то video-sitemap здесь не нужен.
При наличии на сайте новостного контента и участии в Google Новостях полезно использовать Sitemap для новостей, так Google будет быстрей находить ваши свежие материалы и индексировать все новостные статьи. В этом случае Sitemap должен содержать только адреса страниц, опубликованных за последние 2 дня и содержать не более 1000 урлов.
При необходимости можно использовать несколько карт сайтов, объединяя их в один индексный сайтмап. Несколько sitemap.xml используются в случаях, когда:
В последнем случае каждый большой раздел сайта имеет свой sitemap.xml и все они добавляются в панель для вебмастеров, где удобно наблюдать, в каком из разделов больше всего ошибок (см. раздел поиска ошибок в карте сайта).
Если у вас 2 и более сайтмапа, их необходимо объединить в индексный сайтмап, который выглядит также как обычный (за исключением наличия тегов sitemapindex и sitemap вместо urlset и url), имеет аналогичные ограничения и может ссылаться только на обычные XML карты (не на индексные).
Пример Sitemap Index:
sitemapindex
(обязательный) - указывает стандарт текущего протокола.
sitemap
(обязательный) - содержит информацию об отдельном sitemap.
loc
(обязательный) - местоположение sitemap (в формате xml, txt или rss для Google).
lastmod
- время изменения сайтмапа. Позволяет поисковикам быстро обнаруживать новые URL на сайтах больших размеров.
Методы создания XML Sitemap:
Позволяет получить sitemap.xml в несколько кликов. Поддерживает форматы XML, HTML, TXT и GZ. Удобно использовать для небольших сайтов (до 500 страниц).
Похожий генератор, но имеет чуть больше настроек и позволяет создать карту до 2000 страниц бесплатно.
Имеет множество настроек, позволяет импортировать URL-адреса из CSV-файла. Бесплатно сканирует до 500 урлов.
Не имеет лимитов на количество страниц для сканирования. Но для больших сайтов процесс генерации может подвисать на несколько десятков минут.
Бесплатная десктопная версия генератора карты сайта под Windows.
Гибкий инструмент генерации карты сайта с множеством настроек. Удобно, если вы уже пользуетесь скримин фрогом для других SEO-задач. После сканирования сайта используйте пункт меню Sitemaps -> Create XML Sitemap.
Менее гибкое, но тоже удобное решение для быстрой генерации sitemap.xml. После сканирования сайта необходимо использовать пункт меню Инструменты -> Генерация Sitemap.
Бесплатный генератор Sitemap для быстрого автоматического создания полной карты сайта. Нужно лишь указать его адрес и запустить программу.
Карта сайта обычно бывает в двух форматах:
С помощью первого варианта карты можно найти страницу по названию и оценить масштаб сайта (увидев перечень всех его страниц).
А второй помогает улучшить индексацию сайта поисковиками.
И программа SiteMap Generator от WonderWebWare дает широчайшие возможности по созданию карты сайта с минимальными усилиями со стороны веб-мастера.
Самое главное, что может делать это программа - создавать карты сайта в разных форматах (XML, TXT, экспорт ссылок в файл CSV или HTML).
Подобно интернет-пауку поисковика она, получив стартовый URL, сканирует весь Ваш сайт, выдавая список всех ссылок.
В программе даже есть встроенный браузер для предпросмотра сайта.
Еще одна полезность: программой можно пользоваться, сканируя несколько сайтов сразу (не по очереди). Для этого достаточно запустить несколько окон SiteMap Generator и работать с ними одновременно.
Установка программы вполне стандартная. Скачиваем архив с сайта и запускаем установочный файл.
Лимит страниц:
1200
Цена:
Бесплатно!
Подход:
Профессиональный!
Основное назначение sitemap.xml указать системам для поиска, какие страницы нуждаются в индексации в первую очередь. Некоторые не знают об этой роли карты сайта, а другие просто этим пренебрегают и не придают ей какого-то особого значения. Файл, который имеет более распространенное название , считается важным инструментом, можно сказать, основным, для того, чтобы указать поисковикам, какие страницы ресурса нуждаются в обязательном индексировании, хотя сам файл посетители вашего проекта видеть не будут.
Карта сайта содержит важную информацию, которая закладывается в него, для чего используется специальный синтаксис. Здесь перечисляются страницы для поисковиков, а также указывается какова степень их важности , как часто и когда последний раз они обновлялись. Все это непонятно и не нужно ни посетителям, ни владельцу сайта. Это предназначено только для поисковых машин.
Не имея этого файла, или если он неправильно заполнен, владелец сайта рискует тем, что его ресурс может быть поврежден или сайт не сможет раскрыть все свои возможности. Страницы, которые имеют важное значение, могут не индексироваться продолжительное время, а это отражается на посещении сайта, а соответственно и на его рейтинге. Это могут подтвердить специалисты, которым известна статистика множества проектов, создатели которых пренебрегали sitemap.xml . При одном показательном и интересном исследовании были выявлены самые популярные причины, из-за которых проекты продвигаются очень медленно. Если карта сайта, которая имеет расширение xml, не соответствует нужному формату или просто отсутствует, является причиной медленного продвижения, которая находится на втором места из десяти причин после некачественного контента. Эти факты могут убедить в важности карты больше, чем простые слова.
Чтобы быть уверенным, что проект правильно проиндексирован поисковиками создать файл sitemap мало. Можно его иметь, но поисковые машины могут его не увидеть. Нужно чтобы поисковики знали о его существовании. Для этого нужно правильно его создать и выбирать именно те страницы, которые считаются наиболее важными. Для правильно поиска нужно сделать определенные настройки, которые позволят не включать в поиск весь материал, находящийся на сайте, чтобы не замедлить работу робота.
В этом может помочь инструмент . Кроме того, что этот инструмент поможет в создании карты, он будет уведомлять поисковики о появлении нового материала, тем самым как бы давая понять, что они нуждаются в скорейшей индексации. Чтобы спрятать карту от любопытных, с помощью инструмента можно даже изменить ее название.
Где находится sitemap.xml поисковикам можно указать с помощью двух способов. В директиве ничего не опуская указать полный путь к файлу.
Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».
Наличие xml карты сайта () на сервере - стратегически важно для оптимизации. Карта хранит в себе структуру актуальных страниц вашего ресурса и служит для того, чтобы поисковые роботы быстрее ориентировались по сайту, а ваши страницы быстрее индексировались. Иными словами: карта сайта указывает поисковым роботам кратчайший путь к страницам. Вот такая карусель.
Файл sitemap. xml содержит не только url страниц, но и дополнительную информацию каждой страницы:
Естественно, прописать ручками этот файл очень трудно. Особенно если у вас большой интернет-магазин. Для упрощения жизни был разработан онлайн генератор карты сайта (sitemap generator online) , который выполняет всю рутинную работу за вас.
На данный момент существует достаточно много ресурсов для генерации карты, в этой статье я расскажу о наиболее популярных онлайн генераторах .
Практически все сервисы о нлайн генерации карт сайта работают по одному и тому же принципу. Даже интерфейс примерно везде один и тот же, отличается только стиль оформления и расположение кнопок управления.
Итак вы заходите на типичный онлайн генератор… что вы скорее всего увидите? Правильно! Поле ввода url. Вставляем нужный нам сайт. Для примера будем использовать генератор карты сайта cy-pr.com.
Вводим адрес нашего сайта, выбираем частоту обновления (если оно вам надо), также для удобства можно использовать дату последнего обновления (чтобы запомнить когда создавалась карта) и нажимаем кнопку «Создать».
После нажатия происходит волшебство! Вы сможете наблюдать как трудолюбивый сервис бегает по вашему сайту, записывая каждую страницу в файлик. После такого марафона генератор карты выдает вам всю свою рукопись с описанием каждой страницы:
Теперь нам нужно ее сохранить. Для этого открываем блокнот, вставляем туда наш код, который нам дала адская система, нажимаем «сохранить как», далее вводим имя файла « sitemap.xml », выбираем тип «все файлы», выбираем кодировку utf-8 и нажимаем кнопку «сохранить».
Мы получили файлик sitemap.xml:)
Будьте внимательны с регистрами! Название карты сайта должно быть в нижним регистре
Если вы все сделали правильно то получите такой файлик:
Важно помнить, что карта сайта не резиновая - потолок 50 000 url. Готовую карту можно скидывать на сервер. Главное, не забудьте прописать в robots, что у вас есть карта! Роботы вредные и не будут ее сами искать:)
Если вы решили не использовать сервисы онлайн генерации карты сайта , а захотели пойти по хардкору и написать все сами, то вам следует знать каждого из этого списка:
Конечно, не все онлайн генераторы дают вам код, многие генерируют готовую карту сайта в виде файла « sitemap.xml », вам остается лишь скачать ее и закинуть в корень сайта.
А если вы чувствуете, что работа с файлами это вообще не для вас…
Решение есть! Sitemap generator для админки без регистрации и смс. Рассмотрим подробнее на примере админки wordpress.
Плагин « Карта сайта» используется для небольших проектов, он выводит не такую подробную информацию как онлайн генераторы холопских файлов, но все же работает.
Для установки переходим в раздел меню плагины > установленные > добавить новый
В поиске вводим «Google sitemaps»
Устанавливаем данный плагин, активируем и (Бац! Wow!) карта сайта создана. Ее можно дополнительно настроить вручную (если вам это понадобиться). Также существует множество других плагинов для генерации карты сайта. Не только для WP, но и для других CMS и с каждым днем их больше и больше.
В этом путеводителе мы рассмотрим следующие вопросы:
Это файл, который содержит в себе перечень ссылок на все важные страницы сайта. То есть, этот документ направляет поисковые системы на основной контент на сайте.
Сайтмап нужен, если у сайта есть проблемы с индексацией, которые вызваны:
1) большим количеством страниц;
2) отсутствием ссылок (внутренних или внешних) на страницы;
3) глубокой вложенностью на сайте (запутанной структурой).
Карты сайта бывают следующих типов:
Самое простое объяснение разницы между этими форматами в том, что XML-карта в первую очередь предназначена для поисковых систем, а HTML – для пользователей.
HTML-карта – это всего лишь общий обзор сайта, содержит только информацию и страницы, которые нужно видеть пользователям. Если вы находитесь на сайте и ищете определённый раздел, при переходе на Sitemap HTML легко его найдёте. Несмотря на то, что такой тип карт сайта ориентирован на пользователя, он также может помочь вашему ранжированию в поисковых системах. Это одно из свидетельств того, что вы заботитесь об удобстве сайта для пользователя.
При составлении HTML-карты сайта важно учитывать:
1. Структурированное содержание.
Карта сайта должна быть понятна и удобна для восприятия пользователя. Желательно, чтобы она включала в себя разделы, категории, подкатегории и т. д.
2. Анкоры ссылок.
Протокол XML-карты сайта предназначен для поисковых роботов. XML-файл содержит в себе информацию о том, когда последний раз обновлялся URL-адрес, насколько это важно и как часто происходят изменения.
Обычно Sitemap состоит из следующих XML-тегов:
Обязательные:
Необязательные:
Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.
Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:
Для Google:
— RSS, mRSS и Atom 1.0;
RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
— Сайты Google.
Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.
Для Google и Яндекс:
— текстовый формат (TXT).
Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.
1. Используйте кодировку UTF-8.
2. Максимальное количество URL – 50 000.
3. Ссылки в сайтмапе должны быть на том же домене, что и файл.
4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
5. Ответ сервера при обращении к файлу должен быть 200 ОК.
6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).
1. Максимальный размер – 10 МБ.
2. Поддерживает кириллические URL.
1. Максимальный размер – 50 МБ.
2. Поддерживает только цифры и латинские буквы.
Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.
Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.
1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.
2. Определить, какой формат файла будете использовать.
3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.
Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке .
Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:
1. Парсим сайт.
2. Переходим в раздел «Сайты» => «Генерировать Sitemap».
3. Сохраняем в нужном нам формате.
4. Карта сайта готова.
Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator .
Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.
Исключить ненужные страницы можно и с помощью регулярных выражений.
Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.
Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.
Обязательные:
Необязательные:
Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.
Плюсы добавления XML-тегов для видео:
1) даёт понять Google, какой контент на сайте;
2) даёт возможность предоставить детальное описание к файлу;
3) станет доступным для поиска в Google Видео;
4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).
Карта сайта для видеофайлов состоит из следующих обязательных элементов:
Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.
Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google .
Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:
– «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.
– «Если я удалю URL из XML-карты, он будет удалён из индекса».
Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.
– «XML-файлы Sitemap трудно создавать и поддерживать»
Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.
Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.
Подписаться на рассылку