Файл sitemap создать c учетом графики. Детальное руководство по файлу Sitemap. Технические подробности sitemap

С помощью файла Sitemap можно сообщить Яндексу об актуальной структуре сайта, указав специальную директиву в robots.txt или добавив в Яндекс.Вебмастер.

Вебмастер позволяет:

Загрузка Sitemap

    Выберите из списка сайт.

    В поле впишите URL, по которому доступен файл. Например, https://example.com/sitemap.xml .

    Нажмите кнопку Добавить .

После добавления файл попадает в очередь на обработку. Робот загрузит его в течение двух недель. Каждый добавленный файл, в том числе вложенный в файл индекса Sitemap , обрабатывается роботом отдельно.

После загрузки напротив каждого файла вы увидите один из статусов:

Статус Описание Примечание
«OK»
«Редирект» Удалите редирект и сообщите роботу об обновлении
«Ошибка» Файл сформирован неправильно сообщите роботу об обновлении
«Не проиндексирован»

Проверка ответа сервера

Disallow сообщите роботу об обновлении
Статус Описание Примечание
«OK» Файл сформирован правильно и загружен в базу робота

Напротив файла отобразится дата последней загрузки.

Проиндексированные страницы появятся в результатах поиска в течение двух недель

«Редирект» Указанный URL перенаправляет на другой адрес Удалите редирект и сообщите роботу об обновлении
«Ошибка» Файл сформирован неправильно Нажмите ссылку Ошибка , чтобы узнать подробности. После внесения изменений в файл сообщите роботу об обновлении
«Не проиндексирован» При обращении к Sitemap сервер возвращает HTTP-код, отличный от 200

Проверьте, доступен ли файл для робота с помощью инструмента Проверка ответа сервера , указав полный путь к файлу.

Если файл недоступен, обратитесь к администратору сайта или сервера, на котором он расположен.

Доступ к файлу запрещен в robots.txt с помощью директивы Disallow Разрешите доступ к Sitemap и сообщите роботу об обновлении

Обновление Sitemap

Если вы изменили добавленный в Яндекс.Вебмастер файл Sitemap , его не надо удалять и загружать снова - робот регулярно проверяет файл на обновления и ошибки.

Чтобы ускорить обход файла, нажмите значок . Если вы используете файл индекса Sitemap , можно запустить обработку каждого перечисленного в нем файла. Робот загрузит данные в течение трех дней. Использовать функцию можно до 10 раз для одного хоста.

Когда вы израсходуете все попытки, следующая будет доступна через 30 дней после первой. Точная дата отображается в интерфейсе Вебмастера.

Удаление Sitemap

В интерфейсе Яндекс.Вебмастера можно удалить те файлы, которые были добавлены на странице Файлы Sitemap : Если для Sitemap была добавлена директива в файле robots.txt , удалите ее. После внесения изменений информация о Sitemap пропадет из базы робота и Яндекс.Вебмастера в течение нескольких недель.

Укомплектовав свой сайт файлом Google Sitemap , Вы убиваете сразу двух зайцев: во-первых, Вы можете быть уверены в том, что Google проиндексирует все имеющиеся в этом файле страницы Вашего сайта, во-вторых, Google будет регулярно сканировать этот файл на наличие новых страниц для индексации.

В этой статье мы обсудим ряд вопросов, касающихся Google Sitemap:

  1. Преимущества, получаемые вследствие внедрения Google Sitemap в свою деятельность;
  2. Кому следует это использовать;
  3. Как это работает;
  4. Как создать Google Sitemap для своего сайта;
  5. Как создать динамический XML -файл Google Sitemap;
  6. Инструменты для генерации файла Google Sitemap от сторонних производителей.

Преимущества, получаемые вследствие внедрения Google Sitemap в свою деятельность:

  1. Ускорение процесса обнаружения и добавления страниц сайта в индекс Google.
  2. Быстрое нахождение Google’ом претерпевших изменения страниц сайта.
  3. Обеспечение более быстрого попадания сайта в результаты поисковой выдачи Google.
  4. Помощь Google в пополнении его индекса свежим контентом, вследствие чего пользователи Google получают в ответ на свои поисковые запросы актуальный и свежий контент.

Кому следует это использовать?

Использовать Google Sitemap может каждый сайтовладелец независимо от того, сколько на сайте страниц одна или миллион. Но всё-таки необходимее всего использовать Google Sitemap владельцам тех сайтов, страницы которых претерпевают очень частые изменения.

Обычно бывает так, что определённое количество страниц сайта не индексируется , хотя ссылки, ведущие на них, корректно распознаются поисковыми роботами. Причина этому банальна – расположение ссылок на эти страницы в глубине сайта, т.е. поисковый робот не доходит до этих ссылок, соответственно не находит эти страницы. Избежать данной проблемы можно, воспользовавшись Google Sitemap .

Запомните: использование Google Sitemap не даёт преимущества при ранжировании!

Как это работает?

Google Sitemaps созданы с использованием XML (Extensible Markup Language). Этот язык часто используется в фидах и на блогах.

Ниже приведён пример XML -кода, который Вы должны включить в каждую страницу своего сайта:


http://www.yoursite.com/
2005-07-15
monthly
0.5

Ниже приводится описание каждой строки кода:

  • location – адрес веб-страницы, например http://www.yoursite.com
  • last modified – дата последней модификации страницы
  • change frequency – говорит Google о том, как часто Вы обновляете веб-страницу. Возможные значения: never, weekly, daily, hourly, monthly, yearly
  • priority – устанавливает приоритет, который Google назначит для конкретной веб-страницы. Возможные значения: 0.0 (низший приоритет), 1.0 (высший приоритет), 0.5 (средний приоритет).

Некоторые веб-страницы Вашего сайта могут быть особенно приоритетными , т.к. часто обновляются , например главная (домашняя) страницы сайта, страница статей, поэтому им необходимо присвоить высший приоритет…

Ещё раз повторюсь — Google Sitemap никак не влияет на ранжирование сайта.

Как создать динамический XML -файл Google Sitemap?

Если Ваш сайт состоит из 1000 страниц и более, то создавать Google Sitemap вручную будет слишком долго, муторно и неудобно.

К счастью, Google предоставляет собственный скрипт, называемый Sitemap Generator , позволяющий очень быстро сгенерировать необходимый файл. Этот скрипт написан на языке Python, он создаёт Sitemap для Вашего сайта, используя Sitemap Protocol . Этот скрипт может создавать Sitemaps из списка URL , директорий веб-сервера или из логов доступа.

Инструменты для генерации файла Google Sitemap от сторонних производителей

Google также предоставляет информацию о других sitemap-генераторах.

Например я использую бесплатный sitemap-генератор. Он лёгок в применении, и он быстро генерирует необходимый XML -код для сайта.

Ниже я привожу пошаговый план создания Google Sitemap при помощи одного из множества бесплатных Sitemap-генераторов:

  1. Зайдите на сайт http://www.sitemapspal.com и введите адрес Вашего сайта в форму, находящуюся в самом верху страницы сайта
  2. Нажмите Submit
  3. Скопируйте сгенерированный для Вашего сайта код и вставьте его в чистый текстовый файл блокнота (notepad)
  4. Сохраните этот текстовый файл под именем sitemap.xml
  5. Загрузите этот файл в корневую директорию Вашего сайта (туда, где находится домашняя страница сайта)
  6. В адресной строке браузера наберите полный путь к сгенерированному файлу, например http://www.yoursite.com/sitemap.xml. Если Вы всё сделали правильно, то Вы увидите список URL ’ов и никаких ошибок
  7. Теперь откройте свой Google Sitemap аккаунт и добавьте этот путь (из пункта 6) в соответствующую графу в аккаунте
  8. Проделывайте эти шаги применительно к каждому своему сайту.

Резюме

Google является крупнейшей и популярнейшей поисковой машиной во всём Интернете. Каждый год миллионы веб-сайтов попадают в индекс Google, что естественным образом усложняет задачу нахождения Вашего сайта в результатах поисковой выдачи (SERP). Поэтому создайте и начинайте использовать Google Sitemap прямо сейчас.

You can very easy create your sitemap. First type in your URL and then select the parameters you may wish to change. (change frequency, last modification date and page priority. You may also alter default settings for exclude extensions, do not parse extensions and session ids. In the next fields you can declare which URLs you want to exclude from sitemap (see example below). Finally you may select the maximum number of pages and the depth level. Optionally you can select to create additional sitemaps, like ROR sitemap, HTML sitemap or TXT sitemap.

What is "Page changing frequency" ?
Change frequency affects when and how often search engine spiders visit your site’s pages. It may have one of seven values: always, hourly, daily, weekly, monthly, yearly, never. This tells the search engines how often each page is updated. An update refers to actual changes to the HTML code or text of the page.

What is "Last modification date" ?
This parameter can take one of the next three values:
Server"s response. Set the date of last modification of the file using server response headers. This value, gives crawlers the information to not recrawling documents that have not changed. We recommend to keep this setting.
Current time. Set the date of last modification of the file using the current date and time.
None. Do not use any value for Last modification of the files.

What is "Page priority" ?
The Priority is set to a number between zero and one. If no number is assigned, priority is set to 0.5. This number determines the priority of a particular URL relative to other pages on the same site. A high priority page may be indexed more often and appear above other pages from the same site in search results. Automatic priority reduces the priority of a page depending on depth level.

What is "Depth Level" ?
Depth level of a page means how many clicks away is this page from homepage.

What is "Exclude extensions" ?
Files with these extensions found in your website pages are not included in sitemap (not crawled). Separate input values with spaces.

What is "Do not parse extensions" ?
Files with these extensions will not be fetched in order to save bandwidth, because they are not html files and have no embedded links but will be included in the sitemap. Separate input values with spaces.

What is "Session IDs" ?
If URLs on your site have session IDs in them, you must remove them. Including session IDs in URLs may result in incomplete and redundant crawling of your site. Common session IDs: PHPSESSID, sid, osCsid. Separate with spaces.

What is "Exclude URLs" ?
URLs that contain these strings (or regex) will not be included on sitemap. Input values one per line.
e.g. 1 Use string: component/ in order to exlude all pages in www.yoursite.com/component/
If regex, add in the end: \s* (example: blo\s*)
e.g. 2 If you have any of the following websites, you may exclude these strings: (copy and paste to Exlude URLs box)

Из этой статьи вы узнаете, как создать файл Sitemap и предоставить Google доступ к нему.

Создание и отправка файлов Sitemap

Форматы файлов Sitemap

Google поддерживает несколько форматов файлов Sitemap, описанных ниже. Во всех форматах следует использовать стандартный протокол . Google в настоящее время не поддерживает атрибут В файлах Sitemap.

Для всех форматов действуют следующие ограничения: файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. Если объем файла или количество перечисленных в нем адресов превышают эти лимиты, разбейте его на несколько частей. Вы можете создать файл индекса Sitemap , перечислив в нем все файлы Sitemap, и отправить их в Google все сразу.

Текстовый файл

Если в файле Sitemap есть только адреса страниц, вы можете отправить Google обычный текстовый файл с этими URL (по одному в каждой строке). Пример:

Http://www.example.com/file1.html http://www.example.com/file2.html

  • Необходимо использовать кодировку UTF-8.
  • Файл не должен содержать ничего, кроме списка URL.
  • Этому текстовому файлу можно дать любое имя, но необходимо использовать расширение.txt (например, sitemap.txt).

Сайты Google

Если сайт был создан и подтвержден с помощью сервиса "Google Сайты", файл Sitemap создается автоматически. Его нельзя изменить, но можно отправить в Google , чтобы получать сведения для отчетов. Обратите внимание, что если в одном подкаталоге содержится более 1000 страниц, файл Sitemap может отображаться некорректно.

  • Если ваши страницы размещены на Google Сайтах , файл Sitemap должен находиться по адресу http://sites.google.com/site/VashSait /system/feeds/sitemap .
  • Если сайт создан с помощью Google Apps , URL файла Sitemap должен быть таким: http://sites.google.com/VashDomen /VashSait /system/feeds/sitemap .

Расширения файлов Sitemap

Google поддерживает расширенный синтаксис в файле Sitemap для приведенных ниже типов информации. С его помощью можно добавлять описание видео, изображений и другого контента для улучшения его индексации.

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Наличие xml карты сайта () на сервере - стратегически важно для оптимизации. Карта хранит в себе структуру актуальных страниц вашего ресурса и служит для того, чтобы поисковые роботы быстрее ориентировались по сайту, а ваши страницы быстрее индексировались. Иными словами: карта сайта указывает поисковым роботам кратчайший путь к страницам. Вот такая карусель.

Что конкретно находится в карте сайта?

Файл sitemap. xml содержит не только url страниц, но и дополнительную информацию каждой страницы:

  • дату последнего изменения;
  • частоту изменения;
  • приоритетность на уровне сайта.

Естественно, прописать ручками этот файл очень трудно. Особенно если у вас большой интернет-магазин. Для упрощения жизни был разработан онлайн генератор карты сайта (sitemap generator online) , который выполняет всю рутинную работу за вас.

На данный момент существует достаточно много ресурсов для генерации карты, в этой статье я расскажу о наиболее популярных онлайн генераторах .

Как сгенерировать sitemap и как работает эта адская система?

Практически все сервисы о нлайн генерации карт сайта работают по одному и тому же принципу. Даже интерфейс примерно везде один и тот же, отличается только стиль оформления и расположение кнопок управления.

Итак вы заходите на типичный онлайн генератор… что вы скорее всего увидите? Правильно! Поле ввода url. Вставляем нужный нам сайт. Для примера будем использовать генератор карты сайта cy-pr.com.

Вводим адрес нашего сайта, выбираем частоту обновления (если оно вам надо), также для удобства можно использовать дату последнего обновления (чтобы запомнить когда создавалась карта) и нажимаем кнопку «Создать».

После нажатия происходит волшебство! Вы сможете наблюдать как трудолюбивый сервис бегает по вашему сайту, записывая каждую страницу в файлик. После такого марафона генератор карты выдает вам всю свою рукопись с описанием каждой страницы:

Теперь нам нужно ее сохранить. Для этого открываем блокнот, вставляем туда наш код, который нам дала адская система, нажимаем «сохранить как», далее вводим имя файла « sitemap.xml », выбираем тип «все файлы», выбираем кодировку utf-8 и нажимаем кнопку «сохранить».

Мы получили файлик sitemap.xml:)

Будьте внимательны с регистрами! Название карты сайта должно быть в нижним регистре

Если вы все сделали правильно то получите такой файлик:

Важно помнить, что карта сайта не резиновая - потолок 50 000 url. Готовую карту можно скидывать на сервер. Главное, не забудьте прописать в robots, что у вас есть карта! Роботы вредные и не будут ее сами искать:)

Если вы решили не использовать сервисы онлайн генерации карты сайта , а захотели пойти по хардкору и написать все сами, то вам следует знать каждого из этого списка:

  1. - Тег в котором указывается данные об url
  2. - В этом теге заключаются данные о многих url
  3. - Используется для указания url
  4. - Хранит дату последнего изменения
  5. - Данные о частотности изменения (могу использоваться атрибуты « always, hourly, daily, weekly, monthly, yearly, never» )
  6. Описывает приоритет страницы по сравнению с другими (от 0.1 - холоп до 1 - царь)

, и являются обязательными, остальные могут не использоваться.

Могучий пример

//сайт/ 2016-06-09T11:46:13+04:00 always 1.0 //сайт/category/ 2016-06-09T11:46:13+04:00 hourly 0.8 //сайт/page/ 2016-06-09T11:46:13+04:00 daily 0.6

Не царское это дело, файлики сохранять

Конечно, не все онлайн генераторы дают вам код, многие генерируют готовую карту сайта в виде файла « sitemap.xml », вам остается лишь скачать ее и закинуть в корень сайта.

А если вы чувствуете, что работа с файлами это вообще не для вас…

Решение есть! Sitemap generator для админки без регистрации и смс. Рассмотрим подробнее на примере админки wordpress.

Плагин « Карта сайта» используется для небольших проектов, он выводит не такую подробную информацию как онлайн генераторы холопских файлов, но все же работает.

Для установки переходим в раздел меню плагины > установленные > добавить новый

В поиске вводим «Google sitemaps»

Устанавливаем данный плагин, активируем и (Бац! Wow!) карта сайта создана. Ее можно дополнительно настроить вручную (если вам это понадобиться). Также существует множество других плагинов для генерации карты сайта. Не только для WP, но и для других CMS и с каждым днем их больше и больше.

Генератор sitemap xml: с оветы

  • При создании карты сайта не стоит забывать о размере. Если файл весит больше 10 мб, рекомендуется его разбить на несколько частей. Тем самым вы избавите сервер от перегрузок.
  • Все url необходимо писать единообразно (с www либо без www)
  • Файл карты сайта должен иметь кодировку UTF-8
  • Всегда указывать на пространство имен языка XML xmlns="