Что такое XML-карта сайта и как ее создать?

Опубликовано: 2020-11-20

Создание веб-сайта требует большой дисциплины и любопытства, чтобы его заметили в постоянно расширяющемся интернет-ландшафте — одним из основных шагов к успеху в SEO является карта сайта.

Протокол Sitemap — это дорожная карта вашего сайта. Полезные карты сайта позволяют поисковым системам более эффективно сканировать ваш сайт. Google впервые представил протокол в 2005 году, позволив разработчикам публиковать ссылки со своих сайтов.

Совместная поддержка со стороны Yahoo и Microsoft была оказана в 2006 году, а позже в том же году Ask.com и IBM поддержали новый протокол. Одним из значительных достижений протокола стало автоматическое обнаружение через файл robots.txt.

Что такое карта сайта?

Функция поисковой системы заключается в поиске в Интернете нового кода и веб-страниц. Вторая функция — индексировать контент и размещать его в доступной для обнаружения иерархии — последняя часть головоломки; отображать контент по релевантным запросам.

Карта сайта — это интерфейс между сайтом и поисковыми системами. Карта сайта Google — это расширение XML-файла, дающее веб-мастерам возможность сообщать роботам-роботам о новых и измененных URL-адресах. Полезные карты сайта сообщают ботам, когда последний раз обновлялся URL-адрес, и его важность для других URL-адресов на сайте. Вот как может выглядеть карта сайта:

Что такое XML-карта сайта

(Изображение предоставлено: DYNO Mapper)

Люди используют карты сайта в качестве SEO-маркера для своих сайтов. Тем не менее, следует полностью понимать: индекс карты сайта предназначен для поисковых роботов. Все, что веб-мастера могут сделать для увеличения этого общения, тем лучше.

Поисковые системы периодически отправляют поисковых роботов или пауков, чтобы найти обновленный контент. Боты — это небольшие фрагменты кода, которые взаимодействуют с движком и вашим сайтом. Чем эффективнее ваша карта сайта, тем легче поисковой системе обнаруживать и индексировать новый контент и ссылки.

Сканирование — это процесс посещения ботами веб-сайтов на основе частотного алгоритма поисковой системы и других факторов. Поисковые роботы используют ссылки для обнаружения других страниц, обращая пристальное внимание на новый контент и существующие изменения темы.

Google и другие движки предоставили веб-мастерам детальный выбор, когда поисковые роботы сканируют их сайты. Эта функция является значительным шагом вперед по сравнению с тайной политикой прошлого.

Если вы настраиваете карту сайта Google, необходимо выполнить несколько условий:

  • Расположение вашей карты сайта должно быть в корневом каталоге вашего сайта. Сканирующие боты обычно начинают с корня и перемещаются наружу. Если есть карта сайта, вы облегчили задачу боту.
  • Во-вторых, каждый последующий URL-адрес должен совпадать с картой сайта. Если карта сайта имеет протокол HTTP:, каждый URL-адрес должен иметь одно и то же расширение HTTP:.
  • Основные поисковые системы теперь позволяют размещать несколько файлов карты сайта в одном каталоге для облегчения сканирования. Максимальное количество URL-адресов, разрешенных в одном файле карты сайта, составляет 50 000. Веб-мастера могут еще больше разбить это число и иметь несколько карт сайта, чтобы лучше определить структуру веб-сайта.
  • Следуйте форматам карты сайта с Sitemaps.org, чтобы установить правильную схему для вашего сайта.

SEO и ваша карта сайта

Каждому веб-сайту нужна карта сайта и знания о том, как создавать карты сайта в формате xml, будь то новый с одной страницей или магазин электронной коммерции с тысячами продуктов. Веб-сайты выигрывают, когда поисковые системы могут легко находить важные страницы и когда они в последний раз обновлялись.

Карта сайта в структуре вашего веб-сайта сообщает поисковым системам, что каждый включенный URL-адрес является качественной целевой страницей.

Лучшие практики SEO всегда в движении; то, что вчера было отличным советом о том, как создать XML-карту сайта, возможно, изменилось сегодня. Будет мудрым советом знать расположение лучших практик SEO для каждой из поисковых систем, на которые ориентируется ваш сайт.

Держитесь подальше от раздутых мнений в блогах и на форумах. Сконцентрируйтесь на том, что важно, например, на требованиях к карте сайта Google XML. Потратьте время на то, чтобы рассеять шум и сформулировать передовой опыт работы с основными двигателями.

Вам будет интересно

Формат XML-карты сайта

  • org является окончательным источником того, что такое протокол xml карты сайта и как структурировать карту сайта. Правильное форматирование XML-карты сайта состоит из ряда описательных тегов. Каждое значение должно быть экранировано сущностью, что означает, что карта сайта имеет кодировку UTF-8. Например:

Что такое XML-карта сайта

(Изображение предоставлено: карты сайта)

UTF-8 — это сокращение от Unicode Transformation Format-8 Bit. Это обозначение представляет собой стандартную переменную ширину, характер электронной связи. Еще одно условие форматирования: каждый URL карты сайта должен быть закодирован для удобства чтения веб-сервером.

Ниже приведены определения тегов карты сайта. некоторые из них являются некоторыми из требований к карте сайта Google XML, а другие являются необязательными.

  • <urlset> — обязательный тег. Это стандартные ссылки; что такое протокол sitemap xml и описывает файл.
  • <url> — родительский тег для каждой записи. Каждый тег после этой записи является дочерним тегом.
  • <loc> — еще один обязательный тег. Эта функция ссылается на URL-адрес и начинается с протокола, такого как HTTP или HTTPS, и должна заканчиваться косой чертой, если этого требует веб-сервер. Это значение должно быть меньше 2048 символов.
  • <lastmod> — необязательный тег, который определяет, когда файл был в последний раз изменен. Тег должен быть в формате даты и времени W3C. Тег отделен от тега if-modified-since. Поисковые системы могут использовать информацию из альтернативных источников.
  • <changefreq> — еще один необязательный тег, улучшающий возможности поиска по карте сайта. Этот тег показывает, как часто страница может меняться.

Всегда используется для описания документов, которые будут меняться при каждом доступе к ним:

  • Ежечасно
  • Повседневная
  • Еженедельно
  • Ежемесячно
  • Ежегодно
  • Никогда, заархивированные URL

Поисковые роботы могут обращаться к странице чаще, чем раз в час, и могут сканировать страницы, помеченные ежегодно, чаще. Страницы, помеченные никогда, могут быть просканированы для обработки неожиданных изменений.

  • <priority> — это относительный тег URL по отношению к другим URL-адресам на сайте. Диапазон значений от 0,0 до 1,0, по умолчанию 0,5. Это значение не влияет на сравнение страниц с другими сайтами. Тег отображает требования карты сайта Google XML и страницы, которые веб-мастер считает наиболее важными для поисковых роботов.

Назначенные приоритеты вряд ли повлияют на позицию поиска. Веб-мастера могут использовать этот тег, чтобы увеличить вероятность того, что самые важные страницы будут проиндексированы.

Создать карту сайта

Поначалу создание индекса карты сайта может показаться сложным, если вы делаете это впервые. Карты сайта создаются для поисковых роботов, а не для людей. Как мы уже говорили, в современном SEO существует множество инструментов, которые создают идеальные карты сайта.

Крайне важно понимать структуру XML, чтобы убедиться, что инструменты выполняют свою работу.

Разберем простую карту сайта:

  • XML-декларация : этот оператор сообщает роботу поисковой системы, что он читает; в большинстве случаев это файл типа XML. Другие объявления сообщают боту; информация о версии и типе кодировки. Карта сайта должна быть в кодировке UTF-8.
  • Набор URL -адресов: этот раздел содержит URL-адреса в карте сайта. Набор URL информирует ботов о том, какой стандарт используется. Наиболее распространенным стандартом является 0,90, который поддерживается Google, Microsoft и Yahoo.
  • URL -адрес: веб-мастера должны сообщать боту каждый URL-адрес, вложенный в тег <loc>. Крайне важно заявить; URL-адреса должны быть абсолютными, а не относительными, каноническими URL-адресами. Тег <loc> — единственный обязательный элемент на данном этапе.

После того, как веб-мастер объявит URL-адрес, он может использовать любой из дополнительных тегов, указанных выше, чтобы лучше понять каждую запись. Включайте только релевантные SEO-страницы; вы помогаете сканирующему роботу работать более разумно, что, в свою очередь, помогает вашему производителю пожинать плоды хорошего сеанса сканирования.

Сканирующий бот заходит на веб-сайт с заданными параметрами для сканирования примера сайта в формате xml. Эти параметры обычно основаны на последних результатах. Не тратьте драгоценное время ботов на включение менее релевантных страниц веб-сайта — только лучших.

Проверьте SEO и производительность вашего сайта за 60 секунд!

Хороший дизайн веб-сайта имеет решающее значение для вовлечения посетителей и конверсии, но медленный веб-сайт или ошибки производительности могут сделать даже самый лучший веб-сайт неэффективным. Diib — один из лучших инструментов для мониторинга производительности веб-сайтов и SEO в мире. Diib использует силу больших данных, чтобы помочь вам быстро и легко увеличить трафик и рейтинг. Как показано в Предприниматель!

  • Простой в использовании автоматизированный SEO-инструмент
  • Мониторинг ключевых слов и обратных ссылок + идеи
  • Обеспечивает скорость, безопасность и + отслеживание Core Vitals
  • Разумно предлагает идеи по улучшению SEO
  • Более 250 000 тысяч участников со всего мира
  • Встроенный бенчмаркинг и анализ конкурентов

Например, «www.diib.com»

Используется более чем 250 тысячами компаний и организаций:

  • логотип
  • логотип
  • логотип
  • логотип

Синхронизируется с Гугл Аналитика

Линкбилдинг

Страницы, которые НЕ следует включать в карту сайта:

  • Служебные и архивные страницы
  • Страницы, заблокированные файлом robots.txt и страницы noindex
  • Дублированные и разбитые на страницы страницы и сообщения
  • Неканонические страницы
  • Ответы на комментарии и адреса электронной почты
  • Перенаправление, отсутствующие страницы и страницы с ошибками

Будьте осторожны с генератором html карты сайта. Некоторые из них ненадежны и практикуют плохое SEO, включая неканонические URL-адреса и страницы без индекса.

Наличие некачественных страниц в карте сайта имеет ужасные последствия для SEO:

  • Первый и самый важный; они тратят драгоценное время краулингового бюджета. Это время лучше потратить на полное изучение только лучших страниц и ссылок с вашего сайта.
  • Страницы низкого качества крадут авторитет ссылок у страниц, которые могут иметь более высокий рейтинг. Например, блог aHrefs удалил треть своих незначительных сообщений и обнаружил, что трафик увеличился.
  • Пользователи находят опыт более низкого уровня, если направляются на второстепенные страницы. Посетители раздражаются, когда попадают на бесполезные страницы веб-сайта, и быстро уходят. Оставляйте на сайте только лучшие страницы.

Различные типы файлов Sitemap

В настоящее время существует более 140 поисковых систем и каталогов по всему миру. По последним подсчетам, Google проиндексировал почти 4,5 миллиарда веб-страниц. По мере роста Интернета растет и количество типов карт сайта, генератор html-карт сайта. Возникает вопрос, что такое sitemap.xml в SEO?

Поскольку сложность и размер веб-сайтов продолжают расти, то же самое произойдет и с технологиями карты сайта.

XML-карта сайта

XML Sitemap — это стандартный файл для того, чтобы ваш сайт заметили в Интернете. Однако существуют некоторые ограничения для XML-карты сайта. Может быть обработано не более 50 000 URL-адресов, а размер файла ограничен 50 МБ.

Если ваша карта сайта превышает любое из двух ограничений, их необходимо разделить на другой файл карты сайта. Большие сайты могут использовать гранулярный подход, создавая при необходимости несколько индексных файлов.

Из блога Google для веб-мастеров пример XML-карты сайта для нескольких индексных файлов:

  1. xml http://example.com/stores/store2_sitemapindex.xml http://example.com/stores/store3_sitemapindex.xml

Создание отдельных индексных файлов идеально подходит для организации нескольких сайтов. Или магазины, которые хотят отправлять контент в разное время суток. Веб-мастера задаются вопросом, что такое sitemap.xml в SEO. На изображении ниже показан еще один пример XML Sitemap:

Что такое XML-карта сайта

(Изображение предоставлено: журнал поисковой системы)

XML-карта сайта для изображений

XML Image Sitemap — отличный ресурс для сайтов с большим количеством видео или изображений вместе с контентом.

Карты сайта с изображениями могут быть ненужными из-за современных методов SEO. Большинство веб-сайтов имеют изображения, встроенные в их страницы. Поисковые системы сканируют изображения вместе с любым содержимым страницы. Вот пример файла Sitemap в формате XML:

Что такое XML-карта сайта

(Изображение предоставлено SwissUpLabs)

Используйте разметку; JSON-LD schema.org/ImageObject, что дает веб-мастеру дополнительные возможности настройки.

Для большинства веб-сайтов карты сайта с изображениями занимают слишком много краулинговых бюджетов. Если у вас есть веб-сайт, где изображения являются основной частью сайта, внимательно изучите варианты. Сайты электронной коммерции и игр могут извлечь выгоду из файла изображения карты сайта.

XML-файлы видео

XML-файлы видео аналогичны карте сайта изображения. Если видео имеет решающее значение для успеха вашего веб-сайта, отправьте XML-файл видео для сканирования. Например:

Что такое XML-карта сайта

(Изображение предоставлено Мозом)

Опять же, не тратьте драгоценное время, которое есть у сайтов, когда бот ползает.

Динамический XML

Динамический XML автоматически обновляет карты сайта, которые в противном случае были бы устаревшим содержимым. Статические карты сайта устаревают, как только содержимое изменяется или пересматривается каким-либо образом. Статические карты сайта не используют преимущества тега lastmod.

Современные передовые методы SEO разработали динамические файлы Sitemap для постоянно меняющегося контента. Сервер веб-мастера автоматически отправляет новую карту сайта всякий раз, когда вносятся изменения.

Любой из этих шагов может помочь веб-мастеру создать файл динамической карты сайта:

  • Попросите вашего разработчика написать собственный скрипт; указание на поставленную задачу
  • Используйте инструмент генератора карты сайта
  • Большинство платформ CMS предлагают плагины для создания XML-файла динамической карты сайта.

HTML-файлы Sitemap

HTML-файлы Sitemap — это файлы индексации старой школы, и их следует использовать только в том случае, если другие XML-файлы не подходят для приложения. Карты сайта в формате HTML были разработаны, чтобы помочь пользователям находить контент.

Карты сайта в формате HTML свидетельствуют о качестве ссылок сайта. Карта сайта в формате HTML должна быть тщательно рассмотрена по любой причине существования. Если веб-мастера разработали свои сайты с твердой политикой ссылок и картой сайта XML; Спроси себя; нужна ли карта сайта в формате HTML?

В большинстве случаев; Нет.

Мы надеемся, что вы нашли эту статью полезной.

Если вы хотите узнать больше интересного о состоянии вашего сайта, получить персональные рекомендации и оповещения, просканируйте свой сайт с помощью Diib. Это занимает всего 60 секунд.

Введите свой веб-сайт

Например, «www.diib.com»

Я не могу насытиться DIIB!! Лучший инструмент, и я так благодарен за то, что нашел его. Я Абсолютно люблю это!! Скрестим пальцы, вы не поднимаете цены, потому что это так прекрасно.
Отзывы
Катарина Гейдж
Операционный директор ahoymatey.com.au

Файлы Sitemap для Новостей Google

Файлы Sitemap для Новостей Google ограничены сайтами, зарегистрированными в поисковой системе. Ограничения — новостные статьи, опубликованные за последние два дня, до 1000 URL-адресов.

Файлы Sitemap для Новостей Google не поддерживают файлы Sitemap для изображений и видео.

Поисковая система рекомендует использовать schema.org для указания атрибутов миниатюры изображения. Например:

Что такое XML-карта сайта

(Изображение предоставлено: G-Squared Interactive)

Карты сайта для мобильных устройств

Мобильные карты сайта являются устаревшим кодом и доступны для веб-мастеров, но обычно они никогда не нужны. Мобильные XML-файлы предназначены для страниц обычных телефонов, а не смартфонов. Эти карты сайта бесполезны для веб-мастеров, если на веб-сайте нет конкретных URL-адресов для этого типа платформы.

SEO-оптимизация с помощью файлов Sitemap

Теперь, когда основы рассмотрены, пришло время увидеть, насколько карты сайта бесценны для веб-сайтов. Веб-мастера не должны включать в карту сайта каждую страницу своего веб-сайта, а только релевантные страницы, авторитетные для SEO.

Пять SEO-причин для создания карты сайта

  • Карта сайта бесплатна и очень проста в создании. Как указывалось ранее, каждая платформа CMS имеет несколько плагинов и скриптов карты сайта. Только WordPress имеет десятки различных приложений, от одной карты сайта до комплексных SEO-сервисов.

Карта сайта — бесценный инструмент SEO. Они поощряют каждую поисковую систему индексировать больше контента вашего веб-сайта и индексировать его правильно.

Желательно иметь карту сайта, созданную как часть общей эффективной стратегии SEO. возможности WordPress; Плагины Yoast SEO и All in One, предлагающие полезные функции.

  • Улучшенный рейтинг. Изображения и видео могут улучшить рейтинг вашего сайта в поиске, предоставляя роботам дополнительную информацию.

Использование карты сайта для видео, размещенных на вашем сайте, означает, что веб-мастера могут включать дополнительные метаданные для каждого видео. Информация может включать местоположение, название, описание, продолжительность, количество просмотров и категории. Одни и те же данные могут быть включены для каждого изображения, встроенного в ваш сайт.

  • Приоритет сканирования. Страницы с высокой ценностью получают приоритет сканирования с помощью карты сайта. Если нет дорожной карты для веб-сайта, роботы-сканеры не имеют направления, как только они попадают на ваш сайт.

Управление процессом сканирования должно быть главным приоритетом для веб-мастеров. Веб-мастера могут создавать приоритеты для каждой из своих страниц. Например, домашняя страница может иметь приоритет 100 %, а документы низкого уровня — 60 %. Эта гибкость полезна при определении ценности вашего сайта, страница за страницей.

  • Откройте для себя больше страниц. Действительные карты сайта помогают роботам-сканерам обнаруживать больше страниц, а это означает, что больше контента будет проиндексировано.

Файлы Sitemap не гарантируют более высокие результаты поиска, только то, что будет обнаружено больше содержимого веб-сайта.

Еще одна важная функция — карты сайта защищают от дублирования контента. Разочаровывает публикация оригинального контента позже, чтобы найти такой же контент на веб-сайте конкурента.

Если найдено два идентичных фрагмента контента, поисковые системы пытаются сохранить оригинал и отбросить дубликаты. Поисковые системы будут сканировать сайт чаще, если используется действительная карта сайта. Они не всегда получают правильное обращение к оригиналу, но у вас есть защита.

  • Ссылки. Поисковые системы, в основном Google, могут добавлять дополнительные ссылки на сайт, если он содержит карту сайта. Алгоритм Google может добавлять ценные ссылки в органический список сайта, давая пользователям более полное представление о запросе. Этот процесс автоматизирован; однако шансы выше, если на веб-сайте есть карта сайта.
  • Ошибки сведены к минимуму. Ошибки сканирования подсвечиваются; если вы предоставите Google расположение действительной карты сайта, поисковая система отплатит вам тем же, предоставив веб-мастерам информацию о сканировании. Используйте Google Search Console и Bing Webmaster для отправки любых файлов Sitemap.

Боты сканируют сайт и сообщают о своих выводах. Этот ресурс бесценен для лучших практик SEO.

Diib: Получите последние показатели на карте сайта XML

SEO начинается на детальном уровне веб-сайта в корневом каталоге. Веб-мастера должны понимать иерархию каждого сайта и страницы и создавать их с учетом поисковых систем. Diib Digital предлагает самые полные и актуальные показатели состояния вашей XML-карты сайта и предупредит вас о возможных проблемах задолго до того, как они серьезно повлияют на ваш рейтинг или трафик. Вот некоторые из функций нашей пользовательской панели, которые вам понравятся:

  • Отслеживание и состояние карты сайта
  • Круглосуточный мониторинг домена
  • Исправление показателя отказов
  • Пост производительность
  • Неработающие страницы, на которые у вас есть обратные ссылки (проверка 404)
  • Инструменты мониторинга и отслеживания ключевых слов, обратных ссылок и индексации
  • Пользовательский опыт и оптимизация скорости мобильных устройств

Получите бесплатное 60-секундное сканирование сайта или просто позвоните по телефону 800-303-3510, чтобы поговорить с одним из наших экспертов по развитию.