Как избежать дублирования контента?
Опубликовано: 2020-10-13Как владельцу веб-сайта важно, чтобы вы понимали, как избежать дублирования контента, потому что этот тип контента часто является признаком низкого качества и «спама» веб-сайтов. Дублированный контент может стоить вам дорого, если вы хотите повысить свою известность в Google и других поисковых системах.
Один из лучших способов заявить о своем онлайн-бизнесе — постоянно разрабатывать уникальный, первоклассный и заслуживающий доверия контент для вашей аудитории — контент, который представляет ценность.
Хотя поисковые системы любят свежий контент, им не нравятся сайты с дублирующимся контентом. Всякий раз, когда вы отправляете дублированный контент, вы вынуждаете поисковые системы решать, какой из ваших страниц/сайтов следует отдать должное опубликованному контенту. Поисковые системы могут не ранжировать или индексировать некоторые веб-сайты с дублирующимся контентом, поэтому вам необходимо избегать внутреннего дублированного контента и дублированного контента между доменами.
В этом посте мы рассмотрим лучший способ обнаружения и предотвращения дублирования. Читай дальше, чтобы узнать больше.
Что такое дублированный контент?
Тема дублированного контента обычно многих смущает. Согласно Google Search Console, «дублированный контент обычно относится к существенным блокам контента внутри или между доменами, которые либо полностью соответствуют другому контенту, либо заметно похожи. В основном это не обманчивое происхождение».
Дублированный контент — это термин, обычно используемый контент-маркетологами, которые используют методы SEO для продвижения своих сайтов. Этот термин относится к ситуациям, когда разные веб-страницы внутри или между доменами содержат очень похожий или идентичный контент. Владельцы веб-сайтов иногда испытывают соблазн копировать и вставлять содержимое на разные страницы своего сайта, чтобы заполнить свои веб-страницы.
Любой дублированный контент повредит SEO-кампании вашего сайта, потому что такой контент ставит под угрозу пользовательский опыт. Поскольку ваша конечная цель — занять первое место на страницах результатов поисковой системы (SERP), ваши усилия могут оказаться напрасными, если вы не создадите уникальный, высококачественный и свободный от плагиата контент.
ФАКТ: Создание контента повышает уровень индексации более чем на 434%.
Типы дублированного контента
Как правило, существует две широкие категории дублированного контента:
- Внутренний дублированный контент: это когда одно имя хоста/домен имеет дублированный контент на одном и том же веб-сайте и имеет несколько внутренних URL-адресов. Дублированный контент ограничен доменом вашего веб-сайта.

- Дублированный контент между доменами: также известный как дублированный контент между доменами, этот тип контента возникает, когда несколько доменов имеют одинаковый контент, ранжированный поисковыми системами.
Влияние дублированного контента на SEO
SEO-специалисты знают, что информация, которая была реплицирована на различных доменах, редко ориентирована на клиента. Более того, целью многих поисковых систем является предоставление пользователям высококачественных страниц с результатами. Если поисковые системы, такие как Google, не стремятся удовлетворить потребности своих пользователей, пользователи будут искать альтернативы.
Хотя Google не налагает штрафов за дублированный контент, SEO-кампания вашего сайта будет негативно затронута, поскольку Google фильтрует идентичную или почти аналогичную информацию.
Что это значит для вашего сайта?
Для многих SEO-специалистов фильтрация — это наказание для вашего веб-сайта, потому что это потеря индексации вашего веб-контента. Независимо от того, кто создал контент, существует высокая вероятность того, что исходная веб-страница не будет выбрана для ранжирования в верхних результатах поиска Google.
По словам Дэна Петровича из Dejan Marketing: «Если в Интернете есть несколько экземпляров одного и того же документа, URL-адрес с наивысшим авторитетом становится канонической версией. Остальные считаются дубликатами.
Как возникают проблемы с дублированием контента?
Существует множество причин дублирования контента, и большинство из них носят технический характер. Крайне важно выявить и устранить эти проблемы до того, как они нанесут серьезный ущерб вашему рейтингу.
Вам будет интересно
Тенденции размера рынка одежды для электронной коммерции в 2021 году
Почему органическое SEO важно и как его получить
Каков средний коэффициент конверсии для веб-сайта?
Сравните SEO вашего сайта с конкурентами
Что такое внутреннее SEO?
Как сделать SEO?
Помимо скопированного контента, вот некоторые из основных причин дублирования контента:
Структура URL
Различные поисковые системы имеют разные правила для структур URL. Хотя URL-адреса чувствительны к регистру для Google, они не чувствительны к регистру для Bing.
- Например: https://yourdomainname.com/url-r/ совпадает с https://yourdomainname.com/url-R/ для Bing. Однако эти URL-адреса воспринимаются поисковой системой Google как разные.
Вы должны быть очень внимательны, когда создаете ссылки для своего контента. В противном случае опечатка может привести к тому, что обе версии вашего URL не будут ранжироваться.
Порядок параметров
В тех случаях, когда система управления контентом (CMS) не использует чистый и красивый URL-адрес, разные URL-адреса могут отображать похожие страницы результатов для большинства сайтов, но оцениваться как уникальные в поисковых системах.
- Например, беспорядочные URL-адреса, такие как: /?id=3&cat=4 и /?id=4&cat=3, могут давать одинаковые результаты в системах веб-сайтов, хотя для поисковых систем это разные URL-адреса.
Страницы для печати
Есть ли на вашем сайте страницы для печати? Если да, то ссылаетесь ли вы на эти страницы со страниц вашего контента/статьи? Нужно задаться вопросом, какую из двух версий вы действительно хотите, чтобы Google показывал?
Ссылки на страницы для печати могут нанести ущерб SEO вашего сайта, потому что Google обычно находит страницы для печати и ранжирует их как, как вы уже догадались, дублирующий контент. Вот хорошая иллюстрация к этому:

(Изображение предоставлено: tronicglobal)
Индексные страницы
Если домашняя страница вашего веб-сайта настроена неправильно, люди могут заходить на ваш сайт по нескольким URL-адресам. Неправильная конфигурация обычно происходит без вашего ведома. Если URL-адрес главной страницы вашего веб-сайта https://yourdomainname.com, важно отметить, что к нему можно получить доступ через другие URL-адреса, такие как:
- https://имя_домена.com/index.asp
- https://вашедомен.com/index.html
- https://вашедомен.com/index.php
- https://имя_домена.com/index.aspx
Чтобы избежать таких случаев, не торопитесь, чтобы выбрать лучший способ обслуживания вашей домашней страницы.
Проверьте свое SEO за 60 секунд!
Diib — один из лучших SEO-инструментов в мире. Diib использует силу больших данных, чтобы помочь вам быстро и легко увеличить трафик и рейтинг. Мы даже сообщим вам, если вы уже заслуживаете более высокого рейтинга по определенным ключевым словам.
- Простой в использовании автоматизированный SEO-инструмент
- Мониторинг ключевых слов и обратных ссылок + идеи
- Скорость, безопасность, + отслеживание основных показателей жизнедеятельности
- Разумно предлагает идеи по улучшению SEO
- Более 250 000 тысяч участников со всего мира
- Встроенный бенчмаркинг и анализ конкурентов
Используется более чем 250 тысячами компаний и организаций:
Синхронизируется с 
WWW против NON-WWW или HTTP против HTTPS
Хотя в настоящее время эта проблема возникает редко, у некоторых владельцев веб-сайтов все еще возникают проблемы с обслуживанием их контента. Если вы используете HTTPS и поддомен WWW, вы предпочитаете обслуживать свои веб-страницы в форме:
https://WWW.вашедоменноеимя.com
Однако в тех случаях, когда ваш веб-сервер настроен неправильно, к вашим статьям можно получить доступ через другие URL-адреса, такие как:
https://имя_домена.com или http://имя_домена.com или http://www.имя_домена.com
Выделенные страницы для изображений
На вашем сайте изображения отображаются на пустой странице? Что ж, ваша CMS может иногда создавать разные страницы для каждого изображения, которое вы используете в своем контенте. Поскольку такие страницы не имеют никакого содержания, они похожи на другие страницы изображений в Интернете. Таким образом, они воспринимаются поисковыми системами как дублирующийся контент.
Распространение контента
Это происходит довольно часто, особенно если ваш сайт популярен в данной нише. Иногда блоги или сайты, предлагающие аналогичные товары и услуги (как и вы), могут использовать ваш контент. Обычно синдикация контента происходит без вашего согласия, хотя другие владельцы веб-сайтов могут попросить использовать ваш контент по разным причинам.
Если повторно опубликованный контент не ведет на ваш сайт, поисковые системы могут не знать источник статьи.
Страницы результатов поиска
Ваш веб-сайт, вероятно, позволяет посетителям искать информацию на вашей домашней странице. Это означает, что результаты поиска, отображаемые на этих страницах, более или менее одинаковы и не представляют никакой ценности для поисковых систем. Чтобы избежать этого, важно, чтобы вы не связывали содержимое своего веб-сайта со страницами результатов поиска.
Идентификаторы сеанса
Довольно часто вам может понадобиться отслеживать посетителей вашего сайта. Чтобы достичь этого, вам нужно дать своим посетителям «сеанс». Итак, что такое сессия?

Сессия — это история посетителей вашего сайта. Он сообщает вам о действиях посетителей на ваших сайтах, например, о количестве товаров, помещенных в корзину, по сравнению с количеством купленных. Чтобы веб-сайт поддерживал сеанс, когда посетители переходят с одной страницы на другую, используется идентификатор сеанса.

(Изображение предоставлено: tronicglobal)
Идентификаторы сеансов обычно хранятся в виде файлов cookie. Однако поисковые системы никогда не сохраняют файлы cookie. Это приводит к тому, что поисковые системы путают идентификатор сеанса и его URL. В свою очередь, он воспринимает их как дублированный контент.
Как определить дублированный контент
Выявить дублированный контент на вашем сайте непросто. Чтобы узнать, копируется ли контент вашего сайта, перейдите в карточки «шапка контента» и «Метаинформация». Вы найдете информацию, касающуюся титульной страницы, мета-описания и заголовков H1.
Для дублирования контента за пределами вашего веб-сайта попробуйте выполнить поиск контента, уже опубликованного на вашем веб-сайте. Например, если вы хотите узнать, есть ли дублированный контент для этой статьи «Как избежать дублирования контента», вы можете выполнить поиск по словам «Для дублирования контента за пределами вашего веб-сайта попробуйте выполнить поиск контента, уже опубликованного на вашем веб-сайте». Или «Какое из них является одним из возможных решений проблемы дублирования контента?» (Используется в конце этого поста).
Поскольку вы, вероятно, будете публиковать много контента на своем веб-сайте, рекомендуется дважды проверить ваш контент с помощью инструментов Google для проверки дубликатов контента, чтобы убедиться, что ваш контент уникален. Вот пример результатов, которые вы ожидаете увидеть от этого инструмента:


(Изображение предоставлено Мозом)
Вот несколько инструментов, которые вы можете использовать для проверки дублированного контента и экономии вашего времени.
Мы надеемся, что вы нашли эту статью полезной.
Если вы хотите узнать больше интересного о состоянии вашего сайта, получить персональные рекомендации и оповещения, просканируйте свой сайт с помощью Diib. Это занимает всего 60 секунд.
Копискейп
Copyscape — широко известный инструмент для проверки дублирующегося контента. Он имеет инструмент сравнения, который выделяет любой дублирующийся контент в вашем тексте. Преимущество Copyscape в том, что инструмент дает вам результаты всего за несколько секунд, и вы узнаете точный процент вашего текста, который уже был опубликован.
Siteliner
Иногда вам может понадобиться проверить дублированный контент для всего вашего сайта. Siteliner — отличный инструмент для проверки всего вашего сайта не только на дублированный контент, но и на неработающие ссылки, а также для определения веб-страниц, которые занимают видное место в рейтинге поисковых систем.
Дубликат
Duplichecker — это инструмент, который проверяет ваш контент на плагиат. Сайт позволяет вам проверять свой контент в DocX, текстовом файле или поиске по URL. Перед регистрацией вам разрешено выполнять только один бесплатный поиск в день, а после регистрации ограничение увеличивается до 50 поисков.
PlagSpotter
PlagSpotter URL-поиск эффективен, бесплатен и дает результаты в течение нескольких секунд. Результаты сканирования URL-адресов включают ссылки на источники дублированного контента. Таким образом, вы можете сравнить свой текст с аналогичным контентом в Интернете.
Инструмент также может автоматически отслеживать ваш сайт каждую неделю.
Удаление повторяющегося контента
Поиск решений для вашего веб-контента значительно улучшит SEO вашего сайта, особенно если у вас есть онлайн-бизнес. Вот несколько вещей, которые вы можете сделать для эффективного удаления дублированного контента.
Удалить ненужное дублирование
Несмотря на то, что это занимает очень много времени, первый и самый простой способ удалить повторяющийся контент — это переписать информацию или статьи. Не торопитесь и прочитайте похожий контент в Интернете, это может быть несколько веб-сайтов, посвященных одной и той же теме, а затем изложите прочитанные идеи своими словами. И не стесняйтесь добавлять дополнительную информацию и использовать различные устройства кадрирования, чтобы гарантировать, что создаваемый вами контент на 100% уникален.
Используйте редирект 301
В некоторых случаях для вас может быть невозможно полностью запретить вашей CMS создавать несколько или неправильные URL-адреса для вашего контента. В большинстве случаев возможно перенаправление неправильных URL-адресов. Перенаправление заставляет браузер переходить с одного URL-адреса на другой, будь то на одном веб-сайте или на нескольких веб-сайтах. Это пример перенаправления 301:

Проверить повторение шаблона
Длинные шаблоны не должны использоваться на разных страницах одного и того же веб-сайта. Скорее, их следует использовать на одной странице. Например, вместо того, чтобы использовать длинное уведомление об авторских правах внизу каждой страницы, напишите краткое изложение уведомления и дайте ссылку на страницу с дополнительной информацией.
Метатег Noindex
Как указывалось ранее, другие владельцы веб-сайтов могут копировать ваш контент без вашего ведома. Поскольку вы, возможно, не избежите таких вещей, добавьте небольшое примечание на страницу с контентом, обычно внизу. Попросите тех, кто может использовать ваш контент, использовать метатег «noindex», чтобы предотвратить ранжирование любого дублированного контента Google или другими поисковыми системами.
Избегайте публикации заглушек
Как бы вы себя чувствовали, если бы открыли страницу веб-сайта и нашли только несколько слов и несколько пустых страниц? Вы, наверное, были бы шокированы. В большинстве случаев вы обнаружите, что владельцы веб-сайтов еще не публиковали контент на таких страницах. Это может быть вредным, потому что Google будет ранжировать все пустые страницы как имеющие дублированный контент.
Всякий раз, когда вы хотите создать страницу-заполнитель, всегда используйте метатеги noindex, чтобы предотвратить индексацию таких страниц.
Используйте только один URL-адрес
Хотя вы можете использовать несколько URL-адресов для ссылки на свой веб-сайт, важно выбрать только один URL-адрес. Помните о своих клиентах при выборе URL-адреса, поскольку он должен быть удобным для пользователя. Один URL-адрес облегчает не только Google ранжирование вашего веб-сайта, но и вашим пользователям для поиска вашего сайта или страницы.
Вам необходимо установить предпочитаемый стандарт как WWW или не WWW. Идея состоит в том, чтобы не создавать путаницы для ваших пользователей и поисковых систем.
Используйте тег Hreflang
Тег hreflang использует метатег сигнала HTML, который сообщает людям язык и/или географическое положение вашего сайта. Hreflang необходим для сайтов с несколькими языками. Например, этот тип тега делает это возможным:

Обслуживание пользователей неродной поисковой системы означает, что их опыт на вашем сайте улучшится.
Однако, если у вас есть разные версии одной и той же страницы на разных языках, вы должны использовать теги hreflang, чтобы сообщить Google или другим поисковым системам об этом варианте.
Всегда ссылайтесь на исходный контент
Что из перечисленного является одним из возможных решений проблемы дублирования контента? Что ж, если вы не можете избавиться от дублированного контента по разным причинам, всегда не забывайте включать ссылку на исходный контент. Это может быть чуть ниже или поверх дублированного контента.
Если поисковые системы обнаружат несколько ссылок на статьи, которые указывают на ваш контент, они определят, что ваш контент является оригинальной или канонической версией.
Насколько допустимо дублирование контента?
Google вознаграждает только уникальный контент, который приносит пользу клиентам, а это означает, что Google не приветствует дублирование контента. Однако ответ на вопрос «сколько дублированного контента допустимо для Google или других поисковых систем?» все еще спорный, потому что ни один ответ не является совершенным. Таким образом, всегда используйте средство проверки дублированного контента Google и убедитесь, что ваши статьи на 100 % перед их публикацией. Вот как поисковые системы определяют дублирующийся контент:

(Изображение предоставлено: www.elliance.com)
Diib: повысьте свой SEO-рейтинг, избегая дублированного контента
SEO-специалисты предостерегут вас от дублирования контента — они правы. Хотя в наши дни дублированный контент встречается почти везде, важно следить за тем, что вы хотите публиковать на своем сайте, если хотите улучшить свой рейтинг. Панель управления пользователя Diib настроена так, чтобы выявлять любые случаи дублирования контента и отправлять вам оповещения с инструкциями по устранению. Вот некоторые функции этой панели, которые вы обязательно оцените:
- Инструменты исследования ключевых слов и обратных ссылок помогут вам определить, по каким ключевым словам ранжируются ваши конкуренты, и создать контент на основе этих ключевых слов.
- Ключевые показатели, такие как показатель отказов, дублированный контент и вернувшиеся посетители, могут поддерживать работоспособность вашего сайта.
- Проверьте, нравится ли подписчикам вашей страницы Facebook контент, которым вы делитесь.
- Наслаждайтесь ежемесячной беседой с экспертом по росту Diib.
Щелкните здесь, чтобы получить бесплатный 60-секундный анализ сайта, или позвоните по телефону 800-303-3510, чтобы пообщаться с экспертом по развитию уже сегодня!
