如何避免重复内容?
已发表: 2020-10-13作为网站所有者,了解如何避免重复内容很重要,因为这种类型的内容通常是低质量和“垃圾”网站的标志。 如果您希望提高在 Google 和其他搜索引擎上的知名度,重复内容可能会花费您很多钱。
为您的在线业务打造品牌的最佳方式之一是不断为您的受众开发独特、一流和可信的内容——提供价值的内容。
虽然搜索引擎喜欢新鲜的内容,但他们不喜欢内容重复的网站。 每当您提交重复的内容时,您都在迫使搜索引擎决定您的哪些页面/站点应该被授予已发布内容的功劳。 搜索引擎可能无法对某些具有重复内容的网站进行排名或索引,这就是为什么您需要避免内部重复内容和跨域重复内容的原因。
在这篇文章中,我们将研究检测和避免重复的最佳方法。 请继续阅读以了解更多信息。
什么是重复内容?
重复内容的话题通常会让很多人感到困惑。 根据 Google Search Console 的说法,“重复内容通常是指域内或跨域的实质性内容块,它们要么完全匹配其他内容,要么明显相似。 大多数情况下,这在起源上并不具有欺骗性。”
重复内容是使用 SEO 技术推广其网站的内容营销人员常用的术语。 该术语指的是在域内或跨域的不同网页似乎包含非常相似或相同的内容的情况。 网站所有者有时会试图将内容复制并粘贴到其网站内的不同页面以填充其网页。
任何重复的内容都会损害您网站的 SEO 活动,因为此类内容会损害用户体验。 由于您的最终目标是在搜索引擎结果页面 (SERP) 上排名第一,如果您不制作独特、高质量和无抄袭的内容,您的努力可能会白费。
事实:内容创建将索引率提高了 434% 以上。
重复内容的类型
通常,有两大类重复内容:
- 内部重复内容:这是指一个主机名/域在同一网站内具有重复内容并且具有多个内部 URL。 重复内容仅限于您的网站域。

- 跨域重复内容:也称为跨域重复内容,当多个域具有相同的内容被搜索引擎排名时,就会出现这种类型的内容。
重复内容对 SEO 的影响
SEO 专家知道,已在各个领域复制的信息很少以客户为中心。 此外,许多搜索引擎的目标是为其用户返回高质量的结果页面。 如果谷歌等搜索引擎的目标不是满足用户的需求,用户就会寻找替代品。
尽管 Google 不会对重复内容进行处罚,但您网站的 SEO 活动将受到负面影响,因为 Google 会过滤相同或几乎相似的信息。
这对您的网站意味着什么?
对于许多 SEO 专家来说,过滤是对您网站的一种惩罚,因为它会丢失您的 Web 内容的索引。 不管内容是谁制作的,原始网页很有可能不会被选入谷歌的热门搜索结果中。
根据 Dejan Marketing 的 Dan Petrovic 的说法,“如果网络上有同一文档的多个实例,则最高权限的 URL 将成为规范版本。 其余的被认为是重复的。
重复内容问题是如何发生的?
重复内容的原因有很多,其中大部分是技术性的。 在这些问题对您的排名造成严重损害之前识别并解决这些问题至关重要。
你会感兴趣
2021 年电子商务服装市场规模趋势
为什么有机搜索引擎优化很重要以及如何获得它
一个网站的平均转化率是多少?
将您的网站 SEO 与您的竞争对手进行比较
什么是页面搜索引擎优化?
如何做搜索引擎优化?
除了复制的内容之外,以下是重复内容的一些主要原因:
网址结构
不同的搜索引擎对 URL 结构有不同的规则。 虽然 URL 对于 Google 区分大小写,但对于 Bing 则不区分大小写。
- 例如:https://yourdomainname.com/url-r/ 与 Bing 的 https://yourdomainname.com/url-R/ 相同。 但是,这些 URL 被 Google 搜索引擎视为不同。
在为内容创建链接时,您需要非常注意。 否则,拼写错误可能会导致您的两个版本的 URL 都没有排名。
参数顺序
在内容管理系统 (CMS) 不使用干净且美观的 URL 的情况下,不同的 URL 可能会为大多数网站显示相似的结果页面,但在搜索引擎中排名为唯一。
- 例如,诸如 /?id=3&cat=4 和 /?id=4&cat=3 之类的杂乱 URL 可以在网站系统中给出类似的结果,尽管它们对于搜索引擎来说是不同的 URL。
适合打印的页面
您的网站是否有适合打印的页面? 如果是这样,您是否从您的内容/文章页面链接到这些页面? 人们不得不想知道您真的希望 Google 展示这两个版本中的哪一个?
链接到适合打印的页面可能不利于您网站的 SEO,因为 Google 通常会定位适合打印的页面并将其列为重复内容。 这是一个很好的例子:

(图片来源:tronicglobal)
索引页
如果您的网站主页配置错误,人们可能会通过多个 URL 访问您的网站。 错误配置通常在您不知情的情况下发生。 如果您的网站主页 URL 是 https://yourdomainname.com,请务必注意,它可以通过其他 URL 访问,例如:
- https://yourdomainname.com/index.asp
- https://yourdomainname.com/index.html
- https://yourdomainname.com/index.php
- https://yourdomainname.com/index.aspx
为避免此类情况,请花时间选择提供主页的最佳方式。
在 60 秒内测试您的 SEO!
Diib 是世界上最好的 SEO 工具之一。 Diib 利用大数据的力量帮助您快速轻松地增加流量和排名。 我们甚至会让您知道您是否已经应该为某些关键字获得更高的排名。
- 易于使用的自动化 SEO 工具
- 关键字和反向链接监控+想法
- 速度、安全性、+ 核心生命体征跟踪
- 智能地提出改进 SEO 的想法
- 超过 250,000,000 名全球会员
- 内置基准测试和竞争对手分析
被超过 250,000 家公司和组织使用:
与
WWW 与 NON-WWW 或 HTTP 与 HTTPS
尽管现在这个问题很少发生,但一些网站所有者仍然存在提供内容的问题。 如果您使用 HTTPS 和子域 WWW,您更喜欢以以下形式提供网页:
https://WWW.yourdomainname.com
但是,如果您的网络服务器配置不正确,您的文章可以通过不同的 URL 访问,例如:
https://yourdomainname.com 或 http://yourdomainname.com 或 http://www.yourdomainname.com
图像专用页面
您的网站是否在空白页面上显示图像? 好吧,您的 CMS 有时可以为您在内容中使用的每个图像创建不同的页面。 由于此类页面没有任何内容,因此它们类似于互联网上的其他图像页面。 因此,它们被搜索引擎视为重复内容。

内容联合
这种情况经常发生,特别是如果您的网站在给定的利基市场很受欢迎。 有时,提供类似商品和服务的博客或网站(就像您一样)可能会使用您的内容。 通常,内容联合是在未经您同意的情况下发生的,尽管其他网站所有者可能会出于各种原因要求使用您的内容。
如果重新发布的内容没有链接到您的网站,搜索引擎可能不知道文章的来源。
搜索结果页面
您的网站可能允许访问者在您的主页中搜索信息。 这意味着这些页面上显示的搜索结果或多或少是相同的,对搜索引擎没有任何价值。 为避免这种情况,请勿将网站内容链接到搜索结果页面,这一点很重要。
会话 ID
很多时候,您可能想要跟踪您的网站访问者。 为此,您需要给访问者一个“会话”。 那么,什么是会话?
会话是您网站访问者的历史记录。 它会告诉您访问者在您的网站上的活动,例如放入购物车的商品数量与购买的商品数量。 对于网站在访问者从一个页面移动到另一个页面时保持会话,使用会话 ID。

(图片来源:tronicglobal)
会话 ID 通常以 cookie 的形式存储。 但是,搜索引擎从不存储 cookie。 这会导致搜索引擎混淆会话 ID 和它的 URL。 反过来,它将它们视为重复的内容。
如何识别重复内容
识别您网站上的重复内容并不容易。 要查看您的网站内容是否被复制,请转到“内容标题”和“元信息”卡片。 您将找到与标题页、元描述和 H1 标题相关的信息。
对于您网站之外的重复内容,请尝试搜索已在您的网站上发布的内容。 例如,如果您想查看这篇文章“如何避免重复内容”的重复内容,您可以搜索“对于您网站之外的重复内容,请尝试搜索您网站上已发布的内容”。 或“其中哪一个是处理重复内容问题的一种可能解决方案?”(用于本文结尾处)。
由于您可能会在您的网站上发布大量内容,因此建议您使用 Google 重复内容检查工具仔细检查您的内容,以确保您的内容是独一无二的。 以下是您希望从该工具中看到的结果示例:


(图片来源:莫兹)
以下是一些可用于检查重复内容并节省时间的工具。
我们希望您发现这篇文章很有用。
如果您想更有趣地了解您的网站健康状况,获得个人推荐和提醒,请通过 Diib 扫描您的网站。 只需 60 秒。
文案
Copyscape 是一种广泛认可的检查重复内容的工具。 它有一个比较工具,可以突出显示文本中的任何重复内容。 Copyscape 的好处是该工具只需几秒钟即可为您提供结果,并且您可以了解已发布文本的确切百分比。
定位器
有时,您可能需要检查整个网站的重复内容。 Siteliner 是一款出色的工具,不仅可以检查您的整个网站是否有重复的内容,还可以检查损坏的链接以及识别被搜索引擎排名靠前的网页。
重复检查器
Duplichecker 是一种检查您的内容是否存在抄袭的工具。 该站点允许您在 DocX、文本文件或 URL 搜索中检查您的内容。 注册前,您每天只能进行一次免费搜索,注册后最多可进行 50 次搜索。
PlagSpotter
PlagSpotter URL 搜索高效、免费,并在几秒钟内提供结果。 URL 扫描的结果包括指向重复内容来源的链接。 因此,您可以将您的文本与在线的类似内容进行比较。
该工具还可以每周自动监控您的网站。
重复内容删除
为您的 Web 内容找到解决方案将极大地改善您网站的 SEO,特别是如果您有在线业务。 为了有效地删除重复内容,您可以执行以下操作。
删除不必要的重复
虽然非常耗时,但删除重复内容的第一个也是最简单的方法是重写您的信息或文章。 花点时间在网上阅读类似的内容,这些可以是涵盖同一主题的多个网站,然后将你读到的想法变成你自己的话。 并随时添加更多信息并使用各种框架设备来确保您制作的内容是 100% 独一无二的。
使用 301 重定向
在少数情况下,您可能无法完全阻止 CMS 为您的内容创建多个或错误的 URL。 在大多数情况下,可能会重定向错误的 URL。 重定向使浏览器从一个 URL 更改为另一个 URL,无论是在同一个网站还是多个网站中。 这是 301 重定向的示例:

检查样板重复
不应在同一网站的不同页面上使用长样板。 相反,它们应该在一页上使用。 例如,与其在每一页的底部使用很长的版权声明,不如写一个通知摘要并将其链接到包含更多信息的页面。
无索引元标记
如前所述,其他网站所有者可以在您不知情的情况下复制您的内容。 因为您可能无法避免此类事情的发生,请在您的内容页面上添加一个小注释,通常在底部。 请那些可能使用您的内容的人使用“noindex”元标记,以防止任何重复的内容被 Google 或其他搜索引擎排名。
避免发布存根
如果你打开一个网站页面,只发现几个字和几个空白页面,你会有什么感觉? 你可能会感到震惊。 在大多数情况下,您会发现网站所有者尚未在此类页面上发布内容。 这可能是有害的,因为 Google 会将所有空白页面列为具有重复内容的页面。
每当您要创建占位符页面时,请始终使用 noindex 元标记来防止此类页面被索引。
只使用一个网址
尽管您可以使用多个 URL 链接到您的网站,但重要的是您只能选择一个 URL。 在选择您的 URL 时请牢记您的客户,因为您的 URL 需要对用户友好。 单个 URL 不仅可以让 Google 更轻松地对您的网站进行排名,还可以让您的用户更轻松地找到您的网站或页面。
您需要将首选标准设置为 WWW 或非 WWW。 这个想法是为了避免给您的用户和搜索引擎造成任何混淆。
使用 Hreflang 标签
hreflang 标记使用 HTML 信号元标记,告诉人们您网站的语言和/或地理位置。 Hreflang 对于具有多种语言的网站是必不可少的。 例如,这种类型的标签使这成为可能:

迎合非本地搜索引擎用户意味着他们在您网站上的体验得到改善。
但是,如果您有不同语言的单个页面的不同版本,则必须使用 hreflang 标签告诉 Google 或其他搜索引擎有关变化的信息。
始终链接回原始内容
以下哪一项是处理重复内容问题的一种可能解决方案? 好吧,如果由于各种原因您无法摆脱重复内容,请始终记住包含指向原始内容的链接。 这可以位于重复内容的下方或上方。
如果搜索引擎遇到多个指向您内容的文章链接,他们会发现您的内容是原始版本或规范版本。
可以接受多少重复内容?
谷歌只奖励为客户增加价值的独特内容,这意味着谷歌不欢迎任何数量的内容重复。 然而,对于“谷歌或其他搜索引擎可以接受多少重复内容?”这个问题的答案。 仍然值得商榷,因为没有一个答案是完美的。 因此,请始终使用 Google 重复内容检查器,并确保您的文章在发布之前是 100%。 这是搜索引擎确定重复内容的方式:

(图片来源:www.elliance.com)
Diib:通过避免重复内容来提高您的 SEO 排名
搜索引擎优化专家会警告你不要重复内容——他们是对的。 尽管这些天几乎到处都会出现重复的内容,但如果您想提高排名,请务必注意要在网站上发布的内容。 Diib 用户仪表板被配置为发现任何重复内容的情况,并向您发送带有修复步骤的警报。 以下是您一定会喜欢的仪表板的一些功能:
- 关键字和反向链接竞争对手研究工具将帮助您找到竞争对手排名的关键字,并围绕这些关键字创建内容。
- 跳出率、重复内容和回访者等关键指标可以让您的网站保持健康。
- 检查您的 Facebook 页面关注者如何喜欢您分享的内容。
- 享受与 Diib 增长专家的每月通话。
单击此处获取免费的 60 秒站点分析或立即致电 800-303-3510 与增长专家聊天!
