页面从搜索结果消失。浪费爬行预算。下降排名和不合标准的用户体验。重复内容造成的问题是SEO营销人员的重要交易。

虽然建议很简单——不要在网页上重用文本——但避免重复内容的现实情况要复杂一些。

什么是重复内容?

根据谷歌的网站管理员定义重复内容通常是指在域内或跨域的实质性内容块,这些内容要么完全匹配其他内容,要么明显相似。大多数情况下,这并不是欺骗性的。”

找到重复内容的最明显的地方是在页面上;但是,重复的标题和元描述也计入重复内容,并且对于搜索营销人员来解决和修复没有A可能更加困难重复内容检查

之间25%和30%前谷歌工程师马特·卡茨说,网络内容的大部分都属于复制类。很容易看出这是如何发生的:通用的产品描述、样板文本或品牌消息经常在域和页面之间重复,没有恶意的意图。搜索引擎知道重复的内容会发生;这就是为什么,尽管有相反的声明,重复的内容不会招致谷歌的惩罚。

将拍摄Google罚款的某些内容。垃圾邮件器从原始来源刮掉内容并将其放在自己的网站上时,会发生复制的内容。与重复内容一样,复制内容会导致两个网页,其中包含相同的内容;然而,与重复内容不同,复制内容有意地发生,无法向读者添加价值,并且通常涉及次级资质网站。

搜索引擎严重查看被抓取的内容,可能会对抓取网站进行惩罚。最好让爬虫知道您的站点内容不是从其他来源搜集的。我们将在下面讨论。

重复内容对SEO重要吗?

如果重复的内容不会导致谷歌罚款,你能高兴地让它在你的网站上乱跑吗?不。重复的内容仍然会对你的页面排名产生负面影响有机的交通,没有任何实际的惩罚,击中您的网站。

首先,搜索引擎避免在结果页面返回重复的条目。这对搜索者来说很有意义;毕竟,一个由10个相同的结果托管在不同页面上的结果页面不如一个由10个不同的、原始的结果页面有用。

搜索引擎必须决定哪个版本的重复内容是最相关的。为了做到这一点,他们考虑领域权威和哪个页面看起来是原始的,最权威的内容来源。爬虫然后从结果页过滤出重复:

  • 如果你展示的内容也出现在一个更权威的网站上,你的URL将被过滤出结果页面,有利于更高权威的网站。
  • 如果您的网站的几个页面中有重复的内容,这些页面中的大多数将被从搜索引擎结果页面(serp)中过滤掉。整个网站的可见性将受到影响。

第二,重复的内容页面会稀释链接的公平性和页面的权威性。如果您的网站拥有两个不同的url,但内容相同,那么链接到您的内容的网站必须在这两个版本中进行选择。这会将入站链接传播得比必要的更薄,对问题页面的排名信号产生负面影响。

如何找到重复的内容问题

肉眼通常可见重复的内容,但有时它隐藏在网站的代码中。这就是为什么最好使用软件检查是否重复内容

现场重复内容

Alexa的搜索引擎优化审计工具包含一个重复的内容检查器,查找具有相同内容的不同URL,并建议如何修复它们。该工具还提醒您普通复制内容SEO提示,就像您可以在此提示框中看到的内容提示:

Alexa的SEO审核工具提醒您重复内容SEO提示

Site Audit工具识别跨元描述和标题的重复内容,产生一个可导出的url列表,使发现和修复问题更容易:

结果是生成的url列表

修复这些技术错误将帮助您改进meta标记搜索引擎优化,从搜索引擎结果页面(SERPS)导致较高的点击率。

非现场重复内容

站点外的重复内容——存在于不同网站上的相同内容——可能更难被发现。

为了确保您没有发布已经存在于另一个站点上的内容,请在发布之前尝试使用抄袭工具,以确保博客内容都不是抄袭。如果您正在使用外包作家或新团队成员,这尤其重要,他们可能不知道原始内容的重要性。

你也可以使用剽窃工具来查看其他网站是否没有复制你的内容。像Copyscape这样的付费工具可以扫描网页,找到从你的网站复制的内容。这种类型的站点外重复内容很难修复,尽管您可以尝试联系站点管理员并请他们修复它。如果这不能奏效,请继续阅读另一种处理复制内容的方法。

8常见的重复内容问题以及如何修复它们

没有单尺寸适合的全部解决方案重复内容。但是有常见的修复程序有助于解决最常见的问题及其后果:

1:打印友好版本的页面

打印友好的网页在用户体验方面非常好,即使是在移动数据和语音助手的无限时代。但是,尽管它们对于需要访问纸质文档的人来说很好,但它们可能会产生重复内容的问题。打印友好的url会创建同一个页面的两个不同版本;如果两个版本都是可索引的,爬虫将花费您的爬网预算爬行,并且必须选择在SERPS中显示哪一个。

解决方案:使用规范的标签将防止打印机友好和移动页面版本成为重复的内容问题。的canonical标签设置页面的主版本,并向该主版本发送所有排名信号。

要设置Rel = Consonical URL,请将块的代码放在您要定位的页面的部分中,将URL与您网站上的URL替换为原始内容。

< link rel = "规范化" href = " originalcontenturl.com " >

2: http/https或子域问题

改变过来newbee赞助雷竞技应该对你的网站的排名有积极的影响,因为谷歌认为HTTPS是一个积极的排名因素。但是这种转换有时会导致重复内容问题,因为爬行器会看到站点的两个相同版本。

将站点从HTTP更改为HTTPS

同样的事情也会出现在有或没有www的同一网站的版本中。前缀。机器人不得不在网站的不同版本中进行选择,这消耗了爬虫预算和不必要的链接分配。

解决方案:在您的网站搜索控制台中设置一个首选域让爬虫知道他们应该专注于哪个版本的域名。要设置首选域,请转到搜索控制台中的站点设置,然后在首选域部分中选择所需的选项。

注意:目前此选项仅在旧版本的搜索控制台

3: UTM参数和会话id

使用参数来跟踪信息和会话id是一个很好的主意,以准确的web营销指标.但搜索引擎将每个版本解释为具有重复内容的不同URL。再次,多个版本将混淆爬虫和稀释排名因子。

解决方案:rel=canonical标记允许您设置URL的首选版本。它保证了正确的URL被机器人抓取,并收到所有的SEO好处带来的反向链接和网站访问。

注意:rel=canonical标签应该只在每个页面的内容相同的情况下使用。

4:分页

搜索引擎可能无法识别分页页面,并将其解释为重复的内容。有不同类型的分页问题会导致重复的内容——例如,图库分页,当图库中的每个项目都有自己的页面时;还有类别分页,当产品列表跨越几个页面时。无论问题的技术细节如何,它们都可能导致重复内容问题。

搜索引擎会将分页页面误认为重复内容

解决方案:分页问题通常通过使用rel =“prev”rel =“下一个”标签。它们告诉爬虫分页系列的组件url之间的确切关系。

2019年3月谷歌宣布他们决定放弃这些标签,这表明用户喜欢单页内容,但分页内容仍然可以包含rel= " prev "和rel= " next "标签。

5:同一页面的国家/语言版本

网站通常具有特定于不同的域,每个域具有相同的内容 - 例如,www.yousite.comwww.yoursite.com.au.,分别服务于美国和澳大利亚。这些网站上几乎所有的内容都可能被复制,但网站管理员仍然需要确保两者都出现在serp中。

解决方案:有两个选项可以帮助保证每个域的可见性:顶级域名和hreflang标签。

  • 顶级域显示在域名末尾,包括熟悉的表单,如.com,.org,.edu,.net,.gov,以及国家一级的域。谷歌建议使用这些顶级结构来发送内容服务于不同地域的明确信号。这意味着http://www.example.de从搜索引擎的角度来看,更容易理解http://de.example.com.,这不是顶级格式。
  • HReflang标记有助于机器人向用户展示其位置的正确版本。将以下代码添加到您网站的部分将在Spain中显示您域的西班牙版本的用户,例如:

< link rel =替代“href =“hreflang = http://example.comen-es“/>

爬虫不会将网站的翻译版本识别为重复内容,感谢Hreflang。

6:复制内容

垃圾网站窃取你的内容是现实。不幸的是,这种活动会对原来的网站产生负面影响。这就是为什么你需要采取行动反对复制内容,保护你的网站的权威。

解决方案:首先,尝试与违规网站联系并要求他们删除内容。如果他们没有,你可以在这里了解更多信息从谷歌开始如何报告版权侵权。

7:Indicated内容

与高级合作伙伴网站分享你的内容是一种很好的方式来驱动推荐流量和获得有价值的反向链接。但是如果您采用这条路线,您需要确保爬虫程序理解这不是重复的内容。如果不这样做,可能会导致您共享的站点出现在serp中,并且您自己的站点也会被过滤掉,即使您制作了内容。

解决方案:在你同意让一个博客联合你的内容之前,要求他们包括一个rel = canonical标签在具有内容的每个URL上的元素中。这是有效的一部分SEO内容规划

8:样板内容

样板内容是跨域重复的文本,但不是恶意的。例如,当供应商在销售产品时提供标准文本时,你会经常看到电子商务域名上的样板内容。零售商为了节省时间而重复使用这些文本;缺点是,爬行器知道这是一个重复的内容问题。

电子商务零售商应该尽可能重写产品描述。这需要大量的劳动资本,但它避免了重复内容,并得到改进电子商务SEO.如果您的博客或其他SEO内容上的样板内容,请尝试确保包含样板内容的页面也有足够的其他内容来区分用户和搜索引擎。

防止重复内容的最佳做法

妨碍网站窃取您的内容,并通过以下这些预防措施减轻了在现场排名上的重复内容的影响:

  • 通过使用a,停止垃圾扫描站点为您的内容提供信誉自我参照rel = canonical链接在您的网站页面上。在原始页面的部分中的这一代码块点为自己的规范引用点为单位。如果任何网站复制URL的内容,搜索引擎可以将您的页面识别为最终的真理来源。
  • 链接到规范版本您网站的URL始终。例如,如果您有一个带有移动和桌面版本的页面,请选择即规范,然后仅将所有内部链接指向该页面。如果将外部链接构建到该URL,请确保所有转到规范链接。这将为您想要出现在SERPS中的链接的爬行信号发送清除信号。
  • 使用一个301重定向在适当的情况下,通过合并类似的页面到一个强大的页面来减少重复的内容。随着时间的推移,你可能已经建立了几个类似的登陆页面,所有这些页面都包含类似的信息,并试图为相同的关键词排名。301重定向将阻止这些页面竞争,并向首选页面发送更强的排名信号。

保护您的网站免受重复内容是最佳实践。但是,仍然会出现重复的内容问题。

结论

在关键词研究,内容策略和营销计划中投资出汗股权后,由于可避免的重复内容问题,您不想失去竞争对手。监测和修复这些问题应该是正在进行的SEO卫生的一部分。

注册Alexa先进计划的免费试验得到循环的搜索引擎优化审计,以及竞争分析和关键词研究工具