重复内容
什么是重复内容?
重复内容是指与其他网站或同一网站不同页面上的内容相似或完全相同的内容。网站上有大量重复内容会对谷歌排名产生负面影响。
换句话说:
重复内容是与出现在另一个页面上的内容逐字逐句相同的内容。
但是“重复内容”也适用于与其他内容相似的内容……即使它被稍微改写了。
重复内容如何影响 SEO?
一般来说,Google 不希望对包含重复内容的页面进行排名。
事实上,谷歌声明:
“Google 努力索引和显示具有不同信息的页面”。
因此,如果您网站上的页面没有明确的信息,可能会损害您的搜索引擎排名。
具体来说,这是具有大量重复内容的网站遇到的三个主要问题。
更少的自然流量:这非常简单。Google 不想对使用从 Google 索引中其他页面复制的内容的页面进行排名。
(包括您自己网站上的页面)
例如,假设您的网站上有三个内容相似的网页。
Google 不确定哪个页面是“原始”页面。所以这三个页面都很难排名。
处罚(极其罕见):谷歌表示,重复的内容可能会导致网站受到处罚或完全取消索引。
然而,这是非常罕见的。而且只有在网站故意从其他网站抓取或复制内容的情况下才会这样做。
因此,如果您的网站上有一堆重复的页面,您可能不需要担心“重复内容惩罚”。
更少的索引页面:这对于拥有大量页面的网站(如电子商务网站)尤为重要。
有时谷歌不只是降低重复内容的排名。它实际上拒绝索引它。
因此,如果您网站上的某些页面没有被编入索引,可能是因为您的抓取预算浪费在了重复的内容上。
最佳实践
在不同的 URL 上观察相同的内容
这是弹出重复内容问题的最常见原因。
例如,假设您经营着一个电子商务网站。
您有一个销售 T 恤的产品页面。
如果一切设置正确,那件 T 恤的每个尺码和颜色仍将在同一个 URL 上。
但有时您会发现您的网站会为产品的每个不同版本创建一个新的 URL……这会导致数以千计的重复内容页面。
另一个例子:
如果您的站点具有搜索功能,那么这些搜索结果页面也可以被编入索引。同样,这可以轻松地向您的站点添加 1,000 多个页面。所有这些都包含重复的内容。
检查索引页面
查找重复内容的最简单方法之一是查看您网站中在 Google 中编入索引的页面数量。
您可以通过在 Google 中搜索 site:example.com 来完成此操作。
或者在Google Search Console中检查您的索引页面。
无论哪种方式,这个数字都应该与您手动创建的页面数量一致。
例如,Backlinko 有 112 个页面被索引:
这是我们制作的页数。
如果这个数字是 16,000 或 160,000,我们就会知道很多页面是自动添加的。这些页面可能包含大量重复内容。
确保您的网站正确重定向
有时您不仅拥有同一页面的多个版本……而且还拥有同一站点的多个版本。
虽然很少见,但我在野外见过很多次。
当您网站的“WWW”版本没有重定向到“非 WWW”版本时,就会出现此问题。
(或相反亦然)
如果您将网站切换到 HTTPS 并且没有重定向 HTTP 网站,也会发生这种情况。
简而言之:您网站的所有不同版本都应该放在同一个地方。
使用 301 重定向
301 重定向是解决网站重复内容问题的最简单方法。
(除了完全删除页面)
因此,如果您在您的网站上发现了一堆重复的内容页面,请将它们重定向回原始页面。
一旦 Googlebot 停下来,它将处理重定向并仅索引原始内容。
(这可以帮助原始页面开始排名)
留意类似内容
重复内容并不仅仅意味着从其他地方逐字复制的内容。
事实上,谷歌将重复内容定义为:
因此,即使您的内容在技术上与现有内容不同,您仍然会遇到重复内容问题。
这对大多数网站来说不是问题。大多数网站都有几十个页面。他们为每一页写独特的东西。
但在某些情况下,可能会出现“相似”的重复内容。
例如,假设您经营一个教人们如何说法语的网站。
你服务于大波士顿地区。
好吧,您可能有一个围绕关键字优化的服务页面:“Learn French Boston”。
另一个试图为“学习法语剑桥”排名的页面。
有时内容在技术上会有所不同。例如,一个页面列出了波士顿位置的位置。另一页有剑桥地址。
但在大多数情况下,内容超级相似。
这是技术上重复的内容。
为您网站上的每个页面编写 100% 独特的内容是不是很痛苦?是的。但是,如果您真的想对网站上的每个页面进行排名,那么这是必须的。
使用规范标签
rel =canonical标签告诉搜索引擎:
“是的,我们有一堆内容重复的页面。但是这个页面是原来的。您可以忽略其余部分”。
谷歌表示,规范标签比阻止具有重复内容的页面更好。
(例如,使用robots.txt或网页 HTML 中的 noindex 标记阻止 Googlebot)
因此,如果您在您的网站上发现一堆包含重复内容的页面,您可以:
- 删除它们
- 重定向他们
- 使用规范标签
使用工具
有一些SEO 工具具有旨在发现重复内容的功能。
例如,Siteliner 会扫描您的网站以查找包含大量重复内容的页面。
合并页面
就像我提到的,如果你有很多页面直接重复内容,你可能想将它们重定向到一个页面。
(或使用规范标签)
但是,如果您的页面内容相似怎么办?
好吧,您可以为每个页面磨出独特的内容……或者将它们合并到一个大页面中。
例如,假设您的网站上有 3 篇技术不同的博文……但内容几乎相同。
您可以将这 3 篇文章合并为一篇 100% 独一无二的精彩博文。
因为您从站点中删除了一些重复内容,所以该页面的排名应该高于其他 3 个页面的总和。
Noindex WordPress 标签或分类页面
如果您使用 WordPress,您可能已经注意到它会自动生成标签和类别页面
这些页面是重复内容的巨大来源。
所以它们对用户有用,我建议在这些页面上添加“noindex”标签。这样,它们就可以在没有搜索引擎索引的情况下存在。
您还可以在 WordPress 中进行设置,这样根本就不会生成这些页面。
了解更多
Google 如何处理重复内容?:来自 Google 的 Matt Cutts 的关于 Google 如何查看重复内容的视频。
重复内容惩罚的神话:这篇文章概述了为什么大多数人不需要担心“重复内容惩罚”。