什么是重复内容?
重复内容是指在网络上多处出现的完全相同或近似完全相同的内容。它既可能出现在一个网站内,也可能出现在不同的网站上。
例如,如果您在自己的网站上发布了一篇博文,并决定将其作为客座文章提交给另一个网站,这就属于重复内容。
在网站管理员社区,围绕重复内容存在很多争议。他们主要担心的是,如果网站内容重复,谷歌会对网站进行惩罚。
为什么重复内容不利于搜索引擎优化?
1.不理想的网页版本在搜索结果中的排名
如果您在不同的 URL 上显示相同的内容,Google 最终可能会对您无意排名的版本进行排名。这是因为 Google 会根据它认为最适合用户的版本来选择排名。您可以通过正确管理重复内容来避免这种情况。
2.链接股权稀释
每个内容重复的 URL 都会吸引不同的反向链接,并拥有自己的 PageRank。请记住,PageRank 仍然是一个排名因素,这意味着您无意进行排名的 URL 最终可能比您真正要进行排名的 URL 拥有更好的链接配置文 件。
一个常见的例子是,同一页面或内容同时出现在网站的 www 和非 www 版本中,或同时通过 HTTP 和 HTTPS 协议提供。
3.浪费爬行预算
如果你有一个大型网站或经常更新内容,重复内容就会浪费抓取预算。搜索引擎不会抓取新的更新页面,而是会抓取并重新抓取所有重复内容版本。因此,您的新内容可能需要更长的时间才能出现在搜索引擎结果中。
4.辛迪加或抄袭内容超越原创内容
在极少数情况下,聚合或剪贴内容的排名可能会超过你的原创内容。虽然这种情况并不常见,但在不同的搜索引擎优化社区都有报道。
您会因重复内容而受到惩罚吗?
根据谷歌的说法,大多数重复内容在起源上并不具有欺骗性。换句话说,如果你不打算用重复内容操纵搜索排名,谷歌就不会惩罚你的网站。
不过,对于 "无附加值的单薄内容",包括废料内容,会有处罚(人工操作)。
如何查找网站上的重复内容?
您可以使用Ranktracker Web Audit 等工具查找网站上的重复内容。在对网站进行审计时,您会发现有一个专门针对重复内容的部分。该部分将报告网站上没有正确规范标签的重复页面,以及使用相同标题和描述的页面。
管理重复内容的最佳做法
1.对网站上的所有 URL 使用一个标准
确保网站上的每个页面都能以 www 或非 www 版本访问。对 URL 末尾的斜线也采用同样的原则,确保每个页面只能通过 HTTPS 协议访问。所有其他版本都应重定向到您决定的标准 URL。
2.使用规范标签进行整合
网站上重复或接近重复的页面必须使用规范标签指向单一的规范版本。规范标签告诉谷歌哪个版本是主要版本,应该被收录。
3.使用自相 关规范标签
自引用规范标签是添加到页面主版本的标签,与其他重复页面无关。它们不是强制性的,但建议使用。这在处理附加了各种 URL 参数的 URL 时很有帮助。
例如,当使用自引用规范时,像 https://example.com/blog/?utm_source=facebook 这样的 URL 将自动拥有一个指向 https://example.com/blog/ 的规范标签。
如果您使用的是 WordPress 并安装了 Yoast 或类似的搜索引擎优化插件,自引用规范标签就会自动添加。如果您拥有自定义编码的网站或使用自定义内容管理系统,则需要联系您的开发人员来实施自引用规范标签。
常见问题
重复内容会受到 Google 的惩罚吗?
并不存在重复内容惩罚。不过,抄袭/盗用内容属于谷歌的 "低附加值或无附加值的薄内容 "人工操作范畴。
什么是近乎重复的内容?
近乎重复的内容是指与其他内容差别极小的内容。例如,针对美国和英国访客的相同产品页面,只有货币不同,就属于近乎重复的内容。
在Ranktracker 博客上了解有关管理重复内容和其他搜索引擎优化最佳实践的更多信息,并探索我们的搜索引擎优化词汇表以了解更多术语和定义。