什么是规范 URL?
规范 URL 是 Google 将一组重复或接近重复的页面视为 "主 "版本的 URL。可以把它想象成一件艺术品的原件与副本或印刷品之间的区别。这个规范 URL 将被 Google 索引,并有可能在 Google 搜索中返回给用户。
为什么规范 URL 很重要?
规范 URL 非常重要,因为 Google 只会索引规范 URL。这意味着,如果您的网站上有重复内容,比如页面之间接近或完全重复,Google 只会索引其中一个(规范 URL)。
如果您正确设置了规范 URL,谷歌很可能会尊重您的决定并将该页面视为规范页面。但是,如果没有为完全重复或接近重复的页面指定一个规范化 URL,Google 将根据其最佳判断为您选择一个规范化 URL。这可能并不总是您希望 Google 选择的 URL。
如何设置规范 URL
Google 会通过几个信号来确定一组重复或接近重复页面的规范 URL,规范标签就是其中之一。规范标签是添加到页面<head>
部分的一段 HTML 代码,用于指定该页面的规范版本。它看起来像这样
<link rel="canonical" href="https://example.com/canonical-page/" />
示例
假设您拥有一家电子商务商店,访客可以通过样式、尺寸和颜色等参数筛选产品。这通常会产生参数化 URL,其内容与您的 "主页面 "几乎完全相同:
yourstore.com/tshirts
(列出所有 T恤
的主页面)yourstore.com/tshirts?size=small
(与主页面相同,但仅筛选小号 T 恤)yourstore.com/tshirts?color=red
(与主页面相同,但仅筛选红色 T 恤)
如果没有正确的规范化,最终可能会出现 Google 选择索引错误版本的页面或所有页面的情况。为确保 Google 索引正确的页面,可以在主页面上使用规范标签来设置这些 URL 的规范版本,指向不含 URL 参数的主版本。
规范 URL 的最佳做法
1.使用自引用规范标签
自引用规范标签是页面上指向自身的规范标签。例如
<link rel="canonical" href="/blog/what-is-a-canonical-url/" />
谷歌的约翰-穆勒(John Mueller)建议使用自引用规范标签,因为它可以明确您希望索引的页面。
2.使用绝对 URL
绝对 URL 包含定位资源所需的所有信息,有助于避免搜索引擎无意中造成的错误或对规范 URL 的误解。虽然可以使用相对 URL,但最佳搜索引擎优化做法是在规范标签中使用绝对 URL。
3.从网站地图中排除非规范 URL
Google 建议不要在网站地图中列出非规范 URL,因为它会将这些 URL 视为建议的规范 URL。要检查网站地图中的非规范 URL,可以使用Ranktracker's Web Audit 等工具。
4.不要将 404 设置为规范 URL
404 状态代码表示无法找到页面。应避免将 404 页面指定为规范。随着时间的推移,页面可能会被删除或重新定位,因此必须监控和更新规范标签,以确保它们指向有效页面。
常见问题
是否应将分页页面的 Canonical 化为根页面?
对于分页页面,如一系列博客存档页面,每个页面都应使用自引用规范标签,而不是指向系列中的第一个页面。谷歌的约翰-穆勒(John Mueller)证实,这是处理分页的规范化的正确方法。
是否可以使用多个 Canonical 标记?
不,在同一个页面上使用多个规范标签不是好的做法。如果出现这种情况,Google 很可能会忽略这两个规范标签,页面可能无法被索引。
有关管理重复内容和改进网站搜索引擎优化的更多见解,请访问Ranktracker 博客并浏览我们全面的搜索引擎优化指南。此外,您还可以在我们的搜索引擎优化词汇表中熟悉关键的搜索引擎优化术语和概念。