介绍
Google 的 Gary Illyes 最近在保加利亚举行的 SERP Conf 2024 会议上接受采访时,讨论了令人沮丧的 "已抓取但未编入索引 "错误背后的原因。他的见解揭示了这一常见问题,并为解决这一问题提供了宝贵的指导。
要点
1.内容相似性:
- Illyes 证实,造成这一错误的原因之一是内容相似性。如果一个页面的内容与其他已被索引的内容非常相似,谷歌可能会选择不索引它。
2.一般场地质量:
- 网站的整体质量对索引有很大影响。大量 "已抓取但未被索引 "的页面可能表明网站存在质量问题。
3.技术问题:
- 技术问题(如在多个 URL 上提供相同内容)也会导致此错误。如果检测到此类问题,谷歌对网站的看法可能会改变。
4.复制:
- 重复内容是另一个主要因素。谷歌可能会抓取一个页面,但如果其索引中已经存在信号更好的类似版本,谷歌就会决定不索引该页面。
详细说明:
在采访中,Illyes 回答了一个问题,即 "已抓取但未编入索引 "错误是否可能是由于页面与已编入索引的内容过于相似造成的。他确认这可能是原因之一,但强调造成这一问题的因素很多。
粒度和复杂性:
Illyes 指出,由于谷歌内部处理数据的方式,对这些错误进行分类非常复杂。他解释说,虽然重复内容是一个重要因素,但造成这种错误的潜在原因还有很多。
质量问题:
Illyes 强调说,网站的总体质量会在很大程度上影响索引。抓取但未编入索引 "页面的激增可能暗示着谷歌对网站质量的看法有所下降。这可能有多种原因,包括内容不佳或技术错误。
技术问题:
技术问题,如网站错误地为不同的 URL 提供相同的内容,也会导致这一问题。此类错误会导致 Google 重新考虑其索引决定。
现场信号:
Illyes 提到,如果有另一个信号更好的网站托管相同的内容,谷歌可能更愿意索引该网站。这种情况经常出现在联合发布的内容中,原始发布者的版本不会被收录。
实用收获:
了解这些原因有助于网站管理员调试和修复 "已抓取但未编入索引 "错误。主要操作包括
-
审查内容相似性:确保您的内容独一无二,不会与现有索引内容过于相似。
-
提高网站质量:注重提高网站的整体质量,以增强 Google 对网站的感知。
-
解决技术问题:解决任何可能导致内容重复或其他问题的技术问题。
-
监控网站信号:了解您的网站信号与其他网站信号的比较,尤其是当您的内容被联合发布时。
通过解决这些问题,您可以提高网页被 Google 索引的几率。