什么是谷歌缓存页面?

谷歌缓存的网页是谷歌的记录,当他们最后索引的网页看起来如何。

您可以通过Google搜索页面的URL来访问缓存页面。 并在搜索引擎结果页面(SERP的)上单击其搜索结果旁边的三个垂直点。

将出现一个"关于此结果"面板,提供有关该页面的更多信息。 然后,您可以单击面板的"缓存的"链接按钮:

Google panel’s “缓存的”link button

Google会在特定日期和时间向您显示其缓存的页面版本。

A cached version of the page on Feb 28, 2024 06:26:54 GMT

您还可以通过在浏览器地址栏中的页面URL之前添加"缓存:"来访问Google的缓存版本。

像这样:

“cache:semrush.com/blog”

2024年2月,Google确认从其搜索结果"关于此结果"面板中删除"缓存"链接按钮。 因此,用户无法再从其Serp访问Google的缓存页面。

在地址栏中的页面URL之前添加"缓存:"仍然有效。 但谷歌也将很快禁用此功能。

为什么谷歌缓存页面? 为什么它现在删除了对它们的访问? 鉴于这种变化,你有什么选择?

让我们看看。

Google缓存的基本原理

谷歌的"缓存"功能已经有20多年的历史了。

以下是谷歌的情况SERP的看着十二月。 例如,2000年3月3日。 查看每个搜索结果的"缓存"链接:

Google SERP的 on Dec. 3, 2000

在过去的20多年中,该功能发挥了重要作用。

为什么谷歌缓存页面?

Google缓存页面以帮助用户查看不可用的网页。

由于以下原因,这些页面可能不可用:

  • 网站的服务器坏了
  • 该网站的服务器流量超负荷
  • 页面加载时间太长

因此,如果用户无法访问页面本身,他们可以查看Google的缓存页面。 得到他们想要的信息。

Google缓存页面对网站所有者的重要性

Google缓存页面主要是为了用户的利益。 但网站所有者也可以使用缓存的页面来检查Google是否正确索引了他们的页面。

当谷歌索引一个页面时,它会将该页面的副本保存在其搜索结果数据库或索引中—这是不可公开访问的。 它还在其缓存中保存了页面的另一个副本-这可公开访问。

由于Google缓存能力的限制,Google的缓存页面版本可能与Google索引中的页面版本不相同。 但它仍然是一个很好的近似值。

因此,即使网站所有者无法—并且仍然无法—检查他们的页面在Google索引中的外观,他们仍然可以检查它在Google缓存中的外观。 这样做,他们会得到关于搜索引擎在索引时如何看到他们的页面的指导。

如果Google的缓存版本的页面看起来与网站所有者的意图显着不同,那么其索引对应物可能也不是他们的意图。

然后,网站所有者可以采取行动来改进他们的页面。 然后让谷歌重新索引它。

这样,谷歌就会更新其索引中的页面版本,并显示更新后的页面以响应相关的搜索查询。

停止访问谷歌缓存页面

Google搜索联络员Danny Sullivan在一个X(以前的Twitter)帖子2024年2月2日,搜索引擎从其Serp中删除了"缓存"链接:

Google Search Liaison's post on X confirming that the search engine had removed the “缓存的”links from its SERP的s

在帖子中,沙利文解释说,谷歌最初在20多年前提供该功能,以帮助用户访问页面。

当时网站技术比较原始。 互联网速度也较慢。

结果呢?

网站并不总是可靠地加载。

但多年来技术有所改善。 现在,谷歌认为用户在尝试访问网站时面临的问题较少。

因此,它决定停止其"缓存"链接。 它还将"在不久的将来"阻止用户使用"cache:"方法访问其缓存的页面。

停止访问Google缓存页面的影响

谷歌决定删除对其缓存页面的访问将影响各种利益相关者:

用户

用户将无法使用Google的"缓存"功能来:

  • 查看不可用页面. 他们无法在Google SERP的上单击页面的"缓存"链接来访问其缓存版本。
  • 绕过文章付费墙. 用户以前可以使用缓存的页面免费阅读某些付费文章。 但现在不是了。

高级行政主任专业人员

高级行政主任专业人士可能会遇到更多困难:

  • 检查Google是否已对其页面进行适当索引
  • 检查Google上次索引他们的页面的时间. 他们无法再通过引用缓存版本的时间戳来获取此信息。
  • 进行竞争对手研究. 例如,将竞争对手的实时页面与其缓存版本进行比较,以识别其内容的更改。 特别是如果竞争对手的页面最近得到了很大的排名提升。
  • 识别欺骗性隐形活动. 网站所有者可能给了搜索引擎一个版本的页面索引和排名,并使用重定向向用户显示一个显着不同的页面。 如果是这样,Google的缓存版本的页面可以通过揭示搜索引擎在索引时看到的内容来发现欺骗。

Web开发人员

Web开发人员将需要替代工具:

  • 恢复丢失的内容. 这可能是一个已经下降的页面的内容。 或者他们在更新页面之前忘记备份的内容。 无论哪种方式,他们都可以访问Google的缓存版本页面-假设它仍然包含所需的内容-以检索丢失的内容。
  • 网站代码疑难解答. Web开发人员可以使用Google的缓存页面来检查搜索引擎如何呈现其网页。 呈现页面和预期页面外观之间的差异可能表明代码错误。 即使网站对用户来说看起来"正常"。

Google缓存页面的替代品

Google的"缓存"功能并不是查看过去版本页面的唯一选项。 这里有一些替代方案。

URL检查工具

URL检查工具是一个谷歌搜索控制台(GSC)工具,用于获取您网站的谷歌索引页面的信息。 这些信息包括:

  • Google上次抓取(即访问)页面的日期和时间
  • 谷歌是否可以索引页面
  • Google如何在索引页面时看到该页面

URL检查工具提供了更准确的洞察谷歌如何索引一个页面比谷歌的缓存页面。

这是因为与Google的缓存功能不同,URL检查工具在处理JavaScript代码时不会遇到麻烦。 因此,它可以更准确地显示Google如何看待您的索引页面—特别是如果它的外观受到JavaScript的影响。

要在页面上使用URL检查工具,请登录到GSC. (设置GSC如果你还没有,先在你的网站上。)

每个GSC屏幕的顶部都有一个搜索栏。 键入-或复制并粘贴-要检查的页面的URL。

然后,按"进入"或"回来吧"在你的键盘上。

Google将从其索引中检索您页面上的数据。 如果它已为您的页面编入索引,您将看到消息"URL在Google上。”

点击"查看已爬网页面"要查看Google在您的页面上检测到的超文本标记语言(HTML)。

Hypertext Markup Language (HTML) on the page

或者,单击"页面索引"下拉菜单以了解Google上次抓取您的页面的日期和时间。

“页面索引”drop-down menu showing when Google crawled the page

要查看Google如何查看您的页面,请单击"测试实时URL.”

Google会实时测试您网页的网址。 当测试完成后,点击"查看测试页面”> “截图."你会看到你的网页的当前外观到谷歌的一部分。

A section of page’s current appearance to Google shown under

如果您的页面自Google上次索引以来已更改,则url检查工具对索引和实时Url的结果可能会有所不同。

假设您之前将"noindex"标签添加到您的页面,以防止Google为其编制索引。 但是您最近删除了此标记以使您的页面可索引。

如果Google在此删除后未重新整理您的页面,则不会检测到更改。 因此,URL检查工具仍然会将您的页面的"页面索引"状态报告为"页面未编入索引:URL对Google来说是未知的。”

但是,当您实时测试页面的URL时,该工具会将页面的"页面可用性"状态报告为"页面可以编入索引"。

“Page availability”status showing “Page can be indexed”

丰富的结果测试工具

由谷歌开发的丰富的结果测试工具可以让你实时测试一个页面。丰富的结果-帮助它在SERP的上脱颖而出的特殊内容。 在此过程中,该工具可以提供以下详细信息:

  • Google上次抓取页面的日期和时间
  • 谷歌是否可以抓取页面
  • Google在抓取页面时如何看到该页面

URL检查工具提供了类似的信息。 但丰富的结果测试工具在这些方面有所不同:

  • 丰富的结果测试工具实时抓取页面的实时Url. 与URL检查工具不同,它无法从Google的索引中检索现有的页面数据。
  • 您可以使用丰富的结果测试工具检查任何页面URL. URL检查工具限制您检查您有管理员访问权限的网站的页面Url。

使用丰富的结果测试工具,导航到search.google.com/test/rich-results. 键入—或复制并粘贴-要测试到搜索栏中的URL。

然后,点击"测试URL.”

在"详细信息"下,您将看到:

  • Google对该页面的抓取状态,例如"抓取成功"或"抓取失败"
  • (Un)成功爬网的日期和时间
“Crawled successfully on Feb 28, 2024”message under

要查看Google在抓取页面时如何查看您的页面,请单击"查看测试页面.”

“查看测试页面

右侧将出现一个面板。 它的"HTML"选项卡向您显示Google在页面上检测到的HTML:

Tested page HTML window on the right-hand side

点击"截图"选项卡,以查看您的网页的当前外观到谷歌的部分。

“截图”tab on the right-hand side showing page’s current appearance to Google

其他搜索引擎的缓存

虽然Google可能禁用了对其缓存页面的访问,但其他搜索引擎也会缓存页面。 并继续允许访问它们。

这些搜索引擎包括必应和雅虎!.

例如,以下是如何在必应中访问页面的缓存版本。 如果您知道如何查看Google缓存页面,您会发现这个过程很熟悉:

导航至必应. 键入—或复制并粘贴-页面的URL到搜索栏中。

在必应的SERP的上找到页面的搜索结果,然后单击页面URL旁边的向下指向的箭头。

然后,点击"缓存的.”

“缓存的

你会看到必应的缓存版本的页面。 以及必应创建日期的信息。

必应’s cached version of Vrbo's page

回路机

回路机由Internet Archive拥有,是一个在线页面数据库,因为它们出现在不同的日期。

它作为互联网的历史档案,允许用户检查页面在不同日期的外观。 并跟踪它们随时间的变化。

相比之下,搜索引擎(Google或其他)的缓存只提供一个页面的过去版本-页面上次缓存时的外观。

要使用回路机,请导航到web.archive.org. 键入—或复制并粘贴-页面的URL到搜索栏中。

命中"进入"或"回来吧"在你的键盘上运行搜索。

如果回路机至少存档了一次页面,它会告诉你它第一次这样做的时间。 以及从那以后保存了多少个页面副本。 单击时间线中的任何一年,日历将显示该年快照可用的日期。

回路机 page overview

它还将显示一个带有彩色圆圈的日历,以指示它保存至少一个页面副本或"快照"的日期。

将光标悬停在任何突出显示的日期上,以查看回路机当天快照页面的时间码列表。

回路机 calendar drop-down menu showing 71 snapshots for February 25, 2024

单击列表上的任何时间码以查看其关联的快照。

A snapshot one one timecode in 回路机

后谷歌缓存时代网站管理员的最佳实践

如果您运行或维护网站,请采取以下步骤来减轻Google缓存页面的丢失:

使用URL检查工具查看页面

与其在Google上搜索缓存页面以了解搜索引擎在索引它们时如何看到您的页面,不如使用url检查工具和丰富结果测试工具等替代工具。

如前所述,这些工具可以更准确地了解Google如何为您的页面编入索引。

而且,就像Google的"缓存"功能一样,您无需将网站连接到任何特殊平台即可使用丰富的结果测试工具。

确保您的网站可靠(快速)加载

由于用户现在有一个更少的解决方法来浏览不可用或缓慢的网页,因此更重要的是您的网站快速可靠地加载。

技术问题,如过高的HTTP请求计数,可能会减慢页面的加载速度。 而其他人,如404错误,可以阻止它加载。 使用像Semrush这样的工具现场审核检测和修复这些问题,并安排定期检查,以保持他们在海湾。

要使用站点审核,请登录您的Semrush帐户,然后单击"高级行政主任”> “现场审核"在左侧边栏。

点击"+创建项目.”

在出现的"创建项目"窗口中填写您网站的域(或子域)和可选项目名称。 然后,点击"创建项目.”

默认情况下,站点审核将检查您的域及其子域。 如果您不需要它来检查您的子域名,请单击"抓取范围"设置旁边的铅笔图标。

“Crawl scope”setting in 现场审核 tool

取消选中"爬取[域]的所有子域"复选框,然后单击"保存更改.”

“Crawl all subdomains of [domain]”checkbox in 现场审核 Settings

接下来,使用"已检查页数限制"设置来设置站点审核每次运行时应检查的页数。 例如,如果要在所有网页上运行该工具之前测试该工具,请将限制设置为"100"。

将"爬网源"设置保留为"网站",让网站审核检查您的整个网站。

默认情况下,网站审核将通过电子邮件发送给您,让您知道何时完成检查您的网站。 如果您不需要此通知,请取消选中"每次审核完成时发送电子邮件。"复选框。

可选:使用左侧编号为2到6的选项卡来调整设置,如:

  • URLs站点审核应该(或不应该)检查
  • 该工具应忽略的URL参数

点击"开始现场审核"当你完成。

网站审核将扫描您的网站的问题. 完成检查后,在项目列表中单击您的(子)域以查看完整报告。

点击"问题"tab。

你会得到一份清单。:

  • 错误:需要紧急修复的最严重问题
  • 警告:不那么严重但可能仍然值得关注的问题
  • 通告:您可能会考虑修复的最不严重的问题
错误, warnings, and notices tabs highlighted under

现场审计可以检测到超过140个技术问题. 特别是,请注意这些错误。 它们可能会影响您网站的加载能力和速度:

  • #页数返回的4xx状态代码":这些页面有一个4XX错误-就像一个404错误-阻止用户访问它们
  • #页数无法抓取(DNS解析问题)":这些页面有域名系统(DNS)错误这会阻止站点审核访问托管它们的服务器。 在这种情况下,用户可能也无法查看它们。
  • #页数加载速度慢":这些页面需要很长时间才能加载

点击超链接"#页"任何这些错误的文本,以查看遇到它们的页面。

例如,当您单击以查看返回4xx状态代码的页面时,您将看到以下内容:

Pages that returned 4XX status codes in 现场审核

然后,解决检测到的问题。 点击"为什么以及如何解决它"每个错误旁边的文本,以获得修复它的指导。

这些文章也可能有用:

如果有疑问,请联系web开发人员寻求帮助。

网站审核也可以定期扫描您的网站。 所以,你留在任何新的问题,突然出现的顶部。

单击站点审核报告顶部的齿轮图标。 向下滚动"站点审核设置"下的设置列表,然后单击"时间表:每周,每周二,"(或任何一天你正在看这份报告)。

Schedule site audits in “现场审核 settings”window

选择站点审核是否应每天、每周或每月扫描您的网站。 然后,点击"储蓄"来设置您的自动扫描计划。

Web内容保存的未来

随着谷歌"缓存"功能的停止,像回路机这样的互联网档案平台可能会在保留网络历史记录方面发挥更大的作用。

为啥?

因为这些平台记录了随着时间的推移对页面内容的更改。 与其他搜索引擎的缓存不同,后者只允许用户查看缓存页面的最新版本。

如果回路机与Google正式合作,它将成为一个更加突出的档案服务。

虽然他在这个时候没有承诺,但谷歌的丹尼沙利文已经表示有兴趣将搜索引擎的缓存链接替换为指向回路机的链接:

就个人而言,我希望也许我们会从我们之前有缓存链接的地方添加到[回路机]的链接,在这个结果中。 这是一个如此惊人的资源。 对于关于结果的信息素养目标,我认为这也是一个很好的适合-让人们很容易看到一个页面随着时间的推移是如何变化的。 没有承诺。 我们得和他们谈谈,看看这一切会怎么样--牵涉到我以外的人。 但我想这会很好。

如何防止缓存

虽然Google的"缓存"功能正在消失,但必应和回路机等其他平台仍可能缓存您的页面。

尝试这些选项,如果你不希望他们。

使用"Noarchive"元机器人标签

"无政府主义者"元机器人标签是一个代码片段,您可以添加到页面以告诉平台不要缓存它。 因此,用户将无法访问页面的缓存版本。

标签看起来像这样:

将此标签添加到

每个页面的部分,你想保持别人的缓存。 像这样:
......"/><!DOCTYPE html><html><head><meta name=......"加载="懒惰"宽度="1010"高度="1044"/>

提交不被缓存的请求

某些平台提供了退出其缓存的正式过程。 如果是这样,即使您已经将"noarchive"标签添加到您的页面,也要遵循它。

这是因为平台在缓存页面时可能不会检查"noarchive"标签。 或者,只有当您发出正式请求时,它才会将您的页面从其缓存中排除。

要请求回路机不会缓存您的页面,例如,发送电子邮件至info@archive.org 与信息,如:

  • 您不希望回路机缓存的页面URL
  • 平台不应该缓存您的页面的时间段

回路机将审查您的请求并决定是否同意它。

没有谷歌缓存页面? 没问题!

尽管我们不得不告别谷歌的缓存页面,但它的各种功能都有替代品。

例如,如果您想检查Google在索引页面时如何查看您的页面,则可以使用URL检查工具和丰富结果测试工具。

如果用户在加载您的页面时遇到问题,他们可以在其他搜索引擎的缓存或Wayback机器上检查其缓存版本。

也就是说,如果用户能够可靠地首先访问您的网站,那就最好了。

塞姆鲁什氏现场审核提供监控您的网站的技术问题。 因此,您会意识到—并且可以及时修复-那些阻止用户访问您的网站的因素。

通过注册一个免费Semrush帐户.

雷切尔 汉德利
Rachel是一名资深内容作家,在内容营销和SEO方面拥有12年以上的经验。她曾在代理机构工作,为各种品牌制定和执行内容战略,并在内部推动SaaS初创公司的有机增长。