原文链接:URL removal explained, Part III: Removing content that you don't own
网站站长级别:所有
欢迎阅读我们的删除URL系列博文之三。在前两篇博文中,我们讨论了如何快速删除属于您的内容,以及如何请求快速删除缓存。今天,我们来谈谈如何使用Google的公共URL删除工具将其他网站上的内容从Google搜索结果中删除。
Google提供两种能快速删除内容的工具:
1. 已验证URL删除工具:如果您是站长工具中通过验证的站长(比如您的博客或您公司的网站),当内容发布在您的网站上时,可用其请求将内容从Google搜索结果中删除;
2. 公共URL删除工具:当内容发表在其他人的网站上(比如朋友的博客),可用其请求将内容从Google搜索结果中删除。
有时会发生这种情况,即您想删除的信息来自不属于您的或您无法控制的网站。由于每个站长会控制自己的网站及网站内容,因此更新或删除Google搜索结果的最佳做法就是让站长(发布内容的网站站长)拦截对该URL的抓取、修改内容源或彻底删除该页面。如果内容没有更改,下次我们抓取时它会重新出现在我们的搜索结果中。因此想要删除其他网站上的内容,首先应该联系站长并请求他们删除或拦截相关内容。
如果站长删除了一个页面,删除页面的请求应返回一个“404没有找到”的响应,或一个“410已删除”的响应。如果站长选择拦截搜索引擎抓取该页面,则该页面应被该网站的robots.txt文件禁止访问或包含一个noindex元标签。一旦符合上述任一条件,就可以使用“站长已拦截该页面”的选项提交删除请求。
有时站长声称他们已经拦截或删除了某个页面,但从技术上讲他们没有这样做。如果他们称页面已被拦截,您可以查看该网站的robots.txt文件,核实一下该文件中是否禁止访问该页面。
User-agent: *Disallow: /blocked-page/
通过页面的HTML源代码也能核查该页面是否被拦截。可以通过浏览器访问该页面,选择“查看页面源”,看看HTML“页头”部分是否有noindex元标签。
如果站长告知您该页面已删除,您可以用诸如Firefox浏览器的Live HTTP Headers插件等HTTP响应测试工具来确认。激活该插件,就能请求Firefox内的任意URL测试该HTTP响应的确是“404没找到”或“410已删除”。
一旦确认您想删除的内容不再出现在网页上,就可以使用“内容已从网页上删除”的选项请求删除缓存。这种方式通常叫做“缓存”删除,能确保Google的搜索结果不再显示原页面的缓存副本或版本,也不再显示原网页上的文本片段。从Google的搜索结果中只能访问更新后的当前页(不包含已删除的内容)。然而,由于外部网站中的导入链接仍然存在,因此更新后的当前页有可能仍然按照原内容中的词语排名。要提交缓存删除请求,您需要输入一个“网页上已删除的词语”。确保您输入的是当前页面上没有的词语,这样我们的自动流程才能确认页面已更改——否则请求将遭到拒绝。删除URL释疑系列博文之二中详细地介绍了缓存删除。