中文网站站长博客。
Google中文网站站长博客 为广大站长提供关于Google网页抓取、收录、搜索引擎优化以及其他相关的站长资讯。
#NoHacked:识别和诊断植入乱码的黑客手段
2015年8月19日星期三
原文:
#NoHacked: Identifying and Diagnosing Injected Gibberish URL Hacking
作者:
Eric Kuan, 站长关系专家;Yuan Niu, 网站分析师
在今天的 #nohacked 宣传活动中,我们将讨论如何识别和诊断一种日益猖獗的黑客手段 - 在网站上植入乱码网址。即使您的网站并未受到这种黑客手段的侵扰,这篇博文中的很多步骤也都可以帮助您应对其他类型的黑客手段。作为后续补充,我们将在下周的博文中具体介绍如何解决由这种黑客入侵导致的问题。请使用 #nohacked 标签在
Twitter
和
Google+
上关注我们的讨论。(
第 1 部分
、
第 2 部分
、
第 3 部分
)
识别
相关症状
乱码网页
这种黑客手段的特点是会使网站中出现包含垃圾内容的网页。这些网页会包含具有大量关键字的乱码文本、链接和图片,其目的是要操控搜索引擎。例如,这种黑客手段会创建包含如下乱码内容的网页(比如
www.example.com/pf/download-2012-free-full-crack.html
):
隐藏真实内容
这种黑客手段通常会
隐藏真实内容
,以免被网站站长检测到
。隐藏真实内容是一种分别向网站站长、访问者和搜索引擎呈现不同内容或网址的做法。例如,
网站站长可能会看到一个空白网页或 HTTP 404 网页
,因而便误以为自己的网站上已不再存在黑客入侵问题。但实际上,通过搜索结果访问相应网页的用户仍会被重定向到包含垃圾内容的网页,而且系统仍会向抓取该网站的搜索引擎呈现乱码内容。
监测您的网站
适当监测您的网站是否已遭到黑客入侵,可让您更快速地解决黑客入侵问题并将黑客入侵可能会造成的损害降至最低。您可通过多种方式来监测自己网站上是否存在这种黑客入侵问题。
检查
是否存在网站流量突增的情况
由于这种黑客手段会创建很多包含大量关键字且由搜索引擎抓取的网址,因此请检查近期是否出现过任何意外的流量突增情况。如果您发现确实存在流量突增,请使用 Search Console 中的
“搜索分析”工具
来调查被黑网页是否就是异常网站流量的来源。
跟踪
您的网站在搜索结果中的外观
对于所有网站站长来说,定期查看网站在搜索结果中的外观是一种非常好的做法。这也便于您发现黑客入侵症状。您可通过使用
“site:”运算符
搜索自己的网站(即搜索“site:example.com”)来查看您的网站在 Google 中的显示效果。如果您看到与您网站相关的任何乱码链接或带有“此网站可能已遭到黑客入侵”字样的标签,那么您的网站可能已遭到入侵。
注册
以接收来自 Google 的快讯
我们建议您注册
Search Console
。在 Search Console 中,您可以查看
手动操作查看器
或
安全问题
报告,了解 Google 是否在您网站上检测到了任何被黑网页。如果 Google 在您网站上检测到了被黑网页,Search Console 还会向您发送消息。
此外,我们也建议您为网站设置
Google 快讯
。这样一来,如果 Google 发现系统为某条搜索查询返回了新结果,Google 快讯就会向您发送电子邮件。例如,您可以
结合使用
常见的垃圾内容字词
(如 [site:example.com 廉价软件])为您的网站设置 Google 快讯。如果您收到一封电子邮件,并从中得知 Google 针对该字词返回了一条新查询,那么您应立即检查该快讯是由您网站上的哪些网页触发的。
诊断您的网站
收集有用的工具
在 Search Console 中,
您可以使用
Google 抓取方式
工具。借助这款工具,您可以看到系统向 Google 呈现的网页样貌。这有助于您识别已隐藏真实内容的被黑网页。这篇博文的附录中列出了来自其他提供商的更多付费工具和免费工具。
检查
是否存在被黑网页
如果您不确定自己的网站上是否存在被黑内容,
Google Hacked Troubleshooter
可以引导您完成一些基本的检查工作。对于这种黑客手段,您需要在 Google 中使用“
site:
”搜索自己的网站,然后在搜索结果中查找加载了奇怪关键字的可疑网页和网址。如果您的网站中有大量网页,那么您可能需要尝试使用更有针对性的查询。
查找常见的垃圾内容字词
,然后将它们附加到您的“site:”搜索查询中(如 [site:example.com 廉价软件])。建议您多尝试几个垃圾内容字词,看看系统是否会返回任何结果。
检查
被黑网页是否隐藏了真实内容
由于这种黑客手段会通过隐藏真实内容来阻止您进行准确的检测,因此请务必使用 Search Console 中的“Google 抓取方式”工具来检查您在上一步中发现的垃圾内容网页。请注意,已隐藏真实内容的网页会向您显示 HTTP 404 网页,让您误以为黑客入侵问题已解决(虽然被黑网页仍旧存在)。此外,您也应该对自己的首页使用“Google 抓取方式”工具,因为这种黑客手段通常会向首页添加文本和链接。
我们希望,在这篇博文的帮助下,您已更加清楚如何识别和诊断会在您网站上植入乱码网址的黑客手段。下周,我们将会详细介绍如何从您的网站上消除这种黑客入侵问题,敬请关注。请一定使用 #nohacked 标签关注我们的社交宣传活动,并分享您关于如何确保自己的网络内容安全无虞的提示或技巧。
如果您有任何其他问题,请在
网站站长帮助论坛
中发帖提问。在那里,众多的网站站长同行会为您答疑解惑。此外,您还可以参加我们将于 8 月 26 日举办的
关于“安全”的
环聊直播
。
附录
这些工具均可对您的网站进行扫描,并可能会找出有问题的内容。Google 不会运行或支持除 VirusTotal 以外的其他所有工具。
Virus Total
、
Aw-snap.info
、
Sucuri Site Chleck
、
Wepawet
:
这些工具可能能够通过扫描您的网站来找出有问题的内容
。但请注意,这些扫描工具无法保证一定能识别出每一类有问题的内容。
标签
恶意软件
搜索引擎优化
网站管理员小贴士
网站管理员指南
小贴士
心系四川 爱我中华
badware
Google
Google Webmaster Tools
Google索引
Google站长工具
img
Matt Cutts 的文章
robots.txt
SEO
Top Contributor
博客归档
2020
十一月
九月
八月
七月
六月
五月
四月
三月
二月
一月
2019
十一月
十月
九月
2018
七月
五月
二月
一月
2017
十二月
十一月
六月
四月
三月
2016
十二月
十一月
十月
九月
八月
五月
三月
一月
2015
十二月
十一月
十月
九月
八月
修复被植入乱码的网页
#NoHacked:识别和诊断植入乱码的黑客手段
Search Analytics API 简介
#NoHacked:使用双重身份验证保护您的网站
#NoHacked:如何识别社交工程并保护自己免受其害
七月
五月
四月
三月
二月
一月
2014
十一月
九月
八月
七月
六月
五月
四月
三月
二月
一月
2013
十二月
十一月
九月
八月
七月
六月
五月
四月
三月
二月
一月
2012
十二月
十一月
十月
九月
八月
七月
六月
五月
四月
三月
二月
一月
2011
十二月
十一月
十月
九月
八月
七月
六月
五月
四月
三月
二月
一月
2010
十二月
十一月
十月
九月
八月
七月
六月
五月
四月
三月
二月
一月
2009
十二月
十一月
十月
九月
八月
七月
六月
五月
四月
三月
二月
一月
2008
十二月
十一月
十月
九月
八月
七月
六月
五月
四月
三月
二月
一月
2007
十二月
十一月
十月
九月
八月
七月
Feed
Give us feedback in our
Product Forums
.