如果你能写好和维持准确的元标记(例如,描述性标题和为搜索机器人提供的信息),Google就可以更准确地爬行、索引并在搜索结果中显示你的网站。元标记为各种各样的客户端(例如浏览器和搜索引擎)提供信息。请记住,每一个客 户端可能只解析对该客户端有用的元标记,而忽略了其他元标记(虽然它们有其他用处)。
下面是Google如何解析以下HTML页的元标记:
<meta name="description" content="对本页的描述">此标记提供了对当前页面一个简短描述。在很多情况下该描述会作为页面摘要(snippet)显示在Google的搜索结果中。详情请参阅我们的博客文章“使用更好的元描述来改善页面摘要”以及帮助中心的文章“如何更改网站的标题和描述”。虽然描述元标记是可选的,并且不会影响到您的排名,一个好的描述可以产生一个更好的页面摘要,这反过来又可以帮助提高我们的搜索结果质量和你的网页的访问者数量。
<title>页面标题</title>从技术上讲,标题标记并不是一个元标记,它经常与"description"标记一起使用。此标记的内容(即标题)一般显示在搜索结果中(当然,当用户使用浏览器来浏览网页或察看书签时也能看到页面标题)。我们的博客文章"针对访问者,还是针对搜索引擎?"尤其是"充分利用网页标题"中有关于标题标记的更多信息。
<meta name="robots" content="…, …"><meta name="googlebot" content="…, …">这些元标记控制搜索引擎如何抓取和索引页。 "robots"元标记指定的规则适用于所有搜索引擎,"googlebot"元标记指定的规则只适用于Google。Google可以理解以下值(当指定多个值时,用逗号将它们分开) :
当你完全省略此标记或当你指定content= "all"时,默认规则是"index, follow"。"使用robots元标记"中有关于"robots"元标记的更多信息。作为一个说明,你现在也可以在你的页面首部通过"X-Robots-标签"HTTP头指令来指定这一信息。这特别有用,尤其是当你想微调抓取和索引诸如PDF、图片或其他类型的非HTML文件时。
<meta name="google" value="notranslate">当我们认识到一个页面的内容并不是用用户可能想读的语言所写时,我们往往在搜索结果中提供一个链接以自动翻译你的网页。一般来说,这让你有机会提供独特和令人折服的内容给一个更广大的用户群。不过,在特定情况下,你可能不想你的网页被翻译。用这个元标记,你可以表明你不想让Google提供一个翻译 此页的链接。这个元标记一般不影响该页为任何特定语言的排名。更多的信息请参阅"Google翻译常见问题解答"。
<meta name="verify-v1" content="…">这是一个Google网站管理员工具的特定元标记,它是被用在你网站的高层页面,以在网站管理员中核实一个网站的所有者(另一种核实方法是上传一个HTML文件)。你为这个标记所设置的"content="的值是由你的网站管理员工具帐户提供的。请注意,这一元标记的content值(包括大小写)必须和你的帐户提供给你的值完全一样,这和你是否从XHTML改变标记为HTML无关,也和你标签的格式是否与你的网页相符无关。详情请见" 如何通过向网站主页中添加元标记来验证网站?"
<meta http-equiv="Content-Type" content="…; charset=…">这个元标记定义该页的内容类型和字符集。使用这个元标记时,content属性的值必须放在引号中;否则字符属性可能被错误理解。如果你决定 使用这个元标记,不用说,你应该确保你的内容实际上用的是指定的字符集。"Google的网络作者统计"里有一些关于这个元标记的使用的有趣数据。
<meta http-equiv="refresh" content="…;url=…">这个元标记在一定的时间后将用户指引到一个新的URL,有时它被用来作为一种简单的重定向形式。不是所有浏览器都支持这种重定向。它也可能混淆用户。对显示在搜索引擎结果中的某一页面,如果你需要改变它的URL,我们建议您使用服务器端的301重定向。此外,W3C的"网页内容易读性技巧和故障指南2.0"把它列在应该被废弃的标记中。
(X)HTML和大小写Google既能阅读HTML式的元标记,也能阅读XHTML式的元标记(无论网页用的是哪种编码)。此外,元标记的大小写一般并不重要--我们把<TITLE> and <title>看作是同样的。但是,"verify-v1"元标记是一个例外,它是区分大小写的。
revisit-after网站地图的lastmod 和 changefreq标记偶尔,网络管理员不必要地包含了"revisit-after"标记以加快一个搜索引擎的爬行速度,不幸的是,这个元标记大多数情况下是被忽略的。如果你想 让搜索引擎知道你更改页面的信息,你可以提交一个XML格式的网站地图。在该文件中,你可以说明你网站的最后修改日期(lastmod)和URL页面的改变频率(changefreq)。
如果您想要更多的例子,或有对如上所述的元标记有任何疑问,请到我们的Google网站管理员讨论组参与讨论。
作为谷歌搜索质量团队的一名代表,我经常听朋友们这样揶揄我:"旅途一定很颠簸吧?"实际上我并不觉得惊讶。然而,在这些会议上扮演积极的角色可不总是那么荣耀和惬意的。
从这里,你们可以一窥现实世界:
但是,下面是我为什么仍然喜欢参加会议的原因:
很多致力于搜索引擎排名的人士认为买卖链接会降低互联网上链接的质量。如果你纯粹为了你的访问者或流量而不是为搜索引擎买卖链接,有一个简单的方法(nofollow属性)可以做到这一点。谷歌对买卖链接的立场是相当明确的。我们也在使用算法或手工相当准确地发现买卖的链接。出售链接的网站会失去搜索引擎的信任。
搜索引擎讨厌这种付费链接的流行。谷歌的站长指南禁止购买只是为了提高搜索排名的链接。其它搜索引擎(包括Ask, MSN及雅虎),只要他们是模仿谷歌基于链接的搜索排名的搜索引擎,都劝阻买卖链接。
实际情况是,大多数付费链接是 a.) 显然是不客观的;b.) 往往是无关紧要的。如果你问付费链接的影响,我的答案是,绝对有较大的风险。我们将不会容忍任何对用户体验没有增加多大价值并试图有效地欺骗我们的系统的假链接。
问:这就是为什么我们看到一些卖链接的网站在谷歌的工具栏上的PageRank较低的原因?答:是的。如果一个站点在卖链接,它会影响我们对该网站的价值的判断,或直接导致我们对该站失去信任。问:如果一个网站通过卖链接来传递PageRank,并且该网站自己的PageRank在谷歌工具栏被降低了,网站所有者可以做什么来补救?答:网站所有者可以停止违背网络管理员指南的行为,并在谷歌的站长中心控制台提交复议请求。在提出复议请求之前,请确保所有售出的链接不再传递PageRank或者删除它们。问:谷歌是不是在告诉网站管理员如何管理自己的网站?答:不是。我们给每个想使他们的网站在谷歌上有良好表现的网站管理员提出参考。正如我在2007年6月的主题演讲视频中所说,网站管理员可以随心所欲地创建它们的网站,但是谷歌保留保障我们的索引质量和相关性的权利。据我们所知,所有主要的搜索引擎都采取了同样的立场。
问:谷歌是不是在试图打压其他用来增加网站流量的广告形式?答: 没有,完全不是这回事。我们的站长指南明确指出,你可以使用链接的手段来获得有针对性的流量。事实上,我在2007年8月的演讲中,特意举了几个完全符合我们的指南的非谷歌广告的例子。我们只是希望付费链接能自己让搜索引擎知道它们是付费的,这样它们就不会影响搜索引擎的运作。问:我知道有一个网站似乎是在买卖链接。我怎样才能把这一信息告诉谷歌?答:请阅读我们在2007早期的一篇关于如何报告付费链接的贴子。我们已经在短短几个月内收到了数以千计的举报,但我们欢迎有更多的举报。我们非常感谢你们的反馈,因为它帮助我们采取直接行动,并改善现有的检测算法。我们也使用该数据来训练用以检测违反我们质量准则的付费链接的新算法。问:我可以得到更多的信息吗?答:当然可以。我今年早些时候写了关于付费链接问题的更多解答。如果你还有问题,你可以随时加入我们的站长帮助小组的讨论。
Use comments only when they're necessaryThink twice before deciding to enable a guestbook or comments. If this feature is not really necessary or you will not be able to monitor the guestbook and comments regularly, consider disabling it. If you already have a guestbook, check to see if it's useful to visitors, and if they've been visiting it. If not, consider ways to improve the comments/guestbook feature, or remove it. A lot of spam comments don't create a good impression. Most blogging software will let you turn comments off for individual posts.
Use anti-comment spam tool
Block comment pages using robots.txt or META tagsYou can use your robots.txt file to block Google's access to certain pages. This won't stop spammers from leaving comments, but it will mean that links in these comments won't negatively impact your site. For example, if comments are stored in the subdirectory guestbook, you could add the following to your robots.txt:
Disallow hyperlinks in commentIf you have access to the server, you may want to change its configuration to remove HTML tags inside your guestbook. Spammers will still be able to leave comments, but they won't be able to publish active hyperlinks.
If comment spam is driving you crazy, try one or two of these methods and see how it works out. Got comments or suggestions? Leave them in our Google Webmaster Help discussion group.