多语言网站是指拥有两种以上语言版本的网站。比如说,您的网站既有中文版本,又有英文版本,那他就是一个多语言的网站。
显然,如果浏览您的网站的人使用的是不同的语言,那么多语言网站就非常实用。如果您想让巴西人浏览您写的关于拉美足球的博客,您只需要选用葡萄牙语来发布。但如果您想让阿根廷球迷也能浏览您的博客,使用西班牙语则能帮助您达到目的。
谷歌需要确定您每个网页的主用语言。如果您在每个页面仅使用一种语言,并且避免并行翻译,这将更有利于谷歌进行语言识别。虽然谷歌可以对一种语言以上的网页进行识别,但我们建议,网页的基本部分如标题、工具条和菜单等最好使用同一种语言。
请注意,谷歌会忽略所有代码级语言信息,包括从“lang”属性到文档类型定义(DTD)。有些网页编辑程序会自动生成这些属性,因此,在识别网页语言时它们并不十分可靠。
如果有人在谷歌上使用本国语言进行搜索,并期望找到本地化的搜索结果,此时,网站站长要发挥作用了:如果您要使信息本地化,那么用以下技巧可使搜索结果显现出来。
在开发多语言网站时无需建立特别的URL。但是,您的用户可能希望查看URL来确定他们在浏览您网站的哪个版面。例如,下面的URL能让用户知道他们正在浏览网站的英语页面:http://example.ca/en/mountain-bikes.htmlhttp://en.example.ca/mountain-bikes.html 而下面的URL能让用户知道他们在浏览同一页面的法语页面:http://example.ca/fr/mountain-bikes.htmlhttp://fr.example.ca/mountain-bikes.html 另外,URL结构能让您更容易地分析多语言内容的索引。
如果您想用非英语字符建立URL,请一定使用UTF-8编码。用UTF-8编辑的URL在链接内容时能正确的被转换。 如果您需要对URL进行手动转换,您可以找到一个在线URL编码器来轻松帮您完成。例如,如果我想把下面的URL从英语转换到法语,http://example.ca/fr/mountain-bikes.html URL转换之后可能会变为:http://example.ca/fr/vélo-de-montagne.html 因为这个URL中包含一个非英语字符(é),所以在网页链接转换之后的情况可能是:
http://example.ca/fr/vélo-de-montagne.html
我们建议您不要允许自动翻译来获得索引。自动翻译有时候没有意义,并且可能被当做垃圾信息。更重要的是,建立多语言网站的目的,在于通过提供多种语言的内容从而吸引更多的用户。如果您的用户无法理解自动翻译的内容,或者觉得翻译太僵硬,也许您需要考虑是否真的有必要为用户提供自动翻译的内容。
如果您计划将信息本地化,让Googlebot轻松地抓取到您网站所有语种的版本。您可以考虑在网页与网页间进行横向连接。换句话说,您可以在同样内容的不同语言的网页间建立链接。这样做对您的用户也有很大帮助。用我们之前提供的例子,假设一个法语网民碰巧登陆了页面http://example.ca/en/mountain-bikes.html; 现在,他可以点一下链接转换到页面http://example.ca/fr/vélo-de-montagne.html ,在这里他可以看到法语版的同样内容。为了让您网站的所有内容更容易被抓取到,就应避免根据用户所用语言而进行的自动重新定向。这些重新定向会使用户(和搜索引擎)无法浏览您网站的所有版本。
最后,确保不同语言的内容有不同的URL,不用要cookies来显示转换的版本。
谷歌直接从HTTP标题、HTML 页面标题和内容中摘录文字编码。在文字编码上您不需做什么,除开要留意冲突信息,如内容和标题间的冲突。虽然谷歌能识别不同的文字编码,但我们建议您在网站上尽可能使用UTF-8。
如果您的舌头已经打结……
既然您对此已经有所了解,那么使用多种语言时,即使您的舌头会打结,但您的网站却不会无法应对!
欲知更多信息,请关注我们的下一篇博文,我们将研究关于跨区域网站。谢谢。
发表者:Matt Cutts,搜索质量团队首席工程师
标签:竞争,欧盟,创新,网站站长
最近,欧盟委员会就一系列竞争申诉开始展开初步调查。部分申诉指责谷歌在确定搜索结果排名的方式和原因等问题上不够透明。这一说法让我难以接受。关于如何与网站发布者进行交流,谷歌已经设定过标准。下面让我向您介绍,谷歌如何对搜索结果进行排名及其根据。
关于谷歌“打分”的讨论主要集中在网页排名上。其实,所谓的“秘密准则”其实根本算不上什么秘密。这篇论文对其有详细的介绍。这篇早期的论文不仅介绍了网页排名的规则,同时还提到了谷歌排名的其他标准,其中包括锚文本、词语在文档内的位置、搜索关键词的相关性、所用字体的字号和类型、页面原始HTML代码以及词语大小写状态等。在过去几年中,谷歌陆续发布了数百篇研究论文。这些论文展现了许多与谷歌运营有关的“秘诀”,以及谷歌所使用的文档基础架构。其中的一些论文不仅促进了开源项目的发展,同时还帮助了很多公司的成长。
学术论文只是其中一个方面,谷歌同时还通过其他方法介绍其经营方式。1999年,谢尔盖.布林参加了首届“网站站长搜索引擎战略大会”。2001年,谷歌成为首批加入“网站站长的世界”这一网络发布商在线论坛的搜索引擎之一。谷歌的的一个代表在论坛上发言2800多次,而另一位代表 AdWords顾问则发言约5000次。
随着网络的发展,谷歌为实现透明化并促进信息交流所做出的努力也随之并进。我们于2004年5月开始发布博客,迄今为止我们已经在官方博客上发布了数以千计的博文。谷歌现有70多个官方博客,其中包括官方网站站长博客,这是一个专门帮助网站站长了解谷歌运作方式并帮助他们在我们的搜索结果中获得期望排名的博客。相比其他任何一个大公司,谷歌发布了更多的博文。同时,我们还使用几十种不同语言,在我们的网站上提供大量公共文档,向发布者提供建议。
作为谷歌“反垃圾网站”团队的主管(我们团队致力于阻止各种违反了谷歌的“网站站长指南”里公开、明确规定的垃圾网站行为),经常有人问我谷歌是如何运作的。这也是我2005年开始撰写个人博客的原因。迄今,我已经发表了数百篇关于谷歌的博文。我的博文话题广泛,从常见的网站错误到博客新手建议。我还有幸在30多个搜索引擎会议上为网站站长做演讲,并对一些公共网站做评论和解析。事实上,这周我还将与10多个谷歌同事一起参加另一个搜索引擎会议,解答相关疑问。
我们实验了各种方式,以帮助网站站长了解谷歌搜索排名的运作。我们举行了多次网站站长现场谈话的在线直播,吸引了数百名参与者实时参加。此外,我们还尝试过发布Twitter消息和播客。而我还想介绍一种我最喜欢的方式,通过它,我们开诚公布地向网络发布商提供建议:去年,我们收集了许多来自公众的问题,并在网站站长视频频道中发布了数百段视频答复。这些视频的播放次数超过150万次!我们还通过在线博客回答公众关于谷歌业务运作的问题。
这样的例子不胜枚举。谷歌还与其他搜索引擎合作,探讨如何让网站站长的工作变得更为轻松。由此产生的一系列行业标准有:指定首选的网站地址url格式以及网站地图,此举将使网站站长能够轻松地告知搜索引擎关于其网页的信息。谷歌还推出了一个网站站长论坛,谷歌员工和一些经验丰富的“超级用户”经常会登陆这一论坛,解答关于某些特定站点的问题。我们还推出了人工服务的“虚拟网站诊所”,为从旧金山到俄罗斯、从印度到西班牙语系的各地用户提供一对一的回复和建议。我们甚至还确认了谷歌算法中并不使用的排名符号,如关键词元标记,因为这样能帮助网站站长省去一些无用功,并帮他们避免不必要的官司纠纷。
令人沮丧的是,即便是谷歌所有的2万名员工全天候回答网站发布商的问题,我们仍然无法解答所有网站站长的问题。原因何在?因为互联网上有超过1.92亿个注册域名。这也是我们推出谷歌网站站长工具的原因,谷歌网站站长工具是一个一站式站点,能提供可扩展的自助式服务信息,网站站长也可通过该工具向我们提供数据。要全面介绍我们向网站站长推出的这些功能强大的免费工具,恐怕需要再写一篇完整的博文,因此在这里我仅列出其中的一些功能:
最近,一位谷歌员工发表博文,介绍了如何通过这些免费的公共工具来诊断其超过宽带上限的网站空间(webhost) 的问题。数百万网站站长也采取了类似的办法,利用谷歌的免费工具获取与其网站相关的有用信息。
谷歌致力于创建一种尽可能公开的经营方式,甚至帮助用户将数据从谷歌产品中导出。同时,我们并不认为企业有某些特定的商业秘密是不合理的,尤其当我们的保密是为了避免网站垃圾制造者和黑客利用我们的系统。如果那些试图篡改谷歌搜索排名的人了解到了谷歌排名运作的所有细节,那么要将我们的搜索结果“篡改”成毫无关联的内容简直就轻松多了,比如说改成色情内容和恶意站点,而最终蒙受损失的将会是用户。
最后我想说的是,随便批评谷歌的“秘诀”不是什么难事,但这并不是事实。多年来,谷歌一直致力于以一种开放的方式开展业务,它向发布商提供关于谷歌排名规则的信息,并努力解答无论是发布商还是用户的各种问题。如果这就是人们对“秘密”的定义的话,那么,谷歌的秘密无疑是在搜索的世界中保守得最糟糕的秘密。