原文:Working with multi-regional websites
网站站长级别:中级
您知道吗,经调查表明,绝大多数用户认为获得用自己语言提供的信息比获得一件低价格的商品更重要。生活在一个非英语的国家,我经常能听到一些朋友和家人表示,他们希望能使用本土或本地化网站 —— 经过适当本地化的网站能吸引更多用户,这是毫无疑问的。一直以来,谷歌都尽可能为用户显示最佳的搜索结果。多数情况下,这些搜索结果,都已经根据用户当前的位置或语言进行了本地化。
如果您打算花时间为自己的网站创建并维持一个本地化版本,那么很重要的一点就是,用户能够非常容易的找到这个本地化版本。在这一系列博文中,我们将从搜索引擎的角度来看看创建多区域和多语言网站都会涉及到哪些方面的问题。多区域网站是指给不同地区(通常是不同国家)的用户提供服务的网站;当该网站采用多种语言提供内容时,我们就称它为多语言网站。有些时候,一个网站既是多区域网站,也是多语言网站。下面我们就从一些最基本的准备工作开始,谈谈多区域网站需要注意的细节以及问题。
创建一个多区域网站时,无论这个多区域网站是否有多语言版本,都是一项颇具挑战性的工作。创建基础版本时,往往会出现很多的问题,然而在创建多版本网站时,这些问题还可能会成倍增加,所以,在您开展工作之前,一定要确保一切正常运行。创建多区域网站,通常意味着您得面对突然成倍增加的URL数量,所以不要忘了需要提前预备好合适的基础架构来支持网站。
当针对多个区域(通常指不同国家)规划网站时,一定要先对可能会涉及到的法律或行政要求做一番研究,因为这些要求很可能会决定您接下来的工作方式,比如,是否满足使用国家域名的条件。
所有网站的创建都是从域名开始的;提到域名,谷歌按两种不同的类型来区分域名:
l 国家代码顶级域名(ccTLDs):这些域名与特定的国家相关(比如德国的.de和中国的.cn)。用户和搜索引擎用这些来作为区分您的网站究竟是为哪一国家提供服务的。
l 通用顶级域名(gTLDs): 这些域名通常不依赖于某一特定的国家。常见的通用顶级域名有.com、.net、.org、和.museum等。通常,谷歌也会把一些区域顶级域名,比如.eu和.asia视作通用顶级域名,因为这些域名也不与某一特定的国家相关。另外,我们还把一些虚拟国家代码顶级域名(比如.tv、.me等)当作通用顶级域名,因为我们发现用户和网站站长经常都认为这些域名更为通用,而非面向特定国家(关于此类被视作通用顶级域名的虚拟国家代码顶级域名,我们并没有整套清单,因为随着时间的发展这些情况有可能会发生变化)。使用网站站长工具地理目标设置, 您就可以为通用顶级域名网站定位目标地理区域。
一般情况下,谷歌根据以下要素来确定某一网站(或某网站的一部分)的地理定位:
1. 国家代码顶级域名或者网站站长工具的手动通用顶级域名网站地理定位(这可以在域名级别、子域名级别或子目录级别进行)的使用,对于用户来说,通常都是一个非常明显的信号,清楚无误地说明了网站面向的某一国家。关于这方面的更多信息,可在我们的博客帖文和帮助中心找到。在搜索结果中显示由网站地理定位产生的区域标签,这种方法对于用户来说也非常清晰易懂。如果您网站上的同一页面内容面向的国家不只一个(比如,面向所有讲德语的国家),那么,使用地理设置通常是没有意义的,这种情况下其实只需用一种语言编写全部内容即可,无须使用网站地理定位设置(用其他语言编写的信息很快就能提供!)。
2. 服务器位置(通过服务器的IP地址)通常都靠近您的用户。不过,由于有些网站使用的是分布式的内容分发网络(CDNs)或者网站服务器被托管在某一具备更好的基础架构的国家,所以我们会尽量不单独依靠服务器位置这一要素。
3. 其他的信号也可以给我们一些提示。这有可能是网页上的本地地址和电话号码,本地语言和货币的使用,来自其他本地网站的链接,或谷歌本地商户中心(Google's Local Business Center)的使用,当然得在可使用的情况下。
需要注意的是,我们不使用具有定位作用的元标签(比如“geo.position”或“distribution”)或HTML属性进行网站地理定位。尽管在其他方面这些方法可能会有一定用处,但我们发现在进行网站地理定位方面,它们使用起来通常都不够可靠。
用于进行网站地理定位的前三种要素与使用的服务器和URLs紧密相关。仅仅从网页的基础上我们很难确定网站地理定位,所以有必要考虑使用URL架构,通过把网站内容分割成若干部分再进行地理定位,这样会容易一些。下面是一些可用于网站地理定位的URL架构,以及他们的优势和劣势:
国家代码顶级域名 比如:example.de、 example.fr
带通用顶级域名的子域名 比如:de.site.com、 fr.site.com等
带通用顶级域名的子目录 比如:site.com/de/、 site.com/fr/等
URL 参数 比如: site.com?loc=de、?country=france, 等
优势 (+)- 网站地理定位清晰- 与服务器位置无关- 易于分离网站- 需要满足相关法律要求(有时候)
优势 (+)- 易于设置- 可使用网站站长工具(Webmaster Tools)进行地理定位- 允许有不同的服务器位置- 易于分离网站
优势 (+)- 易于设置- 可使用网站站长工具(Webmaster Tools)进行地理定位- 较低的维护成本(同一主机)
优势 (+) (不推荐)
劣势 (-)- 价格昂贵(+ 可用性)- 需要更多基础架构- 需要满足相关国家代码顶级域名要求(有时候)
劣势 (-)- 用户可能不能单从URL识别地理定位(比如,“de”指的是语言还是国家?)
劣势 (-)- 用户可能不能单从URL识别地理定位- 单一的服务器位置- 较难分离网站
劣势 (-)- 基于 URL的内容分割很困难 - 用户可能不能单从URL识别地理定位- 不能用网站站长工具(Webmaster Tools)进行地理定位
从中大家可以看到,网站地理定位并不是一种精确的科学(即使是使用国家代码顶级域名的网站在实质上也是一个全球性的网站)。所以很重要的一点是,您的网站也应该做好招待那些从“错误”的地方来的“不速之客”的准备,一种方法就是在所有页面上显示让用户选择其地区和所用语言的链接。我们将在以后的博文中进一步讨论一些其他可行方案。
在面向不同地区并提供不同语言时,网站有时会通过不同的URL提供一些相同或类似的内容。通常,我们会建议您最好能够针对每个不同的用户组提供特别的内容,但是,在多区域网站创建的最初阶段,对于所有页面和各种变量来说,这一点并不一定能够实现,所以,一般情况下,只要这些内容是面向不同国家的不同用户的,就不会有什么问题。一般来说,没必要通过禁止在robots.txt file文件中进行抓取或通过使用"noindex" robots meta tag元标签来“隐藏”那些重复内容。不过,如果您是通过不同的URL向相同的用户提供相同的内容(比如,如果“example.de/”和“example.com/de/”都面向德国的用户显示德语内容),就有必要在其中选择一个偏爱的版本,并进行适当的重定向(或使用"rel=canonical"链接要素)。您是否已经有一个面向多个地区的网站?或是否有关于规划此类网站流程方面的疑问?那就请到我们的帮助论坛并加入讨论吧。