不仅如此,我们认为与界面语言相同语种的文件更具相关性
。如果搜索用户的界面语言是英语,我们的算法语言就假定查询是以英语为主,而且用户希望我们能够返回英文资料。
这就是说,即便对于相同的搜索关键词,不同的界面语言下返回的搜索结果也不尽相同。如果用户只选择特定的语言,那么搜索结果还可能因用户所处的地点而异(根据他们的IP地址判断)。如果用户已经订制了自己的个性化搜索,这同样会对搜索结果产生影响。
下面的例子说明了使用西班牙语界面的用户搜索"Mexico"时返回的结果。

请注意,当界面语言为西班牙语时,即使输入的关键词本身并没有重音字符,更多的结果还是带有重音字符的。
如何对搜索结果加以限制?
为了获得仅含有特定语言版本的搜索结果(包含还是不包含重音字符),您可以在检索词的前面加上一个"+"。例如,搜索"+Mexico"时,返回的网页中将只含有"Mexico"(而没有"México")。相反,搜索"+México"时返回的网页中将只含有
"México"而没有"Mexico"。您也许会注意到,有些搜索结果似乎没有使用您所规定的语言版本,但是这个语言版本的关键词出现在了网页内容或网页的底本文字中,而没有出现在结果的标题或描述中。(您可以在站长工具中选择"统计数据">“网页分析”来查看与您的网站相连接的顶层底本文字)。下面的例子表明了使用"+Mexico"为关键词搜索时返回的结果。

2 条评论 :
google的搜索功能确实是比较先进。
看来本blog也改版了
fist time long time. My question is, how about Chinese characters? Does hex characters render Google less semantically powerful to recognize relationships between keywords and link URLs or any other points where there is a mix between ascii and hex in keywords?
I guess this render out any possible LSI approach toward Chinese websites.
Thank you
发表评论