发表于:2009年10月5日,星期一
在过去的三年中,不管是在网站站长之间,还是在我们的博客上,搜索结果中的重复内容都是一个热门话题。在这期间,我们一直都在向网站站长提供工具和一些小窍门,帮助他们控制搜索的URL格式和索引,包括:
a) 使用301重定向;
b) www 和非www 首选域名设置;
c) 更改地址选择(英文)
d) rel="canonical"
我们非常高兴地在此宣布又为大家带来了一个管理重复内容的工具:“参数处理工具”。该工具可方便您一目了然地浏览在谷歌的爬虫收录这些网页的过程中,哪些参数是谷歌认为应该忽略或不应该忽略的,并会根据您的需要改写搜索指令。
让我们再以出售瑞典鱼的网站为例:
假设我们希望的URL格式和所对应的内容如下:
http://www.example.com/product.php?item=swedish-fish
然而,用户还可以通过其他URL访问到这一内容,这取决于用户从哪里访问您的网站,或您的内容管理系统采用何种方式嵌入参数,如sessionid:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
通过对“参数处理”设置,站长可以向我们的网页爬虫提出忽略参数类别、trackingid及 sessionid的建议。如果我们认同了您的建议,对您的网站来说,搜索结果将更加有效,其包含的重复URL也将更少。
具体操作方法如下:
自从我们推出该功能之后,用户反馈中的常见问题包括:
用户的建议是提示性的,还是指令性的?
考虑到站长的建议有时对网站来说可能产生弊大于利的后果,您的建议将被视作是提示性的。但我们会竭尽全力满足您的需求。
我该何时使用参数处理,何时使用rel="canonical"?
rel="canonical"是一个非常好的重复内容管理工具,应用非常广泛。它与参数处理工具之间的差别为:
使用最适合您的方法;如果您想得到更完美的效果,也可以两种方法一起使用。
我们一如既往地期待广大站长对此新功能的反馈。
其他相关文章:
巧妙地处理内容重复
由抄袭造成的重复内容
揭秘“内容重复处罚”
指定您的URL范式