那些不会对网页内容产生影响的URL中的参数——例如session ID或者排序参数——是可以从URL中去除的,并被cookie记录的。通过将这些信息加入cookie,然后301重定向至一个“干净”的URL,你可以保持原有的内容,并减少多个URL指向同一内容的情况。
你的网站上是否有一个日历表,上面的链接指向无数个过去和将来的日期(每一个链接地址都独一无二)?你的网页地址是否在加入一个&page=3563的参数之后,仍然可以返回200代码,哪怕根本没有这么多页?如果是这样的话,你的网站上就出现了所谓的“无限空间”,这种情况会浪费抓取机器人和你的网站的带宽。如何控制好“无限空间”,参考这里的一些技巧吧。
通过使用你的robots.txt 文件,你可以阻止你的登录页面,联系方式,购物车以及其他一些爬虫不能处理的页面被抓取。(爬虫是以他的吝啬和害羞而著名,所以一般他们不会自己 “往购物车里添加货物” 或者 “联系我们”)。通过这种方式,你可以让爬虫花费更多的时间抓取你的网站上他们能够处理的内容。
在理想的世界里,URL和内容之间有着一对一的对应:每一个URL会对应一段独特的内容,而每一段内容只能通过唯一的一个URL访问。越接近这样的理想状况,你的网站会越容易被抓取和收录。如果你的内容管理系统或者目前的网站建立让它实现起来比较困难,你可以尝试使用rel=canonical元素去设定你想用的URL去指示某个特定的内容。
利用这款小工具,您可以在“前往此处:”字段中预先填入一个或多个地址。客户只需一次点击便可打印相应路线。对于不想驾车的客户,这款小工具还提供了步行和公交路线。
当用户输入一个不太确切的出发地址时,这款小工具提供了选项,用于指定更确切的地址。该地址随后将显示在“从此处出发:”字段中。
利用 Google 地图提供路线非常灵活:除了人们习惯使用的地址外,您还可以用其他方式为客户提供路线,比如邮政编码或者您所在位置的经纬度坐标等。目的地示例:
123 River St, Woods, MA
90210
北纬42.06782°, 西经71.756963°您也可以为您的地址起一个别称,或者使用一个大家都理解的名称。要使用别称,只需将别称加上括号并放在地址之后:北纬42.06782°, 西经71.756963°(外婆家)
先来了解一下加州乐高乐园、美国名厨Emeril Lagasse 以及哈佛大学是如何使用这款小工具的。然后,您可以试着在这里创建自己的路线小工具。这款小工具提供 23 种语言版本,可供美国境外多个国家地区的用户使用。