当前位置:首页 >> 新闻内容
网站robots.txt使用中常见的误区
来源:本站 | 作者:Shop7z编辑部 | 发布时间:2014/2/25 

    

  前几天写了robots.txt的规则误区并介绍百度和Google的robots工具的使用,介绍了几个robots.txt文件的规则的误区,然后发现其实不止那些,还有很多大家没有注意的误区。

  今天重新列举一下常见的robots.txt实际使用中的误区:

  误区1.Allow包含的范围超过Disallow,并且位置在Disallow前面。

  比如有很多人这样写:

  User-agent: *

  Allow: /

  Disallow: /mulu/

  想让所有蜘蛛抓取本站除/mulu/下面的url之外的所有页面,禁止抓取/mulu/下面的所有url。

  搜索引擎蜘蛛执行的规则是从上到下,这样会造成第二句命令失效。也就是说禁止抓取/mulu/目录这条规则是无效的。正确的是Disallow应该在Allow之上,这样才会生效。

  误区2.Disallow命令和Allow命令之后没有以斜杠”/”开头。

  这个也很容易被忽视,比如有人这样写Disallow: 123.html ,这种是没有效果的。斜杠”/”表示的是文件对于根目录的位置,如果不带的话,自然无法判断url是哪个,所以是错误的。

  正确的应该是Disallow: /123.html,这样才能屏蔽/123.html这个文件,这条规则才能生效。

  误区3.屏蔽的目录后没有带斜杠”/”。

  也就是比如想屏蔽抓取/mulu/这个目录,有些人这样写Disallow: /mulu。那么这样是否正确呢?

  首先这样写(Disallow: /mulu)确实可以屏蔽/mulu/下面的所有url,不过同时也屏蔽了类似/mulu123.html这种开头为/mulu的所有页面,效果等同于Disallow: /mulu*。

  正确的做法是,如果只想屏蔽目录,那么必须在结尾带上斜杠”/”。

  转载请注明来自逍遥博客,本文地址:http://liboseo.com/1193.html

 Shop7z网上购物系统
 最新资讯
Shop7z终极版:全站百分百采用纯html5/CSS/CSS3代码开发,代码集简洁与大气于一身,系统集合了Shop7z其他各版本优势于一体,高端大气,适合各行业开店。
Shop7z至尊版:集众家之所长,大气超美观页面于一体,采用宽屏版面设计开发,美观大气、动感时尚!宽屏版购物系统适合各行各业的网上开店需求
Shop7z多用户版:集"网上商城+用户开店"的完美模式!支持商家加盟,强大的店铺功能,独立的商家后台及结算,欢迎亲们测试!
Shop7z旗舰版:Shop7z旗舰版功能强大性能稳定,均支持商品组合套餐+限时抢购秒杀+不同规格不同价格+淘定数据包导入等功能!
 热点咨询
 推荐文章
 联系方式
工作时间: 早上9:00 - 21:00 (全年无休)
在线客服:275084681 81447933 
联系电话:0311-85315152 13102887321
电子邮件:Shop7z@126.com
工作期间推荐QQ联系,第一时间回复信息。
 首 页 | 购物系统 | 查看如何购买?如何建立网站? | 成功案例 | 常见问题/支持 | 网站合作 | 空间、域名 | 版权声明 | 新闻中心 | 关于我们
Shop7z网上购物系统在线客服:    275084681 客服QQ二:  81447933     客服电话:13102887321 0311-85315152
软件著作权证书登记号:2014SR001852 软著登字第0671096号     软件著作权证书登记号:2018SR956050 软著登字第3285145号
服务电话:0311-85315152    手机:131 0288 7321 (节假日不休)
地址:河北省石家庄市中山东路乐汇城A座A-1501#  邮政编码:050051
E-mail:Shop7z@126.com  275084681@qq.com (推荐邮箱)
CopyRight Shop7z.com版权所有 2004-2024 All Rights Reserved.冀ICP备19029961号-4
微信:
友情链接:
5vShop电商系统Shop7z购物系统网趣网上购物系统Asp微信支付中国站长站 源码素材网Admin5源码Asp300源码