如何禁止浏览器爬虫

 时间:2024-11-01 00:11:57

1、(1)禁止所有搜索引擎访问网站的任何部分。User-agent: *Disallow: /

2、(2)允许所有的robots访问,无任何限制。User-agent: *Disallow:或者User-agent: *Allow: /还可以建立一个空文件robots.txt或者不建立robots.txt。

3、(3)仅禁止某个搜索引擎的访问(例如:百度baiduspider)User-agent: BaiduSpiderDisallow:/

4、(4)允许某个搜索引擎的访问(还是百度)User-agent: BaiduSpiderDisallow:User-agent: *Disallow: /这里需要注意,如果你还需要允许谷歌bot,那么也是在“User-agent: *”前面加上,而不是在“User-agent: *”后面。

5、(5)禁止Spider访问特定目录和特定文件(图片、压缩文件)。User-agent: *Disallow: /AAA.net/Disallow: /admin/Disallow: .jpg$Disallow: .rar$这样写之后,所有搜索引擎都不会访问这2个目录。需要注意的是对每一个目录必须分开说明,而不要写出“Disallow:/AAA.net/ /admin/”。

  • 小黑盒护眼模式怎么开启
  • 京东APP如何快速取消全部商品收藏
  • 怎么卸载win10隐藏程序
  • 关于雷神笔记本电脑一键重装win7的问题教程
  • H5加密加固的三个技巧
  • 热门搜索
    歆是什么意思 什么是旗舰店 couple是什么意思 号虎食是什么字 卫生巾什么牌子好 维生素c哪个牌子好 什么水果含维生素c 真水无香什么意思 无后为大是什么意思 准生证需要什么材料