揭秘robot.txt文件

四月 20, 2015 Views
Comments 0

揭秘robot.txt文件

rotbot.txt文件是网站和网络爬虫之间的一个协议,用来告诉搜索引擎爬虫哪些文件或文件夹是否允许爬虫抓取文件,目的是屏蔽无用的网站信息,节省服务器宽带提高收录。

分为三种情况:

1、不允许所有的爬虫进行抓取:

user-agent:*

Disallow:/

2、不允许谷歌蜘蛛进行抓取:

User-agent:Googlebot

disallow:/

3、不允许抓取某个目录

阅读全文建站教程robot.txt文件  
分页:«1»