0
点赞
收藏
分享

微信扫一扫

Web安全学习积累1

悄然丝语 2022-04-15 阅读 65
web安全

1.robots.txt(robots协议)(统一小写)

        robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。即,Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots ExclusionProtocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。

         robots协议用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:图片,音乐,视频等,节省服务器带宽;可以屏蔽站点的一些死链接。方便搜索引擎抓取网站内容;设置网站地图连接,方便引导蜘蛛爬取页面。

例如:某宝的robots.txt文件

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5omY54mp6KiA5b-X,size_10,color_FFFFFF,t_70,g_se,x_16

表示:禁止baiduspider爬所有目录

(具体详细的解读待后续学习)

 

2 web的备份文件

index.php下的备份文件后缀常有 ‘.bak’ 和 ‘.~’

再经过百度得知有‘.git’ __'.swp'__'.bash_history'__'.bkf'__'.svn'

 

 

举报

相关推荐

0 条评论