0
点赞
收藏
分享

微信扫一扫

Python+django网页设计入门(9):自定义反爬虫功能


前导课程:

Python+django网页设计入门(8):网站项目文件夹布局

Python+django网页设计入门(7):常用ORM操作

Python+django网页设计入门(6):文件上传与数据导入

Python+django网页设计入门(5):自定义用户注册与登录功

Python+django网页设计入门(4):用户登录与登录验证

Python+django网页设计入门(3):使用SQLite数据库

技术要点:

1)识别请求来自浏览器还是来自爬虫程序,根据不同的访问方式给出不同的响应。

2)获取客户端IP地址并限制其访问时间间隔,如果来自爬虫程序,则多次访问之间的间隔会很短,判断这种情况并给出相应的响应。

3)使用自定义修饰器实现代码复用。

===================

1、修改questions应用的views.py文件,导入time标准库中的time()函数,并定义修饰器函数isCraw()。

Python+django网页设计入门(9):自定义反爬虫功能_python

2、把定义的修饰器作用到相应的视图函数上,以登录界面为例。

Python+django网页设计入门(9):自定义反爬虫功能_django_02

3、执行命令,运行网站,使用浏览器打开登录界面,一切正常。

Python+django网页设计入门(9):自定义反爬虫功能_django_03

4、使用Python模块urllib编写简单爬虫程序,尝试读取登录界面信息,失败。

Python+django网页设计入门(9):自定义反爬虫功能_编程语言_04

5、修改程序,伪装浏览器访问登录页面,成功。

Python+django网页设计入门(9):自定义反爬虫功能_编程语言_05

6、进一步修改爬虫程序,连续多次读取登录页面,第一次成功,后面失败。

Python+django网页设计入门(9):自定义反爬虫功能_软件测试_06


--------董付国老师Python系列图书--------

1)《Python程序设计(第2版)》清华大学出版社(2018年8月第9次印刷)

2)《Python可以这样学》清华大学出版社(2018年7月第6次印刷)(本书已在台湾发行繁体版)

3)《Python程序设计基础(第2版)》清华大学出版社(2018年9月第6次印刷)

4)《中学生可以这样学Python》清华大学出版社(2018年9月第3次印刷)

5)《Python程序设计开发宝典》清华大学出版社(2018年2月第3次印刷)

6)《玩转Python轻松过二级》清华大学出版社(2018年7月第3次印刷)

7)《Python程序设计基础与应用》机械工业出版社(2018年9月第1次印刷)

8)《Python程序设计实验指导书》清华大学出版社(预计2019年1月出版)

9)《Python编程基础与案例集锦(中学版)》机械工业出版社(预计2019年2月出版)

董老师127课免费视频地址: https://pan.baidu.com/s/1jJeAs8Q 密码: px59

举报

相关推荐

0 条评论