入门必学的python爬虫教程-CFANZ编程社区

入门必学的python爬虫教程

对于大多数的人来说，如果在网上发现自己喜欢的图片，然后会一张张的点击保存，或者是快捷键保存，但是有没有想过，如果是成千上万的图片，想想都累。假如一张图片从搜索出来，到点击放大，再到下载，假如以最快速度，中间不间断，那我们来算一下时间，搜索->点击图片->保存最大的图片->点击下载->点击保存。

简单的一套下来，除去搜索，最简单的步骤是4步，每一步算1秒钟，4秒，那就是40000秒，也就是11.1个小时，等下完这些图片，估计已经吐血了，那好，我们在来增加步骤，加上搜索，加上修改名称，网络问题不考虑，那就是6步，6万秒，只是多了两步，却是多了5个多小时，想想那是多痛苦的事。

下面，是传受你武功秘籍的时候了，只要掌握五个步骤，下载分分钟钟的事，还等什么，直接上代码：

import requests#导入两个模块
import re
url=requests.get("需要下载的目标网站")#请求url
url.encoding="utf-8"#编码格式，根据情况指定
url_text=url.text#获取到网页内容
extract=r'<a href="(.*?)" title=".*?">'#正则表达式
img_url=re.findall(extract,url_text)#根据正则表达式提取url
print(img_url)#这里可以打印看一下

然后一个爬虫就完成了，至于后面的操作都是根据这个重复操作得到的，就不一一叙述。

0 条评论