0
点赞
收藏
分享

微信扫一扫

入门必学的python爬虫教程

对于大多数的人来说,如果在网上发现自己喜欢的图片,然后会一张张的点击保存,或者是快捷键保存,但是有没有想过,如果是成千上万的图片,想想都累。假如一张图片从搜索出来,到点击放大,再到下载,假如以最快速度,中间不间断,那我们来算一下时间,搜索->点击图片->保存最大的图片->点击下载->点击保存。

简单的一套下来,除去搜索,最简单的步骤是4步,每一步算1秒钟,4秒,那就是40000秒,也就是11.1个小时,等下完这些图片,估计已经吐血了,那好,我们在来增加步骤,加上搜索,加上修改名称,网络问题不考虑,那就是6步,6万秒,只是多了两步,却是多了5个多小时,想想那是多痛苦的事。

下面,是传受你武功秘籍的时候了,只要掌握五个步骤,下载分分钟钟的事,还等什么,直接上代码:

import requests#导入两个模块
import re
url=requests.get("需要下载的目标网站")#请求url
url.encoding="utf-8"#编码格式,根据情况指定
url_text=url.text#获取到网页内容
extract=r'<a href="(.*?)" title=".*?">'#正则表达式
img_url=re.findall(extract,url_text)#根据正则表达式提取url
print(img_url)#这里可以打印看一下

然后一个爬虫就完成了,至于后面的操作都是根据这个重复操作得到的,就不一一叙述。


举报

相关推荐

0 条评论