0
点赞
收藏
分享

微信扫一扫

Java 的多线程和并发处理,在项目中是如何使用它?

ZMXQQ233 2024-06-22 阅读 30

python爬取飞卢小说网免费小说

一、爬取流程介绍

首先看一下我们需要爬取的飞卢小说网的免费小说《全民:开局邀请光头强挑战只狼》网址,如下图所示:
在这里插入图片描述
点击第一章,按F12键打开浏览器开发者工具,再点击开发者工具左上角的小箭头,找到小说内容在网页中所在的位置,如下图所示:
在这里插入图片描述
可以看到,在具体的章节中,小说内容均在一个class="noveContent readline"的标签下,先构造一个函数,用于获取章节页的小说文本内容,使用的是BeautifulSoup库提取数据,再用正则表达式替换掉不需要的内容,代码如下:

def get_content(url):
    r = requests.get
举报

相关推荐

0 条评论