0
点赞
收藏
分享

微信扫一扫

python爬虫解析工具BeautifulSoup(bs4)和CSS选择器——处理HTML和XML数据(7)

Python百事通 2024-09-23 阅读 1

文章目录

1、BeautifulSoup

1.1 常用解析器

解析器 使用方法 优势 劣势
Python标准库 BeautifulSoup(markup, “html.parser”) Python的内置标准库、执行速度适中 、文档容错能力强 Python 2.7.3 or 3.2.2)前的版本中文容错能力差
lxml HTML 解析器 BeautifulSoup(markup, “lxml”) 速度快、文档容错能力强 需要安装C语言库
lxml XML 解析器 BeautifulSoup(markup, “xml”) 速度快、唯一支持XML的解析器 需要安装C语言库
html5lib
举报

相关推荐

0 条评论