0

点赞

收藏

分享

Python爬虫：使用bs4和xpath，定位网页中的标签/元素，比如a、href这些

mm_tang 2022-02-14 阅读 71

标签: python 爬虫 xpath bs4 视频教程 Python 编程语言

????定位网页中的元素，有两个选择方案：

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.

传送门：BeautifulSoup4官方文档这篇文档介绍了BeautifulSoup4中所有主要特性,并且有小例子.让我来向你展示它适合做什么,如何工作,怎样使用,如何达到你想要的效果,和处理异常情况.

XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

0 条评论

关注