0
点赞
收藏
分享

微信扫一扫

Python爬虫:使用bs4和xpath,定位网页中的标签/元素,比如a、href这些

​​ ​​​ ​​​ ​​​ ​​​ ​​​ ​​​ ​​

????定位网页中的元素,有两个选择方案:
  1. Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.


传送门:​​BeautifulSoup4官方文档​​ 这篇文档介绍了BeautifulSoup4中所有主要特性,并且有小例子.让我来向你展示它适合做什么,如何工作,怎样使用,如何达到你想要的效果,和处理异常情况.


  1. XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。




举报

相关推荐

0 条评论