0
点赞
收藏
分享

微信扫一扫

【四二学堂】BeautifulSoup库的对象


BeautifulSoup库的对象

Beautiful库用于将一个复杂的HTML文档转换成一个复杂的树形结构,每个节点都是一个Python对象,根据功能划分,将BeautifulSoup库的对象可分为4类。包括Tag、NavigableString、BeautifulSoup、Comment。

Tag

Tag相当于HTML中的一个标签:

【四二学堂】BeautifulSoup库的对象_python


【四二学堂】BeautifulSoup库的对象_HTML_02


关于Tag,有name和attrs两个重要的属性,使用方法分别如下。1)name:标签本身的名字

2)attrs:每个Tag对象的attrs属性就是一个字典,包含了标签的全部属性。

【四二学堂】BeautifulSoup库的对象_HTML_03


NavigableString

用于获取标签内部文字。具体用法如下:

【四二学堂】BeautifulSoup库的对象_python_04


【四二学堂】BeautifulSoup库的对象_HTML_05


BeautifulSoup

BeautifulSoup对象表示的是一个文档的全部内容。大部分时候,可以把它当作Tag对象,是一个特殊的Tag,我们可以分别取它的名称、类型以及属性。

【四二学堂】BeautifulSoup库的对象_爬虫_06


【四二学堂】BeautifulSoup库的对象_树形结构_07


Comment

Comment对象是一个特殊类型的NavigableString对象。

【四二学堂】BeautifulSoup库的对象_爬虫_08

将加上注释,我们来看一下。

【四二学堂】BeautifulSoup库的对象_示例代码_09


【四二学堂】BeautifulSoup库的对象_示例代码_10


由上述示例代码运行结果可知,其注释输出只显示其中的内容。


举报

相关推荐

0 条评论