BeautifulSoup库的对象
Beautiful库用于将一个复杂的HTML文档转换成一个复杂的树形结构,每个节点都是一个Python对象,根据功能划分,将BeautifulSoup库的对象可分为4类。包括Tag、NavigableString、BeautifulSoup、Comment。
Tag
Tag相当于HTML中的一个标签:
关于Tag,有name和attrs两个重要的属性,使用方法分别如下。1)name:标签本身的名字
2)attrs:每个Tag对象的attrs属性就是一个字典,包含了标签的全部属性。
NavigableString
用于获取标签内部文字。具体用法如下:
BeautifulSoup
BeautifulSoup对象表示的是一个文档的全部内容。大部分时候,可以把它当作Tag对象,是一个特殊的Tag,我们可以分别取它的名称、类型以及属性。
Comment
Comment对象是一个特殊类型的NavigableString对象。
将加上注释,我们来看一下。
由上述示例代码运行结果可知,其注释输出只显示其中的内容。