那小那小

关注

Python爬虫:使用lxml解析网页内容

那小那小

关注

阅读 35

2022-02-17


安装

pip install lxml

代码示例

from lxml import etree

text = """
<html>
<head>
<title>这是标题</title>
</head>
<body>
<div>这是内容</div>
</body>
</html>"""

html = etree.HTML(text)

# 使用xpath解析
titles = html.xpath("//title")
for title in titles:
print(title.text)

# 使用css解析
titles = html.cssselect("title")
for title in titles:
print(title.text)



相关推荐

墨春

Python 爬虫基础:利用 BeautifulSoup 解析网页内容

墨春 18 0 0

皮皮球场

使用爬虫抓取网页内容

皮皮球场 43 0 0

ITWYY

Python 爬虫爬不到内容如何检查网页解析情况?

ITWYY 124 0 0

夕阳孤草

【Java爬虫】008-网页内容解析:JSON解析

夕阳孤草 125 0 0

无愠色

网页解析之lxml与xpath

无愠色 16 0 0

岛上码农

使用BeautifulSoup解析网页内容

岛上码农 67 0 0

陆公子521

Python 操作 lxml库与Xpath(爬取网页指定内容)

陆公子521 64 0 0

小暴龙要抱抱

python爬虫(一)BeautifulSoup解析网页

小暴龙要抱抱 79 0 0

婉殇成长笔记

Python爬虫:pyquery模块解析网页

婉殇成长笔记 62 0 0

萍儿的小确幸

python-爬虫-自带库抓取网页内容

萍儿的小确幸 64 0 0

精彩评论(0)

0 0 举报