那小那小

关注

Python爬虫:使用lxml解析网页内容

那小那小

关注

阅读 30

2022-02-17


安装

pip install lxml

代码示例

from lxml import etree

text = """
<html>
<head>
<title>这是标题</title>
</head>
<body>
<div>这是内容</div>
</body>
</html>"""

html = etree.HTML(text)

# 使用xpath解析
titles = html.xpath("//title")
for title in titles:
print(title.text)

# 使用css解析
titles = html.cssselect("title")
for title in titles:
print(title.text)



相关推荐

墨春

Python 爬虫基础:利用 BeautifulSoup 解析网页内容

墨春 12 0 0

皮皮球场

使用爬虫抓取网页内容

皮皮球场 39 0 0

ITWYY

Python 爬虫爬不到内容如何检查网页解析情况?

ITWYY 123 0 0

无愠色

网页解析之lxml与xpath

无愠色 15 0 0

夕阳孤草

【Java爬虫】008-网页内容解析:JSON解析

夕阳孤草 122 0 0

岛上码农

使用BeautifulSoup解析网页内容

岛上码农 66 0 0

陆公子521

Python 操作 lxml库与Xpath(爬取网页指定内容)

陆公子521 44 0 0

小暴龙要抱抱

python爬虫(一)BeautifulSoup解析网页

小暴龙要抱抱 77 0 0

婉殇成长笔记

Python爬虫:pyquery模块解析网页

婉殇成长笔记 56 0 0

萍儿的小确幸

python-爬虫-自带库抓取网页内容

萍儿的小确幸 63 0 0

精彩评论(0)

0 0 举报