0
点赞
收藏
分享

微信扫一扫

网络爬虫中这种请求格式怎么解析?


曲径通幽处,禅房花木深。

大家好,我是皮皮。

一、前言

前几天在Python钻石交流群【花间一壶酒】问了一个Python网络爬虫的问题,这里拿出来给大家分享下。


网络爬虫中这种请求格式怎么解析?_python

截图如下:


网络爬虫中这种请求格式怎么解析?_python_02

看上去有加密参数:


网络爬虫中这种请求格式怎么解析?_开发语言_03

使用爬虫工具得到的结果不是预期的。


网络爬虫中这种请求格式怎么解析?_字符串_04

二、实现过程

这里【吴大佬】给了一个思路,使用selenium可以搞定,代码如下:

from selenium import webdriver
from selenium.webdriver.common.by import By

url = 'http://ggzyjy.baiyin.gov.cn/InfoPage/TradeInfomation.aspx?state=3'
browser = webdriver.Chrome()
browser.get(url)

li_list = browser.find_elements(By.XPATH, '//ul[@id="tradMainWrap"]/li')
for li in li_list:
    url_detail = li.find_element(By.XPATH, './a').get_attribute('href')
    print(url_detail)


网络爬虫中这种请求格式怎么解析?_字符串_05

顺利地解决了粉丝的问题。

后来【甯同学】经验丰富,看出了代码的问题,给了一个提示,入下图所示。


网络爬虫中这种请求格式怎么解析?_Python_06

将请求的字典,修改为字符串,然后就出来对应的请求结果了,真是太强了!

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python网络爬虫的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【花间一壶酒】提问,感谢【吴大佬】和【甯同学】给出的思路和代码解析,感谢【eric】、【未央.】等人参与学习交流。


举报

相关推荐

0 条评论