网络爬虫中这种请求格式怎么解析？-CFANZ编程社区

网络爬虫中这种请求格式怎么解析？

今

日

鸡

汤

曲径通幽处，禅房花木深。

大家好，我是皮皮。

一、前言

前几天在Python钻石交流群【花间一壶酒】问了一个Python网络爬虫的问题，这里拿出来给大家分享下。

网络爬虫中这种请求格式怎么解析？_python

截图如下：

网络爬虫中这种请求格式怎么解析？_python_02

看上去有加密参数：

网络爬虫中这种请求格式怎么解析？_开发语言_03

使用爬虫工具得到的结果不是预期的。

网络爬虫中这种请求格式怎么解析？_字符串_04

二、实现过程

这里【吴大佬】给了一个思路，使用selenium可以搞定，代码如下：

from selenium import webdriver
from selenium.webdriver.common.by import By

url = 'http://ggzyjy.baiyin.gov.cn/InfoPage/TradeInfomation.aspx?state=3'
browser = webdriver.Chrome()
browser.get(url)

li_list = browser.find_elements(By.XPATH, '//ul[@id="tradMainWrap"]/li')
for li in li_list:
    url_detail = li.find_element(By.XPATH, './a').get_attribute('href')
    print(url_detail)

网络爬虫中这种请求格式怎么解析？_字符串_05