2023网络爬虫 -- 获取动态加载数据-CFANZ编程社区

2023网络爬虫 -- 获取动态加载数据

1、爬取的网址

http://www.kfc.com.cn/kfccda/storelist/index.aspx

2、要爬取的内容，输入关键字，点击查询，获取餐厅名称和餐厅地址

2023网络爬虫 -- 获取动态加载数据_网络爬虫

3、F12，打开开发者工具，点击查询，抓包

2023网络爬虫 -- 获取动态加载数据_网络爬虫_02

4、点击标头，查看请求网址，是post请求，查看载荷也就是提交的参数

http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword

2023网络爬虫 -- 获取动态加载数据_Powered by 金山文档_03

5、表单数据就是我们要提交的数据

2023网络爬虫 -- 获取动态加载数据_Python_04

6、导入requests包

import requests

7、头和提交的参数

头={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}参数={"cname":"","pid":"","keyword": "河南","pageIndex": "1","pageSize": "10",}

8、要获取的网址

网页="http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword"

9、post请求，提交参数需要data

响应=requests.post(网页,headers=头,data =参数)

10、获取JSON数据

响应内容=响应.json()

11、将数据存储

withopen("kfc.txt","w",encoding="utf-8") as 数据:for i in 响应内容['Table1']:        店名=i['storeName']        地址=i["addressDetail"]        数据.write(店名+"餐厅"+":"+地址+"\n")

12、存储结果

2023网络爬虫 -- 获取动态加载数据_数据_05

0 条评论