python 爬虫之URLlib之request.Request-CFANZ编程社区

python 爬虫之URLlib之request.Request

才德的女子 2022-04-05 阅读 200

request.Request用于请求页面数据数据，与urlopen函数相比，功能更强大，可以带参数。比如头文件请求。

函数原型：

urllib.request.Request(url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None)

url   要请求的url
data   data必须是bytes(字节流）类型，如果是字典，可以用urllib.parse模块里的urlencode()编码
headers   headers是一个字典类型，是请求头。可以在构造请求时通过headers参数直接构造，也可以通过调用请求实例的add_header()方法添加。可以通过请求头伪装浏览器，默认User-Agent是Python-urllib。要伪装火狐浏览器，可以设置User-Agent为Mozilla/5.0 (x11; U; Linux i686) Gecko/20071127 Firefox/2.0.0.11
origin_req_host   指定请求方的host名称或者ip地址
unverifiable   设置网页是否需要验证，默认是False，这个参数一般也不用设置。
method   method是一个字符串，用来指定请求使用的方法，比如GET，POST和PUT等。

from urllib import request

headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 			(KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
}

rq = request.Request('https://www.baidu.com/',headers=headers)


resp = request.urlopen(rq)

print(resp.read())

0 条评论