错误内容

直接使用以下代码获取内容

import requests

# url = '你的url地址'
url = 'http://www.piaofang.biz/'
response = requests.get(url)
print(response.text)

会出现中文是乱码的情况：
在这里插入图片描述

错误分析

在获取网页源代码时如果不指定页面所对应的编码格式就会出现中文是乱码的情况，这时需要找到页面所所对应的编码格式
居然：怎么找页面所对应的编码格式啊
hacker：我来教你一种最简单的方法

在这里插入图片描述

解决方案

改正后的代码如下：

import requests

# url = '你的url地址'
url = 'http://www.piaofang.biz/'
response = requests.get(url)
response.encoding = 'gbk'
print(response.text)

在这里插入图片描述

扩展知识(非常好用)

我们需要人为的去判断页面的编码格式，其实，我们有一个更智能的方法可以解决该问题，就是直接通过代码去获取当前页面的编码即可，代码如下：

import requests

# url = '你的url地址'
url = 'http://www.piaofang.biz/'
response = requests.get(url)
# apparent_encoding是从网页的响应内容分析编码的方式(更加intelligence智能)
response.encoding = response.apparent_encoding
print(response.text)

在这里插入图片描述

0 条评论