python用requests获取网页源代码为什么中文显示错误?

网友解答: 是不是中文乱码的问题,你先用试试text和content,然后print打印一下信息看看。我以一下代码例子说明一下:注:text返回Unicode类型数据,content返回

网友解答:

是不是中文乱码的问题,你先用试试text和content,然后print打印一下信息看看。我以一下代码例子说明一下:

注:text返回Unicode类型数据,content返回二进制数据。如果出现乱码的化,你可以下打印一下获取页面的编码,看看代码如下:

如果是不支持中文编码的字符,可以自行设置一下,utf-8,gbk,gb2312等都可以,只要支持中文就行,代码如下:

设置好字符编码后,可以先打印一下页面内容,看是否还出现乱码,代码如下:

一般情况下,出现中文乱码的页面并不多,如果真的出现的化,你可以自行设置一下,应该不会在出现乱码的问题,我也是初学pythonp爬虫的知识,发表一下自己的见解,希望能对你有所帮助吧。

网友解答:

Python3的话不需要自己decode

resp = requests.get(url)

如果resp.text乱码的话,这样:

resp.encoding = resp.apparent_encoding

print(resp.text)

可以参考我写过的:https://www.toutiao.com/i6496773720189698573/

标签: