python用requests获取网页源代码为什么中文显示错误？

2018-10-11

1506

网友解答: 是不是中文乱码的问题，你先用试试text和content，然后print打印一下信息看看。我以一下代码例子说明一下：注：text返回Unicode类型数据，content返回

网友解答:

是不是中文乱码的问题，你先用试试text和content，然后print打印一下信息看看。我以一下代码例子说明一下：

注：text返回Unicode类型数据，content返回二进制数据。如果出现乱码的化，你可以下打印一下获取页面的编码，看看代码如下：

如果是不支持中文编码的字符，可以自行设置一下，utf-8,gbk,gb2312等都可以，只要支持中文就行，代码如下：

设置好字符编码后，可以先打印一下页面内容，看是否还出现乱码，代码如下：

一般情况下，出现中文乱码的页面并不多，如果真的出现的化，你可以自行设置一下，应该不会在出现乱码的问题，我也是初学pythonp爬虫的知识，发表一下自己的见解，希望能对你有所帮助吧。

网友解答:

Python3的话不需要自己decode

resp = requests.get(url)

如果resp.text乱码的话，这样：

resp.encoding = resp.apparent_encoding

再

print(resp.text)

可以参考我写过的：https://www.toutiao.com/i6496773720189698573/

相关推荐