python用requests获取网页源代码为什么中文显示错误?
网友解答: 是不是中文乱码的问题,你先用试试text和content,然后print打印一下信息看看。我以一下代码例子说明一下:注:text返回Unicode类型数据,content返回
是不是中文乱码的问题,你先用试试text和content,然后print打印一下信息看看。我以一下代码例子说明一下:
注:text返回Unicode类型数据,content返回二进制数据。如果出现乱码的化,你可以下打印一下获取页面的编码,看看代码如下:
如果是不支持中文编码的字符,可以自行设置一下,utf-8,gbk,gb2312等都可以,只要支持中文就行,代码如下:
设置好字符编码后,可以先打印一下页面内容,看是否还出现乱码,代码如下:
一般情况下,出现中文乱码的页面并不多,如果真的出现的化,你可以自行设置一下,应该不会在出现乱码的问题,我也是初学pythonp爬虫的知识,发表一下自己的见解,希望能对你有所帮助吧。
网友解答:Python3的话不需要自己decode
resp = requests.get(url)
如果resp.text乱码的话,这样:
resp.encoding = resp.apparent_encoding
再
print(resp.text)
可以参考我写过的:https://www.toutiao.com/i6496773720189698573/