当前位置:   article > 正文

Python爬虫处理抓取数据中文乱码问题_python爬虫保存数据时汉字是繁体

python爬虫保存数据时汉字是繁体

乱码原因:
因为你的文件声明为utf-8,并且也应该是用utf-8的编码保存的源文件。但是windows的本地默认编码是cp936,也就是gbk编码,所以在控制台直接打印utf-8的字符串当然是乱码了。

解决方法:
在控制台打印的地方用一个转码就ok了,打印的时候这么写:

print myname.decode('UTF-8').encode('GBK') 
  • 1

比较通用的方法是:

import sys
type = sys.getfilesystemencoding()
print myname.decode('UTF-8').encode(type)
  • 1
  • 2
  • 3
声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号