Python中文的编码和解码

print type("join输出list_a")
print type(u"join输出list_a")
list_b = (u"中文", "中文带u", "abc", "12.3")
list_a = ("中文", "中文带u", "abc", "12.3")
#一个元素有u,全部变成unicode,在同一个tuple中的才有效果
print u"join输出list_a",
print " ".join(list_a)
print u"join输出list_b",
print " ".join(list_b)
print u"直接输出list_a:",
print list_a
print u"直接输出list_b:",
print list_b
print list_a[0].decode("utf8")
print list_b[0].decode("utf8")
print list_a[0].encode("gbk")
print list_b[0].encode("gbk")
print list_a[0].encode("utf8")
print list_b[0].encode("utf8")
print list_a[0].encode("raw_unicode_escape")
print list_b[0].encode("raw_unicode_escape")

没有加u的默认编码是文件编码,这里是utf-8。需要先解码。使用gbk解码,会出现错误。
加u的是unicode编码。
控制台是gbk编码。


捕获1.PNG
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容