Python读取中文字符编码问题


preface:许久没遇到过编码问题,一没注意就被绊倒脚了。。

一、编辑器是以ASICC编码格式的,若想在程序中有中文,需要改为utf-8格式,加入如下代码可破:

import sys 
reload(sys) 
sys.setdefaultencoding('utf8') 

或者参考转载的这篇 ,另外一种方式可破。

二、读取中文文档时,卤主天真的以为字符长度是根据中文长度来着,但是读入后发现是根据字符长度来着,一个中文字长度字符长度为3。发现codecs可破:

import codecs
with codecs.open("XXX.txt", encoding = "utf-8") as f:
    text  =  f.readlines()
for i in text:
    i = i.strip("\n")
    print i,len(i)

无需操作系统直接运行 Python 代码 

CentOS上源码安装Python3.4 

《Python核心编程 第二版》.(Wesley J. Chun ).[高清PDF中文版]

《Python开发技术详解》.( 周伟,宗杰).[高清PDF扫描版+随书视频+代码]

Python脚本获取Linux系统信息

在Ubuntu下用Python搭建桌面算法交易研究环境

Python 语言的发展简史

Python 的详细介绍:请点这里
Python 的下载地址:请点这里

本文永久更新链接地址

相关内容

    暂无相关文章