VIM 中文乱码解决方法


我刚来公司的时候,发现公司的 Linux 开发环境没有配置中文,因为绝大多数同事都是在 VC/SourceInsight/UltraEdit上编辑后sz到服务器上编译,所以没人在意这个问题。而我习惯于在 vim 下直接写代码,很不习惯,就搞了一下。

首先让 vim 支持中文,这个修改配置即可,但是没想到后来那么麻烦。

一开始尝试统一设置为 en_US.UTF-8,SecureCRT 的编码也设置为 UTF-8,vim 好了,但是 cat 和 more GB 编码的文件时会乱码。

设置为 en_US.ISO8859-1,cat 和 more 好了,vim 又不行了。

很奇怪 vim 的 fileencoding 里面设置了检测中文的选项,

set fileencodings=utf-8-bom,ucs-bom,utf-8,cp936,gb18030,ucs,big5

为什么不起作用呢?后来明白了 UTF-8 本身能够兼容中文,所以 vim 不管语言是不是中文,vim 都会进行中文的检测,而语言设置为 en_US,编码不是 UTF-8 的时候,则认为环境不支持中文,直接忽略 fileencodings 里的cp936,gb18030等中文编码。

这就好办了。

因为我们的系统大部分还都是 GB 编码,而 cat 和 more 又不会进行编码的自动识别和转换。但是 vim 会,因此就委屈一下 vim,全局依然用 GB 编码。

具体操作:

编辑 ~/.profile,加入:

export LC_CTYPE=zh_CN.GB18030

编辑 ~/.vimrc,确认含有:

set fileencodings=utf-8-bom,ucs-bom,utf-8,cp936,gb18030,ucs,big5

这个顺序比较好,能准确识别的优先放前面。

然后 vim 就能正确识别中文了,不会出现乱码和半个汉字的问题。

如果要全中文,就用:

export LC_ALL=zh_CN.GB18030

取代

export LC_CTYPE=zh_CN.GB18030

这样终端的错误信息和gcc错误信息都是中文的了,cat 和 more GB 编码的文件也很正常了。

这个问题涉及到好几个方面:文件本身的编码终端的语言vim的中文支持vim的编码检测转换和输出SecureCRT的编码

所以实际上还是挺复杂的,一环错了都出不来效果。

现在编码问题算是比较完美地解决了,生活真美好……

相关内容