Qt中QFtp获取带有中文的文件名称出现乱码的解决方法
Qt中QFtp获取带有中文的文件名称出现乱码的解决方法
今天研究了一下QFtp这个类,发现访问得到的文件名称中一旦出现中文,不管怎么转换编码格式,最终显示出来的始终都是乱码。于是我深入地对这一现象进行了研究。这里先简单介绍一下我的分析过程:
FTP服务器在收到List指令后,会把当前文件夹的所有项目(包括文件夹和文件的名称,大小,时间,所有者等相关信息)列举出来并返回给FTP客户端。曾经在网上看到有人说过这样一句话:“ftp 在编码问题上相当笨,笨到对编码一无所知”。确实,多数FTP服务器在返回这些名称时采用的文字编码格式为ANSI。这是一个不太好的格式,英文字符占用一个字节存储空间,非英文字符占用两个字节存储空间,长度不一致。而Qt的默认文本编码采用的UTF-16(是么?这里不太肯定,反正从实验得到的数据来看至少是这样的)。即每个字符占据两个字节的存储空间。当QFtp从FTP服务器获取到当前目录下的项目信息时,名称部分直接粗暴地一个个地拆分成了UTF-16格式,并认为这些数据就是UTF-16格式的数据。那么当然不管你如何对其进行转换,数据本身都是错的,又怎么会得到正确的中文显示呢?所以,我们需要对这些数据进行特别的整理。
今天先写到这里,做个记号。过两天会写出详细的解决办法。
项目忙完了,下面贴出解决方法。
由于编码错误,我写了两个函数用于互相转换编码。
一个是由正常编码转为QFTP上所谓的“乱码”的:QString _ToSpecialEncoding(const QString &InputStr);
另一个是由QFTP乱码转换为正常编码的:QString _FromSpecialEncoding(const QString &InputStr);
需要注意的是,使用这个函数之前,你的应用程序应该在界面上能正常显示中文。我是这样来实现的:
在main函数中,QApplication app...下一行写如下代码:
QTextCodec::setCodecForTr(QTextCodec::codecForName("GBK"));
QTextCodec::setCodecForLocale(QTextCodec::codecForName("GBK"));
QTextCodec::setCodecForCStrings(QTextCodec::codecForName("GBK"));
转换函数实现:
- QString TFTPCommunicator::_FromSpecialEncoding(const QString &InputStr)
- {
- QString TempResult;
- //1.提取数据
- size_t InStrBufSize= InputStr.size()*sizeof(QChar);
- char* InStrBuf= (char*)malloc(InStrBufSize);
- if (InStrBuf==NULL)
- {
- return TempResult;
- }
- memcpy(InStrBuf, InputStr.data(), InStrBufSize);
- //2.拆分数据
- size_t i;
- #if Q_BYTE_ORDER==Q_LITTLE_ENDIAN
- //小端对齐下(基于Intel的x86架构)
- //原始数据下标 0 2 4 6 8 10
- //修复数据下标 0 1 2 3 4 5
- i= 0;
- for (i=0; i<InStrBufSize; i=i+2)
- {
- InStrBuf[i>>1]=InStrBuf[i];
- }
- memset(InStrBuf+ (i>>1), 0, i>>1);
- #else
- //大端对齐下
- //原始数据下标 1 3 5 7 9
- //修复数据下标 0 1 2 3 4
- i= 1;
- for (i=1; i<=InStrBufSize; i=i+2)
- {
- InStrBuf[(i-1)>>1]=InStrBuf[i];
- }
- memset(InStrBuf+ ((i-1)>>1), 0, (i-1)>>1);
- #endif
- //3.数据重新组装
- TempResult= TempResult.fromAscii(InStrBuf);
- free(InStrBuf);
- return TempResult;
- }
- //=============================================================================
- QString TFTPCommunicator::_ToSpecialEncoding(const QString &InputStr)
- {
- QString TempResult;
- //1.提取数据
- size_t InStrBufSize= InputStr.toAscii().size();
- char* InStrBuf= (char*)malloc(InStrBufSize);//= InputStr.toAscii().data();
- memset(InStrBuf, 0, InStrBufSize);
- if (InStrBuf==NULL)
- {
- return TempResult;
- }
- memcpy(InStrBuf, InputStr.toAscii().constData(), InStrBufSize);
- //2.建立输出缓冲
- //输出缓冲大小要比Ascii字节*2后多两个字节 用于标识输出字符串结尾
- size_t OutStrBufSize= (InStrBufSize+1)*sizeof(QChar);
- quint16* OutStrBuf= (quint16*)malloc(OutStrBufSize);
- if (OutStrBuf==NULL)
- {
- return TempResult;
- }
- memset(OutStrBuf, 0, OutStrBufSize);
- //3.重新编码
- size_t i= 0;
- for(i= 0; i<InStrBufSize; i++)
- {
- OutStrBuf[i]=(quint8)InStrBuf[i];
- }
- //4.数据重新组装
- TempResult= QString::fromUtf16(OutStrBuf);
- free(InStrBuf);
- free(OutStrBuf);
- return TempResult;
- }
当使用QFTP的put方法上传的时候,目标文件名参数的位置使用_ToSpecialEncoding(正常编码的字符串);
当使用QFTP的get方法下载的时候,目标文件名参数位置也使用上述函数
当使用QFTP遍历到的文件作为本地文件名时须使用_FromSpecialEncoding(错误编码的字符串);
以上代码在Windows XP SP3 + IIS 测试通过。FTP服务器设置使用ASCII编码的也可通过。
评论暂时关闭