Qt中QFtp获取带有中文的文件名称出现乱码的解决方法


今天研究了一下QFtp这个类,发现访问得到的文件名称中一旦出现中文,不管怎么转换编码格式,最终显示出来的始终都是乱码。于是我深入地对这一现象进行了研究。这里先简单介绍一下我的分析过程:

FTP服务器在收到List指令后,会把当前文件夹的所有项目(包括文件夹和文件的名称,大小,时间,所有者等相关信息)列举出来并返回给FTP客户端。曾经在网上看到有人说过这样一句话:“ftp 在编码问题上相当笨,笨到对编码一无所知”。确实,多数FTP服务器在返回这些名称时采用的文字编码格式为ANSI。这是一个不太好的格式,英文字符占用一个字节存储空间,非英文字符占用两个字节存储空间,长度不一致。而Qt的默认文本编码采用的UTF-16(是么?这里不太肯定,反正从实验得到的数据来看至少是这样的)。即每个字符占据两个字节的存储空间。当QFtp从FTP服务器获取到当前目录下的项目信息时,名称部分直接粗暴地一个个地拆分成了UTF-16格式,并认为这些数据就是UTF-16格式的数据。那么当然不管你如何对其进行转换,数据本身都是错的,又怎么会得到正确的中文显示呢?所以,我们需要对这些数据进行特别的整理。

今天先写到这里,做个记号。过两天会写出详细的解决办法。

项目忙完了,下面贴出解决方法。

由于编码错误,我写了两个函数用于互相转换编码。

一个是由正常编码转为QFTP上所谓的“乱码”的:QString _ToSpecialEncoding(const QString &InputStr);

另一个是由QFTP乱码转换为正常编码的:QString _FromSpecialEncoding(const QString &InputStr);

需要注意的是,使用这个函数之前,你的应用程序应该在界面上能正常显示中文。我是这样来实现的:

在main函数中,QApplication app...下一行写如下代码:

QTextCodec::setCodecForTr(QTextCodec::codecForName("GBK"));

QTextCodec::setCodecForLocale(QTextCodec::codecForName("GBK"));

QTextCodec::setCodecForCStrings(QTextCodec::codecForName("GBK"));

转换函数实现:

  1. QString TFTPCommunicator::_FromSpecialEncoding(const QString &InputStr)   
  2. {   
  3.     QString TempResult;   
  4.     //1.提取数据   
  5.     size_t InStrBufSize= InputStr.size()*sizeof(QChar);   
  6.     char* InStrBuf= (char*)malloc(InStrBufSize);   
  7.     if (InStrBuf==NULL)   
  8.     {   
  9.         return TempResult;   
  10.     }   
  11.     memcpy(InStrBuf, InputStr.data(), InStrBufSize);   
  12.     //2.拆分数据   
  13.     size_t i;  
  14. #if Q_BYTE_ORDER==Q_LITTLE_ENDIAN   
  15.     //小端对齐下(基于Intel的x86架构)   
  16.     //原始数据下标 0 2 4 6 8 10   
  17.     //修复数据下标 0 1 2 3 4 5   
  18.     i= 0;   
  19.     for (i=0; i<InStrBufSize; i=i+2)   
  20.     {   
  21.         InStrBuf[i>>1]=InStrBuf[i];   
  22.     }   
  23.     memset(InStrBuf+ (i>>1), 0, i>>1);  
  24. #else   
  25.     //大端对齐下   
  26.     //原始数据下标 1 3 5 7 9   
  27.     //修复数据下标 0 1 2 3 4   
  28.     i= 1;   
  29.     for (i=1; i<=InStrBufSize; i=i+2)   
  30.     {   
  31.         InStrBuf[(i-1)>>1]=InStrBuf[i];   
  32.     }   
  33.     memset(InStrBuf+ ((i-1)>>1), 0, (i-1)>>1);  
  34. #endif   
  35.     //3.数据重新组装   
  36.     TempResult= TempResult.fromAscii(InStrBuf);   
  37.     free(InStrBuf);   
  38.     return TempResult;   
  39. }   
  40. //=============================================================================   
  41. QString TFTPCommunicator::_ToSpecialEncoding(const QString &InputStr)   
  42. {   
  43.     QString TempResult;   
  44.     //1.提取数据   
  45.     size_t InStrBufSize= InputStr.toAscii().size();   
  46.     char* InStrBuf= (char*)malloc(InStrBufSize);//= InputStr.toAscii().data();   
  47.     memset(InStrBuf, 0, InStrBufSize);   
  48.     if (InStrBuf==NULL)   
  49.     {   
  50.         return TempResult;   
  51.     }   
  52.     memcpy(InStrBuf, InputStr.toAscii().constData(), InStrBufSize);   
  53.     //2.建立输出缓冲   
  54.     //输出缓冲大小要比Ascii字节*2后多两个字节 用于标识输出字符串结尾   
  55.     size_t OutStrBufSize= (InStrBufSize+1)*sizeof(QChar);   
  56.     quint16* OutStrBuf= (quint16*)malloc(OutStrBufSize);   
  57.     if (OutStrBuf==NULL)   
  58.     {   
  59.         return TempResult;   
  60.     }   
  61.     memset(OutStrBuf, 0, OutStrBufSize);   
  62.     //3.重新编码   
  63.     size_t i= 0;   
  64.     for(i= 0; i<InStrBufSize; i++)   
  65.     {   
  66.         OutStrBuf[i]=(quint8)InStrBuf[i];   
  67.     }   
  68.     //4.数据重新组装   
  69.     TempResult= QString::fromUtf16(OutStrBuf);   
  70.     free(InStrBuf);   
  71.     free(OutStrBuf);   
  72.     return TempResult;   
  73. }  

当使用QFTP的put方法上传的时候,目标文件名参数的位置使用_ToSpecialEncoding(正常编码的字符串);

当使用QFTP的get方法下载的时候,目标文件名参数位置也使用上述函数

当使用QFTP遍历到的文件作为本地文件名时须使用_FromSpecialEncoding(错误编码的字符串);

以上代码在Windows XP SP3 + IIS 测试通过。FTP服务器设置使用ASCII编码的也可通过。

相关内容