utf8+bom格式保存php curl乱码问题


今天开发遇到一个php curl取数据乱码问题

不是gzip也不是编码设置问题

最后有一同事判断为utf8+bom保存数据原因,懒得深入了解utf8+bom,仅做记录

[root@centos5 ~]# curl -s http:
  ef bb bf 3c   4f          6d  ||
  6c     4c      2d 2f 2f     |l PUBLIC 
  2f 2f         4d 4c   2e    |
     6e      6f 6e  6c 2f 2f  4e  |Transitional
         3a  2f 2f    2e    | http:
  2e 6f   2f   2f     6d 6c  2f   |.org/TR/xhtml1/D|
    2f    6d 6c   2d    6e    |TD/xhtml1-transi|
    6f 6e  6c 2e      3e 0d 0a        |tional.dtd
~]# curl -s http:
  ef bb bf                                        |...|

~]# curl -s http: ef bb bf 3c 4f 6d || 6c 4c 2d 2f 2f |l PUBLIC 2f 2f 4d 4c 2e | 6e 6f 6e 6c 2f 2f 4e |Transitional 3a 2f 2f 2e | http: 2e 6f 2f 2f 6d 6c 2f |.org/TR/xhtml1/D| 2f 6d 6c 2d 6e |TD/xhtml1-transi| 6f 6e 6c 2e 3e 0d 0a |tional.dtd

从curl转hexdump格式后看,正常的utf8是以|...<!DOCTYPE htm|开头

utf8+bom保存的文件curl得出的是

备忘

详细参考地址:http://huoding.com/2011/05/14/78

最后当然是让对方技术人员将文件转成utf8保存即解决问题

相关内容