类似WINDOWS自带的记事本等软件,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见
的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以
UTF-8编码。对于一般的文件,这样并不会产生什么麻烦。但对于 PHP来说,BOM是个大麻烦。
PHP并不会忽略BOM,所以在读取、包含或者引用这些文件时,会把BOM作为该文件开头正文的一部分。
根据嵌入式语言的特点,这串字符将被直接执行(显示)出来。由此造成即使页面的 top padding 设置为0
,也无法让整个网页紧贴浏览器顶部,因为在html一开头有这3个字符。同时也会造成中文乱码的问题。
window编辑器如果保存为utf8文件就会帮你加上BOM头,以告诉其他编辑器以utf8来显示字符 ,
但是在网页上并不需要添加BOM头识别,因为网页上可以使用 head头指定charset=utf8告诉浏览器用utf8
来解释。但是你用window自动的编辑器编辑,然后显示在网页上这样就会显示出0xEF 0xBB 0xBF这3个字
符。
这样网页上就需要去除0xEF 0xBB 0xBF,可以在编辑器中选择不带BOM的编码,这样就可以去除了,也就解
决了PHP在使用UTF-8编码出现中文乱码的问题。
如:Notepad++中,如果出现中文乱码,解决办法:【编码】-->【转为 UTF-8无 BOM 编码格式】
(一定要选择【转为……编码格式】,不能直接选择【以……格式编码】)