锟斤拷
utf-8 是一种变长的编码格式,最长为6个字节,最短为一个字节
gbk 是一种定长编码格式,汉字2个字节,字符1个字节
gbk 定长字符串转换成 utf-8 时,变成了 utf-8 解析不了的字符。例如:“�������й���”
而utf-8的变长字符“�”转换为定长字符gbk,为“\xef\xbf\xbd” 3个字符
经过多册重复 “��”,即:“\xef\xbf\xbd\xef\xbf\xbd” 6个字符
gbk 一个汉字2个字符
\xef\xbf == 0xEFBF == '锟'
\xbd\xef == 0xBDEF == '斤'
\xbf\xbd == 0xBFBD == '拷'
"��" === "锟斤拷"
如有纰漏,请指正