编码是对全世界的文字的存储记录格式
ANSI
ANSI——美国国家标准学会
计算机早期出现,规定的字符串以1字节为单位,开始对字符进行编码工作。
美标
ASCII
ASCII是“美国信息交换标准编码”的英文字头缩写,可以称为美标。
计算机出现在美国,美国制定ASCII码,1字节。
0~127表示:大小写字母、控制符等。
128~255表示:没有规范,但被扩展为其他小语言字符、表格等等,成为“扩展字符集”。
后来各国家制定自己的ANSI,废除了该部分的字符。
国标
中国汉字需要上网,制定了自己使用的汉字编码方案
GB2312
GB2312是对ANSII的中文扩展,汉字2个字节,英文1个字节,
特点是:连续两个大于127的字符表示汉字。第一个字节(高字节)0xA10xF7,低字节0xA10xFE。收录了大约7000多简体汉字,包括数学符号、罗马希腊的字母、日本假名,还包括ANSII的文本字符2字节版,称为全角,原来127号以下的成为半角
GBK
GB2312里没有收录繁体字,香港和湾湾人民有意见,于是GBK编码出现,其实就是对GB2312的扩展。包含了GB2312的所有内容,新增20000个新汉字(包括繁体)和符号。
所有GBK兼容GBK2312。
GB18030
对GBK扩展,加入几千少数名族的文字。
BIG5
BIG5码是针对繁体汉字的汉字编码,在台湾、香港电脑系统中得到普遍应用。