计算机常用编码
ASCII编码
- 最早的最重要的最基本的英美文字的字符集
- 只使用最低7位表示字符,剩余的128位留作拓展
- 采用顺序储存方式储存字符
ISO-8859-*
- 使用ASCII剩余的码位进行拓展
- ISO-8859-1专门对英语的拓展
- Tomcat 默认采用ISO-88591>UTF-8
GBK[936]
- 包括简繁字体
- 包括GB2312字集、BIG5字集
- GBK编码是GB2312编码的超集,向下完全兼容GB2312
- GBK支持希腊字母、日文假名字母、俄语字母等字符,但不支持韩语中的表音字符(非汉字字符)。
UTF-8
- 英文使用8位(一个字节),中文使用24位(3个字节)
- UTF-8包含全世界所有国家需要用到的字符,是国际编码
ANSI
- ANSI不是一种具体的编码
- 由系统默认的编码决定,如果系统默认的编码gbk那ANSI就是gbk
- 查看系统默认编码在DOS命令窗口输入 chcp
ASCII码表
常用09,AZ,az对应的ASCII码分别为4857,6590,97122
0 -- 48
A -- 65
a -- 97
乱码产生原因
- 计算机中文件的存储是以二进制的形式保存,在保存到硬盘上时,计算机会将内存中的文件,按照特定的格式[编码方式]转换为二进制文件,保存到硬盘中。
- 当文件再次打开时,计算机会把硬盘中的二进制文件加载到内存,按照特定的格式,重新编码成可读的普通文件;
- 重新编码时,系统会搜索当前系统中,对于不同后缀名文件的默认打开方式[每种打开方式包含的编码不一定相同],如果默认的打开方式中包含的编码方式与原编码格式相同,则文件可以正常打开,没有乱码;
- 如果默认打开方式中的编码不包含,或者没有全部包含,则会出现乱码
乱码的解决方式
- 在保存文件时,确定编辑保存的编码方式
- 在打开文件时,要根据不同的文件后缀名,选择对应的打开方式