1. 单一字符和数字的转换
- 事实上是单一字符和单一字符对应的编码之间的转换。
- 如下2个函数接收的是单一字符,即character,如果长度超过1就会报错。
- python怎么知道单一字符要转换为什么数字呢?这个涉及到编码的概念了。
- ord()函数、chr()函数没办法指定编码方式,猜测默认是unicode编码
ord()函数:查看单一字符对应的编码(一个数字)
chr()函数:将编码(一个数字)处理成对应的单一字符
2. 中文unicode编码
- 汉字的unicode范围主要是4E00到9FA5的范围,这一范围包括最常用的20902个普通汉字
- 除了普通汉字外,还有另外的汉字,如汉语外来词汇、单字拼音、方言词汇、书面语等,这些汉字的unicode范围是从3400到4DB5,一共有7586个汉字。
- 在中文unicode范围内,还包括数字和标点符号,他们的unicode范围是从0030到0039,从FF10到FF19,从3000到303F,从FE10到FE1F,一共有45个标点符号,其中一些是用于表示注音符,一些是用于表示拼音符,一些是用于表示社会文化文学中的符号,这些标点符号的作用是形成自己的独立的语系。
3.输出全部汉字
for j in range(0x4e00, 0x9fA5 + 1):
print(chr(j), end='')