第一种方法:Unicode码
在unicode码中,汉字的范围是(0x4E00, 9FBF)
import random
def Unicode():
val = random.randint(0x4e00, 0x9fbf)
return chr(val)
这个方法有个小问题,unicode码中收录了2万多个汉字,包含很多生僻的繁体字.
第二种方法:GBK2312
gbk2312对字符的编码采用两个字节相组合,第一个字节的范围是0xB0-0xF7, 第二个字节的范围是0xA1-0xFE.
对GBK2312编码方式详细的解释请参看GBK2312编码
import random
def GBK2312():
head = random.randint(0xb0, 0xf7)
body = random.randint(0xa1, 0xf9) # 在head区号为55的那一块最后5个汉字是乱码,为了方便缩减下范围
val = f'{head:x}{body:x}'
str = bytes.fromhex(val).decode('gb2312')
return str
GBK2312收录了6千多常用汉字.两种方法的取舍就看需求了.
原博://www.greatytc.com/p/73bf99e37ca2
需求:随机生成两字或三字的名字
思路1:姓后面的第一个名,用数组随机取数,数组第一个数据为随机的中文字符(调用上述函数),第二个数据为空字符,随机取数取到空字符就是两字名字,取到非空字符就是三字名字
思路2:for循环生成中文字符的函数,然后进行str拼接,循环次数为随机生成[1-2]随机整数,随机到1,则为二字名字,随机到2,则为三字名字(4字名字类推)
思路1代码:
import random
def GBK2312():
head = random.randint(0xb0, 0xf7)
body = random.randint(0xa1, 0xf9) # 在head区号为55的那一块最后5个汉字是乱码,为了方便缩减下范围
val = f'{head:x}{body:x}'
st = bytes.fromhex(val).decode('gb2312')
return st
def first_name(): # 随机取姓氏字典
first_name_list = [
'赵', '钱', '孙', '李', '周', '吴', '郑', '王', '冯', '陈', '褚', '卫', '蒋', '沈', '韩', '杨', '朱', '秦', '尤', '许',
'何', '吕', '施', '张', '孔', '曹', '严', '华', '金', '魏', '陶', '姜', '戚', '谢', '邹', '喻', '柏', '水', '窦', '章',
'云', '苏', '潘', '葛', '奚', '范', '彭', '郎', '鲁', '韦', '昌', '马', '苗', '凤', '花', '方', '俞', '任', '袁', '柳',
'酆', '鲍', '史', '唐', '费', '廉', '岑', '薛', '雷', '贺', '倪', '汤', '滕', '殷', '罗', '毕', '郝', '邬', '安', '常',
'乐', '于', '时', '傅', '皮', '卞', '齐', '康', '伍', '余', '元', '卜', '顾', '孟', '平', '黄', '和', '穆', '萧', '尹',
'姚', '邵', '堪', '汪', '祁', '毛', '禹', '狄', '米', '贝', '明', '臧', '计', '伏', '成', '戴', '谈', '宋', '茅', '庞',
'熊', '纪', '舒', '屈', '项', '祝', '董', '梁']
n = random.randint(0, len(first_name_list) - 1)
f_name = first_name_list[n]
return f_name
def second_name():
# 随机取数组中字符,取到空字符则没有second_name
second_name_list = [GBK2312(), '']
n = random.randint(0, 1)
s_name = second_name_list[n]
return s_name
def last_name():
return GBK2312()
def create_name():
name = first_name() + second_name() + last_name()
return name
print(create_name())
思路2代码:
def create_name():
n = random.randint(1, 2)
name = ''
for i in range(n):
s = GBK2312()
name = name+s
return first_name()+name
优化后版本(2023.5.19更新):
random.choice()从序列中获取一个随机元素,其原型为random.choice(sequence),参数sequence表示一个有序类型。这里说明一下,sequence在Python中不是一种特定的类型,而是泛指序列数据结构。列表,元组,字符串都属于sequence
second_name = random.choice([GBK2312(), ''])
def GBK2312():
head = random.randint(0xb0, 0xf7)
body = random.randint(0xa1, 0xf9) # 在head区号为55的那一块最后5个汉字是乱码,为了方便缩减下范围
val = f'{head:x}{body:x}'
st = bytes.fromhex(val).decode('gb2312')
return st
def create_name():
first_name_list = [
'赵', '钱', '孙', '李', '周', '吴', '郑', '王', '冯', '陈', '褚', '卫', '蒋', '沈', '韩', '杨', '朱', '秦', '尤', '许',
'何', '吕', '施', '张', '孔', '曹', '严', ]
f_name = random.choice(first_name_list)
name = f_name + random.choice([GBK2312(), '']) + GBK2312()
return name
print(create_name())