大模型的tokens是通过Tokenizer模型计算出来的。如果只是要预估大模型的tokens和字符数的换算关系,可以参考: 中文场景下 一个 token ≈ 1.6汉字 英文场景下 一个 token ≈ 0.75单词 ≈ 4个字符