MySQL 字符串数据类型
CHAR & VARCHAR
区别:
- CHAR 是一种长度固定的类型;VARCHAR 是一种长度可变的类型
- 从 CHAR 列检索出来的值,其尾部空格会被移除。对于 CHAR(M)列,如果其值的长度小于 M 个字符,那么在存入时会用空格将长度补齐。如果启用 SQL 的 PAD_CHAR_TO_FULL_LENGTH 模式,那么在检索 CHAR 列值时就可以保留尾部空格。
- 对于 VARCHAR 列,其尾部空格在存储和检索时都会被保留。
注意:CHAR(0) 是合法的,仅一个二进制位。两种取值:NULL 或 空串。
如何选择?以下两条通用原则:
- 如果所有值的长度固定,选用 CHAR。因为 VARCHAR 需要用额外的字节来记录值的长度。反之长度不固定,则选用 VARCHAR 节省空格占用的空间,因为 CHAR 会用空格补齐。
- 如果使用的是 MyISAM 表,并且各个值的长度差别不大,那么选用 CAHR 更好些。因为 MyISAM 存储引擎对固定长度行的处理效率高。
BINARY & VARBINARY
这两种类型与 CHAR 和 VARCHAR 相似,但有以下区别:
- CHAR 和 VARCHAR 都是用于存储字符的非二进制类型,并且都有字符集和排序规则。
- BINARY 和 VARBINARY 都是用于存储字节的二进制类型,它们没有字符集和排序规则。
对于 BINARY(M),固定长度M,会用 0x00 字节进行补齐,检索时,不会去除任何内容。
对于 VARBINARY,在存储值时,不会补齐,检索时,也不会去除任何内容。
BLOB & TEXT
BLOB:二进制大对象,一个能够存放任何内容的容器,多达 4G。存储的是二进制串,比如:压缩数据、加密数据、图像和声音。
TEXT:与 BLOB 有很多相似之处,但其存储的是非二进制串,如字符。
BLOB 和 TEXT 列能否被索引,具体取决于所使用的存储引擎。
- 存储引擎 InnoDB 和 MyISAM 都支持对 BLOB 和 TEXT 列进行索引,但必须指定一个前缀长度。除了 FULLTEXT 索引不会使用那个前缀长度。
- MEMORY 引擎不支持 BLOB 和 TEXT 列。
使用注意:
- 由于两者在长度方面的差异很大,因此在多次删除和修改之后,表里容易产生大量碎片。如果使用 MyISAM 表来存储 BLOB 和 TEXT 值,那么定期运行 OPTIMIZE TABLE 命令可以减少碎片和改善系统性能。
- max_sort_length 系统变量,有必要时,可以调大。
ENUM & SET
它们只能从一个固定的字符串列表里取值。
主要区别:ENUM 列值必须包含且只能包含一个值列表成员(可以为空);而 SET 列值则允许包含任意多个值列表成员。
- ENUM 是单选字符串数据类型,适用于存储单选值,而 SET 是多选字符串数据类型,适用于存储多选值
- MySQL 从 1 开始依次对 ENUM 列定义的成员进行顺序编号;而 SET 成员并没有按顺序编号,而被存储为二进制位值。
如何字符串数据类型?
- 这些值是要表示为字符数据还是二进制数据?字符数据,选择非二进制串类型;二进制数据,选二进制串类型。
- 比较操作需要区分大小写吗?如果需要,选非二进制串类型。因为与字符集和排序规则是相关联的。
- 想要少占用存储空间吗?想,选用一种长度可变的类型。
- 列的取值总是从固定的某些值里选取吗?总是,则选用 ENUM 或 SET。
- 尾部的填充值很重要吗?如果要求数据必须原样存入和取出,不能增加和移除尾部的空格,那么应该选用 TEXT 或 VARCHAR 、BLOB 或 VARBINARY ;如果想要存储压缩数据、散列数据或加密数据时,编码方式可能会导致尾部空,需要启用 SQL 模式 PAD_CHAR_TO_FULL_LENGTH ,可以让检索出来的 CHAR 列值保留尾部空格。