数据库结构优化
选择合适的数据类型
数据类型的选择,重点在于合适二字,如何确定选择的数据类型是否合适?
1.使用可以存下你的数据的最小的数据类型。
2.使用简单的数据类型。Int要比carchar类型在mysql处理上简单。
3.尽可能的使用not null定义字段。
4.尽量少用text类型,费用不可时最好考虑分表。
-使用int来存储日期时间,利用FROM_UNIXTIME(),UNIX_TIMESTAMP()两个函数来转换
-使用bigint来存IP地址,利用INET_AUTO(),INET_NTOA()两个函数来进行转换
表的范式化和反范式化
范式化是指数据库设计的规范,目前说到范式化一般是指第三设计范式,也就是要求数据表中不存在非关键字段对任意候选字段的传递函数依赖则符合第三范式
存在以下传递函数依赖关系:
(商品名称)->(分类)->(分类描述)
也就是说存在非关键字段”分类描述“对关键字段”商品名称“的传递函数依赖。
反范式化是指为了查询效率的考虑把原符合第三范式的表适当的增加冗余,以达到优化查询效率的目的,反范式化是一种以空间来换取时间的操作。
表的垂直拆分
所谓的垂直拆分,就是把原来一个有很多列的表拆分成多个表,这解决了表的宽度问题,通常垂直拆分可以按以下原则进行:
1.把不常用的字段单独存放到一个表中。
2.把大字段独立存放到一个表中。
3.把经常一起使用的字段放到一起。
表的水平拆分
表的水平拆分是为了解决单表的数据量过大的问题,水平拆分的表每一个表的结构都是完成一致的。
常用的水平拆分方法为:
1.对主键id进行hash运算,如果要拆分五个表则使用mod(id,5)取出0-4个值
2.针对不同的hashID把数据存到不同的表中。
挑战:1.跨分区表进行数据查询.2.统计及后台报表操作.