数据库三大设计范式
其实,目前的关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯科德范式(BCNF)、第四范式(4NF)、第五范式(5NF,又称完美范式)。
第一范式(1NF)是指在关系模型中,对于添加一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不是集合,数组,记录等非原子数据项。即实体中的某个属性有多个值时,必须拆分为不同属性。
第二范式(2NF)时在第一范式(1NF)的基础上简历起来的。第二范式要求数据库表中的每个实例或者记录必须可以被唯一地区分。选取一个能区分每个试题的属性或属性组,作为实体的唯一标识。第二范式要求实体属性完全依赖于主关键字。所谓的完全依赖是指不能存在仅依赖主关键字一部分的属性。
第三范式(3NF)是第二范式的一个子集,即满足第三范式,必须满足第二范式。第三范式要求一个关系中不包含已在其它关系已包含的主关键字信息。即一个表中不因该包含两类或多类信息,比如员工信息和部门信息,应当设计出两张表分别表示。
如何设计一个关系型数据库?
首先要有存储模块(文件系统);其次用程序来控制存储。
程序实例里包括:存储管理、缓存机制、SQL解析、日志管理、权限划分、容灾机制、索引管理和锁管理。
为什么使用索引?
快速查找信息。
索引的数据结构:二叉树、B-Tree、B+-Tree。
B-Tree定义:
- 根节点至少包含两个孩子
- 树中每个节点最多包含m个孩子(m>=2)
- 除根节点和叶节点外,其他每个节点至少有>(m/2)个孩子
- 所有叶子节点位于同一层
-
每个非终端节点包含n个关键字信息,其中,关键字按顺序升序排列,关键字的个数必须在[m/2-1, m-1]之间。
B-Tree定义(在B-Tree的基础上):
- 非叶子节点的字数指针与关键字个数相同
- 非叶子节点的字数指针P[i],指向关键字[k[i], k[i+1])的字数
- 非叶子节点仅用来索引,所有数据都保存在叶子节点中
- 所有叶子节点均有一个链指针指向下一个叶子节点
密集索引和稀疏索引的区别
- 密集索引文件中的每个搜索码值都对一个索引值
- 稀疏索引文件只为索引码的某些值建立索引项
InnoDB有且只有一个密集索引:
- 若一个主键被定义,则该主键作为密集索引
- 若没有主键被定义,该表的第一个唯一非空索引则作为密集索引
- 若不满足已上条件,innodb内部会生成一个隐藏主键(密集索引)
- 非主键索引存储相关键位和其对应的主键值,包含两次查找
联合索引的最左匹配原则及成因
最做匹配原则:mysql会一直向右匹配知道遇到范围查询(<, >, between, like)就停止匹配,=和in可以乱序。
数据库在建立联合索引时,默认以第一个索引排序,后面的索引是无序的,因此,如果没有最左索引时,则不会用上联合索引,因为找不到大致位置。
MyISAM与InnoDB关于锁方面的区别是什么?
- MyISAM默认用的是表级锁,不支持行级锁(读锁是共享锁,写锁是排他锁)
- InnoDB默认用的是行级锁,也支持表级锁(在没有用到索引)
MyISAM适合频繁执行全表count语句;对数据进行增删改的频率不高,查询非常频繁,不支持事务
InnoDB适合增删改查频率高,支持事务,安全性较高。