一、通俗解释
数据库索引就是在一个或者几个列上创建的一种用于提高数据库查询速度的对象,可以把它想象成字典中的目录。
没有索引的话,查询照样可以执行,但是查找时需要全表扫描,逐条扫描全部记录,直到找完符合条件的。
索引查询可以避免全表扫描,多数查询可以仅扫描少量索引页及数据页,而不是遍历所有数据页。
二、索引的副作用:
没有索引的表,执行增、删、改的时候很快,但是使用索引以后,会多一个维护索引的操作,导致增(insert)、删(delete)、改(update)的性能下降。
三、数据库索引的存储:
一条索引记录中包含的基本信息包括:健值(即定义索引时所指定的所有字段的值,)+逻辑指针(指向数据页或者另一索引页)。
当你为一张空表创建索引时,数据库系统将为你分配一个索引页,该索引页在你插入数据前一直是空的,此页此时即是根节点,也是叶节点。每当你往表中插入一行数据,数据库系统即向此跟节点中插入一行索引记录。当根节点满时,数据库系统大抵按照以下步骤进行分裂:
1) 创建两个儿子节点
2) 将原根节点中的数据近似地拆成两半,分别下入新的两个儿子节点
3) 根节点中加上指向两个儿子节点的指针
通常情况下,由于索引记录仅包含索引字段值(以及4-9字节的指针),索引实体比真实的数据行要小许多,索引页相较数据页来说要密集许多。一个索引页可以存储数量更多的索引记录,这意味着使用索引查找时,磁盘I/O次数将会减少,相应的耗时就会减少,理解这一点有助于在本质上了解使用索引的优势。
四、查询数据的操作步骤
第一步:
无论有无索引,都是先在数据缓冲区查找所需要的数据,如果数据缓冲区中没有需要的数据时,服务器进程才去读磁盘。
第二步:
l 无索引:直接去读表数据存放的磁盘块(大量的磁盘I/O操作,耗时长),读到数据缓冲区中再查找需要的数据。
l 有索引:先读入索引表,通过索引表直接找到所需数据的物理地址(减少了磁盘I/O操作次数,节省时间),并把数据读入数据缓冲区。
五、索引的类型:
1) 聚集索引:表数据按照索引的顺序来存储的。对于聚集索引,叶子节点即存储了真实的数据行,不再有另外单独的数据页。
2) 非聚集索引:表数据存储结构与索引顺序无关。对于非聚集索引,叶节点包含索引字段值及指向数据页数据行的逻辑指针,该层紧邻数据页,其行数据与数据表行数据量一致。
在一张表上,只能创建一个聚集索引,因为真实数据的物理顺序只可能是一种。如果一张表没有聚集索引,那么它被称为“堆记”(heap)。这样的表中的数据行没有特定的顺序,所有的新行将被添加到表的末尾位置。