覆盖索引是一种特殊的复合索引,所有查询的列都包括在索引中。这种情况下,MySQL 能直接从索引返回数据,不用访问行数据。
考虑一种情形,我们不使用SELECT * FROM Country
,而只需要国家的名称。例子12展示了,复合索引(大洲,人口,名称)能够用上前两列来过滤行,然后从第 3 列返回值。
例子12:使用3列覆盖索引
ALTER TABLE Country ADD INDEX c_p_n (Continent,Population,Name);
EXPLAIN FORMAT=JSON
SELECT Name FROM Country WHERE continent='Asia' and population > 5000000;
{
"query_block": {
"select_id": 1,
"cost_info": {
"query_cost": "8.07" # 查询代价进一步减少了 67%
},
"table": {
"table_name": "Country",
"access_type": "range",
"possible_keys": [
"p",
"c",
"p_c",
"c_p",
"c_p_n"
],
"key": "c_p_n",
"used_key_parts": [
"Continent",
"Population"
],
"key_length": "5",
"rows_examined_per_scan": 32,
"rows_produced_per_join": 15,
"filtered": "100.00",
"using_index": true, # 表明是覆盖索引
"cost_info": {
"read_cost": "1.24",
"eval_cost": "3.09",
"prefix_cost": "8.07",
"data_read_per_join": "3K"
},
"used_columns": [
"Name",
"Continent",
"Population"
],
"attached_condition": "((`world`.`Country`.`Continent` = 'Asia') and (`world`.`Country`.`Population` > 5000000))"
}
}
}
EXPLAIN 中的using_index
表示使用了覆盖索引。它是一项被低估了的优化,许多从业者不正确地认为覆盖索引能让代价减少为一半,因为不用访问行。而在例子12中我们看到其代价相比例子11减少到了三分之一。
在生产环境中,由于索引的聚集效果,覆盖索引可能更好地利用内存空间。然而,如果次级索引与聚集索引(主键)没有关联,就会有多得多的页需要被访问。
(这里的 “关联” 是指 “大致遵循一样的顺序”。例如,一个时间戳的次级索引会与自增主键有很高的关联;而人口和大洲与国家编号就没有什么关联。)
译自:
Covering Indexes - The Unofficial MySQL 8.0 Optimizer Guide