1 问题描述
本文对建立好的复合索引进行排序,并取记录中非索引字段,发现索引不生效,例如,有如下表,DDL语句为:
CREATE TABLE <code>employees</code> (
<code>emp_no</code> int(11) NOT NULL,
<code>birth_date</code> date NOT NULL,
<code>first_name</code> varchar(14) NOT NULL,
<code>last_name</code> varchar(16) NOT NULL,
<code>gender</code> enum('M','F') NOT NULL,
<code>hire_date</code> date NOT NULL,
<code>age</code> int(11) NOT NULL,
PRIMARY KEY (<code>emp_no</code>),
KEY <code>unique_birth_name</code> (<code>first_name</code>,<code>last_name</code>) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
复合索引为unique_birth_name
(first_name
,last_name
) 。使用以下语句:
EXPLAIN SELECT
gender
FROM
employees
ORDER BY
first_name,
last_name
根据上图:type:all 及 Extra:Using filesort 可得,索引没有生效。
继续进行试验,对查询语句进一步改写,加上一个范围查找:
EXPLAIN SELECT
gender
FROM
employees
WHERE first_name > 'Leah'
ORDER BY
first_name,
last_name
执行计划显示如下图:
这里发现结果和第一次sql分析无异。继续试验。
改写sql语句:
EXPLAIN SELECT
gender
FROM
employees
WHERE first_name > 'Tzvetan'
ORDER BY
first_name,
last_name
此时,令人惊讶的是,索引生效了。
2 问题分析
此时,我们做一个大胆的猜测:
第一次进行sql分析时,因为第一次order by 后,得到的还是全表数据,如果根据复合索引中携带的主键查找每一个gender进行拼接,自然很费资源和时间,mysql不会做如此蠢的事。不如直接进行全表扫描,把扫描到的每条数据和order by得到的临时数据进行拼接,从而得到需要的数据。
为了验证上述想法的正确性,我们对三次sql进行分析。
第一次sql根据复合索引得到的数据量为:300024,为全表数据
SELECT
COUNT(first_name)
FROM
employees
ORDER BY
first_name,
last_name
第二次改写的sql根据复合索引得到的数据量为:159149 , 为全表数据量的1/2。
SELECT
COUNT(first_name)
FROM
employees
WHERE first_name > 'Leah'
ORDER BY
first_name,
last_name
第三次改写的sql根据复合索引得到的数据量为:36731, 为全表数据量的1/10。
SELECT
COUNT(first_name)
FROM
employees
WHERE first_name > 'Tzvetan'
ORDER BY
first_name,
last_name
通过对比发现,第二次改写的sql根据复合索引得到的数据量是全表数据量的1/2。此时还没有达到mysql使用索引进行二次查找的量级。第三次改写的sql根据复合索引得到的数据量是全表数据量的1/10,达到了mysql使用索引进行二次查找的量级,于是从执行计划上可以看到,第三次改写sql是走了索引的。
3 总结
mysql 是否根据首次索引条件查询出的主键进行二次查找,也是要看查询出来的数据量级,如果数据量接近全表数据量的话,就会进行全表扫描,否则根据第一次查询出来的主键进行二次查询。
来源:https://blog.csdn.net/qq_25188255/article/details/81316498
作者:qq_25188255