1 问题描述

本文对建立好的复合索引进行排序,并取记录中非索引字段,发现索引不生效,例如,有如下表,DDL语句为:

CREATE TABLE <code>employees</code> (
  <code>emp_no</code> int(11) NOT NULL,
  <code>birth_date</code> date NOT NULL,
  <code>first_name</code> varchar(14) NOT NULL,
  <code>last_name</code> varchar(16) NOT NULL,
  <code>gender</code> enum('M','F') NOT NULL,
  <code>hire_date</code> date NOT NULL,
  <code>age</code> int(11) NOT NULL,
  PRIMARY KEY (<code>emp_no</code>),
  KEY <code>unique_birth_name</code> (<code>first_name</code>,<code>last_name</code>) USING BTREE
  ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

复合索引为unique_birth_name (first_name,last_name) 。使用以下语句:

EXPLAIN SELECT
    gender
FROM
    employees
ORDER BY
    first_name,
    last_name

根据上图:type:all 及 Extra:Using filesort 可得,索引没有生效。
继续进行试验,对查询语句进一步改写,加上一个范围查找:

EXPLAIN SELECT
    gender
FROM
    employees
WHERE first_name > 'Leah'
ORDER BY
    first_name,
    last_name

执行计划显示如下图:

这里发现结果和第一次sql分析无异。继续试验。
改写sql语句:

EXPLAIN SELECT
    gender
FROM
    employees
WHERE first_name > 'Tzvetan'
ORDER BY
    first_name,
    last_name


此时,令人惊讶的是,索引生效了。

2 问题分析

此时,我们做一个大胆的猜测:
第一次进行sql分析时,因为第一次order by 后,得到的还是全表数据,如果根据复合索引中携带的主键查找每一个gender进行拼接,自然很费资源和时间,mysql不会做如此蠢的事。不如直接进行全表扫描,把扫描到的每条数据和order by得到的临时数据进行拼接,从而得到需要的数据。
为了验证上述想法的正确性,我们对三次sql进行分析。
第一次sql根据复合索引得到的数据量为:300024,为全表数据

SELECT
    COUNT(first_name)
FROM
    employees
ORDER BY
    first_name,
    last_name

第二次改写的sql根据复合索引得到的数据量为:159149 , 为全表数据量的1/2。

SELECT
    COUNT(first_name)
FROM
    employees
WHERE first_name > 'Leah'
ORDER BY
    first_name,
    last_name


第三次改写的sql根据复合索引得到的数据量为:36731, 为全表数据量的1/10。

SELECT
    COUNT(first_name)
FROM
    employees
WHERE first_name > 'Tzvetan'
ORDER BY
    first_name,
    last_name

通过对比发现,第二次改写的sql根据复合索引得到的数据量是全表数据量的1/2。此时还没有达到mysql使用索引进行二次查找的量级。第三次改写的sql根据复合索引得到的数据量是全表数据量的1/10,达到了mysql使用索引进行二次查找的量级,于是从执行计划上可以看到,第三次改写sql是走了索引的。

3 总结

mysql 是否根据首次索引条件查询出的主键进行二次查找,也是要看查询出来的数据量级,如果数据量接近全表数据量的话,就会进行全表扫描,否则根据第一次查询出来的主键进行二次查询。

来源:https://blog.csdn.net/qq_25188255/article/details/81316498

作者:qq_25188255