InnoDB 是如何存储数据的?
记录是按照行来存储的,但是数据库的读取并不是以行为单位,否则一次读取(一次 I/O 操作) 只能处理一行数据,效率会非常低。因此,InnoDB 的数据是按 数据页
数据库的 I/O 操作的最小单位是页,InnoDB 数据页的默认大小是 16KB,数据库每次读写都是以 16KB 为单位,一次最少从磁盘中读取 16K 的内容到内存中 或者 一次最少把 16K 内容刷新到磁盘中。
名称 | 说明 |
File Header | 文件头,表示页的信息 |
Page Header | 页头,表示页的状态信息 |
Infimum + Supremum Records | 两个虚拟伪记录,分别表示页中的最小记录和最大记录 |
User Records | 用户记录,存储行记录内容 |
Free Space | 空闲空间,表示页中还未被使用的空间 |
Page Directory | 页目录,存储用户记录的相对位置,对记录起到索引作用 |
Fil Trailer | 文件尾,校验页是否完整 |
在 File Header 中有两个指针(FIL_PAGE_PREV, FIL_PAGE_NEXT),分别指向上一个数据页和下一个数据页,连接起来的页相当于一个双向的链表,如下图:
数据页中的 User Records 是如何组织的
User Reocrds 是用来存储用户数据的,各条记录之间通过 next_record 字段串联成了一个链表。除了用户的行记录之外,还有两条记录: Infimum(最小行) 和 Supermum(最大行)。这是 InnoDB
页目录(Page Directory)
数据页中的记录按照索引键值顺序组成单项链表,单向链表的特点是插入、删除很高效,但是检索效率不高,最差的情况下需要遍历链表上的所有节点才能完成检索。 因此,数据页中有一个页目录(Page Directory),起到记录的 “索引” 作用。
- 将所有的记录划分成几个组,这些记录包括 Infimum 和 Supermum
- 每个记录组的最后一条记录就是组内最大的那条记录,并且最后一条记录的头信息中会存储该组一共有多少条记录,作为 n_owned 字
- 页目录用来存储每组最后一条记录的地址偏移量,这些地址偏移量会按照先后顺序存储起来,每组的地址偏移量也被称之为槽(slots),每个槽相当于指针指向了不同组的最后一个记录。
- Infimum 只能包含一条记录
- Supermum 可以是 [1,8] 条记录
- 其他的则是 [4,8] 条记录
以上图为例,5 个槽的编号分别为 0,1,2,3,4,我想查找主键为 10 的用户记录
- 先二分得出槽中间位是 (0+4)/2=2 ,2号槽里最大的记录为 8。因为 10 > 8,所以需要从 2 号槽后继续搜索记录
- 再使用二分搜索出 2 号和 4 槽的中间位是 (2+4)/2= 3,3 号槽里最大的记录为 12。因为 10 < 12,所以键值为 10 的记录在 3 号槽里
- 再从 3 号槽指向的主键值为 9 记录开始向下搜索 1 次,定位到主键为 10 的记录,取出该条记录的信息即为我们想要查找的内容
- B+树 索引本身并不能找到具体的一条记录,能找到的只是该记录所在的页。数据库把页载入内存,然后通过 Page Directory 进行二叉查找。只不过二叉查找的时间复杂度很低,同时内存中的查找很快,因此通常忽略这部分查找所用的时间。
二分查找法(binary search)也称为折半查找法,先以有序数列的中点位比较对象,如果要找的元素值小于该中心元素,则将待查找序列缩小为左半部分,否则为右半部分。通过一次比较,将查找区间缩小一半。如下图所示。
前面数据页结构中,每页 Page Directory 中的槽是按照主键顺序存放的,对于某一条具体记录的查询是通过对 Page Directory 进行二分查找得到的。
平衡二叉树是来解决二叉查找树极端情况下退化为链表的问题。平衡二叉树其实就是在二叉查找树的基础上加上约束:让每个节点的左右子树高度差不能超过 1。这样可以让左右子树都保持平衡。如下图。
但是尽管是平衡二叉树,也会随着插入的元素增多,而导致树的高度变高,这同样意味着磁盘 I/O 操作次数变多,影响到整体的查询效率。
B 树
平衡二叉树本身是一个二叉树,每个节点只能有2个子节点,随着数据量的增大,节点个数越多,树的高度也会增高,增加了磁盘的 I/O 次数,影响查询效率。
B 树的出现可以解决树高度的问题。之所以是 B 树,而不是”某某二叉树”,就是它不在限制一个父节点中只能有两个子节点,而是允许 M 个子节点(M>
B 树是一棵多叉树,它的每一个节点包含的最多子节点数量称为B树的阶。下图是一棵3阶的B树。
- 每个节点称为页,在mysql中数据读取去的基本单位是页,而也就是上面的磁盘块。P节点是指向子节点的指针。
B 树查找流程
在这个3阶B树中,查找 89 这个元素时的流程:
先从根节点出发,也就是 磁盘块1,判断 89 大于 45,通过磁盘块1中的指针 p3 找到磁盘块4。还是按照原来的步骤,在磁盘块4中的65 ~ 87之间相比较,最后磁盘4的指针p3找到磁盘块11。也就找到有匹配89的键值。
B树其实已经满足了减少磁盘 I/O 操作,同时支持按区间查找。但是 B树的区间查找效率并不高。因为B树在做范围查询时,需要使用中序遍历,那么父节点和子节点也就需要不断的来回切换。会给磁盘 I/O 带来很多负担。
B+ 树
B+树从 + 可以看出是B树的升级版,MySQL 中 InnoDB 引擎中的索引底层数据结构采用的正是 B+树。
B+ 树结构
B+ 树查询
B+ 树底层是数据,上层都是按底层区间构成的索引。搜到到关键字不会直接返回,会一直走到叶子节点这一层查询数据。比如搜索 id=10,虽然在根节点中就命中了,但是全部的数据在叶子节点上,所以还要继续往下搜索,一直到叶子节点。
B+ 树插入和删除
而且B+ 树的插入也是如此,最多只涉及树的一条分支路线。
估算一颗 B+ 树 中的数据量
1 |
explain 关键字可以模拟 MySQL 优化器执行 SQL 语句,可以很好的分析 SQL 语句或表结构的性能瓶颈。
key_len 计算公式
字段类型 | 长度 | latin1 | gbk | uft8 | utf8mb4 | 允许为 null | 不允许为 null | key_len |
char | L | k = 1 | k = 2 | k = 3 | k = 4 | n = 1 | n = 0 | L*k + n |
varchar | L | k = 1 | k = 2 | k = 3 | k = 4 | n = 1 | n = 0 | L*k + n + 2 |
tinyint | 1 | n = 1 | n = 0 | 1 + n | ||||
smallint | 2 | n=1 | n = 0 | 2 + n | ||||
mediumint | 3 | n=1 | n = 0 | 3 + n | ||||
int | 4 | n=1 | n = 0 | 4 + n | ||||
bigint | 8 | n=1 | n = 0 | 8 + n | ||||
datetime | ||||||||
(mysql5.6及以后) | 5 | n=1 | n = 0 | 5 + n | ||||
date | 3 | n=1 | n = 0 | 3 + n | ||||
time | 3 | n=1 | n = 0 | 3 + n | ||||
year | 1 | n=1 | n = 0 | 1 + n | ||||
timestamp | 4 | n=1 | n = 0 | 4 + n |
1 | 1.整数类型,浮点数类型,时间类型的索引长度 NOT NULL=字段本身的字段长度 NULL=字段本身的字段长度+1,因为需要有是否为空的标记,这个标记需要占用1个字节 datetime 类型在5.6中字段长度是5个字节 |
##explain 各字段含义
explain 中各字段含义见下图:
索引是一个单独的、存储在磁盘上的数据库结构,包含着对数据表里多有记录的引用指针。使用索引可以快度找出某个或多个列中有一特定值的行,所有 MySQL 列类型都可以被索引,对相关列使用索引是提高查询操作速度的最佳途径。
聚集索引就是以 主键 创建的索引
非聚集索引就是以 非主键 创建的索引,也叫做 二级索引
- 聚集索引在叶子节点存储的是表中的数据
- 非聚集索引在叶子节点存储的是主键和索引列
- 使用非聚集索引查询出数据时,先查询到叶子节点上的主键,再去主键索引中查找要找的数据(拿到主键再查找的这个过程叫做回表)
联合索引是指按一定顺序对表上的多个列进行索引。一个联合索引是一个有序元组 <a1, a2, …, an>。单列索引可以看成联合索引元素数为1的特例。
- 对于需要排序的查询,联合索引中的键值都是排序的,通过叶子节点可以逻辑上顺序读的读出所有数据,可以避免多一次的排序操作。
假如索引列分别为 A, B, C,且顺序也为 A, B, C
- 如果查询的时候,查询 【A】【A, B】【A, B, C】,那么可以通过索引查询。
- 如果查询的时候,采用 【A, C】,那么 C 虽然是索引,但是由于中间缺失了B,因此C 这个索引是用不到的,只能用到 A 索引。
- 如果查询的时候,采用【B】【B, C】【C】,由于没有用到第一列索引,不是最左前缀,那么后面索引也是用不到的。
- 如果查询的时候,采用范围查询(>、<、between、like 左匹配),并且是最左前缀,mysql 无法再使用范围列后面的其他索引列了。如果查询的时候,采用 A = 1 and b > 2 and C = 3,则会在每个节点依次命中
A、B,无法命中C。 - 列的排列顺序决定了可命中索引的列数。
###=、in 自动优化顺序
不需要考虑=、in 等的顺序,mysql 会自动优化这些条件的顺序,以匹配尽可能多的索引列。
- 如有索引 (a, b, c, d),查询条件 c > 3 and b = 2 and a = 1 and d < 4 与 a = 1 and c > 3 and b = 2 and d < 4 等顺序都是可以的,MySQL
都会自动优化为 a = 1 and b = 2 and c > 3 and d < 4,依次命 a、b、c。
在联合索引中,存在着一种特殊的索引 - 覆盖索引。
- 非聚集索引的叶子节点存储的是主键 + 列值,最终还是要 回表,也就是要通过主键再查找一次,这样就会比较慢。覆盖索引从二级索引中就可以得到查询的记录,不需要查询聚集索引中的记录。
- 覆盖索引不包含整行记录的所有信息,故其大小要远小于聚集索引,因此可以减少大量的 I/O 操作。
- 能使用覆盖索引就使用。
- 如果现有索引 (username, age),在查询数据的时候:select username,age from user where username = ‘Tom’ and age = 19;
- 很明显,where 后面的 username 和 age 是要走索引的,而且要查询的 username 和 age 也正是索引的列,这些列都存于索引的叶子节点上,所以就不用回表了。
MySQL 有两种方式可以生成有序的结果:通过排序操作 或者 按索引顺序扫描。如果 EXPLAIN 出来的 type 列的值为 “index”,则说明 MySQL 使用了索引扫描来做排序。
只有当索引的列顺序和 ORDER BY 子句的顺序完全一致,并且所有列的排序方向(倒序或顺序)都一样时,MySQL 才能够使用索引来对结果做排序。如果查询需要关联多张表,则只有当 ORDER BY
子句引用的字段全部为第一个表时,才能使用索引做排序。ORDER BY 子句和查找型查询的限制是一样的:需要满足索引的最左前缀的要求;否则,MySQL 都需要执行文件排序操作,而无法利用索引排序。
在进行插入操作时,数据页的存放还是按主键 id
Index Condition Pushdown 是 MySQL 5.6 开始支持的一种根据索引进行查询的优化方式。mysql 数据库会在取出索引的同时,判断是否可以进行 where 条件的过滤,也就是将 where
的部分过滤操作放在了存储引擎层。在某些查询下,可以大大减少上层 sql 层对记录的索取(fetch),从而提高数据库的整体性能。
索引下推优化支持 range、ref、eq_ref、ref_or_null 类型的查询。支持 MyISAM 和 InnoDB 存储引擎。当优化器选择 Index Condition Pushdown 优化时,可以在执行计划的列 Extra
看到 Using index condition 提示。
不可见索引是 mysql8.0 的新特性。
在删除多余索引前,可以先隐藏一个索引,然后观察对数据库的影响。如果数据库心梗有所下降,就说明这个索引是有用的,于是将其”恢复显示” 即可。如果数据库性能看不出变化,说明这个索引是多余的,可以删除了。
列的值分布不均,这个索引是严重倾斜的,而索引的优势就是从大量数据中找出少量数据;但是就算创建了该列的索引,mysql的优化器可能也不会用该索引,因为优化器不会知道该列存在索引倾斜,此时有可能需要人工指定索引了,explain select
- from table force index() where …
1 | select * from information_schema.statistics where table_schema='DBNAME' and table_name = 'TABLENAME'; |
在实际应用中,cardinality/n_rows_in_table 应尽可能的接近1。如果非常小,那么需要考虑是否还有必要创建这个索引。
- 查询条件包含 or,可能导致索引失效 示例
- 如果字段名类型是字符串,where 时一定要用引号括起来,否则不使用索引 示例
- 使用 like 以 % 开头导致索引失效 示例
- 不符合最左匹配原则 示例
- 在索引列上使用 mysql 内置函数,索引失效 示例
- 对索引列运算(如,+、-、*、/),索引失效 示例
- mysql 估计使用全表扫描要比使用索引快,则不使用索引 示例
- 连接查询关联字段的字符集不一样,可能导致索引失效 示例
- 最左匹配原则。MySQL 会一直向右匹配到范围查询 列的排列顺序决定了可命中索引的列数 就停止匹配
- 尽量选择区分度搞的列作为索引,区分度的公式是 COUNT(DISTINCT col) / COUNT(*),表示字段不重复的比率,比率越大扫描的记录数就越少。
- 索引不能参与计算,尽量保持列“干净”。比如 比如,FROM_UNIXTIME(create_time) = ‘2022-08-06’
就不能使用索引,原因很简单,B+树中存储的都是数据表中的字段值,但是进行检索时,需要把所有元素都应用函数才能比较,显然这样的代价太大。所以语句要写成 : create_time = UNIX_TIMESTAMP(‘
2022-08-06’) - 尽可能的扩展索引,不要新建立索引。比如表中已经有了 (a) 的索引,现在要加 (a, b) 的索引,那么只需要修改原来的索引即可。
- 单个多列组合索引和多个单列索引的检索查询效果不同,因为在执行SQL时,MySQL会从多个单列索引中选择一个或多个(union 索引合并时)效率最高的索引。
创建 t_user_action_log 表并插入数据
– create table CREATE TABLE customer_info
bigint(20) unsigned NOT NULL AUTO_INCREMENT,name
varchar(32) NOT NULL COMMENT ‘名字’,province
varchar(32) NOT NULL COMMENT ‘省份’,level
int(6) NOT NULL COMMENT ‘等级’,sex
varchar(10) NOT NULL COMMENT ‘性别’, PRIMARY KEY (id
– create sql script import random import string
with open(‘customer.sql’, ‘a’) as f:
for i in range(0, 100000):
name=’’.join(random.sample(string.ascii_lowercase, 4))
provice = random.choice(['heilongjiang', 'jilin', 'liaoning', 'hebei', 'neimenggu', 'henan', 'xinjiang', 'gansu', 'shanxi', 'shanxi', 'shandong', 'jiangsu', 'hubei', 'sichuan', 'xizang', 'qinghai', 'anhui', 'jiangsu', 'zhejiang', 'jiangxi', 'fujian', 'hunan', 'guzhou', 'yunan', 'guangxi', 'guangdong', 'taiwan', 'hainan', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin', 'jilin'])
level = random.choice([1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])
sex = random.choice(['female', 'male', 'female', 'female', 'female', 'female', 'female', 'female', 'female', 'female', 'female'])
sql = f"INSERT INTO customer_info (name, province, level, sex) values ('{name}', '{provice}', '{level}', '{sex}');"
– impport sql 将数据导入表中
查询 id 为 1 的记录,sql 如下:
select name, province, level, sex from customer_info where id = 1;
mysql> explain select name, province, level, sex from customer_info where id = 1;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | const | PRIMARY | PRIMARY | 8 | const | 1 | 100.00 | NULL |
- key 都为 PRIMARY,表示使用了主键索引
- ref 为 const,表示通过索引一次就找到了
- rows 为 1,表示大致估算出找到所需的记录需要读取1行记录
查询 province 为 zhejiang的所有记录,sql 如下:
select name, province, level, sex from customer_info where province = ‘zhejiang’;
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | NULL | NULL | NULL | NULL | 100962 | 10.00 | Using where |
1 row in set, 1 warning (0.00 sec)
- type为ALL表示要进行全表扫描。这样效率无疑是极慢的。
alter table customer_info add index prov_idx(province
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_idx | prov_idx | 130 | const | 1768 | 100.00 | NULL |
1 row in set, 1 warning (0.00 sec)
- 看到这次查询就使用索引 prov_idx 了。
- 这次查询扫描了 1768 行,即所有 province= ‘zhejiang’ 的行。
varchar 中存的为数字时
insert into customer_info(name
, province
, level
, sex
) values (‘kd’, ‘1’, 2, ‘male’);
mysql> explain select name, province, level, sex from customer_info where province = 1;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | prov_level_sex_idx | NULL | NULL | NULL | 100963 | 10.00 | Using where |
1 row in set, 3 warnings (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province = ‘1’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1 | 100.00 | NULL |
1 row in set, 1 warning (0.00 sec)
- 如果字段名类型是字符串,where 时一定要用引号括起来,否则不使用索引
在索引列上使用 mysql 内置函数
alter table customer_info add key lvl_idx(level
mysql> explain select name, province, level, sex from customer_info where level = 5;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | lvl_idx | lvl_idx | 4 | const | 2179 | 100.00 | NULL |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where ABS(level) = 5;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | NULL | NULL | NULL | NULL | 100963 | 100.00 | Using where |
1 row in set, 1 warning (0.00 sec)
- 在索引列上使用 mysql 内置函数,索引失效
mysql> explain select name, province, level, sex from customer_info where level = 5;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | lvl_idx | lvl_idx | 4 | const | 2179 | 100.00 | NULL |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where level - 1 = 4;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | NULL | NULL | NULL | NULL | 100963 | 100.00 | Using where |
1 row in set, 1 warning (0.00 sec)
- 对索引列运算(如,+、-、*、/),索引失效
mysql> explain select name, level from customer_info where level not in (5);
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | lvl_idx | NULL | NULL | NULL | 100963 | 58.75 | Using where |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, level from customer_info force index(lvl_idx) where level not in (5);
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | lvl_idx | lvl_idx | 4 | NULL | 59316 | 100.00 | Using index condition |
1 row in set, 1 warning (0.00 sec)
- mysql 估计使用全表扫描要比使用索引快,则不使用索引
删除之前创建的索引 prov_idx , lvl_idx
alter table customer_info dorp index prov_idx, drop index lvl_idx;
查询条件:来自浙江,level 为 1 的男生。sql 如下:
select name, province, level, sex from customer_info where province = ‘zhejiang’ and level=1 and sex=’male’;
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ and level=1 and
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | NULL | NULL | NULL | NULL | 100962 | 0.10 | Using where |
1 row in set, 1 warning (0.00 sec)
- type 为 ALL,全表扫描
alter table customer_info add index prov_level_sex_idx(province
, level
, sex
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ and level=1 and
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 176 | const,const,const | 126 |
100.00 | NULL |
1 row in set, 1 warning (0.00 sec)
- 查询走了索引 prov_sex_level_idx
- ref 显示命中了 prov_sex_level_idx 中的三个字段
更换 where 后面的查询条件再执行一次 explain:
mysql> explain select name, province, level, sex from customer_info where sex=’male’ and province = ‘zhejiang’ and
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 176 | const,const,const | 126 |
100.00 | NULL |
1 row in set, 1 warning (0.00 sec)
- 结果和上面的一样,说明 mysql 会自动优化这些条件的顺序
– 查询条件为 province 和 level mysql> explain select name, province, level, sex from customer_info where province = ‘
zhejiang’ and level=1;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 134 | const,const | 1486 | 100.00
| NULL |
1 row in set, 1 warning (0.00 sec)
– 查询条件为 province 和 sex mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’
and sex=’male’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1768 | 10.00 | Using
index condition |
1 row in set, 1 warning (0.00 sec)
– 查询条件为 level 和 sex mysql> explain select name, province, level, sex from customer_info where level=1 and sex=’male’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | NULL | NULL | NULL | NULL | 100962 | 1.00 | Using where |
1 row in set, 1 warning (0.00 sec)
- 查询条件为 province 和 level 时,符合最左前缀原则,走了 prov_sex_level_idx 索引
- 查询条件为 province 和 sex 时,只有 province 符合最左匹配原则,所以只有 province 走了索引
- 查询条件为 level 和 sex 时,都不符合最左匹配原则,不能走索引
查询条件变为 1 个
– 查询条件为 province mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1768 | 100.00 | NULL
1 row in set, 1 warning (0.00 sec)
– 查询条件为 level mysql> explain select name, province, level, sex from customer_info where level=1;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | NULL | NULL | NULL | NULL | 100962 | 10.00 | Using where |
1 row in set, 1 warning (0.00 sec)
– 查询条件为 sex mysql> explain select name, province, level, sex from customer_info where sex=’male’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | NULL | NULL | NULL | NULL | 100962 | 10.00 | Using where |
1 row in set, 1 warning (0.00 sec)
- 和预期的一样,只有查询条件为 province 时才符合最左前缀原则,才会走索引
查询条件中有范围查询 >、<
– 范围查询 > <
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ and level > 2 and
level < 8;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | prov_level_sex_idx | prov_level_sex_idx | 134 | NULL | 174 | 100.00 |
Using index condition |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ and level > 2 and
level < 8 and sex=’male’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | prov_level_sex_idx | prov_level_sex_idx | 134 | NULL | 174 | 10.00 | Using
index condition |
1 row in set, 1 warning (0.00 sec)
- 使用了 prov_level_sex_idx 索引,根据扫描的行数知道,province 和 level 字段使用了索引
- 遇到 >、<范围查询,mysql 无法再使用范围列后面的其他索引列了
查询条件中有 between
– 范围查询 between mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ and
level between 3 and 7;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | prov_level_sex_idx | prov_level_sex_idx | 134 | NULL | 174 | 100.00 |
Using index condition |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ and level between 3 and
7 and sex=’male’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | prov_level_sex_idx | prov_level_sex_idx | 176 | NULL | 133 | 10.00 | Using
index condition |
1 row in set, 1 warning (0.00 sec)
从 key 看,三个字段都走了索引,但是从 filter看,并不是所有的字段都走了索引。那该如何判断? 可以看下这篇文章 The range access method and why you should use EXPLAIN
JSON,这时候 explain 可以加上参数 format=json 来查看哪些字段走了索引
mysql> explain format=json select name, province, level, sex from customer_info where province = ‘zhejiang’ and level
between 3 and 7 and sex=’male’ \G
*************************** 1. row ***************************
“query_block”: {
“select_id”: 1,
“cost_info”: {
“query_cost”: “187.21”
“table”: {
“table_name”: “customer_info”,
“access_type”: “range”,
“possible_keys”: [
“key”: “prov_level_sex_idx”,
“used_key_parts”: [
“key_length”: “176”,
“rows_examined_per_scan”: 133,
“rows_produced_per_join”: 13,
“filtered”: “10.00”,
“index_condition”: “((testdb
= ‘zhejiang’) and (testdb
between 3
and 7) and (testdb
= ‘male’))”,
“cost_info”: {
“read_cost”: “184.55”,
“eval_cost”: “2.66”,
“prefix_cost”: “187.21”,
“data_read_per_join”: “4K”
“used_columns”: [
} } } 1 row in set, 1 warning (0.00 sec)
- 从 “used_key_parts”: [“province”, “level”] 可以看出只有 province 和 level 走了索引,sex 字段并没有走索引。
- key_len 字段并不是所有走了索引的索引长度之和
- 使用 format=json 可以更好的查看 explain
- 遇到 between 范围查询,mysql 无法再使用范围列后面的其他索引列了
查询条件中有 like
– 范围查询 like mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1768 | 100.00 | NULL
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province like ‘%zhe’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | NULL | NULL | NULL | NULL | 100962 | 11.11 | Using where |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province like ‘zhe%’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | prov_level_sex_idx | prov_level_sex_idx | 130 | NULL | 1768 | 100.00 |
Using index condition |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province like ‘zhe%iang’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | prov_level_sex_idx | prov_level_sex_idx | 130 | NULL | 1768 | 100.00 |
Using index condition |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province like ‘zhe%’ and level = 9;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | prov_level_sex_idx | prov_level_sex_idx | 134 | NULL | 1768 | 10.00 |
Using index condition |
1 row in set, 1 warning (0.00 sec)
和 between 一样,这里通过 key_len 和 filter 判断哪些字段走了索引时有冲突,使用 format=json 重新查看 mysql> explain format=json select name,
province, level, sex from customer_info where province like ‘zhe%’ and level = 9 \G
*************************** 1. row ***************************
“query_block”: {
“select_id”: 1,
“cost_info”: {
“query_cost”: “2476.21”
“table”: {
“table_name”: “customer_info”,
“access_type”: “range”,
“possible_keys”: [
“key”: “prov_level_sex_idx”,
“used_key_parts”: [
“key_length”: “134”,
“rows_examined_per_scan”: 1768,
“rows_produced_per_join”: 176,
“filtered”: “10.00”,
“index_condition”: “((testdb
= 9) and (testdb
like ‘zhe%’))”,
“cost_info”: {
“read_cost”: “2440.85”,
“eval_cost”: “35.36”,
“prefix_cost”: “2476.21”,
“data_read_per_join”: “53K”
“used_columns”: [
} } } 1 row in set, 1 warning (0.00 sec)从 “used_key_parts”: [“province”] 可以看出只有 province 走了索引,level 字段并没有走索引。
遇到 like 范围查询,mysql 无法再使用范围列后面的其他索引列了
查询条件中有 or
– 相同列使用 or 查询 – drop index prov_level_sex_idx on customer_info; – alter table customer_info add index
); mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ or
province= ‘jiangsu’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | prov | prov | 130 | NULL | 5280 | 100.00 | Using index condition |
1 row in set, 1 warning (0.00 sec)
– 不同列且部分列建立索引 mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ or level
= 9;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | prov | NULL | NULL | NULL | 100962 | 19.00 | Using where |
1 row in set, 1 warning (0.00 sec)
– 不同列且全部列分别建立索引 – alter table customer_info add index level(level
); mysql> explain select name, province, level, sex
from customer_info where province = ‘zhejiang’ or level = 9;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | index_merge | prov,level | prov,level | 130,4 | NULL | 3999 | 100.00 | Using
union(prov,level); Using where |
1 row in set, 1 warning (0.00 sec)
– 不同列建立联合索引 – drop index prov on customer_info; – drop index level on customer_info; – alter table customer_info add
index prov_level_sex_idx(province
, level
, sex
); mysql> explain select name, province, level, sex from
customer_info where province = ‘zhejiang’ or level = 9;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ALL | prov_level_sex_idx | NULL | NULL | NULL | 100962 | 19.00 | Using where |
1 row in set, 1 warning (0.00 sec)
- 相同列使用 or:索引生效
- 不同列且部分列建立索引:索引失效
- 不同列且全部列分别建立索引:自动将 or 转为 union,索引生效
- 不同列建立联合索引:索引失效
查询条件中有 in
mysql> explain select name, province, level, sex from customer_info where province in (‘zhejiang’, ‘jiangsu’);
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | prov_level_sex_idx | prov_level_sex_idx | 130 | NULL | 5280 | 100.00 |
Using index condition |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province in (‘zhejiang’, ‘jiangsu’) and level
= 9;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | range | prov_level_sex_idx | prov_level_sex_idx | 134 | NULL | 110 | 100.00 |
Using index condition |
1 row in set, 1 warning (0.00 sec)
- in 后面的 level 字段可以走索引
查询条件中有 order by
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1768 | 100.00 | NULL
1 row in set, 1 warning (0.00 sec)
– 索引列顺序和 order by 子句的顺序完全一致 – 所有列的排序方向全部相同 mysql> explain select name, province, level, sex from customer_info where
province = ‘zhejiang’ order by level,sex;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1768 | 100.00 |
Using index condition |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ order by level desc,sex
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1768 | 100.00 |
Using where |
1 row in set, 1 warning (0.00 sec)
– 索引列顺序和 order by 子句的顺序完全一致 – 所有列的排序方向非全部相同 mysql> explain select name, province, level, sex from customer_info where
province = ‘zhejiang’ order by level desc,sex;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1768 | 100.00 |
Using index condition; Using filesort |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ order by level,sex desc;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1768 | 100.00 |
Using index condition; Using filesort |
1 row in set, 1 warning (0.00 sec)
– 索引列顺序和 order by 子句的顺序非完全一致 – 所有列的排序方向全部相同 mysql> explain select name, province, level, sex from customer_info where
province = ‘zhejiang’ order by sex,level;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1768 | 100.00 |
Using index condition; Using filesort |
1 row in set, 1 warning (0.00 sec)
mysql> explain select name, province, level, sex from customer_info where province = ‘zhejiang’ order by sex desc,level
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 130 | const | 1768 | 100.00 |
Using index condition; Using filesort |
1 row in set, 1 warning (0.00 sec)
- 只有当索引的列顺序和 ORDER BY 子句的顺序完全一致,并且所有列的排序方向(倒序或正序)都一样时,mysql 才能够使用索引来对结果做排序。
mysql> explain select province, level, sex from customer_info where province = ‘zhejiang’ and level = 5 and sex = ‘
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | customer_info | NULL | ref | prov_level_sex_idx | prov_level_sex_idx | 176 | const,const,const | 5 |
100.00 | Using index |
1 row in set, 1 warning (0.00 sec)
- Extra 字段是 Using index,意思就是索引覆盖,查询的内容可以直接在索引中拿到
– create table customer_info – use utf8mb4 CREATE TABLE customer_info
bigint(20) unsigned NOT NULL AUTO_INCREMENT,name
varchar(32) NOT NULL COMMENT ‘名字’,province
varchar(32) NOT NULL COMMENT ‘省份’,level
int(6) NOT NULL COMMENT ‘等级’,sex
varchar(10) NOT NULL COMMENT ‘性别’, PRIMARY KEY (id
KEY prov
), KEY lvl_idx
), KEY nm
– create table customer_info_2 – use utf8mb4 CREATE TABLE customer_info_2
bigint(20) unsigned NOT NULL AUTO_INCREMENT,name
varchar(32) NOT NULL COMMENT ‘名字’,province
varchar(512) NOT NULL COMMENT ‘省份’,level
int(6) NOT NULL COMMENT ‘等级’,sex
varchar(10) NOT NULL COMMENT ‘性别’, PRIMARY KEY (id
), KEY prov
), KEY lvl_idx
KEY nm
mysql> explain select * from customer_info c1 join customer_info_2 c2 on = where = ‘gdtb’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | c1 | NULL | ref | nm | nm | 130 | const | 1 | 100.00 | NULL | | 1 | SIMPLE | c2 | NULL | ALL | NULL |
NULL | NULL | NULL | 99986 | 100.00 | Using where; Using join buffer (Block Nested Loop) |
2 rows in set, 1 warning (0.00 sec)
mysql> explain select * from customer_info c1 join customer_info_2 c2 on = where = ‘gdtb’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | c2 | NULL | ref | nm | nm | 98 | const | 1 | 100.00 | NULL | | 1 | SIMPLE | c1 | NULL | ref | nm | nm |
130 | func | 1 | 100.00 | Using index condition |
2 rows in set, 1 warning (0.00 sec)
- 字符集 utf8mb4 是 utf8 的超集
- 当 c1 为驱动表时,c1 中过滤出来的 name 字段的字符集为 utf8mb4,然后再去关联 c2 中的 name(utf8) 字段,超集关联子集,这时候 c2 中的 name 字段需要转换为 utf8mb4 字符集,即
CONVERT( USING utf8mb4),因为在索引列上使用了函数操作,所以索引失效了 - 当 c2 为驱动表时,c2 中过滤出来的 name 字段的字符集为 utf8,然后再去关联 c1 的 name(utf8mb4) 字段,子集关联超集,这没问题,所以 c1 中的关联字段可以走索引
了解了是什么原因造成的,如果要暂时解决这个问题,可以在关联条件中手动将 utf8mb4 向 utf8 进行转换
mysql> explain select * from customer_info c1 join customer_info_2 c2 on CONVERT( USING utf8) = where = ‘gdtb’;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | c1 | NULL | ref | nm | nm | 130 | const | 1 | 100.00 | NULL | | 1 | SIMPLE | c2 | NULL | ref | nm | nm |
98 | func | 1 | 100.00 | Using index condition |
2 rows in set, 1 warning (0.00 sec)
当然,最好的方法还是让两张表的字符集变得一致。int 类型的不受影响。
mysql> explain select * from customer_info_2 c2 left join customer_info c1 on =;
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
| 1 | SIMPLE | c2 | NULL | ALL | NULL | NULL | NULL | NULL | 99986 | 100.00 | NULL | | 1 | SIMPLE | c1 | NULL | ref | nm
| nm | 130 | func | 1 | 100.00 | Using where |
2 rows in set, 1 warning (0.00 sec)
- c1 和 c2 表都有 name 字段的索引,当 c2 为驱动表时,当关联字段不是 where 的条件时,关联字段的索引只需要加在 c1 表(被驱动表)即可,c2 表(驱动表)的字段可以不加。