0
点赞
收藏
分享

微信扫一扫

Mysql数据库的索引优化和查询优化

程序员阿狸 2022-06-24 阅读 56

都有哪些维度可以进行数据库调优?简言之:

  • 索引失效、没有充分利用到索引——索引建立
  • 关联查询太多JOIN(设计缺陷或不得已的需求)——SQL优化
  • 服务器调优及各个参数设置(缓冲、线程数等)——调整my.cnf。
  • 数据过多——分库分表
  • 虽然SQL查询优化的技术有很多,但是大方向上完全可以分成物理查询优化逻辑查询优化两大块。

  • 物理查询优化是通过索引和表连接方式等技术来进行优化,这里重点需要掌握索引的使用。
  • 逻辑查询优化就是通过SQL等价变换提升查询效率,直白一点就是说,换一种查询写法执行效率可能更高。

索引失效

MySQL中提高性能的一个最有效的方式是对数据表设计合理的索引。索引提供了高效访问数据的方法,并且加快查询的速度,因此索引对查询的速度有着至关重要的影响。

使用索引可以快速地定位表中的某条记录,从而提高数据库查询的速度,提高数据库的性能。
如果查询时没有使用索引,查询语句就会扫描表中的所有记录。在数据量大的情况下,这样查询的速度会很慢。
大多数情况下都(默认)采用B+树来构建索引。只是空间列类型的索引使用R-树,并且MEMORY表还支持hash索引。

其实,用不用索引,最终都是优化器说了算。优化器是基于什么的优化器?基于cost开销(CostBaseOptimizer),它不是基于规则(Rule-BasedOptimizer),也不是基于语义。怎么样开销小就怎么来。另外,SQL语句是否使用索引,跟数据库版本、数据量、数据选择度都有关系。
1.主键插入顺序

最好让插入的记录的 主键值依次递增 ,这样就不会发生这样的性能损耗了。
建议:让主键具有 AUTO_INCREMENT ,让存储引擎自己为表生成主键,而不是我们手动插入
2.最左前缀原则
索引文件具有 B-Tree 的最左前缀匹配特性,如果左边的值未确定,那么无法使用此索引。
在MySQL建立联合索引时会遵守最佳左前缀匹配原则,即最左优先,在检索数据时从联合索引的最左边开始匹配。

在student上面创建idx_age_classid_name的联合索引,注意顺序,age、classid、name

CREATE INDEX idx_age_classid_name ON student (age ,classId,NAME);

image.png
举例1:

这下面的SQL就只用到了用了idx_age_classid_name,但是只用到了name字段(最左前缀原则),先根据age去查,发现第二个条件不是classid,就不会使用了,其实回忆B+树就行了。

EXPLAIN SELECT SQL_NO_CACHE * FROM student 
WHERE student.age=30 AND student.name = 'abcd';

image.png
结论:MySQL可以为多个字段创建索引,一个索引可以包括16个字段。对于多列索引,过滤条件要使用索引必须按照索引建立时的顺序,依次满足,一旦跳过某个字段,索引后面的字段都无法被使用。如果查询条件中没有使用这些字段中第1个字段时,多列(或联合)索引不会被使用。

3.计算、函数、类型转换(自动或手动)导致索引失效
计算导致索引失效
第一个走索引,第二个不走索引,因为用了计算

EXPLAIN SELECT SQL_NO_CACHE id, stuno, NAME FROM student WHERE stuno = 900000;
EXPLAIN SELECT SQL_NO_CACHE id, stuno, NAME FROM student WHERE stuno+1 = 900001;

4.类型转换导致索引失效
name是varchar类型的,第一个失效,因为第一个不是varchar类型,查询优化器会将它转换成varchar类型,导致索引失效,(其实也相当于使用了函数进行转换)

EXPLAIN SELECT SQL_NO_CACHE * FROM student WHERE NAME = 123; 
EXPLAIN SELECT SQL_NO_CACHE * FROM student WHERE NAME = '123'; 

5.范围条件右边的列索引失效

CREATE INDEX idx_age_classId_name ON student(age,classId,NAME);
EXPLAIN SELECT SQL_NO_CACHE * FROM student
WHERE student.age=30 AND student.classId>20 AND student.name = 'abc' ;

可以看出来key_len是10,也就是说只用到了age和classid的值,而name并没有使用到索引,范围条件右边的列索引失效。(这里的右边是索引的右边)
那么索引idx_age_classid_name还能正常使用吗?

  • 不能,范围右边的列不能正常使用。比如:(>)(<)(>=)
  • 如果这种查询条件过多,应建立:也就是在索引中把classid的字段放在索引的最后。
    CREATE INDEX idx_age_name_classid ON student(age,NAME,classid);

    还是之前那句查询语句,这里和where条件后面的查询的字段的顺序无关,因为查询优化器,会帮我们选择合适的顺序。

    EXPLAIN SELECT SQL_NO_CACHE * FROM student
    WHERE student.age=30 AND student.classId>20 AND student.name = 'abc' ;

    应用开发中范围查询,例如:金额查询,日期查询往往都是范围查询。应将查询条件放置where语句最后。(创建的联合索引中,务必把范围涉及到的字段写在最后)

6.不等于(!= 或者<>)索引失效
这也很好理解,=的话就直接直接根据B+树去查找就行了,而!=(<>)就需要去查找=之外的了,就相当于全表扫描了。

先在name字段上创建索引。

CREATE INDEX idx_name ON student(NAME);

然后再查询。

EXPLAIN SELECT SQL_NO_CACHE * FROM student WHERE student.name <> 'abc' ;

发现并没有用上索引。
7.is null可以使用索引,is not null无法使用索引

结论:最好在设计数据表的时候就将字段设置为 NOT NULL 约束,比如你可以将INT类型的字段,默认值设置为0。将字符类型的默认值设置为空字符串('')。
拓展:同理,在查询中使用not like 也无法使用索引,导致全表扫描。

  1. like以通配符%开头索引失效
    在使用LIKE关键字进行查询的查询语句中,如果匹配字符串的第一个字符为“%”,索引就不会起作用。只有“%"不在第一个位置,索引才会起作用。
    • 使用到索引
      EXPLAIN SELECT SQL_NO_CACHE * FROM student WHERE NAME LIKE 'ab%'; 
    • 未使用上索引(因为你要找的是不确定的,所有无法准确的从B+树中去找,只能全表扫描)
      EXPLAIN SELECT SQL_NO_CACHE * FROM student WHERE NAME LIKE '%ab%';

9.OR 前后存在非索引的列,索引失效
在WHERE子句中,如果在OR前的条件列进行了索引,而在OR后的条件列没有进行索引,那么索引会失效。也就是说,OR前后的两个条件中的列都是索引时,查询中才使用索引。

因为OR的含义就是两个只要满足一个即可,因此只有一个条件列进行了索引是没有意义的,只要有条件列没有进行索引,就会进行全表扫描,因此索引的条件列也会失效。

查询语句使用OR关键字的情况:

  • 未创建索引
    #未使用到索引
    EXPLAIN SELECT SQL_NO_CACHE * FROM student WHERE age = 10 OR classid = 100;

    image.png

  • 在age字段上创建索引,发现还是没有用到索引(也就是上面所说到的情况)
    CREATE INDEX idx_age ON student(age);

    image.png

  • 在classid上创建索引,这时候用上了索引,因为OR的前后两个字段都加上了索引。
    CREATE INDEX idx_cid ON student(classid);

10.数据库和表的字符集统一使用utf8mb4
统一使用utf8mb4( 5.5.3版本以上支持)兼容性更好,统一字符集可以避免由于字符集转换产生的乱码。不同的 字符集 进行比较前需要进行 转换 会造成索引失效
练习及一般性建议
练习:假设:index(a,b,c)
image.png
一般性建议:

对于单列索引,尽量选择针对当前query过滤性更好的索引
在选择组合索引的时候,当前query中过滤性最好的字段在索引字段顺序中,位置越靠前越好。
在选择组合索引的时候,尽量选择能够包含当前query中的where子句中更多字段的索引。
在选择组合索引的时候,如果某个字段可能出现范围查询时,尽量把这个字段放在索引次序的最后面。
总之,书写SQL语句时,尽量避免造成索引失效的情况。

举报

相关推荐

0 条评论