索引的本质-CFANZ编程社区

1、索引的底层本质是一个排好序的数据结构

a、最早是二叉树方式 key是存储的值，value是磁盘文件地址。

b、之后是红黑树（二叉平衡树）

c、之后是B树。

d、在之后是B+树。

a、B+树多了区间指针，在查询数据范围的时候可以通过区间指针直接把区间的数据拿出来。而B树没有区间指针，只能拿到与之相邻的数据，多次查找，如果范围较大，效率就会很低。

b、B+树非叶子节点不存储data，只存储索引，叶子节点包含所有的索引数据

a、frm框架文件（表结构文件） MYD存的是data数据 MYI存储的是索引数据

b、frm框架文件（表结构文件） ibd存的是data数据和索引数据

正常执行一个sql查询语句的时候，首先会判断查询条件中哪个字段是带有索引的，优先会查询带有索引字段的条件，因为表里存储的数据就是索引的冗余，直接判断查询条件中的数据在索引表MYI对应的磁盘文件地址指向，然后去MYD数据表中找到对应磁盘文件指向的数据。

INNodb和MYISAM存储引擎差距的是INNODB的表数据和索引数据都存放在一起，所以B+树的叶子节点不仅仅存放了索引文件，同时也存放了data数据（所在行的所有的其他列的数据）。

聚簇索引指的是叶子节点包含了完整的数据记录，INnodb的主键索引就是聚簇索引。非聚簇索引指的是索引文件和数据文件是分离的，MYISAM的主键索引就是非聚簇索引。

索引最左前缀原则，首先比较第一个字段，如果第一个字段是String，那么比较第一个字符，B>H，若果第一个字段的第一个字符一致，那么比较第二个字段，int类型比较的是整个数字的大小。以此类推。（联合主键不允许所有个字段都相等）