MySQL 运行原理 [数据页]

文章根据《MySQL技术内幕:InnoDB存储引擎(第二版)》、掘金小册《MySQL是怎样运行的:从根儿上理解MySQL》 两本书得到的总结

文章参考 淘宝数据库内核组月报
文章中的图均截自《MySQL技术内幕:InnoDB存储引擎(第二版)》

概述

之前在介绍表的那篇文章里,简单的介绍到了 数据页 ,关于数据页一点半点的文字根本介绍不清楚,所以单开一篇文章来介绍数据页。

一切对数据库的操作归根到底就是对索引页(Index page,文章中的数据页都指的是索引页)的操作,常见的页类型有数据页、undo页、系统页、事务数据页、插入缓冲位图页等等,我们这篇文章只单单介绍数据页。

页结构

数据页包括七个部分,数据页文件头,数据页头,最大最小记录,用户记录,空闲空间,数据目录,数据页尾部。数据页简单的分为两大部分,一部分存储数据记录,按照记录的大小通过记录的指针连接起来,另一部分存储数据页的目录。

1ACHqlVSda.png!large

文件头(File Header)

File Header 主要用于存储表空间相关信息,组成部分如下:

cQsFjFssUL.png!large
  • FIL_PAGE_SPACE_OR_CHKSUM:主要用于存储数据页的 checksum
  • FIL_PAGE_OFFSET:这个对应数据页的 page number,每个表空间从 0 开始
  • FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID:现版本用于存储 spaceid

数据页头(Page Header)

Page Header 主要用于存储数据页的元信息,组成部分如下:

Byt6COXO0q.png!large
  • PAGE_N_DIR_SLOTS:用于存放数据页条目的个数,一个新建的初始数据页就会有两条记录,分别指向最大最小记录,在非空的数据页中,第一条记录永远指向最小记录,最后一条永远指向最大记录
  • PAGE_HEAP_TOP:指向数据页中空闲空间的起始地址,由于有 PAGE_FREE 的记录存在,小于 PAGE_HEAP_TOP 地址的也可以被重用
  • PAGE_N_HEAP:目前数据页空间中的记录数量,正常来说记录着正常记录和删除记录,所以说这个数不会减小只会增加,一个新建的初始数据页的 PAGE_N_HEAP 的默认值为 2 ,即为最大最小记录
  • PAGE_FREE:记录被删除会进入这个删除链表,如果有记录插入,可以先从这个空间进行分配,若这个空间不够用,则在 PAGE_HEAP_TOP 空间中分配
  • PAGE_DIRECTION:最后一个记录插入的方向,从左插入从右插入,为了加速后续插入速度
  • PAGE_N_RECS:该页中记录的数量,不包括最大值最小值两条记录数

最大最小记录(Infimum and superfimum records)

每个数据页中有两个虚拟行记录用来限定记录的边界,infimum record 是数据页上最小的记录,所有用户的记录都大于它,superfimum record 是数据页上最大的记录,所有用户的记录都小于它,即他们两为数据页上的最大值最小值的边界。

用户记录(User record)

用户所有插入的数据记录都被存放在此,每个数据记录都有指向下一个记录的指针,但是没有指向上一个记录的指针。记录按照主键顺序排序,即用户可以从最小数据记录开始遍历,直到最大数据记录,其中包括了所有正常数据记录和被 delete-mark 的记录,但是不会访问到被标记删除的记录。

空闲空间(Free space)

在一条数据记录被删除后,该空间会被加入到空闲链表中。从 PAGE_HEAP_TOP 开始到最后一个数据目录,这之间就是空闲空间,都被重置为 0,当用户插入记录的时候会首先从被删除的记录空间中查找,若没有合适的位置,则从空闲空间中分配,插入记录后会递增 PAGE_HEAP_TOP、PAGE_N_RECS 两个值。

页目录(Page directory)

这里强烈推荐看小册的数据页结构中页目录这一块

页目录中存放了记录的相对位置,这些记录指针有时也被称为槽(slots),并不是每个记录都有槽,InnoDB存储引擎中的槽是一个稀疏的目录,这就代表了一个槽拥有多个记录。由于在InnoDB存储引擎中页目录是稀疏目录,二叉查找的结果只是一个粗略的结果,因此InnoDB存储引擎必须通过 recorder header 中的 next_record 来继续查找相关记录。

需要注意的是,B+树索引并不能找到具体的一条记录,能找到的只是该记录的页,数据库把页加载到内存,然后通过页目录进行二叉查找,因为二叉查找时间复杂度非常低,又在内存中进行查找,所以这部分的查找时间可以忽略不计。

文件结尾信息(File trailer)

这部分信息处于数据页的最后位置,只有 8 个字节,为了检测页是否完整的刷新至磁盘,其中只有一个 FIL_PAGE_END_LSN 部分,前 4 字节代表该页的 checksum 值,后 4 字节和 file header 中的 FIL_PAGE_LSN 值相同。

本作品采用《CC 协议》,转载必须注明作者和本文链接
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!