您现在的位置是:首页 >其他 >说说MySQL中MVCC机制的原理网站首页其他
说说MySQL中MVCC机制的原理
一、概述:
了解了MySql的底层架构后,我们今天要深入了解下什么是MVCC。
MVCC,全称Multi-Version Concurrency Control,即多版本并发控制。MVCC是一种多并发控制的方法,一般在数据库管理系统中,实现对数据库的并发访问,在编程语言中实现事务内存。
我们知道,MySql在5.5后由MyISAM存储引擎改成了InnoDB存储引擎,主要是因为InnoDB是支持事务的,那么当多线程同时执行的时候,可能会出现并发问题。这个时候可能会出现一个能够控制并发的方法,MVCC就起到了这个作用。
MVCC主要靠undo log版本链与ReadView来实现。
二、什么是Undo log
- Undo log主要用于事务回滚时恢复原来的数据。
- mysql在执行sql时,会将一天逻辑相反的日志保存到undo log中。因此,undo log中记录的也是逻辑日志。
- 但mysql执行Insert语句时,会在undo log日志中记录本次插入的主键id。等事务回滚时,delete删除此id。
- 当MySQL执行update语句时,会在undo log中保存修改前的数据。等事务回滚时,再执行一次update,得到原来的数据。
- 当MySQL执行delete语句时,会在undo log中保存删除前的数据。等事务回滚时,再执行insert,插入原来的数据。
- 数据库中的四大特性–原子性,即事务是不可分割的,要么全部成功,要不全部失败,其底层就靠undo log来实现。在执行某一条语句失败时,就会对之前事务的语句进行回滚。
三、行的隐藏列
- 在数据库的每行上,除了存放真实的数据以外,还存在3个隐藏的列:row_id、trx_id和roll_pointer
- row_id,行号:
如果当前表有整数类型的主键,那么row_id的值就是主键的值
如果没有整数类型的主键,则MySQL会按照字段的顺序选择一个非空的整数类型的唯一索引为row_id
如果都没有找到,则会创建一个自动增长的整数作为row_id
- trx_id,事务号:
当一个事务开始执行前,MySQL就会为这个事务分配一个全局自增的事务id。
之后该事务对当前进行的增、改、删除等操作时,都会将自己的事务ID记录到trx_id中。
- roll_pointer,回滚指针:
事务对当前数据改动时,会将旧的数据记录到undo log中,在将数据写入当前行,且当前的roll_pointer指向刚才那个undo log,因此可通过roll_pointer来找到改行前一个版本。
当一直有事务对该行改动时,就会一直生成undo log,最终将会形成undo log版本链。
四、Undo log版本链
一开始,我们使用以下语句创建一个stduent表
CREATE TABLE `student` (
`id` INT ( 11 ) NOT NULL AUTO_INCREMENT,
`name` VARCHAR ( 255 ) NOT NULL,
`age` INT ( 11 ) NOT NULL,
PRIMARY KEY ( `id` ) USING BTREE
) ENGINE = INNODB;
现在开启第一个事务,事务id为1,执行以下插入语句。
INSERT INTO student VALUES ( 1, "a", 24 );
那么当前的示意图如下:
因为该数据是新插入的,因此它的roll_pointer指向的undo log为空。
接着开启第2个事务,分配的事务id是2,执行以下修改命令。
UPDATE student SET NAME = 'b' WHERE id = 1;
现在的示意图变为:
当开启第3个事务,分配到事务id是3,执行以下修改命令。
UPDATE student SET age = 25 WHERE id = 1;
示意图变为:
每个事务对该行进行改动时,都会生成一个undo log,用于保存之前的版本,之后再将新版本的roll_pointer指向刚才生成的undo log。
因此,roll_pointer可以将这些不同版本的undo log串联起来,形成undo log的版本链。
五、关于ReadView
首先需要理解一下快照读与当前读
快照读:简单的select查询,即不包括 select … lock in share mode, select … for update,可能会读到数据的历史版本。
当前读:以下语句都是当前读,总是读取最新版本,会对读取的最新版本加锁。
select ... lock in share mode
select ... for update
insert
update
delete
在事务执行每一个快照读或事务初次执行快照读时,会生成一致性视图,即ReadView。
ReadView的作用是,判断undo log版本链中的哪些数据对当前事务可见。
ReadView包含以下几个重要的参数:
-
m_ids
在创建ReadView的那一刻,mysql中所有未提交的事务id集合。 -
min_trx_id
m_ids中的最小值 -
max_trx_id
mysql即将为下一个事务分配的事务id,并不是m_ids中的最大值。 -
creator_trx_id
即创建此ReadView的事务id
简要的示意图如下:
那么事务在执行快照读时,可以通过以下的规则来确定undo log版本链上的哪个版本数据可见。
-
如果当前undo log的版本的trx_id<min_trx_id,说明该版本对应的事务在生成ReadView之前就已经提交了,因此是可见的。
-
如果当前undo log的版本的trx_id≥max_trx_id,说明该版本对应的事务在生成ReadView之后才开始的,因此是不可见的。
-
如果当前undo log的版本的trx_id∈[min_trx_id,max_trx_id),如果在这个范围里,还要判断trx_id是否在m_ids中:
在m_ids中,说明版本对应的事务未提交,因此是不可见的。 不在m_ids中,说明版本对应的事务已经提交,因此是可见的。
-
如果当前undo log的版本的trx_id=creator_trxt_id,说明事务正在访问自己修改的数据,因此是可见的。
-
当undo log版本链表的头结点数据被判定为不可见时,则利用roll_pointer找到上一个版本,再进行判断。如果整个链表中都没有找到可见的数据,则代表当前的查询找不到数据。