您现在的位置是:首页 >其他 >说说MySQL中MVCC机制的原理网站首页其他

说说MySQL中MVCC机制的原理

lovoo 2023-06-08 04:00:03
简介说说MySQL中MVCC机制的原理

一、概述:

了解了MySql的底层架构后,我们今天要深入了解下什么是MVCC。

MVCC,全称Multi-Version Concurrency Control,即多版本并发控制。MVCC是一种多并发控制的方法,一般在数据库管理系统中,实现对数据库的并发访问,在编程语言中实现事务内存。
我们知道,MySql在5.5后由MyISAM存储引擎改成了InnoDB存储引擎,主要是因为InnoDB是支持事务的,那么当多线程同时执行的时候,可能会出现并发问题。这个时候可能会出现一个能够控制并发的方法,MVCC就起到了这个作用。

MVCC主要靠undo log版本链与ReadView来实现。

二、什么是Undo log

  • Undo log主要用于事务回滚时恢复原来的数据。
  • mysql在执行sql时,会将一天逻辑相反的日志保存到undo log中。因此,undo log中记录的也是逻辑日志。
  • 但mysql执行Insert语句时,会在undo log日志中记录本次插入的主键id。等事务回滚时,delete删除此id。
  • 当MySQL执行update语句时,会在undo log中保存修改前的数据。等事务回滚时,再执行一次update,得到原来的数据。
  • 当MySQL执行delete语句时,会在undo log中保存删除前的数据。等事务回滚时,再执行insert,插入原来的数据。
  • 数据库中的四大特性–原子性,即事务是不可分割的,要么全部成功,要不全部失败,其底层就靠undo log来实现。在执行某一条语句失败时,就会对之前事务的语句进行回滚。

三、行的隐藏列

  • 在数据库的每行上,除了存放真实的数据以外,还存在3个隐藏的列:row_id、trx_id和roll_pointer
  • row_id,行号:

如果当前表有整数类型的主键,那么row_id的值就是主键的值
如果没有整数类型的主键,则MySQL会按照字段的顺序选择一个非空的整数类型的唯一索引为row_id
如果都没有找到,则会创建一个自动增长的整数作为row_id

  • trx_id,事务号:

当一个事务开始执行前,MySQL就会为这个事务分配一个全局自增的事务id。
之后该事务对当前进行的增、改、删除等操作时,都会将自己的事务ID记录到trx_id中。

  • roll_pointer,回滚指针:

事务对当前数据改动时,会将旧的数据记录到undo log中,在将数据写入当前行,且当前的roll_pointer指向刚才那个undo log,因此可通过roll_pointer来找到改行前一个版本。
当一直有事务对该行改动时,就会一直生成undo log,最终将会形成undo log版本链。

四、Undo log版本链

一开始,我们使用以下语句创建一个stduent表

CREATE TABLE `student` (
	`id` INT ( 11 ) NOT NULL AUTO_INCREMENT,
	`name` VARCHAR ( 255 ) NOT NULL,
	`age` INT ( 11 ) NOT NULL,
  PRIMARY KEY ( `id` ) USING BTREE 
) ENGINE = INNODB;

现在开启第一个事务,事务id为1,执行以下插入语句。

INSERT INTO student VALUES ( 1, "a", 24 );

那么当前的示意图如下:
在这里插入图片描述
因为该数据是新插入的,因此它的roll_pointer指向的undo log为空。

接着开启第2个事务,分配的事务id是2,执行以下修改命令。

UPDATE student SET NAME = 'b' WHERE id = 1;

现在的示意图变为:
在这里插入图片描述

当开启第3个事务,分配到事务id是3,执行以下修改命令。

UPDATE student SET age = 25 WHERE id = 1;

示意图变为:
在这里插入图片描述
每个事务对该行进行改动时,都会生成一个undo log,用于保存之前的版本,之后再将新版本的roll_pointer指向刚才生成的undo log。
因此,roll_pointer可以将这些不同版本的undo log串联起来,形成undo log的版本链。

五、关于ReadView

首先需要理解一下快照读与当前读
快照读:简单的select查询,即不包括 select … lock in share mode, select … for update,可能会读到数据的历史版本。
当前读:以下语句都是当前读,总是读取最新版本,会对读取的最新版本加锁。

select ... lock in share mode
select ... for update
insert
update
delete

在事务执行每一个快照读或事务初次执行快照读时,会生成一致性视图,即ReadView。
ReadView的作用是,判断undo log版本链中的哪些数据对当前事务可见。

ReadView包含以下几个重要的参数:

  • m_ids
    在创建ReadView的那一刻,mysql中所有未提交的事务id集合。

  • min_trx_id
    m_ids中的最小值

  • max_trx_id
    mysql即将为下一个事务分配的事务id,并不是m_ids中的最大值。

  • creator_trx_id
    即创建此ReadView的事务id

简要的示意图如下:
在这里插入图片描述

那么事务在执行快照读时,可以通过以下的规则来确定undo log版本链上的哪个版本数据可见。

  • 如果当前undo log的版本的trx_id<min_trx_id,说明该版本对应的事务在生成ReadView之前就已经提交了,因此是可见的。

  • 如果当前undo log的版本的trx_id≥max_trx_id,说明该版本对应的事务在生成ReadView之后才开始的,因此是不可见的。

  • 如果当前undo log的版本的trx_id∈[min_trx_id,max_trx_id),如果在这个范围里,还要判断trx_id是否在m_ids中:

      在m_ids中,说明版本对应的事务未提交,因此是不可见的。
    
      不在m_ids中,说明版本对应的事务已经提交,因此是可见的。
    
  • 如果当前undo log的版本的trx_id=creator_trxt_id,说明事务正在访问自己修改的数据,因此是可见的。

  • 当undo log版本链表的头结点数据被判定为不可见时,则利用roll_pointer找到上一个版本,再进行判断。如果整个链表中都没有找到可见的数据,则代表当前的查询找不到数据。

风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。