您现在的位置是:首页 >技术交流 >Golang Mutex怎么实现互斥的?网站首页技术交流

Golang Mutex怎么实现互斥的?

动态一时爽,重构火葬场 2023-06-06 12:00:02
简介Golang Mutex怎么实现互斥的?

Mutex是Golang常见的并发原语,不仅在开发过程中经常使用到,如channel这种具有golang特色的并发结构也依托于Mutex从而实现

type Mutex struct {
  // 互斥锁的状态,比如是否被锁定
  state int32
  // 表示信号量。堵塞的协程会等待该信号量,解锁的协程会释放该信号量
  sema int32
}
const (
  // 当前是否已经上锁
  mutexLocked = 1 << iota // 1
  // 当前是否有唤醒的goroutine
  mutexWoken // 2
  // 当前是否为饥饿状态
  mutexStarving // 4
  // state >> mutexWaiterShift 得到等待者数量
  mutexWaiterShift = iota // 3

  starvationThresholdNs = 1e6 // 判断是否要进入饥饿状态的阈值
)

Mutex有正常饥饿模式。

  • 正常模式:等待者会入队,但一个唤醒的等待者不能持有锁,以及与新到来的goroutine进行竞争。新来的goroutine有一个优势——他们已经运行在CPU上。

    超过1ms没有获取到锁,就会进入饥饿模式

  • 饥饿模式:锁的所有权直接移交给队列头goroutine,新来的goroutine不会尝试获取互斥锁,即使互斥锁看起来已经解锁,也不会尝试旋转。相反,他们自己排在等待队列的末尾。

    若等待者是最后一个,或者等待小于1ms就会切换回正常模式

获取锁

未锁——直接获取

func (m *Mutex) Lock() {
	// 快路径。直接获取未锁的mutex
  // 初始状态为0,所以只要状态存在其他任何状态位都是无法直接获取的
	if atomic.CompareAndSwapInt32(&m.state, 0, mutexLocked) {
		if race.Enabled {
			race.Acquire(unsafe.Pointer(m))
		}
		return
	}
	// Slow path (outlined so that the fast path can be inlined)
	m.lockSlow()
}

在不饥饿且旋的不多的情况下,尝试自旋

		// 只要原状态已锁且不处于饥饿状态,并满足自旋条件
		if old&(mutexLocked|mutexStarving) == mutexLocked && runtime_canSpin(iter) {
			// 在当前goroutine没有唤醒,且没有其他goroutine在尝试唤醒,且存在等待的情况下,cas标记存在goroutine正在尝试唤醒。若标记成功就设置当前goroutine已经唤醒了
			if !awoke && old&mutexWoken == 0 && old>>mutexWaiterShift != 0 &&
				atomic.CompareAndSwapInt32(&m.state, old, old|mutexWoken) {
				awoke = true
			}
      // 自旋
			runtime_doSpin()
      // 自旋次数加一
			iter++
      // 更新原状态
			old = m.state
			continue
		}

具体的自旋条件如下

  • 自旋次数小于4
  • 多核CPU
  • p数量大于1
  • 至少存在一个p的队列为空
const (
	locked uintptr = 1

	active_spin     = 4
	active_spin_cnt = 30
	passive_spin    = 1
)

func sync_runtime_canSpin(i int) bool {
	// sync.Mutex is cooperative, so we are conservative with spinning.
	// Spin only few times and only if running on a multicore machine and
	// GOMAXPROCS>1 and there is at least one other running P and local runq is empty.
	// As opposed to runtime mutex we don't do passive spinning here,
	// because there can be work on global runq or on other Ps.
	if i >= active_spin || ncpu <= 1 || gomaxprocs <= int32(sched.npidle+sched.nmspinning)+1 {
		return false
	}
	if p := getg().m.p.ptr(); !runqempty(p) {
		return false
	}
	return true
}

自旋究竟在做什么呢?

自旋是由方法runtime_doSpin()执行的,实际调用了procyield()

# 定义了一个runtime.procyield的文本段,通过NOSPLIT不使用栈分裂,$0-0 表示该函数不需要任何输入参数和返回值
TEXT runtime·procyield(SB),NOSPLIT,$0-0
	# 从栈帧中读取cycles参赛值,并储存在寄存器R0中
	MOVWU	cycles+0(FP), R0
# 组成无限循环。在每次循环中,通过YIELD告诉CPU将当前线程置于休眠状态
# YIELD: x86上,实现为PAUSE指令,会暂停处理器执行,切换CPU到低功耗模式并等待更多数据到达。通常用于忙等待机制,避免无谓CPU占用
# ARM上,实现为WFE(Wait For Event),用于等待中断或者其他事件发生。在某些情况下可能会导致CPU陷入死循环,因此需要特殊处理逻辑解决
again:
	YIELD
	# 将R0值减1
	SUBW	$1, R0
	# CBNZ(Compare and Branch on Non-Zero)检查剩余的时钟周期数是否为0。不为0就跳转到标签again并再次调用YIELD,否则就退出函数
	CBNZ	R0, again
	RET

以上汇编代码分析过程感谢chatgpt的大力支持

从代码中可以看到自旋次数是30次

const active_spin_cnt = 30

func sync_runtime_doSpin() {
	procyield(active_spin_cnt)
}

计算期望状态

  1. 原状态不处于饥饿状态,新状态设置已锁状态位

    原状态处于已锁状态或饥饿模式,新状态设置等待数量递增

    当前goroutine是最新获取锁的goroutine,在正常模式下期望就是要获取锁,那么就应该设置新状态已锁状态位

    如果锁已经被抢占了,或者处于饥饿模式,那么就应该去排队

  2. 若之前尝试获取时已经超过饥饿阈值时间,且原状态已锁,那么新状态设置饥饿状态位

  3. 若goroutine处于唤醒,则新状态清除正在唤醒状态位

    期望是已经获取到锁了,那么自然要清除正在获取的状态位

		new := old
		// Don't try to acquire starving mutex, new arriving goroutines must queue.
    // 若原状态不处于饥饿状态,就给新状态设置已加锁
		if old&mutexStarving == 0 {
			new |= mutexLocked
		}
    // 只要原状态处于已锁或者饥饿模式,就将新状态等待数量递增
		if old&(mutexLocked|mutexStarving) != 0 {
			new += 1 << mutexWaiterShift
		}
    // 若已经等待超过饥饿阈值时间且原状态已锁,就设置新状态为饥饿
    // 这也意味着如果已经不处于已锁状态,就可以切换回正常模式了
		if starving && old&mutexLocked != 0 {
			new |= mutexStarving
		}
    // 如果已经唤醒了(也就是没有其他正在抢占的goroutine),则在新状态中清除正在唤醒状态位
		if awoke {
			// The goroutine has been woken from sleep,
			// so we need to reset the flag in either case.
			if new&mutexWoken == 0 {
				throw("sync: inconsistent mutex state")
			}
			new &^= mutexWoken
		}

尝试达成获取锁期望

  1. cas尝试从原状态更新为新的期望状态

  2. 如果失败,则更新最新状态,继续尝试获取锁

    说明这期间锁已经被抢占了

  3. 若原来既没有被锁住,也没有处于饥饿模式,那么就获取到锁,直接返回

  4. 排队。若之前已经在等待了就排到队列头

  5. 获取信号量。此处会堵塞等待

  6. 被唤醒,认定已经持有锁。并做以下饥饿相关处理

    1. 计算等待时长,若超出饥饿阈值时间,就标记当前goroutine处于饥饿

    2. 若锁处于饥饿模式,递减等待数量,并且在只有一个等待的时候,切换锁回正常模式

if atomic.CompareAndSwapInt32(&m.state, old, new) {
      // 如果原状态既没有处于已锁状态,也没有处于饥饿模式
      // 那么就表示已经获取到锁,直接退出
			if old&(mutexLocked|mutexStarving) == 0 {
				break // locked the mutex with CAS
			}
      // 若已经在等待了,就排到队列头
			queueLifo := waitStartTime != 0
			if waitStartTime == 0 {
				waitStartTime = runtime_nanotime()
			}
      // 尝试获取信号量。此处获取一个信号量以实现互斥
      // 此处会进行堵塞
			runtime_SemacquireMutex(&m.sema, queueLifo, 1)
      // 被信号量唤醒之后,发现若等待时间超过饥饿阈值,就切换到饥饿模式
			starving = starving || runtime_nanotime()-waitStartTime > starvationThresholdNs
			old = m.state
      // 处于饥饿模式下
			if old&mutexStarving != 0 {
				// If this goroutine was woken and mutex is in starvation mode,
				// ownership was handed off to us but mutex is in somewhat
				// inconsistent state: mutexLocked is not set and we are still
				// accounted as waiter. Fix that.
        // 若既没有已锁且正在尝试唤醒,或者等待队列为空,就代表产生了不一致的状态
				if old&(mutexLocked|mutexWoken) != 0 || old>>mutexWaiterShift == 0 {
					throw("sync: inconsistent mutex state")
				}
        // 当前goroutine已经获取锁,等待队列减1;若等待者就一个,就切换正常模式。退出
				delta := int32(mutexLocked - 1<<mutexWaiterShift)
				if !starving || old>>mutexWaiterShift == 1 {
					delta -= mutexStarving
				}
				atomic.AddInt32(&m.state, delta)
				break
			}
      // 不处于饥饿模式下,设置当前goroutine为唤醒状态,重置自璇次数,继续尝试获取锁
			awoke = true
			iter = 0
		} else {
      // 若锁被其他goroutine占用了,就更新原状态,继续尝试获取锁
			old = m.state
		}

考虑几种场景

  • 如果lock当前只有一个goroutine g1去获取锁,那么会直接快路径,cas更新已锁状态位,获取到锁
  • 如果锁已经被g1持有,
    1. 此时g2会先自旋4次,
    2. 然后计算期望状态为已锁、等待数量为1、唤醒状态位被清除
    3. 在cas更新的时候尝试更新锁状态成功,接着因为原状态本身处于已锁,所以就不能获取到锁,只能排队,信号量堵塞
    4. g1释放锁后,g2被唤醒,接着再次计算期望状态,并cas更新状态成功,直接获取到锁
  • 如果锁已经被g1持有,且g2在第一次尝试获取时超过了1ms(也就是饥饿阈值),那么
    1. 计算期望状态为已锁、饥饿、清除唤醒状态位
    2. cas更新状态成功,排在队列头,并被信号量堵塞
    3. g1释放锁后,g2被唤醒就直接获取到锁,并减去排队数量以及清空饥饿位

释放锁

只有已锁——直接释放

如果没有排队的goroutine,没有处于饥饿状态,也没有真正尝试获取锁的goroutine,那么就可以直接cas更新状态为0

func (m *Mutex) Unlock() {
	// Fast path: drop lock bit.
	new := atomic.AddInt32(&m.state, -mutexLocked)
	if new != 0 {
		// Outlined slow path to allow inlining the fast path.
		// To hide unlockSlow during tracing we skip one extra frame when tracing GoUnblock.
		m.unlockSlow(new)
	}
}

慢释放

  1. 如果原锁没有被锁住,就报错
  2. 若原状态不处于饥饿状态,尝试唤醒等待者
    1. 若现在锁已经被获取、正在获取、饥饿或者没有等待者,直接返回
    2. 期望状态等待数量减1,并设置正在唤醒状态位
    3. cas尝试更新期望状态,若成功,释放
    4. 失败说明在这过程中又有goroutine在尝试获取,那么继续下一轮释放
  3. 处于饥饿状态,直接释放信号量,移交锁所有权
func (m *Mutex) unlockSlow(new int32) {
  // 若原状态根本没有已锁状态位
	if (new+mutexLocked)&mutexLocked == 0 {
		throw("sync: unlock of unlocked mutex")
	}
  // 若原状态不处于饥饿状态
	if new&mutexStarving == 0 {
		old := new
		for {
      // 若没有等待,或者存在goroutine已经被唤醒,或者已经被锁住了,就不需要唤醒任何人,返回
			if old>>mutexWaiterShift == 0 || old&(mutexLocked|mutexWoken|mutexStarving) != 0 {
				return
			}
			// Grab the right to wake someone.
      // 设置期望状态为正在获取状态位,并减去一个等待者
			new = (old - 1<<mutexWaiterShift) | mutexWoken
      // 尝试cas更新为期望新状态,若成功就释放信号量,失败就更新原状态,进行下一轮释放
      // 失败说明在这过程中又有goroutine在尝试获取,比如已经获取到了、变成饥饿了、自旋等
			if atomic.CompareAndSwapInt32(&m.state, old, new) {
				runtime_Semrelease(&m.sema, false, 1)
				return
			}
			old = m.state
		}
	} else {
    // 饥饿模式下就移交锁所有权给下一个等待者,并放弃时间片,以便该等待者可以快速开始
		runtime_Semrelease(&m.sema, true, 1)
	}
}
风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。