您现在的位置是:首页 >技术杂谈 >Golang GC 三色标记法网站首页技术杂谈

Golang GC 三色标记法

wangxiaoangg 2024-06-17 10:13:39
简介Golang GC 三色标记法

目录

一 概念基础

1.1三色标记法将对象分为三类

1.2 标记过程

1.3 STW

1.4 屏障机制

1.4.1强、弱三色不变式

1.4.2 插入屏障

1.4.3 删除屏障

1.4.4 混合屏障

二 GC过程

2.1 阶段1:Mark Setup 标记准备

2.2 阶段2:Marking 标记

2.3阶段3:Mark Termination 标记结束

2.4 阶段4:Sweeping 清理


推荐
如何优化golang gc_wangxiaoangg的博客-CSDN博客

一 概念基础

1.1三色标记法将对象分为三类

把图过程中遇到的对象,按“是否访问过”这个条件标记成以下三种颜色:

1.白色对象(可能死亡):未被回收器访问到的对象。在回收开始阶段,所有对象均为白色,当回收结束后,白色对象均不可达。

灰色对象(波面):已被回收器访问到的对象,但回收器需要对其中的一个或多个指针进行扫描,因为他们可能还指向白色对象。

黑色对象(确定存活):已被回收器访问到的对象,其中所有字段都已被扫描,黑色对象中任何一个指针都不可能直接指向白色对象。
 

1.2 标记过程

  1. 起初所有的对象都是白色的;
  2. 从根对象出发扫描所有可达对象,标记为灰色,放入待处理队列;
  3. 从待处理队列中取出灰色对象,将其引用的对象标记为灰色并放入待处理队列中,自身标记为黑色;
  4. 重复步骤3,直到待处理队列为空,此时白色对象即为不可达的“垃圾”,回收白色对象;
  5. 回收所有的白色对象,也就是回收垃圾

根对象

在垃圾回收的术语中又叫做根集合,它是垃圾回收器在标记过程时最先检查的对象。

  • 全局变量:程序在编译期就能确定的那些存在于程序整个生命周期的变量。
  • 执行栈:每个 goroutine 都包含自己的执行栈,这些执行栈上包含栈上的变量及指向分配的堆内存区块的指针。
  • 寄存器:寄存器的值可能表示一个指针,参与计算的这些指针可能指向某些赋值器分配的堆内存区块。

1.3 STW

STW(Stop The World)机制是指在进行垃圾回收时,会暂停应用程序的运行,以便进行垃圾回收操作。这意味着在进行垃圾回收时,应用程序将无法继续执行。

为什么需要STW
STW(Stop-The-World)机制来确保并发操作的正确性。

如果不设置STW机制,那么在进行GC时,应用程序线程可能会继续执行,从而导致内存管理的不一致性和错误。此外,GC可能会导致内存分配和释放的不连续,从而导致内存碎片化问题。

因此,需要STW机制来确保GC的正确性和内存管理的一致性。虽然STW机制会导致一定的性能损失,但是这是必要的代价,以确保应用程序的正确性和稳定性。

1.4 屏障机制

1.4.1强、弱三色不变式

强三色不变式:
强制性的不允许黑色对象引用白色对象,只能引用灰色对象,这样就不会出现白色对象被误删的情况。

弱三色不等式 :
保护灰色对象到白色对象的路径不会断;

黑色对象可以引用白色对象,白色对象存在其他灰色对象对它的引用。
或可达它的链路上游存在灰色对象。这样实则是黑色对象引用白色对象,白色对象处于一个被删除的状态,但是上游灰色对象的引用,可以保护白色对象,使其安全。

为了遵循上述两种方式,GC算法演进到两种屏障方式,“插入屏障”和“删除屏障”。


1.4.2 插入屏障

在A对象引用B对象时,B对象被标记为灰色。(将B挂在A下游,B必须被标记为灰色)

满足强三色不等式。

插入屏障机制在栈空间的对象操作不使用,仅仅使用在堆空间对象的操作中。

1.4.3 删除屏障

被删除的对象,如果本身为灰色或白色,那么标记为灰色。

满足弱三色不等式。

1.4.4 混合屏障

插入写屏障和删除写屏障的缺点:

  • 插入写屏障:结束时需要STW来重新扫描栈,标记栈上引用的白色对象存活
  • 删除写屏障:回收精度低,GC开始时STW扫描堆栈来记录快照,这个过程会保护开始时刻的所有的存活对象。

Go1.8引入混合写屏障机制,避免了对栈的重复扫描过程,极大减少了STW的时间。

  1. GC开始将栈上的对象全部扫描并标记为黑色(之后不再进行第二次重复扫描,无需STW)
  2. GC期间,任何在栈上创建的新对象,都标记为黑色
  3. 被删除的对象标记为灰色
  4. 被添加的对象标记为灰色

二 GC过程

2.1 阶段1:Mark Setup 标记准备

为了打开写屏障,必须停止每个goroutine,让垃圾收集器观察并等待每个goroutine进行函数调用,等待函数调用是为了保证goroutine停止时处于安全点。(期间会STW)

2.2 阶段2:Marking 标记

一旦写屏障打开,垃圾收集器就开始标记阶段。

标记阶段需要标记在堆内存中仍然在使用中的值。首先检查所有现goroutine的堆栈,以找到堆内存的根指针。然后收集器必须从那些根指针遍历堆内存图,标记可以回收的内存。

当存在新的内存分配时,会暂停分配内存过快的那些 goroutine,并将其转去执行一些辅助标记(Mark Assist)的工作,从而达到放缓继续分配、辅助 GC 的标记工作的目的。

2.3阶段3:Mark Termination 标记结束

这个阶段会关闭掉阶段1开启的屏障,并计算下一次清理的目标和计划。(本阶段会STW)

2.4 阶段4:Sweeping 清理

清理阶段用于回收标记阶段中标记出来的可回收内存。当应用程序goroutine尝试在堆内存中分配新内存时,会触发该操作,清理导致的延迟和吞吐量降低被分散到每次内存分配时。

本阶段会并发执行,清除前面标记出来需清理的内存。

//todo GC过程图列


引用

gc 三色标记(三色标记法)

风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。