天天看点

「译」JavaScript 垃圾回收机制原理

作者:web前端分享

JavaScript 中的内存管理是自动执行的,对开发者来说是不可见的。 我们创建原始值、对象、函数等等所有这些都需要内存。 然而,当不再需要某些东西时会发生什么? JavaScript引擎如何发现它并清理它?

1.可达性(Reachability)

JavaScript 中内存管理的主要概念是可达性。简而言之,“可达”指的是那些可以以某种方式访问 或使用的值,JavaScript 能保证其一直存储在内存中。有些值是明确不能被删除的,比如:

  • 当前执行的函数,以及它的局部变量和参数。
  • 当前嵌套调用链上的其他函数,它们的局部变量和参数。
  • 全局变量。
  • 还有一些其他的,内部的对象

以上这些值统一表示根节点,即 roots。

如果任何其他值可以通过引用或引用链从 roots 到达,则认为它是可达的。例如,如果全局变量中有一个对象,并且该对象引用了另一个对象的属性,则该对象被认为是可达的。它引用的那些其他变量也是可达的。

JavaScript 引擎中有一个称为垃圾收集器的后台进程,它监视所有对象并删除那些变得无法访问的对象。

2.垃圾回收示例

2.1 示例 1

// user has a reference to the object
let user = {
  name: 'John',
};
           
「译」JavaScript 垃圾回收机制原理

这里的箭头描绘了一个对象引用。全局变量“user”引用对象 {name: "John"},而 John 的“name”属性存储了一个基础类型值,即 John 字符串。如果 user 的值被覆盖为 null,则引用丢失:

「译」JavaScript 垃圾回收机制原理

现在 John 变得无法访问了。没有办法访问它,也没有对它的引用,此时垃圾收集器将丢弃数据并释放内存。

2.2 示例 2

现在假设将引用 user 赋值给 admin:

// user has a reference to the object
let user = {
  name: 'John',
};

let admin = user;
           

引用关系如下:

「译」JavaScript 垃圾回收机制原理

此时修改 user 引用:

user = null;
           

此时,该对象仍然可以通过 admin 全局变量访问,因此它必须保留在内存中。如果覆盖掉 admin,那么它可以被删除。

2.3 相互关联的对象

function marry(man, woman) {
  woman.husband = man;
  man.wife = woman;
  return {
    father: man,
    mother: woman,
  };
}
let family = marry(
  {
    name: 'John',
  },
  {
    name: 'Ann',
  }
);
           

函数 marry 通过给两个对象相互引用来模拟“结婚”,并返回一个包含它们的新对象。生成的内存结构如下:

「译」JavaScript 垃圾回收机制原理

截至目前,所有对象都是可达的,现在让我们删除两个引用:

delete family.father;
delete family.mother.husband;
           
「译」JavaScript 垃圾回收机制原理

仅删除这两个引用中的其中之一是不够的,因为所有对象仍然可以访问。 但是删除以上两者,那么可以看到 此时 John 不再被引用:

「译」JavaScript 垃圾回收机制原理

传出引用无关紧要,只有传入引用才能使对象可达。因此,John 现在无法访问,将从内存中删除,其所有数据也变得无法访问。垃圾回收后:

「译」JavaScript 垃圾回收机制原理

2.4 引用孤岛

所有相互关联的对象变得无法访问并从内存中删除,源代码如上:

family = null;
           

内存快照变为:

「译」JavaScript 垃圾回收机制原理

这个例子展示了可达性概念的重要性。很明显,John 和 Ann 仍然有联系,都有传入的引用, 但这还不够。之前的“family”对象已经从 roots 中删除,不再有任何引用,所以整个岛变得不可访问并将被删除。

3.内部垃圾回收算法

垃圾回收的基本算法被称为 “mark-and-sweep”。垃圾回收器会定期执行以下“垃圾回收”步骤:

  • 垃圾收集器找到所有的根,并“标记”(记住)它们。
  • 遍历并“标记”来自它们的所有引用
  • 遍历标记的对象并标记它们的引用。所有被遍历到的对象都会被记住,以免将来再次遍历到同一个对象
  • 如此操作,直到所有可达的(从根部)引用都被访问到
  • 没有被标记的对象都会被删除

例如,假如对象有如下的结构:

「译」JavaScript 垃圾回收机制原理

可以清楚地看到右侧有一个“引用孤岛”,现在看看“标记和清除”垃圾收集器如何处理它。

第一步标记所有的根:

「译」JavaScript 垃圾回收机制原理

然后它们的引用被标记了:

「译」JavaScript 垃圾回收机制原理

如果还有引用的话,继续标记:

「译」JavaScript 垃圾回收机制原理

现在,所有无法通过这个过程访问到的对象被认为是不可达的,并且会被删除。

「译」JavaScript 垃圾回收机制原理

还可以将这个过程想象成从根溢出一个巨大的油漆桶,它流经所有引用并标记所有可到达的对象。然后移除未标记的。这是垃圾收集工作的概念,JavaScript 引擎做了许多优化,使垃圾回收运行速度更快,并且不影响正常代码运行。下面是垃圾回收的一些建议:

  • 分代收集(Generational collection)—— 对象被分成两组:“新的”和“旧的”。许多对象出现,完成它们的工作并很快死去,它们可以很快被清理。那些长期存活的对象会变得“老旧”,而且被检查的频次也会减少。
  • 增量收集(Incremental collection)—— 如果有许多对象,并且试图一次遍历并标记整个对象集,则可能需要一些时间,并在执行过程中带来明显的延迟。所以引擎试图将垃圾收集工作分成几部分来做,然后将这几部分逐一进行处理。这需要它们之间有额外的标记来追踪变化,虽然这样会有许多微小的延迟但是影响不大。
  • 闲时收集(Idle-time collection)—— 垃圾收集器只会在 CPU 空闲时尝试运行,以减少可能对代码执行的影响。

参考资料

https://javascript.info/garbage-collection

https://jayconrod.com/posts/55/a-tour-of-v8-garbage-collection

https://v8.dev/

https://mrale.ph/

继续阅读