推荐一个检测 JavaScript 内存泄漏的神器-清一色财经

最近，Meta 开源了一款检测 JavaScript 代码内存泄漏的框架：MemLab，我们来一起看看这个框架有啥神奇之处吧。

大家好，我是ConardLi。作为一名Web应用程序开发者，排查和修复JavaScript代码的内存泄漏一直是最困扰我的问题之一。

最近，Meta开源了一款检测JavaScript代码内存泄漏的框架：MemLab，我们来一起看看这个框架有啥神奇之处吧～

推荐一个检测 JavaScript 内存泄漏的神器

2020年，Meta的工程师将Facebook.com重构为了单页应用(SPA)，程序的大部分渲染和导航都会在客户端使用JavaScript完成。后来他们又使用类似的架构来重构了Meta的大多数其他流行的网络应用程序，包括Instagram和Workplace。虽然这种架构能够提供更快的用户交互、更好的开发者体验和更像原生应用程序的感觉，但是在客户端维护Web应用的状态会让内存的管理变得更加复杂。

使用Meta网站的用户经常会快速注意到一些性能和功能正常使用的问题。然而，内存泄漏就是另一回事了。它不会立即被察觉出来，因为它一次会占用一大块内存 — 然后逐渐影响整个Web会话并让后续的交互和响应变得更慢。

Meta的工程师花费了大量时间来测试、优化和控制页面加载和交互时间，以及JavaScript的代码大小。相比之下，他们在管理Web浏览器内存方面做的工作并不多。当分析新Facebook.com的内存使用情况时，发现客户端的内存使用情况和内存不足 (OOM) 崩溃的数量一直在攀升。较高的内存使用对页面加载、交互性能、用户参与度等核心指标都有负面影响。

为了帮助开发者解决这个问题，Meta的工程师构建了MemLab，这是一个JavaScript内存测试框架，可以自动进行内存泄漏检测，并且更容易找到内存泄漏的根本原因。Meta使用MemLab成功地控制了不可持续的内存增长，并识别出了产品和基础设施中的内存泄漏和内存优化的一些手段。

导致 Web 应用内存过高的原因

因为内存泄漏通常不是很明显，在开发过程中，以及做Code Review的时候都很难发现，而且在生产环境中通常也很难找到根本原因。虽然主流的JavaScript运行时都有垃圾回收机制，那么为什么还会有内存泄漏呢？

JavaScript代码中可能会有很多隐藏对象的引用，而隐藏的引用会以许多意想不到的方式导致内存泄漏。

例如：

var obj = {};
console.log(obj);
obj = null;

在Chrome中，即使我们将引用设置为null，这段代码也会泄漏obj。发生这种情况是因为Chrome需要保留对打印对象的内部引用，以便以后可以在Web控制台中对其进行检查（即使在 Web 控制台没打开的情况下）。

在某些情况下，内存在技术上并没有发生泄漏，而是在用户会话期间线性增长而且没有限制。最常见的原因是客户端缓存没有内置任何释放的逻辑，无限滚动列表没有任何虚拟化的功能，无法在添加新内容时从列表中删除较早的内容。

我们也没有适当的自动化系统和流程来控制内存，因此防止此类问题的唯一防御措施就是专家通过Chrome DevTools定期挖掘内存泄漏，一些大型的项目几乎每天都会有发布和变更，这样的工作方式是不可持续的。

MemLab 的工作原理

MemLab通过预定义的测试场景运行无头浏览器并比较和分析JavaScript堆快照来发现内存泄漏的问题。

这个过程可以分为下面六个步骤：

1.「浏览器交互」：MemLab使用Puppeteer自动化浏览器，在目标页面上查找泄露的对象；

2.「区分堆」：导航到一个页面然后离开它，正常情况下该页面分配的大部分内存也应该被释放，如果没有，可能暗示着存在内存泄漏。MemLab通过区分JavaScript堆并记录在页面B上分配的一组对象，这些对象没有在页面A 上分配，但在重新加载页面A时仍然存在，从而发现潜在的内存泄漏；

3.「细化内存泄漏列表」：内存泄漏检测器进一步结合了特定框架的知识来细化泄漏对象的列表。例如，React分配的Fiber节点（React用于渲染虚拟DOM的内部数据结构）应该在我们访问多个选项卡后清理时释放。

4.「生成 retainer traces」：遍历堆并为每个泄漏的对象生成retainer traces。trace显示了泄漏对象为何以及如何在内存中保持活动状态。打破引用链意味着泄漏的对象将不再可以从GC的根访问，因此可以进行垃圾回收。通过一步步地跟踪，就可以找到应该设置为null的引用；

5.「聚合 retainer traces」：将所有retainer traces聚集在一起，并为每个共享相似retainer traces的泄漏对象聚合显示为一个跟踪，其中还包括调试信息，例如支配节点和保留大小。

6.「报告泄漏」：定期运行MemLab，以持续收集retainer traces，任何新的traces都会记录到内部仪表板，开发者可以查看每个内存泄漏的retainer traces上的对象属性。

MemLab 有哪些能力

内存泄漏检测

对于浏览器内存泄漏的检测，MemLab需要开发者提供的唯一输入就是一个测试场景文件，这个文件定义了如何通过使用Puppeteer API和CSS选择器覆盖三个回调来与网页交互。MemLab会自动区分JavaScript堆、优化内存泄漏并聚合结果。

JavaScript 堆的 Graph-view API

MemLab支持一个自定义的泄漏检测器，作为筛选器回调，应用于每个由目标交互分配的泄漏候选对象，但之后从不释放。泄漏过滤器回调函数可以遍历堆并确定哪些对象是内存泄漏。例如，我们的内置检漏器会跟踪React Fiber节点的返回链路，检查Fiber节点是否与React Fiber树分离。

为了分析每个可能内存泄漏的上下文，MemLab提供了一个JavaScript堆的内存效率图。这可以在不了解V8堆快照文件结构的任何领域知识的情况下查询和遍历JavaScript堆。

在视图中，堆中的每个JavaScript对象或原生对象都是一个图节点，堆中的每个JavaScript引用都是一个图的边。实际应用程序的堆大小通常很大，因此图视图需要在提供直观的面向对象堆遍历API的同时提高内存效率。因此，图节点被设计成了虚拟的，不通过JavaScript引用进行连接。当分析代码遍历堆时，虚拟图会部分地即时构建图的接触部分。图的任何部分都可以很容易地释放，因为这些虚拟节点彼此之间没有JavaScript引用。

堆视图可以从基于Chromium的浏览器、Node.js、Electron和Hermes获取的JavaScript堆快照加载。这允许分析复杂的模式并回答诸如 “有多少React Fiber节点是备用的Fiber节点，它们用于不完整的并发渲染？”之类的问题。

import {getHeapFromFile} from '@memlab/heap-analysis';
const heapGraph = await getHeapFromFile(heapFile);
heapGraph.nodes.forEach(node => {
  // heap node traversal
  node.type
  node.references
);

内存断言

Node.js程序或Jest测试也可以使用graph-view API来获取其自身状态的堆视图，进行自内存检查，并编写各种内存断言。

import type {IHeapSnapshot} from '@memlab/core';
import {config, takeNodeMinimalHeap, tagObject} from '@memlab/core';

test('memory test', async () => {
  config.muteConsole = true;
  const o1 = {};
  let o2 = {};

  // tag o1 with marker: "memlab-mark-1", does not modify o1 in any way
  tagObject(o1, 'memlab-mark-1');
  // tag o2 with marker: "memlab-mark-2", does not modify o2 in any way
  tagObject(o2, 'memlab-mark-2');

  o2 = null;

  const heap: IHeapSnapshot = await takeNodeMinimalHeap();

  // expect object with marker "memlab-mark-1" exists
  expect(heap.hasObjectWithTag('memlab-mark-1')).toBe(true);

  // expect object with marker "memlab-mark-2" can be GCed
  expect(heap.hasObjectWithTag('memlab-mark-2')).toBe(false);

}, 30000);

内存工具箱

除了内存泄漏检测，MemLab还包括一组内置的CLI命令和API，用于寻找可能的内存优化机会：

Meta 使用 MemLab 的实践

在过去的几年中，Meta一直在使用MemLab检测和诊断内存泄漏，并收集了很多有助于优化内存、减少 OOM 崩溃并改善用户体验的手段。

在2021年上半年，Facebook.com上的OOM崩溃减少了50%。

React Fiber 节点清理

为了渲染组件，React构建了Fiber树 — 一个React用于渲染虚拟DOM的内部数据结构。虽然Fiber树看起来像一棵树，但它是一个双向图，将所有Fiber节点、React组件实例和关联的HTML DOM元素强连接起来。理想情况下，React维护对组件Fiber树的根的引用，并防止Fiber树被垃圾回收。当一个组件被卸载时，React会断开组件的根与 Fiber 树的其余部分之间的连接，然后这些部分就可以被垃圾回收了。

拥有这样的强连接图的缺点是，如果有任何外部引用指向图的任何部分，就无法对整个图进行垃圾回收。例如，下面export语句在模块范围级别缓存React组件，因此相关的Fiber树和分离的DOM元素永远不会被释放。

export const Component = (( 
  <List> ... </List> 
): React.Element<typeof List>);

也不仅仅是 React 数据结构要keep alive，Hooks和它们的闭包也可以让各种其他对象保活。这意味着单个React组件泄漏可能会导致页面对象的重要部分泄漏，从而导致巨大的内存泄漏。

为了防止Fiber树中内存泄漏的级联效应，MemLab添加了一个树的完整遍历，当组件在React 18中卸载时会进行清理。这可以让垃圾回收器在清理未挂载的树方面做得更好一点。这个优化将Facebook上的平均内存使用量减少了近25%，其他使用React的站点在升级时也有了很大的改进。你可能会担心这种比较激进的清理方式可能会减慢React组件的卸载速度，但令人惊讶的是，由于内存的减少，性能也有显着的提升。

string interning

通过利用MemLab中的heap analysis API，Meta团队发现字符串占据了70%的堆内存，其中一半的字符串至少有一个重复的实例。（V8对string interning支持的不是很好，这是一种对具有相同值的字符串实例进行重复数据删除的优化。）

另外很大一部分字符串内存被Relay中缓存的键字符串消耗。通过与Relay和React Apps团队合作，可以在客户端插入和缩短过长的字符串键来优化Relay缓存键字符串。

这种优化使Relay能够缓存更多数据，允许站点向用户显示更多内容，尤其是在客户端RAM有限的情况下。内存p99和OOM崩溃减少了20%，页面渲染速度更快，用户体验得到改善，在收入上也有一定提升。

试用MemLab：

npm i -g memlab

最后：MemLab Github：https://github.com/facebookincubator/memlab

©本文为清一色官方代发，观点仅代表作者本人，与清一色无关。清一色对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。本文不作为投资理财建议，请读者仅作参考，并请自行承担全部责任。文中部分文字/图片/视频/音频等来源于网络，如侵犯到著作权人的权利，请与我们联系（微信/QQ:1074760229）。转载请注明出处：清一色财经