如何 hack Node.js 模块？

xiaoxiao2025-12-06 48

为何要去 hack？

在业务开发过程中，往往会依赖一些 Node.js 模块，hack 这些 Node.js 模块的主要目的是在不修改工具源码的情况下，篡改一些特定的功能。可能会是出于以下几种情况的考虑：

总是存在一些特殊的本地需求，不一定能作为工具的通用需求来暴露正常的 API 给更多的用户。临时且紧急的需求，提 PR 已经来不及了。为什么不直接去改源码？考虑到工具会不定期升级，想使用工具的最新特性，改源码可维护性太差。

期望

举个栗子：

// a.jsmodule.exports = function(){ dosomething();}// b.js module.exports = require(a);// c.js console.log(require(b));

b 是项目 c 依赖的一个工具模块，b 依赖 a。希望只在项目 c 中，b 调用 a 时，a 的函数里能注入一些方法 injectSomething()

hack 之前 c 的输出 function(){ dosomething();} 期望：hack 之后 c 的输出 function(){ injectSomething(); dosomething();}

具体案例比如：在做个人自动化工具时，需要 mock 一些工具的手动输入；在本地构建时，需要修改通用的构建流程（后面案例部分会详细说）

主要方法

利用模块 cache 篡改模块对象属性

这是我最早使用的方法，在模块 a 的类型是 object 的时候，可以在自己的项目 c 中提早 require 模块 a，按照你的需求修改一些属性，这样当模块 b 再去 require 模块 a 时，从缓存中取出的模块 a 已经是被修改过的了。

模块 a、b、c 栗子如下：

// a.jsmodule.exports = { p}// b.jsconst a = require(a);a.p();// c.jsrequire(b);

我想修改 a 的方法 p，在 c 中进行如下修改即可，而无需直接去修改工具 a、b 的源码:

// c.jsconst a = require(a);let oldp = a.p; a.p = function(...args){ injectSomething(); oldp.apply(this, args);}require(b);

缺陷：在某些模块属性是动态加载的情况，不是那么灵敏，而且只能篡改引用对象。但大部分情况下还是能够满足需求的。

修改require.cache

在遇到模块暴露的是非对象的情况，就需要直接去修改 require 的 cache 对象了。关于修改 require.cache 的有效性，会在后面的原理部分详细说，先来简单的说下操作：

//a.js 暴露的非对象,而是函数module.exports = function(){ doSomething();}//c.jsconst aOld = require(a); let aId = require.resolve(aPath);require.cache[aId] = function(...args){ injectSomething(); aOld.apply(this, args);}require(b);

缺陷：可能后续调用链路会有人手动去修改 require.cache，例如热加载。

修改 require

这种方法是直接去代理 require ，是最稳妥的方法，但是侵入性相对来说比较强。Node.js 文件中的 require 其实是在 Module 的原型方法上，即 Module.prototype.require。后面会详细说，先简单说下操作：

const Module = require('module');const _require = Module.prototype.require;Module.prototype.require = function(...args){ let res = _require.apply(this, args); if(args[0] === 'a') { // 只修改a模块内容 injectSomething(); } return res;}

缺陷：对整个 Node.js 进程的 require 操作都具有侵入性。

注意点

path路径

require.cache 是一个 key、value 的 map，key 看上去是模块所在的绝对路径，然而是不能用绝对路径直接去用的，需要 require.resolve 来解析路径，解析后才是 cache 中正确的 key 格式。

下面对比下区别：

// 模块的绝对路径/Users/kino/.def/def_modules/.builders/@ali/builder-cake-kpm/node_modules/@ali/builder-cake-kpm/node_modules/@ali/cake-webpack-config/index.js// 用 require.resolve 转义后的结果/Users/kino/.def/def_modules/.builders/@ali/builder-cake-kpm/node_modules/.0.16.23@@ali/cake-webpack-config/index.js

多进程的情况

模块间调用的链路比较长，有可能会新建子进程，需要考虑你项目中的入口文件和你需要代理的文件是否在一个进程中，简单的方法就是在入口文件和你需要代理的文件打印 pid：

console.log(process.pid)

如果一致，那么直接在入口调用前代理即可，否则情况会更复杂点，需要找到相应的进程调用处进行代理。

案例

DEF 是淘宝前端的集成开发环境，支持前端模块创建、构建打包、发布等一系列流程。在以下案例中，主要 hack 的 Node.js 项目便是 DEF。

篡改输入(prompt)

场景：使用 DEF 创建模块 or 发布模块时

原因：想一键完成批量创建 or 批量发布，不想手动输入。

解决过程：以创建模块为例

首先找到 DEF 的入口文件，即一个 bin 目录下的路径，可以通过这个入口文件不断追溯下去，发现创建模块的 generator 用的是 yeoman-generator 的方法。对 prompt 的方法进行代理，可以将该基础库提前 require，更改掉其 prompt 的方法即可。

附上示例代码（示例只篡改 def add 模块的创建类型，其他输入的篡改方法类似）：

#!/usr/bin/env node'use strict';require('shelljs/global');const path = require('path');const HOME = process.env.HOME;const yeomanRouter = require(path.join(HOME, '.def/def_modules/.generators/@ali/generator-abs-router/node_modules/@ali/generator-abs-router/node_modules/yeoman-generator'));yeomanRouter.generators.Base.prototype.prompt = function(list, callback) { let item = list[0]; let prop = {}; prop[item.name] = 'kissy-pc'; // 让模块类型输入自动为pc callback(prop);};//require real def pathconst defPath = which('def').stdout;require(defPath);

篡改构建流程（webpackconfig）

场景：一个淘宝的前端组件，需要在使用def本地调试时提前更改一个文件内容。（淘宝组件的构建会按照组件类型统一构建器，并不是每个组件单独去配置）

原因：一般来说，这种情况可以选择注释代码大法，本地调试时打开注释，发布前干掉。但这样造成代码很不美观，也容易引起误操作。不妨在本地调试的 reflect 过程中动态更换掉就好了。

解决过程：

追溯 def dev 调用链路，找到最终reflect的文件, 在这个构建器 @ali/builder-cake-kpm 项目里。所使用的webpack的配置项在 @ali/cake-webpack-config 下。

现在就是往 webpack 配置项里动态注入一个 webpack loader 的过程了，我需要的 loader 是一个 preLoader，代码非常简单，我把它放在业务项目的文件里:

module.exports = function(content) { return content.replace('require$\'\.\/plugin\'$', "require('./localPlugin')");}; @ali/cake-webpack-config 暴露的是个函数而非对象，所以必须从 require 下手了，最后附上案例的代理过程： #!/usr/bin/env node'use strict';require('shelljs/global');const path = require('path');const HOME = process.env.HOME;const CWD = process.cwd();const cakeWcPath = path.join(HOME, '.def/def_modules/.builders/@ali/builder-cake-kpm/node_modules/@ali/builder-cake-kpm/node_modules/@ali/cake-webpack-config');const preLoaderPath = path.join(CWD, 'debug/plugin_compile.js'); // 注入的loader路径const cakeWebpackConfig = require(cakeWcPath);const requireId = require.resolve(cakeWcPath);require.cache[requireId].exports = (options) => { if (options.callback) { let oldCb = options.callback; options.callback = function(err, obj) { obj.module.preLoaders = [{ 'test': /index\.js$/, 'loader': preLoaderPath }]; oldCb(err, obj); } } cakeWebpackConfig(options);}//require real def pathconst defPath = which('def').stdout;require(defPath);

结束语

去 hack 一个 Node.js 模块，需要对该 Node.js 模块的调用链路有一定的了解，在很多情况下，不一定是最优的方法，但也不失为一种解决方案。有趣的是，Node.js 源码中其实有一行这样的注释：

// Hello, and welcome to hacking node.js!// some descriptions

So, just hacking for fun!

作者：宣予

转载自：http://taobaofed.org/blog/2016/10/27/how-to-hack-nodejs-modules/

最新回复(0)

如何 hack Node.js 模块？

为何要去 hack？

期望

主要方法

利用模块 cache 篡改模块对象属性

修改require.cache

修改 require

相关原理

node的启动过程

一个进程只存在一个 cache 对象？

Module._cache 和 require.cache 的关系

require 不同场景的挂载

注意点

path路径

多进程的情况

案例

篡改输入(prompt)

篡改构建流程（webpackconfig）

结束语