浅读fis3项目模块化方案modJS

前言

第3季度，公司团队需要提升整体技术能力，于是我研究m站fis项目模块化方案，写下这篇文章来浅读modJS源码实现。
限于笔者水平，如果有错误或不严谨的地方，请给予指正，十分感谢。

一、JS现有的模块规范

CommonJS

1,参考nodeJs语法
2,同步风格
3,移步阮老师

1,回调风格的支持异步
2,移步 github

1,SeaJS
2,移步 github

ES6是新一版的标准,对语言有扩展，添加了新的属性与方法。这一标准虽然现在还要用babel来做浏览器支持（将ES6编译成ES5才能被浏览器支持），但是未来浏览器会逐渐对其有原生的支持。到时候JS语法会发生更新，我们可以使用更简单的方式编写代码，使得编程更容易。

二、js模块化方案 modJS的介绍

简介modJS是什么呢

简单的说，modJS是百度fex-team提供的一个轻量级的模块加载器，类似requirejs。
但modJS并不完全兼容规范amd/cmd，事实上，只支持非常简单的全局方法define(id,factory)。另外factory提供了3个参数require/exports/module，用于引用和导出模块。modJS源码只有200行左右，相比之下requirejs的源码达到了2000+行。
除了体量非常小之外，modJS配合fis3的fis3-hook-commonjs插件，可以在纯前端项目中实现类似nodejs一样的开发体验。

我们为什么要使用modJS呢!

1,加载器更小
上面已经提到，200+行和2000+行的差异
2,配合构建工具，开发体验更好
之前开发时，需要将每一个模块的代码单独放在define内部，并且需要申明每一个依赖。而现在，只需要使用类似nodejs的方式编写代码，需要使用某个依赖模块时，直接require('id')即可。发布编译时，由构建工具统一添加define包裹，自动添加模块id（默认根据路径生成，也可以在fis3的配置中声明格式）。整体的开发体验更好一些。此外，js文件打包及异步依赖的问题，也可以通过生成resourceMap来解决。

我们怎么使用modJS呢!

使用defined(id,factory)来定义一个模块
在平常开发中，只需写factory中的代码即可，无需手动定义模块。打包工具fis3会自动将模块代码嵌入factory的闭包里。 factory提供了3个参数：require, exports, module，用于模块的引用和导出。

例1使用require (id) 来引用已预先加载完成的模块

// a.js 文件
define('js/a', function(require, exports, module) {
    function init() {
        console.log('模块a被引用')
    }
    return { init: init }
    // or 
    // exports.init = init
    // or
    // modules.exports = { init : init }
})

// index.html 文件
<script src="./mod.js" type="text/javascript"></script> 
 <script type="text/javascript">
    require('js/a').init();
</script>

例2 使用require.async (ids, onload, onerror) 来引用异步加载的模块

// index.html 文件
 <script src="./mod.js" type="text/javascript"></script> 
 <script type="text/javascript">
    require.async('js/a',function(mod){
        mod.init()
    },function(id){
        console.error("模块" + id + "加载失败")
    });
</script>

考虑到有些模块无需在启动时载入，因此modJS提供了可以在运行时异步加载模块的接口。ids可以是一个模块名，或者是数组形式的模块名列表。当所有都加载都完成时，onload被调用，ids对应的所有模块实例将作为参数传入。如果加载错误或者网络超时，onerror将被触发。超时时间通过require.timeout设置，默认为5000(ms)。

例3 使用require.resourceMap(obj) 解析模块依赖树

// resource_map.js 文件
require.resourceMap({
    "pkg": {},
    "res": {
        "js/a": {
            "url": "js/a.js",
            "type": "js"
        },
        "js/b": {
            "url": "js/b.js",
            "type": "js"
        },
        "js/c": {
            "url": "js/c.js",
            "type": "js",
            "deps": ["js/a", "js/b"]
        }
    }
})

三、modJS的源码细节

从modJS的使用上可以看出，modJS暴露了两个全局变量define、require,现在跟随modJS源代码研究一下实现细节。

define(id,factory)

用define函数包裹js模块来完成模块的定义,包裹操作由打包工具fis3自动完成。

// mod.js 文件
var require, define;

(function(global) {
    if (require) return; // 避免重复加载mod.js而导致已定义模块丢失

    var factoryMap = {},
        modulesMap = {},
        loadingMap = {},
        resMap = {},
        pkgMap = {};
        
    /**
     * @desc 定义js模块, 用define函数包裹模块，由打包工具自动完成
     * @param {String} id 模块唯一标识
     * @param {Function} factory 工厂函数，接受三个参数require、exports、modules,其中exports只是modules.exports的引用
     * @return void
     * @example define('js/a',function(require,exports,module){ return { init: function init(){} } })
     */
    define = function(id, factory) {
        id = alias(id);
        factoryMap[id] = factory;

        var queue = loadingMap[id]; // 异步加载模块,回调函数依次执行
        if (queue) {
            for (var i = 0, len = queue.length; i < len; i++) {
                queue[i]()
            }
            delete loadingMap[id]; // 从正在加载中移除
        }
    }
    
    function alias(id) {
        return id.replace(/\.js$/i, '');
    }
    
})(this) // 使用函数包裹，避免污染全局变量

比如，当我们有一个js文件a.js，文件内容如下：

// a.js 文件
console.log('模块a');

function init() {
    console.log('模块a被引用')
}

return { init: init }
// or 
// exports.init=init
// or
// modules.exports={init:init}

用打包工具进行define函数包裹后，a.js文件就变成了如下内容，此时我们就完成了对一个标识为“js/a”的模块的包裹:

define('js/a', function(require, exports, module) {
    console.log('模块a');

    function init() {
        console.log('模块a被引用')
    }

    return { init: init }

    // or 
    // exports.init=init
    // or
    // modules.exports={init:init}
})

当检测到模块被引用，打包工具会将该模块对应的srcipt标签自动嵌入HTML文档中进行预加载，加载完成后浏览器会立即执行，这样就完成了一个模块的定义。

// index.html 文件
<script src="./mod.js" type="text/javascript"></script> 
<script src="./js/a.js" type="text/javascript"></script>

require(id)
在上一步操作中，完成了对模块标识为“js/a”的模块的定义，现在可以通过require(id)对已定义的模块进行引用了。 require(id)所需要做的就是初始化factory。

// mod.js 文件
var require, define;

(function(global) {

     /** 此处省略部分代码 **/ 

    /**
     * @desc 同步引用已定义的js模块，若该模块未定义，则抛出 “Can not find module”错误
     * @param {String} id 模块唯一标识
     * @return {Object|String} 返回模块内部执行的return语句，如果模块内部没有执行return，则返回模块内部调用的 moduls.exoprts； return 优先级高于 module.exports 
     * @example require('js/a')
     */
    require = function(id) {
        id = alias(id);
    
        var module = modulesMap[id];
    
        // 避免重复初始化factory
        if (module) {
            return module.exports
        }
    
        // 初始化factory
        var factory = factoryMap[id];
        if (!factory) {
            throw "Can not find module `" + id + "`";
        }
    
        module = modulesMap[id] = { exports: {} };
        var result = typeof factory === "function" ? factory.apply(module, [require, module.exports, module]) : factory;
    
        if (result) { // return 优先级高于 module.exports 
            module.exports = result;
        }
        return module.exports
    }
    
    function alias(id) {
        return id.replace(/\.js$/i, '');
    }

})(this)

requier.asyn(ids,onload,onerror)

在上面的介绍中，我们知道：通过define(id,factory)函数包裹一个模块，并使用打包工具fis3自动将该模块对应的script内嵌至HTML文档中完成模块的预加载，然后require(id)函数再引用已经预加载好的模块。但考虑到有些模块无需在启动时载入，所以需要通过requier.async(ids,onload,onerror)进行运行时异步加载模块
那么，运行时异步加载模块需要解决那些问题呢?

模块内部依赖解析
模块资源定位
通过DOM操作动态的往HTML head标签里插入HTML script标签来异步加载模块
模块及模块内部依赖异步加载完成后的执行onload回调，如果加载失败或超时执行onerror回调

对于模块内部依赖解析和模块资源定位这个两个问题，modJS是通过require.resourceMap函数解析打包工具fis3生成的rerource_map对象实现的。
比如，js目录下有三个js文件a.js、b.js、c.js，c.js引用了a.js和b.js,那么打包工具就会解析文件之间的依赖关系以及资源定位，生成一个json对象:

"pkg": {},
"res": {
    "js/a": {
        "url": "js/a.js",
        "type": "js"
    },
    "js/b": {
        "url": "js/b.js",
        "type": "js"
    },
    "js/c": {
        "url": "js/c.js",
        "type": "js",
        "deps": ["js/a", "js/b"]
    }
}

再使用require.resourceMap(obj)函数进行包裹，生成一个resource_map.js文件,内嵌至HTML文档中,浏览器加载完resource_map.js文件后，执行require.resourceMap函数就完成了模块内部依赖解析以及模块资源定位

// resource_map.js 文件
require.resourceMap({
    "pkg": {},
    "res": {
        "js/a": {
            "url": "js/a.js",
            "type": "js"
        },
        "js/b": {
            "url": "js/b.js",
            "type": "js"
        },
        "js/c": {
            "url": "js/c.js",
            "type": "js",
            "deps": ["js/a", "js/b"]
        }
    }
})


// mod.js 文件
var require, define;

(function(global) {

    /** 此处省略部分代码 **/ 
    
    /** 
     * @desc js模块依赖解析
     * @param {Object} obj js模块依赖对象： { pkg: {}, res: { 'js/a': { url: 'js/a.js', type: 'js' }, 'js/b': { url: 'js/b.js', type: 'js', deps: ['js/a'] } } }
     * @return void
     */
    require.resourceMap = function(obj) {
        var k, col;
    
        // merge `res` & `pkg` fields
        col = obj.res;
        for (k in col) {
            if (col.hasOwnProperty(k)) {
                resMap[k] = col[k];
            }
        }
        
        col = obj.pkg;
        for (k in col) {
            if (col.hasOwnProperty(k)) {
                pkgMap[k] = col[k];
            }
        }
    }

})(this)

// index.html
<script src="./mod.js" type="text/javascript"></script>
<script src="./resource_map.js" type="text/javascript"></script>
<script type="text/javascript">
    require.async('js/c', function(mod) {
        mod.init()
    });
</script>

现在，解决了模块内部依赖解析和资源定位的问题，就可以通过DOM操作动态的往HTML head标签里插入HTML script标签来异步加载模块，并在模块及模块内部依赖异步加载完成后的执行onload回调，如果异步加载失败或超时的执行onerror回调，异步加载超时时间，modJS通过require.timeout来设置，默认为5s

var require, define;

(function(global) {
    
    /** 此处省略部分代码 **/ 
        
    var head = document.getElementsByTagName('head')[0];

    /**
     * @desc 异步加载js模块
     * @param {String} id 模块唯一标识
     * @param {Function} onload 所有的模块(包括模块内部依赖)都加载完成后执行回调函数
     * @param {Function} onerror 模块加载错误或超时时执行的回调函数,超时时间通过require.timeout设置，默认5s
     * @example require.async(id,onload,onerror)
     * @example require.async([id1,id2,...],onload,onerror)
     * @tips 先异步加载该模块，再异步加载该模块的依赖，为什么这种顺序不会出现问题？ 因为会等待所有的异步模块加载完毕之后才会执行onload函数
     */
    require.async = function(ids, onload, onerror) {
        if (typeof ids === 'string') {
            ids = [ids]
        }

        var needMap = {},
            needNum = 0;

        function findDependence(depArr) {
            for (var i = 0, len = depArr.length; i < len; i++) {
                var dep = alias(depArr[i]);

                if (dep in factoryMap) { // skip loaded
                    var child = resMap[dep] || resMap[dep + '.js']
                    if (child && 'deps' in child) { // 通过resource_map.js检查模块是否存在内部依赖，若存在，且不依赖本身，则递归内部依赖
                        (child.deps !== depArr) && findDependence(child.deps)
                    }

                    continue;
                }

                if (dep in needMap) { // skip loading
                    continue;
                }

                needMap[dep] = 1;
                needNum++;
                loadScript(dep, updateNeed, onerror) // 动态加载脚本。 updateNeed函数有权访问外部函数的变量(needNum，ids，onload)，并只能得到这些变量的最后一个值（闭包）

                var child = resMap[dep] || resMap[dep + '.js']
                if (child && 'deps' in child) { // 通过resource_map.js检查模块是否存在内部依赖，若存在，且不依赖本身，则递归内部依赖
                    (child.deps !== depArr) && findDependence(child.deps)
                }
            }
        }

        
        function updateNeed() {
            if (0 == needNum--) { // 等待所有的模块以及模块的内部依赖加载成功，再执行回调函数onload
                var args = [];
                for (var i = 0, n = ids.length; i < n; i++) {
                    args[i] = require(ids[i]); // 将加载完成的模块作为参数传递给onload回调函数，如果有模块为加载成功，将抛出Can not find module异常
                }
                typeof onload === 'function' && onload.apply(global, args) // onload函数的作用域指向全局
            }
        }

        findDependence(ids);
        updateNeed(); 
    }

    /** 
     * @desc 加载异步js脚本超时时间,默认5s
     */
    require.timeout = 5000;

    /** 
     * @desc 通过script标签动态加载脚本
     * @param {String} id 模块唯一标识
     * @param {Function} calback js模块loaded的回调函数
     * @param {Function} onerror: js模块errored的回调函数
     * @return void
     */
    function loadScript(id, callback, onerror) {
        var queue = loadingMap[id] || (loadingMap[id] = []);
        queue.push(callback)

        var res = resMap[id] || resMap[id + ".jd"]; // 通过resource_map.js获取模块对应的url
        var pkg = res.pkg;

        if (!res.url) return;
        if (pkg) { 
            url = pkgMap[pkg].url;
        } else {
            url = res.url || id;
        }

        createScript(url, onerror && function() {
            onerror(id)
        });

    }

    function createScript(url, onerror) {
        var script = document.createElement('script');

        if (onerror) {
            var tid = setTimeout(onerror, require.timeout); // 超时执行onerror

            function onload() {
                clearTimeout(tid) // loaded 清除定时器
            }

            if ('onload' in script) {
                script.onload = onload
            } else {
                script.onreadystatechange = function() {
                    if (this.readyState === 'loaded' || this.readyState === 'complete') {
                        onload();
                    }
                }
            }

            script.onerror = function() {
                clearTimeout(tid);  // errored 清除定时器
                onerror()
            };
        }

        script.src = url;
        script.type = "text/javascript";
        head.appendChild(script);

        return script;
    }

})(this);

四、总结

define(id,factory)，定义模块，对模块进行define函数包裹，由打包工具完成。
require(id)，同步加载已定义的js模块，若该模块未定义，则抛出 “Can not find module”错误。
require.resourceMap，通过resource_map.js 解析js模块依赖树，以及模块的资源定位，resource_map.js由打包工具解析文件依赖和资源定位并包裹require.resourceMap函数完成。
require.timeout，设置异步加载模块的超时时间，默认5s。
require.async(ids,onload,onerror)，通过DOM操作动态的往HTML head标签里插入HTML script标签来异步加载模块以及模块的内部依赖,script标签的src通过resourceMap取得。
异步加载模块以及模块的内部依赖完成后，通过require引入该模块，并作为参数传递给require.async的回调函数onload；异步加载失败或超时，执行onerror回调。

五、源码

移步

最后编辑于：2019.09.28 12:44:19

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,684评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,143评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,214评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,788评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,796评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,665评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,027评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,679评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,346评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,664评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,766评论 1赞 331
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,412评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,015评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,974评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,203评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,073评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,501评论 2赞 343