浅析JS模块化规范：CommonJS，AMD，CMD

模块化编程的进化过程

原始写法

这种做法的缺点很明显：”污染”了全局变量，无法保证不与其他模块发生变量名冲突，而且模块成员之间看不出直接关系。

function m1(){
	//...
}
function m2(){
	//...
}

对象写法

这样的写法会暴露所有模块成员，内部状态可以被外部改写。

var module1 = new Object({
	_count : 0,
	m1 : function (){
  		//...
	},
	m2 : function (){
  		//...
	}
});

立即执行函数写法

使用”立即执行函数”（Immediately-Invoked Function Expression，IIFE），可以达到不暴露私有成员的目的。

var module1 = (function(){
	var _count = 0;
	var m1 = function(){
  		//...
	};
	var m2 = function(){
  		//...
	};
	return {
  		m1 : m1,
  		m2 : m2
	};
})();

JavaScript模块的基本写法，之后对这种写法继续加工。

放大模式

继承其他模块，放大模式（augmentation）

var module1 = (function (mod){
	mod.m3 = function () {
  		//...
	};
	return mod;
})(module1);

以上代码说明的是：module1模块添加了一个新方法m3()，然后返回新的module1模块

宽放大模式

有可能被继承的模块不存在，就会加载一个不存在的空对象，这时就要采用“款放大模式”

var module1 = ( function (mod){
	//...
	return mod;
})(window.module1 || {});

输入全局变量

独立性是模块的重要特点，模块内部最好不与程序的其他部分直接交互。
为了在模块内部调用全局变量，必须显式地将其他变量输入模块。

var module1 = (function ($, YAHOO) {
	//...
})(jQuery, YAHOO);

模块规范

CommonJS

编写模块

根据CommonJS规范，一个单独的文件就是一个模块，每一个模块都是一个单独的作用域，在一个文件定义的变量（还包括函数和类），都是私有的，对其他文件是不可见的。
通过exports或者module.exports来导出需要暴露的接口

加载模块

require()函数用于加载模块：

var math = require('math');
math.add(2,3); // 5

浏览器环境：加载模块会导致浏览器阻塞，所以要采用“异步加载”方式，也就是AMD规范诞生的背景。所以CommonJS更适合服务器环境。

评价

优点

服务器端模块便于重用
NPM 中已经有将近20万个可以使用模块包
简单并容易使用

缺点

同步的模块加载方式不适合在浏览器环境中，同步意味着阻塞加载，浏览器资源是异步加载的
不能非阻塞的并行加载多个模块

AMD

异步模块定义，AMD是”Asynchronous Module Definition”的缩写.

定义模块

define(id?, dependencies?, factory);

ID: 是一个字符串，表示模块标识。可以省略，则会定义一个匿名模块。
dependencies: 是一个数组，成员是依赖模块的id。可以省略，默认的依赖是：[“require”, “exports”, “module”]
factory：是一个回调函数，在依赖的模块加载成功后，会执行这个回调函数

一般写法：

define("adder", ["math"], function (math) {
    return {
        addTen : function (x) {
            return math.add(x, 10);
        }
    };
});

默认依赖：

define("adder", function (require, exports) {
    exports.addTen = function (x) {
        return x + 10;
    };
});

匿名模块：

define(["math"], function (math) {
    return {
        addTen : function (x) {
            return math.add(x, 10);
        }
    };
});

兼容CommonJS(匿名+默认依赖)：

// module app/mime-client
define(function (require, exports, module) {
    var rest, mime, client;

    rest = require('rest');
    mime = require('rest/interceptor/mime');

    client = rest.chain(mime);

    module.exports = client;
});

exports写法

通过exports暴露接口

define(function(require, exports) {
  exports.foo = 'bar'; // 对外提供 foo 属性
  exports.doSomething = function() {}; // 对外提供 doSomething 方法
});

通过return暴露接口

define(function(require) {
  // 通过 return 直接提供接口
  return {
    foo: 'bar',
    doSomething: function() {}
  };
});

如果return是模块中唯一的代码，还可以写成这样：
define({
foo: 'bar',
doSomething: function() {}
});

错误的写法：

define(function(require, exports) {
	// 错误用法！！!
	exports = {
		foo: 'bar',
		doSomething: function() {}
	};
});

正确的写法是用return或者给module.exports赋值：

define(function(require, exports, module) {
	// 正确写法
	module.exports = {
		foo: 'bar',
		doSomething: function() {}
	};
});

提示：提示：exports仅仅是module.exports的一个引用。在factory内部给exports重新赋值时，并不会改变module.exports的值。因此给exports赋值是无效的，不能用来更改模块接口。

加载模块

有两个参数，当模块加载完之后，才调用回调函数，第一个参数是一个数组，成员就是要加载的模块

require([module], callback);
//example:
require(['math'], function (math) {
	math.add(2, 3);
});

目前，主要有两个Javascript库实现了AMD规范：require.js和curl.js。

requireJS

RequireJS 的基本思想为：通过一个函数来将所有所需要的或者说所依赖的模块实现装载进来，然后返回一个新的函数（模块）。
贴上阮一峰的requireJS教程

引入requireJS

普通方式：
<script src="js/require.js"></script>
异步加载方式(async属性表明这个文件需要异步加载，避免网页失去响应。IE不支持这个属性，只支持defer，所以把defer也写上)：
　<script src="js/require.js" defer async="true" ></script>

最普遍的写法：

<script data-main='scripts/main' src='scripts/require.js'></script>

data-main属性的作用是，指定网页程序的主模块。在上例中，就是js目录下面的main.js，这个文件会第一个被require.js加载。由于require.js默认的文件后缀名是js，所以可以把main.js简写成main。

main.js的写法

require()函数接受两个参数。第一个参数是一个数组，表示所依赖的模块；第二个参数是一个回调函数，当前面指定的模块都加载成功后，它将被调用。加载的模块会以参数形式传入该函数，从而在回调函数内部就可以使用这些模块。

// main.js
require(['moduleA', 'moduleB', 'moduleC'], function (moduleA, moduleB, moduleC){
	// some code here
});

代码含义：主模块的依赖模块是['moduleA', 'moduleB', 'moduleC']。默认情况下，require.js假定这三个模块与main.js在同一个目录，文件名分别为moduleA.js，moduleB.js和moduleC.js，然后自动加载。回调函数的参数只要位置对应即可，不一定要同名。

require.config() 自定义加载

require.config()就写在主模块（main.js）的头部，参数为一个对象。

require.config({
    paths: {
        "jquery": "lib/jquery.min",
        "underscore": "lib/underscore.min",
        "backbone": "lib/backbone.min"
    }
});
//或者
require.config({
	baseUrl: "js/lib",
	paths: {
  		"jquery": "jquery.min",
  		"underscore": "underscore.min",
  		"backbone": "backbone.min"
	}
});

加载非AMD规范的模块

举例来说，underscore和backbone这两个库，都没有采用AMD规范编写。如果要加载它们的话，必须先定义它们的特征。

require.config({
	shim: {
		'underscore': {
			exports: '_'
		},
		'backbone': {
			deps: ['underscore', 'jquery'],
			exports: 'Backbone'
		}
	}
});

exports值（输出的变量名），表明这个模块外部调用时的名称；
deps数组，表明该模块的依赖性。

评价

优点

适合在浏览器环境中异步加载模块
可以并行加载多个模块

缺点

提高了开发成本，代码的阅读和书写比较困难，模块定义方式的语义不顺畅
不符合通用的模块化思维方式，是一种妥协的实现

CMD

Common Module Definition规范和AMD很相似，尽量保持简单，并与CommonJS和Node.js的Modules规范保持了很大的兼容性。在Sea.js中实现。
官方文档：CMD 模块定义规范

定义模块

和AMD标准定义模块的方式一致，但有一些不同，主要表现在增加了一些对象：

define.cmd：一个空对象，可用来判定当前页面是否有 CMD 模块加载器

if (typeof define === "function" && define.cmd) {
  // 有 Sea.js 等 CMD 模块加载器存在
}

require.async(id, callback?)
用来在模块内部异步加载模块，并在加载完成后执行指定回调。

define(function(require, exports, module) {
	//异步加载一个模块，在加载完成时，执行回调
  	require.async('./b', function(b) {
	    b.doSomething();
  	});
  	// 异步加载多个模块，在加载完成时，执行回调
  	require.async(['./c', './d'], function(c, d) {
	    c.doSomething();
	    d.doSomething();
  	});
});

require.resolve(id)
使用模块系统内部的路径解析机制来解析并返回模块路径。该函数不会加载模块，只返回解析后的绝对路径。
define(function(require, exports) {
console.log(require.resolve('./b'));
// ==> http://example.com/path/to/b.js
});

评价

与 RequireJS 的 AMD 规范相比，CMD 规范尽量保持简单，并与 CommonJS 和 Node.js 的 Modules 规范保持了很大的兼容性。