1.1 基本类型和引用类型的值
ECMAScript变量可能包含两种不同数据类型的值:基本类型值和引用类型值。基本类型值指的是简单的数据段,而引用类型值指那些可能由多个值构成的对象。
1.1.1 动态的属性
对于引用类型的值,我们可以为其添加属性和方法,也可以改变和删除其属性和方法。
1.1.2 复制变量值
如果从一个变量向另一个变量复制基本类型的值,会在变量对象上创建一个新值,然后把该值复制到为新变量分配的位置上。
当从一个变量向另一个变量复制引用类型的值时,同样也会将储存在变量对象中的值复制一份放到为新变量分配的空间中。不同的是,这个值的副本实际上是一个指针,而这个指针指向存储在堆中的一个对象。复制操作结束后,两个变量实际上将引用用一个对象。因此,改变其中一个变量,就会影响另一个变量。
1.1.3 传递参数
ECMAScript中所有函数的参数都是按值传递的。也就是说,把函数外部的值复制给函数内部的参数,就和把值从一个变量复制到另一个变量一样。
在向参数传递基本类型的值时,被传递的值会复制给一个局部变量(即命名参数,或者用ECMAScript的概念来说,就是arguments对象中的一个元素)。在向参数传递引用类型的值时,会把这个值在内存中的地址复制给一个局部变量,因此这个局部变量的变化会反映在函数的外部。
使用数值等基本类型值来说明按值传递参数比较简单,但如果使用对象,那问题就不怎么好理解了。请看以下例子:
function setName(obj) {
obj.name = "Nicholas";
}
var person = new Object();
setName(person);
alert(person.name); // "Nicholas"
以上代码创建一个对象,并将其保存在变量person中。然后,这个变量被传递到setName()函数中之后就被复制给了obj。在这个函数内部,obj和person引用的是同一个对象。换句话说,即使这个变量是按值传递的,obj也会按引用来访问同一个对象。于是,当在函数内部为obj添加name属性后,函数外部的person也将有所反映;因为person指向的对象在堆内存中只有一个,而且是全局对象。有很多开发人员错误地认为:在局部作用域中修改的对象会在全局作用域中反映出来,就说明参数是按引用传递的。为了证明对象是按值传递,下面将举一个经过修改的例子:
function setName(obj) {
obj.name = "Nicholas";
obj = new Object();
obj.name = "Greg";
}
var person = new Object();
setName(person);
alert(person.name); // "Nicholas"
如果以上修改的例子中,person是按引用传递的,那么person就会自动被修改为指向其name属性值为"Greg"的新对象。但是,当接下来再访问person.name时,显示的值仍然是"Nicholas“。这说明即使在函数内部修改了参数的值,但原始的引用仍然保持未变。实际上,当在函数内部重写obj时,这个变量的引用就是一个局部对象了。而这个局部对象会在函数执行完毕后立即被销毁。
1.1.4 检测类型
在检测基本数据类型的时候,可以使用typeof操作符。但是,在检测引用类型的值时,这个操作符的用处不大。通常,我们并不是想知道某个值是对象,而是想知道它是什么类型的对象。对此,ECMAScript提供了instanceof操作符,其语法如下所示:
result = variable instanceof constructor
如果变量是给定引用类型的实例,那么instanceof操作符就会返回true。根据规定,所有引用类型的值都是Object的实例。因此,在检测一个引用类型值和Object构造函数时,instanceof操作符始终返回true。当然,如果使用instanceof操作符检测基本类型的值,则该操作符始终会返回false,因为基本类型不是对象。
1.2 执行环境及作用域
1.2.1 执行环境
执行环境(execution context,EC),又称执行上下文,定义了变量或函数有权访问的其他数据,决定了它们各自的行为。
JavaScript中执行环境可以分为三种:
- Global Code(默认的代码执行环境)
- Function Code(函数被调用时,函数体中运行的代码)
- Eval Code(在Eval函数内运行的代码)
执行环境可以认为是一个对象,大体结构如下:
EC = {
VariableObject: /* arguments, vars, function declaration */ ,
ScopeChain: /* variable object, all parent scopes */ ,
this: /* context object */
}
1.2.2 执行环境栈
一系列活动的执行环境从逻辑上形成一个执行环境栈。栈底总是全局环境,栈顶是当前(活动的)执行环境。下面是执行环境栈的抽象视图:
当浏览器首次载入脚本时,它将默认进入全局执行上下文(在Web浏览器中,全局执行环境被认为是window对象)。如果执行流进入一个函数时,将会创建一个新的执行环境并且将它压入一个环境栈中。而在函数执行结束之后,栈将其环境弹出,把控制权返回给之前的执行环境。
1.2.3 变量对象(variable object,VO)
每个执行环境都有一个与之关联的变量对象,环境中定义的所有变量和函数都保存在这个环境中。但是,VO不包含以下两种情况:
- 函数表达式不在VO中
- 函数的执行环境中,没有使用var声明的变量(这种变量是"全局"的声明方式,并不在与该函数的执行环境与之相联的VO中)
VO分为全局上下文VO(全局对象,Global object)和函数上下文的AO。
- 进入执行上下文时,VO的初始化过程具体如下(该过程是有先后顺序的):
- 函数的形参(arguments,当进入函数执行环境时)——变量对象的一个属性,其属性名就是形参的名字,其值就是实参的值;对于没有传递的参数,其值为
undefined
; - 函数声明(FD,FunctionDeclaration) —— 变量对象的一个属性,其属性名和值都是函数对象创建出来的;如果变量对象已经包含了相同名字的属性,则完全替换它的值;
- 变量声明(var,VariableDeclaration) —— 变量对象的一个属性,其属性名即为变量名,其值为undefined;如果变量名和已经声明的函数名或者函数的参数名相同,则不会影响已经存在的属性。
- 执行代码阶段时,VO中的一些属性undefined值将会确定。
1.2.4 活动对象(activation object,AO)
在函数的执行上下文中,VO是不能直接访问的,此时由活动对象(activation object)扮演VO的角色。AO是在进入函数的执行上下文时创建的,通过arguments对象初始化。
AO = {
arguments: {
callee: ,
length: ,
properties-indexes: //函数传参参数值
}
};
当然,AO也同时拥有VO的属性。
1.2.5 作用域链(scope chain)
当代码在一个环境中执行时,会创建变量对象的一个作用域链。作用域链的用途,是保证对执行环境有权访问的所有变量和函数的有序访问。作用域链的前端,始终都是当前执行的代码所在环境的变量对象。如果这个环境是函数,则将其活动对象作为变量对象。
作用域链中的下一个变量对象来自包含(外部)环境,而再下一个变量对象则来自下一个包含环境。这样,一直延续到全局执行环境;全局执行环境的变量对象始终都是作用域链中的最后一个对象。
标识符(可以认为是变量,函数声明或者函数中的参数)解析是沿着作用域链一级一级地搜索标识符的过程。搜索过程始终从作用域链的前端开始,然后逐级地向后回溯,直至找到标识符为止(如果找不到标识符,通常会导致错误发生)。
1.2.6 this
this是执行上下文的一个属性,不是某个变量对象的属性。this的值直接从执行上下文中获取,而不会从作用域链中搜寻。也就是说this的值只取决于进入上下文时的情况。所以,this是不允许赋值的。
1.3 执行上下文创建
JavaScript解释器创建执行上下文的两个阶段:
- 创建阶段(函数被调用,但是在开始执行函数代码之前):
- 初始化作用域链
- 创建VO/AO(详情见VO的初始化过程)
- 设置this的值
- 激活/代码执行阶段:
- 在当前上下文执行/解释函数代码,并随着代码一行行执行设置变量的值
示例代码:
function foo(i) {
var a = 'hello';
var b = function PrivateB() {};
function c() {}
}
foo(22);
针对上述代码,创建阶段得到AO:
fooExecutionContext = {
ScopeChain: { ... },
VariableObject: {
arguments: {
0: 22,
length: 1
},
i: 22,
c: pointer to function c(),
a: undefined,
b: undefined
},
this: { ... }
}
激活阶段,AO被更新:
fooExecutionContext = {
ScopeChain: { ... },
VariableObject: {
arguments: {
0: 22,
length: 1
},
i: 22,
c: pointer to function c(),
a: 'hello',
b: pointer to function PrivateB()
},
this: { ... }
}
1.4 延长作用域链
有些语句可以在作用域链的前端临时增加一个变量对象,该变量对象会在代码执行后被移除。在两种情况下会发生这种现象。具体来说,就是当执行流进入下列任何一个语句时,作用域链就会得到加长:
- try-catch语句的catch块
- with语句
这两个语句都会在作用域链的前端添加一个变量对象。对with语句来说,会将指定的对象添加到作用域链中。对catch语句来说,会创建一个新的变量对象,其中包含的是被抛出的错误对象的声明。
1.5 没有块级作用域
在其他类C的语言中,由花括号封闭的代码块都有自己的作用域(如果用ECMAScript的话来讲,就是它们自己的执行环境),因而支持根据条件来定义变量。例如,下面的代码在JavaScript中并不会得到想象中的结果:
if (true) {
var color = "blue";
}
alert(color); //"blue"
在JavaScript中,if语句中的变量声明会将变量添加到当前的执行环境(在这里是全局环境)中。在使用for语句时尤其要牢记这一差异,例如:
for (var i = 0; i < 10; i++) {
doSomething(i);
}
alert(i); //10
1.6 垃圾收集
JavaScript具有自动垃圾收集机制,也就是说,执行环境会负责代码执行过程中使用的内存。这种垃圾收集机制的原理其实很简单:找出那些不再继续使用的变量,然后释放其占用的内存。为此,垃圾收集器会按照固定的时间间隔(或代码执行中预定的收集时间),周期性地执行这一操作。
下面我们来分析一下函数中局部变量的正常生命周期。局部变量只在函数执行的过程中存在。而在这个过程中,会为局部变量在栈(或堆)内存上分配相应的空间,以便储存它们的值。然后再函数中使用这些变量,直至函数执行结束。此时,局部变量就没有存在的必要了,因此可以释放它们的内存以供将来使用。垃圾收集器必须跟踪哪个变量有用哪个变量没用,对于不再有用的变量打上标记,以备将来收回其占用的内存。用于标识无用变量的策略可能会因实现而异,但具体到浏览器中的实现,则通常有两个策略。
1.6.1 标记清除
JavaScript中最常用的垃圾收集方式是标记清除(mark-and-sweep)。当变量进入环境(例如,在函数中声明一个变量)时,就将这个变量标记为“进入环境”。从逻辑上讲,永远不能释放进入环境的变量所占用的内存,因为只要执行流进入相应的环境,就可能会用到它们。而当变量离开环境时,则将其标记为“离开环境”。
垃圾收集器在运行的时候会给储存在内存中的所有变量都加上标记(当然,可以使用任何标记方式)。然后,它会去掉环境中的变量以及被环境中的变量引用的变量的标记。而在此之后再被加上标记的变量将被视为准备删除的变量,原因是环境中的变量已经无法访问到这些变量了。最后,垃圾收集器完成内存清除工作,销毁那些带标记的值并回收它们所占用的内存空间。
1.6.2 引用计数
另一种不太常见的垃圾收集策略叫做引用计数(reference counting)。引用计数的含义是跟踪记录每个值被引用的次数。当声明了一个变量并将一个引用类型值赋给该变量时,则这个值的引用次数就是1。相反,如果包含对这个值引用的变量又取得了另外一个值,则这个值的引用次数减1。当这个值的引用次数变成0时,则说明没有办法再访问这个值了,因而就可以将其占用的内存空间回收起来。这样,当垃圾收集器下次再运行时,它就会释放那些引用次数为零的值所占用的内存。
Netscape Navigator 3.0是最早使用引用计数策略的浏览器,但很快它就遇到了一个严重的问题:循环引用。循环引用指的是对象A中包含一个指向对象B的指针,而对象B中也包含一个指向对象A的引用。请看下面的例子:
function problem() {
var objectA = new Object();
var objectB = new Object();
objectA.someOtherObject = objectB;
objectB.anotherObject = objectA;
}
在这个例子中,objectA和objectB通过各自的属性相互引用;也就是说,这两个对象的引用次数都是2。在采用标记清除策略的实现中,由于函数执行之后,这两个对象都离开了作用域,因此这种相互引用不是个问题。但在采用引用计数策略的实现中,当函数执行完毕后,objectA和objectB还将继续存在,因为它们的引用次数永远不会是0。假如这个函数被重复多次调用,就会导致大量内存得不到回收。为此,Netscape Navigator 4.0中放弃了引用计数方式,转而采用标记清除来实现其垃圾收集机制。
1.7 管理内存
优化内存占用的最佳方式,就是为执行中的代码保存必要的数据。一旦数据不再有用,最好通过将其值设置为null来释放其引用——这个做法叫做解除引用(dereferencing)。这一做法适用于大多数全局变量和全局对象的属性。
不过,解除一个值的引用并不意味着自动回收该值所占用的内存。解除引用的真正作用是让值脱离执行环境,以便垃圾收集器下次运行时将其回收。