结果是多少?
public static void main(String[] args) {
int i = 0;
i = i++ + ++i;
System.out.println(i);
}//结果输出 2
为什么是2?
一个.java文件首先要被编译成.class文件jvm才能够运行,而jvm是根据java代码生成的字节码来确认他要如何运行程序的。说的再通俗一点就是,jvm看不懂java代码,他能看懂的是字节码,而编译就是这么一个翻译的过程。
所以为了了解i = i++ + ++i
的运行原理,我们首先反汇编这段代码(请先编译java文件,Main.java是我的文件名):在命令行下输入
javap -c Main.class
可以看到字节码是:
0: iconst_0
1: istore_1
2: iload_1
3: iinc 1, 1
6: iinc 1, 1
9: iload_1
10: iadd
11: istore_1
12: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
15: iload_1
16: invokevirtual #3 // Method java/io/PrintStream.println:(I)V
19: return
不要怕,这其实很容易。为了不至于引入太多复杂概念,这里只需要知道程序在运行时的两个区域,一个叫做局部变量表(Local Variable),一个叫做操作数栈(Operand Stack),前者的结构类似数组,用来存储局部变量,后者的数据结构是栈,用来辅助执行指令。
我一条条解释上述指令。先看下图,因为这里只用到了1个局部变量表的位置,所以其他的就没写出来。
红框的内容代表每条指令执行完,这两个区域的值是多少。建议认真看下每一行的值是怎么来的再往下看。实际上在执行到
getstatic #2
这条命令的时候,我们的想知道的问题已经计算完了。主要关注这条命令以上的命令即可。并且我们的值最终也存储在局部变量表1号位置。所以最终输出2是理所当然的。
规律是什么?
既然说class文件是java文件的“翻译”过来的,那么java代码和字节码总有对应关系吧?我们试着找一下。
我们说局部变量表是用来存放局部变量的,第二条指令又向局部变量表中存入值了,根据指令的解释很容易能够猜到前两条指令iconst_0 istore_1
对应java代码int i = 0;
。
我们通过最后的输出知道了i的值是存在局部变量表1中的,那么istore_1
这个向局部变量表1号位置赋值的语句一定就是将前面计算得到的i++ + ++i
的结果存进表的意思,也就是意味着在执行istore_1
语句时,操作数栈栈顶的元素就是我们计算的结果。
继续往上推,iadd
指令执行的时候,栈顶的两个元素一定一个就是i++ 另外一个就是++i的值。除去最开始的两条指令,一共只剩下四条指令了分别是
iload_1
iinc 1, 1
iinc 1, 1
iload_1
猜也能猜出来前两个对应一条指令,后两个对应一条,毕竟这么两个相似的指令不可能翻译出来字节码的命令数还不相等吧。问题是前两个和后两个谁对应i++谁对应++i。我们先回忆一下这两条语句在java上有什么不同,简单说“i++是先用再加,++i是先加再用”。另外需要再讲一个东西,我前面说操作数栈是用来辅助执行命令的,形象点理解就是操作数栈里面的东西是马上就要拿来用的,而局部变量表是用来暂时先保存下变量的。好了,回到我们刚才的问题,再想一下,你应该就能够想到:前两条指令对应i++而后两条对应++i。前两条字节码的含义是:我准备用1号变量,先放在栈里(先用),好了,我已经放在栈里了,你在局部变量表里可以加1了(再加)。后两条字节码的含义是:你在局部变量表里先加1(先加),然后我要放在栈里了(再用)。
这样我们就把每条语句及其对应的字节码都找出来了,那么规律到底是什么?
我们现在用更加通俗的话来解释i= i++ + ++i。首先这个语句等价于i = (i++) + (++i)。执行顺序是:
- 计算i++
- 计算++i
- 将前两个计算的结果加起来赋值给i
看起来好像在说废话,那么我们结合之前的字节码来分析。
- 步骤1还可以分成2步
- 将当前i的值,拷贝一份(假如拷贝出来的元素叫copy1 )。翻译成代码:int copy1 = i; (最开始i为0)
- 将i的值加1。翻译成代码:i++;(此时i为1)
- 步骤2同样分成2步
- 将i的值加1。翻译成代码:i++;(此时i为2)
- 将当前i的值,拷贝一份(假如拷贝出来的元素叫copy2 )。翻译成代码:int copy2 = i;(此时i还是2)
- 将两个计算结果加起来。i= copy1 + copy2 (也就是0+2)
总结起来:i= i++ + ++i真实执行过程的伪代码就是
int copy1 = i;
i++
i++
int copy2 = i
i = copy1 + copy2;
那么我们现在来试着算一下 i = ++i + i++ + ++i + ++i (i的初始值是0)
首先我们知道,i = ++i + i++ + ++i + ++i 等价于 i = (++i) + (i++) + (++i) + (++i)。
我们将四个括号里的值分别起名为r1、r2、r3、r4。表达式从左向右计算。
- 首先计算r1:++i要先将i加1,然后赋值给r1,所以r1等于1。(执行完这条语句时i的值为1)
- 然后计算r2:i++要先将i的值赋值给r2,然后i字加1,所以r2等于1。(执行完这条语句时i的值为2)
- 然后计算r3:++i要先将i加1,然后赋值给r3,所以r3等于3。(执行完这条语句时i的值为3)
- 然后计算r4:++i要先将i加1,然后赋值给r4,所以r3等于4。(执行完这条语句时i的值为4)
- 然后计算r1+r2+r3+r4,等于1+1+3+4,结果为9
- 最后将9赋值给i。(其实此时i是有值的,就是之前的4,但是被刚赋值进来的9给覆盖了,所以就没能表现出来)
怎么样,你算出来了吗?