一、前言
几年前,接到一个开发任务:用Java开发能运行Java智能合约的虚拟机。在开发Java智能合约时,只能使用智能合约SDK提供的类和一些Java常用类(8种基本数据类型包装类;String、BigInteger、BigDecimal、List、Map、Set 相关的类)。
完整的Java智能合约虚拟机比较复杂,且要保存Java智能合约状态。 这篇文章仅介绍一个简单JVM实现,支持少量字节码。 参考 Java 虚拟机规范(Java SE 8),里面写到:要正确实现 Java 虚拟机,只需能够读取class文件格式并正确执行其中指定的操作。为了简化实现,使用了 ASM解析class文件 。
二、使用ASM解析class文件
使用 ASM Tree API 解析class文件,获得一个 ClassNode 对象,里面包含 class 文件的各种信息。要运行class定义的方法,先在ClassNode中找到这个方法(MethodNode包含方法的各种信息),然后执行方法的指令集。MethodNode.instructions 是这个方法的指令集,遍历指令集,执行每个指令,只要正确执行了指令,方法就能完成运行。
三、实现JVM运行时数据区
要正确执行指令,先要了解JVM结构,参考 Java虚拟机规范第二章(JVM结构),里面介绍了JVM运行时数据区,定义了在程序执行期间使用的各种运行时数据区,如图所示:
下面简要介绍各种运行时数据区,详细信息查看 Java虚拟机规范第二章(JVM结构),根据这些信息,可以简单实现各种运行时数据区。
3.1 程序计数器
Java 虚拟机可以同时支持多个执行线程。每个线程都有自己的程序计数器。程序计数器包含当前线程正在执行的 Java 虚拟机指令的地址。
程序计数器最主要作用就是包含当前指令,程序计数器简单实现如下:
3.2 虚拟机栈
每个 Java 虚拟机线程都有一个Java 虚拟机栈。虚拟机栈存储栈帧,推入和弹出栈帧。
虚拟机栈就是一个保存栈帧的栈,实现如下:
3.2.1 栈帧
每次调用方法时都会创建一个栈帧,每个栈帧都有自己的局部变量数组和操作数栈,局部变量数组和操作数栈的大小在编译时确定。
新栈帧推入虚拟机栈,虚拟机栈的栈顶栈帧是当前正在执行的活动栈帧,称为当前栈帧,其方法称为当前方法,定义当前方法的类是当前类。 在方法返回时,当前栈帧将其方法调用的结果(如果有)传递回前一栈帧。 虚拟机栈弹出当前栈帧,前一栈帧成为当前栈帧。 栈帧包含局部变量和操作数栈,实现如下:
3.2.2 局部变量
每个栈帧都包含一个称为局部变量的变量数组。Java 虚拟机使用局部变量在方法调用时传递参数。在类方法调用中,参数从局部变量0开始。在实例方法调用中,局部变量0用于传递对象的引用,随后从局部变量1开始传递任何参数。
局部变量用来传递方法参数,实现如下:
3.2.3 操作数栈
每个栈帧都包含一个操作数栈。创建栈帧时,操作数栈为空。Java 虚拟机提供将常量、值从局部变量、字段加载到操作数栈的指令。其他 Java 虚拟机指令从操作数栈中获取操作数,对其进行操作,并将结果推回到操作数栈上。操作数栈还用于准备要传递给方法的参数和接收方法结果。
操作数栈就是保存操作数的栈,实现如下:
3.3 虚拟机栈 堆
Java 虚拟机有一个在所有 Java 虚拟机线程之间共享的堆。堆是运行时数据区,从中分配所有类实例和数组的内存。对象的堆存储由垃圾收集器回收,对象永远不会被显式释放。
简单实现堆,不用考虑垃圾回收,就是用来保存对象实例,实现如下:
3.3.1 局部变量
对象实例是通过引用关联的,引用实现如下:
3.4 方法区
Java 虚拟机有一个在所有 Java 虚拟机线程之间共享的方法区。它存储每个类的结构,例如运行时常量池、字段和方法数据,以及方法和构造函数的代码,包括在类和实例初始化和接口初始化中使用的特殊方法。
方法区用来保存类结构,实现如下:
3.5 本地方法栈
本地方法栈是为 Java 虚拟机运行 native 方法服务的,由于很多 native 方法都是用 C 语言实现的,所以它通常又叫 C 栈。本地方法栈与虚拟机栈所发挥的作用非常相似,甚至有的虚拟机直接把本地方法栈和虚拟机栈合二为一。
四、实现JVM
前面对JVM运行时数据区做了简单实现,现在需要把这些运行时数据区关联起来,实现一个简单JVM,这个JVM不考虑线程,直接在Jvm类中关联运行时数据区。
简单JVM实现如下:
这是一个简单JVM,不会实现所有字节码,写一个示例合约,运行这个合约时,用到了哪些字节码,就实现哪些字节码。
五、示例合约
写一个示例合约:
写一个智能合约SDK提供的工具类,里面有一个native方法,需要JVM去调用真正的实现。
native方法实现
运行示例合约
六、实现字节码
运行示例合约,可以看到需要实现哪些字节码,把这些字节码都实现。多次运行、实现后,相关字节码都实现了。再次运行,就可以看到控制台输出:1024。
实现参考 Java虚拟机规范第六章(JVM指令集),下面是其中一个字节码的实现,更多字节码实现,可以看完整代码。
七、结束
这是一个简单的JVM,很多实现都很简化。可以不断丰富示例代码,然后实现更多字节码,在实现字节码过程中,就会发现以前实现的问题,多次迭代后,JVM就会更完善。
下载完整代码:
https://gitee.com/xdehuan/contract-jvm
希望以上内容能对有需要的人有所帮助