Class文件是一组以8位字节为基础单位的二进制流。当遇到需要占用8位字节以上空间的数据项时,则会按照【高位在前】的方式分割成若干个8位字节进行存储,
按照Java虚拟机规范的规定,Class文件结构只有两种数据类型:无符号数和表
- 无符号数
无符号数属于基本的数据类型,以u1、u2、u4、u8来分别代表1个字节,2个字节,4个字节,8个字节的无符号数。
无符号数可用来描述数字、索引引用、数量值或者按照UTF-8编码构成字符串值。 - 表
由多个无符号数或者其他表作为数据项构成的复合数据类型,以“_info”结尾。表用于描述有层次关系的复合结构的数据,整个Class文件本质上就是一张表。由以下数据项构成
Class文件格式类型 名称 数量 u4 magic 1 u2 minor_version 1 u2 major_version 1 u2 constant_pool_count 1 cp_info constant_pool constant_pool_count-1 u2 access_flag 1 u2 this_class 1 u2 super_class 1 u2 interfaces_count 1 u2 interfaces interfaces_count u2 fields_count 1 field_info fields fields_count u2 methods_count 1 method_info methods methods_count u2 attributes_count 1 attribute_info attributes attributes_count
2.1 魔数
每个Class文件的头4个字节成为魔数(Magic Number),它的唯一作用是确定这个文件是否为一个能被虚拟机接受的Class文件,为0xCAFEBABE
2.2 版本号
紧接着魔数的这个字节存储的是Class文件的版本号:
第5和第6个字节是次版本号(Minor Version)
第7和第8个字节是主版本号(Major Version)
Java的版本号是从45开始的
2.3 常量池
1)占用Class文件空间最大的数据项目之一,同时也是Class文件中第一个出现的表类型数据项目;
2)在常量池的入口处存在一项u2类型的数据,代表常量池容量计数值(constant_pool_count),这个容量计数是从1开始的。
第0项常量为空的作用是为了表达“不引用任何一个常量池项目”
3)常量池中主要存放两大类常量:字面量(Literal)和符号引用(Symbolic Reference):
字面量比较接近Java语言的常量概念,如文本字符串、声明为final的常量值等;
符号引用,包括了三类常量:
类和接口的全限定名、字段的名称和描述符、方法的名称和描述符。
4)常量池中每一项常量都是一个表,这14种表都有一共同的特点,就是表开始的第一位是一个u1类型的标志位(tag,取值见下表“标志”列),代表当前这个常量属于哪种常量类型
5)常量池中14种常量项的结构总表(最后三项未列出)
2.4 访问标志
用于识别一些类或接口层次的访问信息,包括:这个Class是类还是接口;是否定义为public类型;是否定义为abstract类型;如果是类的话,是否被声明为final等.
具体的标志位以及标志的含义见表:
2.5 类索引、父类索引与接口索引集合
类索引(this_class)和父类索引(super_class)都是一个u2类型的数据,而接口索引集合(interfaces)是一组u2类型的数据的集合,Class文件中由这三项数据来确定这个类的继承关系。
类索引用于确定这个类的全限定名,父类索引用于确定这个类的父类的全限定名。(除了java.lang.Object外,所有Java类的父类索引都不为0);接口索引集合用来描述这个类实现了哪些接口。
类索引、父类索引和接口索引集合都按顺序排列在访问标志后面,类索引和父类索引用两个u2类型的索引值表示,它们各自指向一个类型为CONSTANT_Class_info的类描述符常量,通过CONSTANT_Class_info类型的常量中的索引值可以找到定义在CONSTANT_Utf8_info类型的常量中的全限定名字符串。
接口索引集合,入口的第一项——u2类型的数据为接口计数器(interfaces_count),表示索引表的容量。如果该类没有实现任何接口,则该计数器值为0,后面的接口索引表不占用任何字节。
2.6 字段表集合
字段表(field_info)用于描述接口或类中声明的表量。字段(field)包括类级变量以及实例级变量,但不包括在方法内部声明的局部变量。