0
点赞
收藏
分享

微信扫一扫

JVM之字节码技术

耳一文 2022-05-03 阅读 106
java

字节码技术

1. 类文件结构

一个简单的HelloWorld.java

public class HelloWorld {
    public static void main(String[] args) {
        System.out.println("hello world");
    }
}

执行javac -parameters -d . HellowWorld.java编译为 HelloWorld.class 后是这个样子的:

0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09 
0000020 00 16 00 17 08 00 18 0a 00 19 00 1a 07 00 1b 07 
0000040 00 1c 01 00 06 3c 69 6e 69 74 3e 01 00 03 28 29 
0000060 56 01 00 04 43 6f 64 65 01 00 0f 4c 69 6e 65 4e 
0000100 75 6d 62 65 72 54 61 62 6c 65 01 00 12 4c 6f 63 
0000120 61 6c 56 61 72 69 61 62 6c 65 54 61 62 6c 65 01 
0000140 00 04 74 68 69 73 01 00 1d 4c 63 6e 2f 69 74 63 
0000160 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c 6f 
0000200 57 6f 72 6c 64 3b 01 00 04 6d 61 69 6e 01 00 16 
0000220 28 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72 
0000240 69 6e 67 3b 29 56 01 00 04 61 72 67 73 01 00 13 
0000260 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69 
0000300 6e 67 3b 01 00 10 4d 65 74 68 6f 64 50 61 72 61 
0000320 6d 65 74 65 72 73 01 00 0a 53 6f 75 72 63 65 46 
0000340 69 6c 65 01 00 0f 48 65 6c 6c 6f 57 6f 72 6c 64
0000360 2e 6a 61 76 61 0c 00 07 00 08 07 00 1d 0c 00 1e 
0000400 00 1f 01 00 0b 68 65 6c 6c 6f 20 77 6f 72 6c 64 
0000420 07 00 20 0c 00 21 00 22 01 00 1b 63 6e 2f 69 74 
0000440 63 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c 
0000460 6f 57 6f 72 6c 64 01 00 10 6a 61 76 61 2f 6c 61 
0000500 6e 67 2f 4f 62 6a 65 63 74 01 00 10 6a 61 76 61 
0000520 2f 6c 61 6e 67 2f 53 79 73 74 65 6d 01 00 03 6f 
0000540 75 74 01 00 15 4c 6a 61 76 61 2f 69 6f 2f 50 72 
0000560 69 6e 74 53 74 72 65 61 6d 3b 01 00 13 6a 61 76 
0000600 61 2f 69 6f 2f 50 72 69 6e 74 53 74 72 65 61 6d 
0000620 01 00 07 70 72 69 6e 74 6c 6e 01 00 15 28 4c 6a 
0000640 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69 6e 67 3b 
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01 
0000700 00 07 00 08 00 01 00 09 00 00 00 2f 00 01 00 01 
0000720 00 00 00 05 2a b7 00 01 b1 00 00 00 02 00 0a 00 
0000740 00 00 06 00 01 00 00 00 04 00 0b 00 00 00 0c 00 
0000760 01 00 00 00 05 00 0c 00 0d 00 00 00 09 00 0e 00 
0001000 0f 00 02 00 09 00 00 00 37 00 02 00 01 00 00 00 
0001020 09 b2 00 02 12 03 b6 00 04 b1 00 00 00 02 00 0a 
0001040 00 00 00 0a 00 02 00 00 00 06 00 08 00 07 00 0b 
0001060 00 00 00 0c 00 01 00 00 00 09 00 10 00 11 00 00 
0001100 00 12 00 00 00 05 01 00 10 00 00 00 01 00 13 00 
0001120 00 00 02 00 14

根据JVM规范, 类文件结构如下:

ClassFile {
    u4 			   magic
    u2             minor_version;    
    u2             major_version;    
    u2             constant_pool_count;    
    cp_info        constant_pool[constant_pool_count-1];    
    u2             access_flags;    
    u2             this_class;    
    u2             super_class;   
    u2             interfaces_count;    
    u2             interfaces[interfaces_count];   
    u2             fields_count;    
    field_info     fields[fields_count];   
    u2             methods_count;    
    method_info    methods[methods_count];    
    u2             attributes_count;    
    attribute_info attributes[attributes_count];
}

魔数

u4 magic
对应字节码文件的 0~3 个字节, 表示它是否是一个Java的class文件
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09

版本

u2 minor_version;
u2 major_version;
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09
00 00 00 34 : 34H(16进制) = 52(10进制), 表示是JDK8

常量池

Constant TypeValue
CONSTANT_Class7
CONSTANT_Fieldref9
CONSTANT_Methodref10
CONSTANT_InterfaceMethodref11
CONSTANT_String8
CONSTANT_Integer3
CONSTANT_Float4
CONSTANT_Long5
CONSTANT_Double6
CONSTANT_NameAndType12
CONSTANT_Utf81
CONSTANT_MethodHandle15
CONSTANT_MethodType16
CONSTANT_InvokeDynamic18

8~9 字节, 表示常量池长度, 00 23 (35) 表示常量池有 #1~#34项, 注意 #0 项不计入, 也没有值
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09

第#1项 0a (10) 表示一个 Method 信息, 00 06 (6) 和 00 15 (21) 表示它引用了常量池中 #6 和 #21项来获得这个方法的所属类方法名
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09

第#2项 09 (9) 表示一个 Field 信息, 00 16 (22) 和 00 17 (23) 表示它引用了常量池中 #22 和 # 23 项 来获得这个成员变量的所属类成员变量名
0000000 ca fe ba be 00 00 00 34 00 23 0a 00 06 00 15 09
0000020 00 16 00 17 08 00 18 0a 00 19 00 1a 07 00 1b 07

第#3项 08 (8) 表示一个字符串常量名称, 00 18 (24) 表示它引用了常量池中 #24 项
0000020 00 16 00 17 08 00 18 0a 00 19 00 1a 07 00 1b 07

第#4项 0a (10) 表示一个 Method 信息, 00 19 (25) 和 00 1a (26) 表示它引用了常量池中 #25 和 #26 项来获得这个方法的所属类方法名
0000020 00 16 00 17 08 00 18 0a 00 19 00 1a 07 00 1b 07

第#5项 07 (7) 表示一个 Class 信息, 00 1b (27) 表示它引用了常量池中 #27 项
0000020 00 16 00 17 08 00 18 0a 00 19 00 1a 07 00 1b 07

第#6项 07 (7) 表示一个 Class 信息, 00 1c (28) 表示它引用了常量池中 #28 项
0000020 00 16 00 17 08 00 18 0a 00 19 00 1a 07 00 1b 07
0000040 00 1c 01 00 06 3c 69 6e 69 74 3e 01 00 03 28 29

第#7项 01 (1) 表示一个 utf8 串, 00 06 (6) 表示长度, 3c 69 6e 69 74 3e 是
0000040 00 1c 01 00 06 3c 69 6e 69 74 3e 01 00 03 28 29

第#8项 01 (1) 表示一个 utf8 串, 00 03 (3) 表示长度, 28 29 56 是 ()V 其实就是表示无参、无返回值
0000040 00 1c 01 00 06 3c 69 6e 69 74 3e 01 00 03 28 29
0000060 56 01 00 04 43 6f 64 65 01 00 0f 4c 69 6e 65 4e

第#9项 01 (1) 表示一个 utf8 串, 00 04 (4) 表示长度, 43 6f 64 65 是Code
0000060 56 01 00 04 43 6f 64 65 01 00 0f 4c 69 6e 65 4e

第#10项 01 (1) 表示一个 utf8 串, 00 0f (15) 表示长度, 4c 69 6e 65 4e 75 6d 62 65 72 54 61 62 6c 65 是LineNumberTable(方法行号表)
0000060 56 01 00 04 43 6f 64 65 01 00 0f 4c 69 6e 65 4e
0000100 75 6d 62 65 72 54 61 62 6c 65 01 00 12 4c 6f 63

第#11项 01 (1) 表示一个 utf8 串, 00 12 (18) 表示长度, 4c 6f 63 61 6c 56 61 72 69 61 62 6c 65 54 61 62 6c 65 是LocalVariableTable(本地变量表)
0000100 75 6d 62 65 72 54 61 62 6c 65 01 00 12 4c 6f 63
0000120 61 6c 56 61 72 69 61 62 6c 65 54 61 62 6c 65 01

第#12项 01 (1) 表示一个 utf8 串, 00 04 (4) 表示长度, 74 68 69 73 是this
0000120 61 6c 56 61 72 69 61 62 6c 65 54 61 62 6c 65 01
0000140 00 04 74 68 69 73 01 00 1d 4c 63 6e 2f 69 74 63

第#13项 01(1) 表示一个 utf8 串, 00 1d (29) 表示长度, 是类型
0000140 00 04 74 68 69 73 01 00 1d 4c 63 6e 2f 69 74 63
0000160 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c 6f
0000200 57 6f 72 6c 64 3b 01 00 04 6d 61 69 6e 01 00 16

第#14项 01 (1) 表示一个 utf8 串, 00 04 (4) 表示长度, 74 68 69 73 main
0000200 57 6f 72 6c 64 3b 01 00 04 6d 61 69 6e 01 00 16

第#15项 01 (1) 表示一个 utf8 串, 00 16 (22) 表示长度, 是([Ljava/lang/String;)V其实就是参数为 字符串数组, 无返回值
0000200 57 6f 72 6c 64 3b 01 00 04 6d 61 69 6e 01 00 16
0000220 28 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72
0000240 69 6e 67 3b 29 56 01 00 04 61 72 67 73 01 00 13

第#16项 01 (1) 表示一个 utf8 串, 00 04 (4) 表示长度, 是args
0000240 69 6e 67 3b 29 56 01 00 04 61 72 67 73 01 00 13

第#17项 01 (1) 表示一个 utf8 串, 00 13 (19) 表示长度, 是[Ljava/lang/String;
0000240 69 6e 67 3b 29 56 01 00 04 61 72 67 73 01 00 13
0000260 5b 4c 6a 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69
0000300 6e 67 3b 01 00 10 4d 65 74 68 6f 64 50 61 72 61

第#18项 01 (1) 表示一个 utf8 串, 00 10 (16) 表示长度, 是MethodParameters
0000300 6e 67 3b 01 00 10 4d 65 74 68 6f 64 50 61 72 61
0000320 6d 65 74 65 72 73 01 00 0a 53 6f 75 72 63 65 46

第#19项 01 (1) 表示一个 utf8 串, 00 0a (10) 表示长度, 是SourceFile
0000320 6d 65 74 65 72 73 01 00 0a 53 6f 75 72 63 65 46
0000340 69 6c 65 01 00 0f 48 65 6c 6c 6f 57 6f 72 6c 64

第#20项 01 (1) 表示一个 utf8 串, 00 0f (15) 表示长度, 是HelloWorld.java
0000340 69 6c 65 01 00 0f 48 65 6c 6c 6f 57 6f 72 6c 64
0000360 2e 6a 61 76 61 0c 00 07 00 08 07 00 1d 0c 00 1e

第#21项 0c 表示一个+类型, 00 07 (7) 和 00 08 (8) 引用了常量池中 #7 #8 两项
0000360 2e 6a 61 76 61 0c 00 07 00 08 07 00 1d 0c 00 1e

第#22项 07 (7) 表示一个 Class 信息, 00 1d (29) 引用了常量池中 #29 项
0000360 2e 6a 61 76 61 0c 00 07 00 08 07 00 1d 0c 00 1e

第#23项 0c (12) 表示一个+类型, 00 1e(30) 和 00 1f (31)引用了常量池中 #30 #31 两项
0000360 2e 6a 61 76 61 0c 00 07 00 08 07 00 1d 0c 00 1e
0000400 00 1f 01 00 0b 68 65 6c 6c 6f 20 77 6f 72 6c 64

第#24项 01 (1) 表示一个 utf8 串, 00 0b (11) 表示长度, 是hello world
0000400 00 1f 01 00 0b 68 65 6c 6c 6f 20 77 6f 72 6c 64

第#25项 07 (7) 表示一个 Class 信息, 00 20 (32) 引用了常量池中 #32 项
0000420 07 00 20 0c 00 21 00 22 01 00 1b 63 6e 2f 69 74

第#26项 0c (12) 表示一个+类型, 00 21 (33) 和 00 22 (34)引用了常量池中 #33 #34 两项
0000420 07 00 20 0c 00 21 00 22 01 00 1b 63 6e 2f 69 74

第#27项 01 (1) 表示一个 utf8 串, 00 1b (27) 表示长度, 是类的权限定名
0000420 07 00 20 0c 00 21 00 22 01 00 1b 63 6e 2f 69 74
0000440 63 61 73 74 2f 6a 76 6d 2f 74 35 2f 48 65 6c 6c
0000460 6f 57 6f 72 6c 64 01 00 10 6a 61 76 61 2f 6c 61

第#28项 01 (1) 表示一个 utf8 串, 00 10 (16) 表示长度, 是java.lang.Object
0000460 6f 57 6f 72 6c 64 01 00 10 6a 61 76 61 2f 6c 61
0000500 6e 67 2f 4f 62 6a 65 63 74 01 00 10 6a 61 76 61

第#29项 01 (1) 表示一个 utf8 串, 00 10 (16) 表示长度, 是java.lang.System
0000500 6e 67 2f 4f 62 6a 65 63 74 01 00 10 6a 61 76 61
0000520 2f 6c 61 6e 67 2f 53 79 73 74 65 6d 01 00 03 6f

第#30项 01 (1) 表示一个 utf8 串, 00 03 (3) 表示长度, 是out
0000520 2f 6c 61 6e 67 2f 53 79 73 74 65 6d 01 00 03 6f
0000540 75 74 01 00 15 4c 6a 61 76 61 2f 69 6f 2f 50 72

第#31项 01 (1) 表示一个 utf8 串, 00 15 (21) 表示长度, 是Ljava.io.PrintStream
0000540 75 74 01 00 15 4c 6a 61 76 61 2f 69 6f 2f 50 72
0000560 69 6e 74 53 74 72 65 61 6d 3b 01 00 13 6a 61 76

第#32项 01 (1) 表示一个 utf8 串, 00 13 (19) 表示长度, 是java.io.PrintStream
0000560 69 6e 74 53 74 72 65 61 6d 3b 01 00 13 6a 61 76
0000600 61 2f 69 6f 2f 50 72 69 6e 74 53 74 72 65 61 6d

第#33项 01 (1) 表示一个 utf8 串, 00 07 表示长度, 是println
0000620 01 00 07 70 72 69 6e 74 6c 6e 01 00 15 28 4c 6a

第#34项 01 (1) 表示一个 utf8 串, 00 15 (21) 表示长度, 是(Ljava/lang/String;)V
0000620 01 00 07 70 72 69 6e 74 6c 6e 01 00 15 28 4c 6a
0000640 61 76 61 2f 6c 61 6e 67 2f 53 74 72 69 6e 67 3b
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01

访问标识与继承信息

Flag NameValueInterpretation
ACC_PUBLIC0x0001Declared public ; may be accessed from outside its package.
ACC_FINAL0x0010Declared final ; no subclasses allowed.
ACC_SUPER0x0020Treat superclass methods specially when invoked by the invokespecial instruction.
ACC_INTERFACE0x0200Is an interface, not a class.
ACC_ABSTRACT0x0400Declared abstract ; must not be instantiated.
ACC_SYNTHETIC0x1000Declared synthetic; not present in the source code.
ACC_ANNOTATION0x2000Declared as an annotation type.
ACC_ENUM0x4000Declared as an enum type.

00 21 表示该 class 是一个类, 公共的 |
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01

00 05 表示根据常量池中 #5 找到本类全限定名
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01

00 06 表示根据常量池中 #6 找到父类全限定名
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01

00 00 表示接口的数量, 本类为 0
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01

Field 信息

Filed TypeTypeInterpretation
Bbytesigned byte
CcharUnicode character code point in the Basic Multilingual Plane, encoded with UTF-16
Ddoubledouble-precision floating-point value
Ffloatsingle-precision floating-point value
Iintinteger
Jlonglong integer
LClassName;referencean instance of class ClassName
Sshortsigned short
Zbooleantrue or false
[referenceone array dimension

00 00 表示成员变量数量, 本类为 0
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01

Method 信息

00 02 表示方法数量, 本类为 2
0000660 29 56 00 21 00 05 00 06 00 00 00 00 00 02 00 01

一个方法由 访问修饰符, 名称, 参数描述, 方法属性数量, 方法属性组成

具体分析参考文献<( ̄︶ ̄)↗[GO!]

2. 字节码指令

参考文档<( ̄︶ ̄)↗[GO!]

javap工具

Java 中提供了 javap 工具来反编译 class 文件

javap -v HelloWorld.class

Classfile /D:/JVM/JVM_Study/out/production/JVM_Study/com/ayu3/HelloWorld.class
  Last modified 2022-4-28; size 551 bytes
  MD5 checksum 98a3ae1e037cc97cf9c0a159278e0d47
  Compiled from "HelloWorld.java"
public class com.ayu3.HelloWorld
  minor version: 0
  major version: 52
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #6.#20         // java/lang/Object."<init>":()V
   #2 = Fieldref           #21.#22        // java/lang/System.out:Ljava/io/PrintStream;
   #3 = String             #23            // Hello World
   #4 = Methodref          #24.#25        // java/io/PrintStream.println:(Ljava/lang/String;)V
   #5 = Class              #26            // com/ayu3/HelloWorld
   #6 = Class              #27            // java/lang/Object
   #7 = Utf8               <init>
   #8 = Utf8               ()V
   #9 = Utf8               Code
  #10 = Utf8               LineNumberTable
  #11 = Utf8               LocalVariableTable
  #12 = Utf8               this
  #13 = Utf8               Lcom/ayu3/HelloWorld;
  #14 = Utf8               main
  #15 = Utf8               ([Ljava/lang/String;)V
  #16 = Utf8               args
  #17 = Utf8               [Ljava/lang/String;
  #18 = Utf8               SourceFile
  #19 = Utf8               HelloWorld.java
  #20 = NameAndType        #7:#8          // "<init>":()V
  #21 = Class              #28            // java/lang/System
  #22 = NameAndType        #29:#30        // out:Ljava/io/PrintStream;
  #23 = Utf8               Hello World
  #24 = Class              #31            // java/io/PrintStream
  #25 = NameAndType        #32:#33        // println:(Ljava/lang/String;)V
  #26 = Utf8               com/ayu3/HelloWorld
  #27 = Utf8               java/lang/Object
  #28 = Utf8               java/lang/System
  #29 = Utf8               out
  #30 = Utf8               Ljava/io/PrintStream;
  #31 = Utf8               java/io/PrintStream
  #32 = Utf8               println
  #33 = Utf8               (Ljava/lang/String;)V
{
  public com.ayu3.HelloWorld();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
      LineNumberTable:
        line 8: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       5     0  this   Lcom/ayu3/HelloWorld;

  public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=2, locals=1, args_size=1
         0: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
         3: ldc           #3                  // String Hello World
         5: invokevirtual #4                  // Method java/io/PrintStream.println:(Ljava/lang/String;)V
         8: return
      LineNumberTable:
        line 10: 0
        line 11: 8
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       9     0  args   [Ljava/lang/String;
}
SourceFile: "HelloWorld.java"

图解方法执行流程

原始代码

public class Demo {
    public static void main(String[] args) {
        int a = 10;
        int b = Short.MAX_VALUE + 1;
        int c = a + b;
        System.out.println(c);
    }
}

编译后的字节码文件

Classfile /D:/JVM/JVM_Study/out/production/JVM_Study/com/ayu3/Demo.class
  Last modified 2022-5-2; size 592 bytes
  MD5 checksum 009af49aba8415c333bdf2ef251bc500
  Compiled from "Demo.java"
public class com.ayu3.Demo
  minor version: 0
  major version: 52
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #7.#25         // java/lang/Object."<init>":()V
   #2 = Class              #26            // java/lang/Short
   #3 = Integer            32768
   #4 = Fieldref           #27.#28        // java/lang/System.out:Ljava/io/PrintStream;
   #5 = Methodref          #29.#30        // java/io/PrintStream.println:(I)V
   #6 = Class              #31            // com/ayu3/Demo
   #7 = Class              #32            // java/lang/Object
   #8 = Utf8               <init>
   #9 = Utf8               ()V
  #10 = Utf8               Code
  #11 = Utf8               LineNumberTable
  #12 = Utf8               LocalVariableTable
  #13 = Utf8               this
  #14 = Utf8               Lcom/ayu3/Demo;
  #15 = Utf8               main
  #16 = Utf8               ([Ljava/lang/String;)V
  #17 = Utf8               args
  #18 = Utf8               [Ljava/lang/String;
  #19 = Utf8               a
  #20 = Utf8               I
  #21 = Utf8               b
  #22 = Utf8               c
  #23 = Utf8               SourceFile
  #24 = Utf8               Demo.java
  #25 = NameAndType        #8:#9          // "<init>":()V
  #26 = Utf8               java/lang/Short
  #27 = Class              #33            // java/lang/System
  #28 = NameAndType        #34:#35        // out:Ljava/io/PrintStream;
  #29 = Class              #36            // java/io/PrintStream
  #30 = NameAndType        #37:#38        // println:(I)V
  #31 = Utf8               com/ayu3/Demo
  #32 = Utf8               java/lang/Object
  #33 = Utf8               java/lang/System
  #34 = Utf8               out
  #35 = Utf8               Ljava/io/PrintStream;
  #36 = Utf8               java/io/PrintStream
  #37 = Utf8               println
  #38 = Utf8               (I)V
{
  public com.ayu3.Demo();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
      LineNumberTable:
        line 8: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       5     0  this   Lcom/ayu3/Demo;

  public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=2, locals=4, args_size=1
         0: bipush        10
         2: istore_1
         3: ldc           #3                  // int 32768
         5: istore_2
         6: iload_1
         7: iload_2
         8: iadd
         9: istore_3
        10: getstatic     #4                  // Field java/lang/System.out:Ljava/io/PrintStream;
        13: iload_3
        14: invokevirtual #5                  // Method java/io/PrintStream.println:(I)V
        17: return
      LineNumberTable:
        line 10: 0
        line 11: 3
        line 12: 6
        line 13: 10
        line 14: 17
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0      18     0  args   [Ljava/lang/String;
            3      15     1     a   I
            6      12     2     b   I
           10       8     3     c   I
}
SourceFile: "Demo.java"

常量池载入运行时常量池

常量池也属于方法区, 只不过这里单独提出来了

方法字节码载入方法区

(stack=2, locals=4) 对应操作数栈有 2 个空间(每个空间 4 个字节), 局部变量表中有 4 个槽位

在这里插入图片描述

main 线程开始运行, 分配栈帧内存

(stack=2, locals=4)

在这里插入图片描述

执行引擎开始执行字节码

bipush 10

  • 将一个 byte 压入操作数栈(其长度会补齐 4 个字节), 类似的指令还有
  • sipush 将一个 short 压入操作数栈(其长度会补齐 4 个字节)
  • ldc 将一个 int 压入操作数栈
  • ldc2_w 将一个 long 压入操作数栈(分两次压入, 因为 long 是 8 个字节)
  • 这里小的数字都是和字节码指令存在一起, 超过 short 范围的数字存入了常量池

在这里插入图片描述

istore 1

  • 将操作数栈栈顶元素弹出, 放入局部变量表的 slot 1 中
  • 对应代码中的 a = 10

在这里插入图片描述
在这里插入图片描述

ldc #3

  • 读取运行时常量池中 #3 , 即 32768 (超过 short 最大值范围的数会被放到运行时常量池中), 将其加载到操作数栈中
  • 注意: Short.MAX_VALUE 是 32767, 所以 32768 = Short.MAX_VALUE + 1 实际是在编译期间计算好的

在这里插入图片描述

istore 2

  • 将操作数栈中的元素弹出, 放到局部变量表的 2 号位置

在这里插入图片描述

iload1 iload2

  • 将局部变量表中 1 号位置和 2 号位置的元素放入操作数栈中
  • 因为只能在操作数栈中执行运算操作

在这里插入图片描述
在这里插入图片描述

iadd

  • 将操作数栈中的两个元素弹出栈并相加, 结果在压入操作数栈中


在这里插入图片描述

istore 3

  • 将操作数栈中的元素弹出, 放入局部变量表的3号位置

在这里插入图片描述

getstatic #4

  • 在运行时常量池中找到 #4 , 发现是一个对象

  • 在堆内存中找到该对象, 并将其引用放入操作数栈中

    在这里插入图片描述

iload 3

  • 将局部变量表中 3 号位置的元素压入操作数栈中

invokevirtual #5

  • 找到常量池 #5 项
  • 定位到方法区 java/io/PrintStream.println:(I)V 方法
  • 生成新的栈帧(分配 locals、stack等)
  • 传递参数, 执行新栈帧中的字节码

  • 执行完毕, 弹出栈帧
  • 清除 main 操作数栈内容

return

  • 完成 main 方法调用, 弹出 main 栈帧
  • 程序结束

分析a++

代码:

public class Demo {
    public static void main(String[] args) {
        int a = 10;
        int b = a++ + ++a + a--;
        System.out.println(a);
        System.out.println(b);
    }
}

字节码:

{
  public com.ayu3.Demo();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
      LineNumberTable:
        line 8: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       5     0  this   Lcom/ayu3/Demo;

  public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=2, locals=3, args_size=1
         0: bipush        10
         2: istore_1
         3: iload_1
         4: iinc          1, 1
         7: iinc          1, 1
        10: iload_1
        11: iadd
        12: iload_1
        13: iinc          1, -1
        16: iadd
        17: istore_2
        18: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
        21: iload_1
        22: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
        25: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
        28: iload_2
        29: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
        32: return
      LineNumberTable:
        line 10: 0
        line 11: 3
        line 12: 18
        line 13: 25
        line 14: 32
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0      33     0  args   [Ljava/lang/String;
            3      30     1     a   I
           18      15     2     b   I
}

分析:

  • 注意 iinc 指令是直接在局部变量 slot 上进行运算
  • a++ 和 ++a 的区别是先执行 iload 还是 先执行 iinc
    在这里插入图片描述在这里插入图片描述
    在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

条件判断指令

指令助记符含义
0×99ifeq判断是否 == 0
0×9aifne判断是否 != 0
0×9biflt判断是否 < 0
0×9cifge判断是否 >= 0
0×9difgt判断是否 > 0
0×9eifle判断是否 <= 0
0×9fif_icmpeq两个int是否 ==
0×a0if_icmpne两个int是否 !=
0×a1if_icmplt两个int是否 <
0×a2if_icmpge两个int是否 >=
0×a3if_icmpgt两个int是否 >
0×a4if_icmple两个int是否 <=
0×a5if_acmpeq两个引用是否 ==
0×a6if_acmpne两个引用是否 !=
0×c6ifnull判断是否 == null
0×c7ifnonnull判断是否 != null

几点说明:

  • byte, short, char 都会按 int 比较, 因为操作数栈都是 4 字节
  • goto 用来进行跳转到指定行号的字节码

源码:

public class Demo {
    public static void main(String[] args) {
        int a = 0;
        if(a == 0) {
            a = 10;
        } else {
            a = 20;
        }
    }
}

字节码:

public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=1, locals=2, args_size=1
         0: iconst_0
         1: istore_1
         2: iload_1
         3: ifne          12
         6: bipush        10
         8: istore_1
         9: goto          15
        12: bipush        20
        14: istore_1
        15: return
      LineNumberTable:
        line 10: 0
        line 11: 2
        line 12: 6
        line 14: 12
        line 16: 15
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0      16     0  args   [Ljava/lang/String;
            2      14     1     a   I
      StackMapTable: number_of_entries = 2
        frame_type = 252 /* append */
          offset_delta = 12
          locals = [ int ]
        frame_type = 2 /* same */

参考文档<( ̄︶ ̄)↗[GO!]

循环控制指令

while循环

源码:

public class Demo {
	public static void main(String[] args) {
    	int a = 0;
    	while (a < 10) {
    		a++;
   		}
    }
}

字节码:

 0: iconst_0
 1: istore_1
 2: iload_1
 3: bipush 10
 5: if_icmpge 14
 8: iinc 1, 1
11: goto 2
14: return

dowhile循环

源码:

public class Demo {
	public static void main(String[] args) {
    	int a = 0;
    	do {
			a++;
		} while (a < 10);
    }
}

字节码:

 0: iconst_0
 1: istore_1
 2: iinc 1, 1
 5: iload_1
 6: bipush 10
 8: if_icmplt 2
11: return

for循环

源码:

public class Demo {
	public static void main(String[] args) {
    	for (int i = 0; i < 10; i++) {
		}
    }
}

字节码:

 0: iconst_0
 1: istore_1
 2: iload_1
 3: bipush 10
 5: if_icmpge 14
 8: iinc 1, 1
11: goto 2
14: return

通过字节码指令分析问题

源码:

public class Demo {
    public static void main(String[] args) {
        int i = 0;
        int x = 0;
        while (i < 10) {
            x = x++;
            i++;
        }
        System.out.println(x); // 0
    }
}

通过字节码来看为什么结果是0:

 0: iconst_0	// 准备一个常数 0
 1: istore_1	// 将常数 0 放入局部变量表的 1 号槽位 i = 0
 2: iconst_0	// 准备一个常数 0
 3: istore_2	// 将常数 0 放入局部变量的 2 号槽位 x = 0	
 4: iload_1		// 将局部变量表 1 号槽位的数放入操作数栈中
 5: bipush        10	// 将数字 10 放入操作数栈中, 此时操作数栈中有 2 个数
 7: if_icmpge     21	// 比较操作数栈中的两个数, 如果下面的数大于上面的数, 就跳转到 21 。这里的比较是将两个数做减法。因为涉及运算操作, 所以会将两个数弹出操作数栈来进行运算。运算结束后操作数栈为空
10: iload_2		// 将局部变量 2 号槽位的数放入操作数栈中, 放入的值是 0 
11: iinc          2, 1	// 将局部变量 2 号槽位的数加 1 , 自增后, 槽位中的值为 1 
14: istore_2	//将操作数栈中的数放入到局部变量表的 2 号槽位, 2 号槽位的值又变为了0
15: iinc          1, 1 // 1 号槽位的值自增 1 
18: goto          4 // 跳转到第4条指令
21: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
24: iload_2
25: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
28: return

构造方法

()V

源码:

public class Demo {
	static int i = 10;

	static {
		i = 20;
	}

	static {
		i = 30;
	}

	public static void main(String[] args) {
		System.out.println(i); // 30
	}
}

字节码:

 0: bipush        10
 2: putstatic     #3                  // Field i:I
 5: bipush        20
 7: putstatic     #3                  // Field i:I
10: bipush        30
12: putstatic     #3                  // Field i:I
15: return

()V

源码:

public class Demo {

    private String a = "s1";

    {
        b = 20;
    }

    private int b = 10;

    {
        a = "s2";
    }

    public Code_13_InitTest(String a, int b) {
        this.a = a;
        this.b = b;
    }

    public static void main(String[] args) {
        Code_13_InitTest d = new Code_13_InitTest("s3", 30);
        System.out.println(d.a); //s3
        System.out.println(d.b); //30
    }

}

字节码:

 0: aload_0
 1: invokespecial #1 // super.<init>()V
 4: aload_0
 5: ldc #2 // <- "s1"
 7: putfield #3 // -> this.a
10: aload_0
11: bipush 20 // <- 20
13: putfield #4 // -> this.b
16: aload_0
17: bipush 10 // <- 10
19: putfield #4 // -> this.b
22: aload_0
23: ldc #5 // <- "s2"
25: putfield #3 // -> this.a
28: aload_0 // ------------------------------
29: aload_1 // <- slot 1(a) "s3" 
30: putfield #3 // -> this.a
33: aload_0 
34: iload_2 // <- slot 2(b) 30
35: putfield #4 // -> this.b --------------------
38: return

方法调用

源码:

public class Demo3_9 {
    public Demo3_9() { }
    
    private void test1() { }
    
    private final void test2() { }
    
    public void test3() { }
    
    public static void test4() { }
    
    public static void main(String[] args) {
        Demo3_9 d = new Demo3_9();
        d.test1();
        d.test2();
        d.test3();
        d.test4();
        Demo3_9.test4();
    }
}

字节码:

 0: new #2 
 3: dup
 4: invokespecial #3 // Method "<init>":()V
 7: astore_1
 8: aload_1
 9: invokespecial #4 // Method test1:()V
12: aload_1
13: invokespecial #5 // Method test2:()V
16: aload_1
17: invokevirtual #6 // Method test3:()V
20: aload_1
21: pop
22: invokestatic #7 // Method test4:()V
25: invokestatic #7 // Method test4:()V
28: return

不同方法在调用时, 对应的虚拟机指令有所区别

  • 私有、构造、被 final 修饰的方法, 在调用时都使用 invokespecial 指令
  • 普通成员方法在调用时, 使用 invokevirtual 指令。因为编译期间无法确定该方法的内容, 只有在运行期间才能确定
  • 静态方法在调用时使用 invokestatic 指令
  • new 是创建对象, 给对象分配堆内存, 执行成功会将对象引用压入操作数栈
  • dup 是赋值操作数栈栈顶的内容, 本例即为对象引用, 为什么需要两份引用呢, 一个是要配合 invokespecial 调用该对象的构造方法 “init”: ()V (会消耗掉栈顶一个引用), 另一个要 配合 astore_1 赋值给局部变量
  • 终方法(final), 私有方法(private), 构造方法都是由 invokespecial 指令来调用, 属于静态绑定
  • 普通成员方法是由 invokevirtual 调用, 属于动态绑定, 即支持多态 成员方法与静态方法调用的另一个区别是, 执行方法前是否需要对象引用

多态原理

/**
  * 演示多态原理, 注意加上下面的 JVM 参数, 禁用指针压缩
  * -XX:-UseCompressedOops -XX:-UseCompressedClassPointers
  */
public class Demo {
    public static void test(Animal animal) {
        animal.eat();
        System.out.println(animal.toString());
    }

    public static void main(String[] args) throws IOException {
        test(new Cat());
        test(new Dog());
        System.in.read();
    }
}

abstract class Animal {
    public abstract void eat();

    @Override
    public String toString() {
        return "我是" + this.getClass().getSimpleName();
    }
}

class Dog extends Animal {
    @Override
    public void eat() {
        System.out.println("啃骨头");
    }
}

class Cat extends Animal {
    @Override
    public void eat() {
        System.out.println("吃鱼");
    }
}

运行代码

使用jps获取进程id

运行 HSDB 工具

进入 JDK 安装目录, 执行java -cp ./lib/sa-jdi.jar sun.jvm.hotspot.HSDB

进入图形界面 attach 进程 id , File -> Attach to HoTSpot process

查找某个对象

打开 Tools -> Find Object By Query

输入 select d from com.ayu3.Dog d 点击 Execute 执行

查看对象内存结构

点击超链接可以看到对象的内存结构, 此对象没有任何属性, 因此只有对象头的 16 字节, 前 8 字节是 MarkWord, 后 8 字节就是对象的 Class 指针, 但目前看不到它的实际地址

查看对象 Class 的内存地址

可以通过 Windows -> Console 进入命令行模式, 执行mem 0x00000000d447ef70 2
mem 有两个参数, 参数 1 是对象地址, 参数 2 是查看 2 行(即 16 字节)
结果中第二行 0x0000000017e641a0 即为 Class 的内存地址

查看类的 vtable

Alt+R 进入 Inspector 工具, 输入刚才的 Class 内存地址, 看到如下界面

从 Class 的起始地址开始算, 偏移 0x1b8 就是 vtable 的起始地址, 进行计算得到:

并且得知Dog Class 的 vtable 长度为 6, 意思就是 Dog 类有 6 个虚方法(多态相关的, final, static 不会列入)

通过 Windows -> Console 进入命令行模式, 执行

mem 0x0000000017e64358 6
0x0000000017e64358: 0x0000000017a61b10 
0x0000000017e64360: 0x0000000017a615e8 
0x0000000017e64368: 0x0000000017e63758 
0x0000000017e64370: 0x0000000017a61540 
0x0000000017e64378: 0x0000000017a61678 
0x0000000017e64380: 0x0000000017e64148 

就得到了 6 个虚方法的入口地址

验证方法地址

通过 Tools -> Class Browser 查看每个类的方法定义, 比较可知

对号入座, 发现

  • eat() 方法是 Dog 类自己的
  • toString() 方法是继承 String 类的
  • finalize() , equals(), hashCode(), clone() 都是继承 Object 类的

小结

当执行 invokevirtual 指令时

  1. 先通过栈帧中的对象引用找到对象
  2. 分析对象头, 找到对象的实际 Class
  3. Class 结构中有 vtable, 它在类加载的链接阶段就已经根据方法的重写规则生成好了
  4. 查表得到方法的具体地址
  5. 执行方法的字节码

异常处理

try-catch

源码:

public class Demo {
    public static void main(String[] args) {
        int i = 0;
        try {
            i = 10;
        }catch (Exception e) {
            i = 20;
        }
    }
}

字节码:

Code:
      stack=1, locals=3, args_size=1
         0: iconst_0
         1: istore_1
         2: bipush        10
         4: istore_1
         5: goto          12
         8: astore_2
         9: bipush        20
        11: istore_1
        12: return
      Exception table:
         from    to  target type
             2     5     8   Class java/lang/Exception
      LineNumberTable:
        line 10: 0
        line 12: 2
        line 15: 5
        line 13: 8
        line 14: 9
        line 16: 12
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            9       3     2     e   Ljava/lang/Exception;
            0      13     0  args   [Ljava/lang/String;
            2      11     1     i   I
  • 可以看到多出来一个 Exception table 的结构, [from, to) 是前闭后开(也就是检测 2~4 行)的检测范围, 一旦这个范围内的字节码执行出现异常, 则通过 type 匹配异常类型, 如果一致, 进入 target 所指示行号
  • 8 行的字节码指令 astore_2 是将异常对象引用存入局部变量表的 2 号位置(为 e )

多个 single-catch

源码:

public class Demo {
    public static void main(String[] args) {
        int i = 0;
        try {
            i = 10;
        }catch (ArithmeticException e) {
            i = 20;
        }catch (Exception e) {
            i = 30;
        }
    }
}

字节码:

Code:
      stack=1, locals=3, args_size=1
         0: iconst_0
         1: istore_1
         2: bipush        10
         4: istore_1
         5: goto          19
         8: astore_2
         9: bipush        20
        11: istore_1
        12: goto          19
        15: astore_2
        16: bipush        30
        18: istore_1
        19: return
      Exception table:
         from    to  target type
             2     5     8   Class java/lang/ArithmeticException
             2     5    15   Class java/lang/Exception
      LineNumberTable:
        line 10: 0
        line 12: 2
        line 17: 5
        line 13: 8
        line 14: 9
        line 17: 12
        line 15: 15
        line 16: 16
        line 18: 19
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            9       3     2     e   Ljava/lang/ArithmeticException;
           16       3     2     e   Ljava/lang/Exception;
            0      20     0  args   [Ljava/lang/String;
            2      18     1     i   I

  • 因为异常出现时, 只能进入 Exception table 中一个分支, 所以局部变量表 slot 2 位置被共用

multi-catch 的情况

源码:

public class Demo {
    public static void main(String[] args) {
        int i = 0;
        try {
            i = 10;
        }catch (NoSuchMethodException | IllegalAccessException | InvocationTargetException e) {
			e.printStackTrace();
		}
    }
}

字节码:

Code:
     stack=3, locals=2, args_size=1
         0: ldc           #2                  // class com/ayu3/Demo
         2: ldc           #3                  // String test
         4: iconst_0
         5: anewarray     #4                  // class java/lang/Class
         8: invokevirtual #5                  // Method java/lang/Class.getMethod:(Ljava/lang/String;[Ljava/lang/Class;)Ljava/lang/reflect/Method;
        11: astore_1
        12: aload_1
        13: aconst_null
        14: iconst_0
        15: anewarray     #6                  // class java/lang/Object
        18: invokevirtual #7                  // Method java/lang/reflect/Method.invoke:(Ljava/lang/Object;[Ljava/lang/Object;)Ljava/lang/Object;
        21: pop
        22: goto          30
        25: astore_1
        26: aload_1
        27: invokevirtual #11                 // Method java/lang/ReflectiveOperationException.printStackTrace:()V
        30: return
     Exception table:
         from    to  target type
             0    22    25   Class java/lang/NoSuchMethodException
             0    22    25   Class java/lang/IllegalAccessException
             0    22    25   Class java/lang/reflect/InvocationTargetException
     LineNumberTable:
        line 14: 0
        line 15: 12
        line 18: 22
        line 16: 25
        line 17: 26
        line 19: 30
     LocalVariableTable:
        Start  Length  Slot  Name   Signature
           12      10     1  test   Ljava/lang/reflect/Method;
           26       4     1     e   Ljava/lang/ReflectiveOperationException;
            0      31     0  args   [Ljava/lang/String;
      StackMapTable: number_of_entries = 2
        frame_type = 89 /* same_locals_1_stack_item */
          stack = [ class java/lang/ReflectiveOperationException ]
        frame_type = 4 /* same */
  • 从字节码来看发现也就那么回事, 有异常发生了先在ExceptionTable进行对比, 然后跳转到25行

finally

源码:

public class Demo {
    public static void main(String[] args) {
        int i = 0;
        try {
            i = 10;
        } catch (Exception e) {
            i = 20;
        } finally {
            i = 30;
        }
    }
}

字节码:

Code:
     stack=1, locals=4, args_size=1
        0: iconst_0
        1: istore_1
        // try块
        2: bipush        10
        4: istore_1
        // try块执行完后, 会执行finally    
        5: bipush        30
        7: istore_1
        8: goto          27
       // catch块     
       11: astore_2 // 异常信息放入局部变量表的2号槽位
       12: bipush        20
       14: istore_1
       // catch块执行完后, 会执行finally        
       15: bipush        30
       17: istore_1
       18: goto          27
       // 出现异常, 但未被 Exception 捕获, 会抛出其他异常, 这时也需要执行 finally 块中的代码   
       21: astore_3
       22: bipush        30
       24: istore_1
       25: aload_3
       26: athrow  // 抛出异常
       27: return
     Exception table:
        from    to  target type
            2     5    11   Class java/lang/Exception
            2     5    21   any
           11    15    21   any
  • 可以看到 finally 中的代码被复制了 3 份, 分别放入 try 流程, catch 流程以及 catch 剩余的异常类型流程
  • 虽然从字节码指令看来, 每个块中都有 finally 块, 但是 finally 块中的代码只会被执行一次

finally 中的 return

源码:

public class Demo {
   public static void main(String[] args) {
		int result = test();
		System.out.println(result);
	}
	public static int test() {
		try {
            return 10;
        } finally {
            return 20;
        }
    }
}

字节码:

Code:
stack=1, locals=2, args_size=0
0: bipush 10 // <- 10 放入栈顶
2: istore_0 // 10 -> slot 0 (从栈顶移除了)
3: bipush 20 // <- 20 放入栈顶
5: ireturn // 返回栈顶 int(20)
6: astore_1 // catch any -> slot 1
7: bipush 20 // <- 20 放入栈顶
9: ireturn // 返回栈顶 int(20)
Exception table:
from to target type
0 3 6 any
  • 由于 finally 中的 ireturn 被插入了所有可能的流程, 因此返回结果肯定以 finally 的为准
  • 至于字节码中第 2 行, 似乎没啥用, 且留个伏笔, 看下个例子
  • 跟上例中的 finally 相比, 发现没有 athrow 了, 这告诉我们: 如果在 finally 中出现了 return, 会吞掉异常, 可以试一下下面的代码
public class Demo {
   public static void main(String[] args) {
        int result = test();
        System.out.println(result);
    }

    public static int test() {
        try {
            int i = 1 / 0;
            return 10;
        } finally {
            return 20;
        }
    }
}

会发现打印结果为 20 , 并未抛出异常

finally 不带 return

源码:

public class Demo {
   public static void main(String[] args) {
		int result = test();
		System.out.println(result);
	}
	public static int test() {
        int i = 10;
		try {
            return i;
        } finally {
            i = 20;
        }
    }
}

字节码:

Code:
     stack=1, locals=3, args_size=0
        0: bipush        10
        2: istore_0 // 赋值给i 10
        3: iload_0	// 加载到操作数栈顶
        4: istore_1 // 加载到局部变量表的1号位置
        5: bipush        20
        7: istore_0 // 赋值给i 20
        8: iload_1 // 加载局部变量表1号位置的数10到操作数栈
        9: ireturn // 返回操作数栈顶元素 10
       10: astore_2
       11: bipush        20
       13: istore_0
       14: aload_2 // 加载异常
       15: athrow // 抛出异常
     Exception table:
        from    to  target type
            3     5    10   any

synchronized

源码:

public class Demo {
    public static void main(String[] args) {
        Object lock = new Object();
        synchronized (lock) {
            System.out.println("ok");
        }
    }
}

字节码:

Code:
      stack=2, locals=4, args_size=1
         0: new           #2                  // class java/lang/Object
         3: dup //复制一份栈顶, 然后压入栈中, 用于执行构造方法
         4: invokespecial #1                  // Method java/lang/Object."<init>":()V
         7: astore_1 //lock引用赋值给lock对象
         8: aload_1 //将对象加载到操作数栈
         9: dup //将这个对象再复制一份
        10: astore_2 //将复制好的对象存入2号槽位
        11: monitorenter //将栈顶的对象交给monitorenter, 也就是对lock加锁
        12: getstatic     #3                  // Field java/lang/System.out:Ljava/io/PrintStream;
        15: ldc           #4                  // String ok
        17: invokevirtual #5                  // Method java/io/PrintStream.println:(Ljava/lang/String;)V
        20: aload_2 //将2号槽位的lock对象加载到操作数栈
        21: monitorexit //使用monitorexit解锁
        22: goto          30
        //发生异常
        25: astore_3 //将异常对象存入3号槽位
        26: aload_2
        27: monitorexit
        28: aload_3 //将异常对象加载到操作数栈
        29: athrow //抛出异常
        30: return
      Exception table:
         from    to  target type
            12    22    25   any
            25    28    25   any
      LineNumberTable:
        line 13: 0
        line 14: 8
        line 15: 12
        line 16: 20
        line 17: 30
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0      31     0  args   [Ljava/lang/String;
            8      23     1  lock   Ljava/lang/Object;

3. 编译期处理

所谓的语法糖 , 其实就是指 java 编译器把 *.java 源码编译为 *.class 字节码的过程中, 自动生成 和转换的一些代码, 主要是为了减轻程序员的负担, 算是 java 编译器给我们的一个额外福利(给糖吃嘛)

注意, 以下代码的分析, 借助了 javap 工具, idea 的反编译功能, idea 插件 jclasslib 等工具。另外, 编译器转换的结果直接就是 class 字节码, 只是为了便于阅读, 给出了几乎等价的 java 源码方式, 并 不是编译器还会转换出中间的 java 源码, 切记。

默认构造器

public class Candy {

}

经过编译期优化后:

public class Candy {
   // 这个无参构造器是java编译器帮我们加上的
   public Candy() {
      // 即调用父类 Object 的无参构造方法, 即调用 java/lang/Object." <init>":()V
      super();
   }
}

自动拆装箱

这个特性是 JDK 5 开始加入的, 代码片段1:

public class Candy {
    public static void main(String[] args) {
        Integer x = 1;
        int y = x;
    }
}

这段代码在 JDK 5 之前是无法编译通过的, 必须改写为 代码片段2:

public class Candy {
    public static void main(String[] args) {
        Integer x = Integer.valueOf(1);
		int y = x.intValue();
    }
}

显然之前版本的代码太麻烦了, 需要在基本类型和包装类型之间来回转换(尤其是集合类中操作的都是包装类型), 因此这些转换的事情在 JDK 5 以后都由编译器在编译阶段完成。即代码片段1都会在编 译阶段被转换为代码片段2

泛型集合取值

泛型也是在 JDK 5 开始加入的特性, 但 java 在编译泛型代码后会执行泛型擦除的动作, 即泛型信息在编译为字节码之后就丢失了, 实际的类型都当做了 Object 类型来处理:

public class Candy {
    public static void main(String[] args) {
        List<Integer> list = new ArrayList<>();
        list.add(10); // 实际调用的是 List.add(Object e)
        Integer x = list.get(0); // 实际调用的是 Object obj = List.get(int index);
    }
}

所以在取值时, 编译器真正生成的字节码中, 还要额外做一个类型转换的操作:

// 需要将 Object 转为 Integer
Integer x = (Integer)list.get(0);

如果前面的 x 变量类型修改为 int 基本类型那么最终生成的字节码是:

// 需要将 Object 转为 Integer, 并执行拆箱操作
int x = ((Integer)list.get(0)).intValue();

对应字节码:

Code:
    stack=2, locals=3, args_size=1
       0: new           #2                  // class java/util/ArrayList
       3: dup
       4: invokespecial #3                  // Method java/util/ArrayList."<init>":()V
       7: astore_1
       8: aload_1
       9: bipush        10
      11: invokestatic  #4                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
      // 这里进行了泛型擦除java实际调用的是add(Objcet o)
      14: invokeinterface #5,  2            // InterfaceMethod java/util/List.add:(Ljava/lang/Object;)Z
      19: pop
      20: aload_1
      21: iconst_0
      // 这里也进行了泛型擦除java实际调用的是get(Object o)   
      22: invokeinterface #6,  2            // InterfaceMethod java/util/List.get:(I)Ljava/lang/Object;
// 这里进行了类型转换java将 Object 转换成了 Integer
      27: checkcast     #7                  // class java/lang/Integer
      30: astore_2
      31: return

使用反射可以得到, 参数的类型以及泛型类型:

public static void main(String[] args) throws NoSuchMethodException {
    // 1. 拿到方法
    Method method = Candy.class.getMethod("test", List.class, Map.class);
    // 2. 得到泛型参数的类型信息
    Type[] types = method.getGenericParameterTypes();
    for(Type type : types) {
        // 3. 判断参数类型是否, 带泛型的类型。
        if(type instanceof ParameterizedType) {
            ParameterizedType parameterizedType = (ParameterizedType) type;

            // 4. 得到原始类型
            System.out.println("原始类型 - " + parameterizedType.getRawType());
            // 5. 拿到泛型类型
            Type[] arguments = parameterizedType.getActualTypeArguments();
            for(int i = 0; i < arguments.length; i++) {
                System.out.printf("泛型参数[%d] - %s\n", i, arguments[i]);
            }
        }
    }
}

public Set<Integer> test(List<String> list, Map<Integer, Object> map) {
    return null;
}

打印结果:

可变参数

可变参数也是 JDK 5 开始加入的新特性:

public class Candy {
    public static void foo(String... args) {
        String[] array = args; // 直接赋值
        System.out.println(array);
    }
    public static void main(String[] args) {
        foo("hello", "world");
    }
}

可变参数 String… args 其实是一个 String[] args , 从代码中的赋值语句中就可以看出来, 同样 java 编译器会在编译期间将上述代码变换为:

public class Candy {
    public static void foo(String[] args) {
        String[] array = args; // 直接赋值
        System.out.println(array);
    }
    public static void main(String[] args) {
        foo(new String[]{"hello", "world"});
    }
}

foreach 循环

仍是 JDK 5 开始引入的语法糖, 数组的循环:

public class Candy {
	public static void main(String[] args) {
        // 数组赋初值的简化写法也是一种语法糖。
		int[] arr = {1, 2, 3, 4, 5};
		for(int x : arr) {
			System.out.println(x);
		}
	}
}

编译器会帮我们转换为:

public class Candy {
    public Candy() {
    }
	public static void main(String[] args) {
		int[] arr = new int[]{1, 2, 3, 4, 5};
		for(int i = 0; i < arr.length; ++i) {
			int x = arr[i];
			System.out.println(x);
		}
	}
}

如果是集合使用 foreach:

public class Candy {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(1, 2, 3, 4, 5);
        for (Integer x : list) {
            System.out.println(x);
        }
    }
}

编译器会帮我们转换为:

public class Candy {
    public Candy() {
    }
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(1, 2, 3, 4, 5);
        Iterator var2 = list.iterator();

        while(var2.hasNext()) {
            Integer x = (Integer)var2.next();
            System.out.println(x);
        }
    }
}

switch 字符串

从 JDK 7 开始, switch 可以作用于字符串和枚举类, 这个功能其实也是语法糖, 例如:

public class Cnady {
   public static void main(String[] args) {
      String str = "hello";
      switch (str) {
         case "hello" :
            System.out.println("h");
            break;
         case "world" :
            System.out.println("w");
            break;
         default:
            break;
      }
   }
}

编译器帮我们转换成:

public class Candy {
    public Candy() {
    }
    public static void main(String[] args) {
        String str = "hello";
        byte var3 = -1;
        switch(str.hashCode()) {
        case 99162322:
            if (str.equals("hello")) {
                var3 = 0;
            }
            break;
        case 113318802:
            if (str.equals("world")) {
                var3 = 1;
            }
        }
        switch(var3) {
        case 0:
            System.out.println("h");
            break;
        case 1:
            System.out.println("w");
        }
    }
}

可以看到, 执行了两遍 switch, 第一遍是根据字符串的 hashCode 和 equals 将字符串的转换为相应 byte 类型, 第二遍才是利用 byte 执行进行比较。

为什么第一遍时必须既比较 hashCode, 又利用 equals 比较呢?hashCode 是为了提高效率, 减少可能的比较, 而 equals 是为了防止 hashCode 冲突, 例如 BMC. 这两个字符串的hashCode值都是 2123 , 如果有如下代码:

public class Candy {
    public static void main(String[] args) {
        String str = "BM";
        switch (str) {
            case "BM": {
                System.out.println("h");
                break;
            }
            case "C.": {
                System.out.println("w");
                break;
            }
        }
    }
}

编译器帮我们转换成:

public class Candy {
    public Candy() {
    }
    public static void main(String[] args) {
        String str = "BM";
        byte var3 = -1;
        switch(str.hashCode()) {
        case 2123:
            if (str.equals("C.")) {
                var3 = 1;
            } else if (str.equals("BM")) {
                var3 = 0;
            }
        default:
            switch(var3) {
            case 0:
                System.out.println("h");
                break;
            case 1:
                System.out.println("w");
            }
        }
    }
}

switch 枚举

switch 枚举的例子, 原始代码:

enum SEX {
    MALE, FEMALE;
}

public class Candy {
    public static void main(String[] args) {
        SEX sex = SEX.MALE;
        switch (sex) {
            case MALE:
                System.out.println("man");
                break;
            case FEMALE:
                System.out.println("woman");
                break;
            default:
                break;
        }
    }
}

转换后代码:

public class Candy {
   /**     
    * 定义一个合成类(仅 jvm 使用, 对我们不可见)
    * 用来映射枚举的 ordinal 与数组元素的关系     
    * 枚举的 ordinal 表示枚举对象的序号, 从 0 开始     
    * 即 MALE 的 ordinal()=0, FEMALE 的 ordinal()=1     
    */ 
   static class $MAP {
      // 数组大小即为枚举元素个数, 里面存放了 case 用于比较的数字
      static int[] map = new int[2];
      static {
         // ordinal 即枚举元素对应所在的位置, MALE 为 0 , FEMALE 为 1
         map[SEX.MALE.ordinal()] = 1;
         map[SEX.FEMALE.ordinal()] = 2;
      }
   }

   public static void main(String[] args) {
      SEX sex = SEX.MALE;
      // 将对应位置枚举元素的值赋给 x , 用于 case 操作
      int x = $MAP.map[sex.ordinal()];
      switch (x) {
         case 1:
            System.out.println("man");
            break;
         case 2:
            System.out.println("woman");
            break;
         default:
            break;
      }
   }
}

枚举类

JDK 7 新增了枚举类, 以前面的性别枚举为例:

enum SEX {
   MALE, FEMALE;
}

转换后的代码:

public final class Sex extends Enum<Sex> {   
   // 对应枚举类中的元素
   public static final Sex MALE;    
   public static final Sex FEMALE;    
   private static final Sex[] $VALUES;
   
   static {       
    	// 调用构造函数, 传入枚举元素的值及 ordinal
    	MALE = new Sex("MALE", 0);    
        FEMALE = new Sex("FEMALE", 1);   
        $VALUES = new Sex[]{MALE, FEMALE}; 
   }
 	
   // 调用父类中的方法
    private Sex(String name, int ordinal) {     
        super(name, ordinal);    
    }
   
    public static Sex[] values() {  
        return $VALUES.clone();  
    }
    
    public static Sex valueOf(String name) { 
        return Enum.valueOf(Sex.class, name);  
    } 
}

try-with-resources

JDK 7 开始新增了对需要关闭的资源处理的特殊语法 try-with-resources:

try(资源变量 = 创建资源对象) {
	
} catch() {

}

其中资源对象需要实现 AutoCloseable 接口, 例如 InputStream 、 OutputStream 、 Connection 、 Statement 、 ResultSet 等接口都实现了 AutoCloseable , 使用 try-with- resources 可以不用写 finally 语句块, 编译器会帮助生成关闭资源代码, 例如:

public class Candy {
    public static void main(String[] args) {
        try(InputStream is = new FileInputStream("./1.txt")) {
            System.out.println(is);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

会被转换成:

public class Candy {
    public Candy() {
    }

    public static void main(String[] args) {
        try {
            InputStream is = new FileInputStream("./1.txt");
            Throwable t = null;

            try {
                System.out.println(is);
            } catch (Throwable e1) { 
                // t 是我们代码出现的异常 
                t = e1; 
                throw e1; 
            } finally {
                // 判断了资源不为空 
                if (is != null) { 
                    // 如果我们代码有异常
                    if (t != null) { 
                        try {
                            is.close(); 
                        } catch (Throwable e2) { 
                            // 如果 close 出现异常, 作为被压制异常添加
                            t.addSuppressed(e2); 
                        } 
                    } else { 
                        // 如果我们代码没有异常, close 出现的异常就是最后 catch 块中的 e 
                        is.close(); 
                    } 
                } 
            } 
        } catch (IOException e) {
            e.printStackTrace(); 
        } 
    }
}

为什么要设计一个 addSuppressed(Throwable e) (添加被压制异常)的方法呢?是为了防止异常信息的丢失(想想 try-with-resources 生成的 fianlly 中如果抛出了异常):

public class Test { 
	public static void main(String[] args) { 
		try (MyResource resource = new MyResource()) { 
			int i = 1/0; 
		} catch (Exception e) { 
			e.printStackTrace(); 
		} 
	} 
}
class MyResource implements AutoCloseable { 
    //关闭时抛出一个异常, 测试是否丢失
	public void close() throws Exception { 
		throw new Exception("close 异常"); 
	} 
}

输出:

如以上代码所示, 两个异常信息都不会丢。

方法重写时的桥接方法

我们都知道, 方法重写时对返回值分两种情况:

  • 父子类的返回值完全一致
  • 子类返回值可以是父类返回值的子类(见下面例子)
class A { 
	public Number m() { 
		return 1; 
	} 
}
class B extends A { 
	@Override 
	// 子类 m 方法的返回值是 Integer 是父类 m 方法返回值 Number 的子类 	
	public Integer m() { 
		return 2; 
	} 
}

对于子类, 编译器转换成:

class B extends A { 
	public Integer m() { 
		return 2; 
	}
	// 此方法才是真正重写了父类 public Number m() 方法 
	public synthetic bridge Number m() { 
		// 调用 public Integer m() 
		return m(); 
	} 
}

其中桥接方法比较特殊, 仅对 java 虚拟机可见, 并且与原来的 public Integer m() 没有命名冲突, 可以用下面反射代码来验证:

for(Method m : B.class.getDeclaredMethods()) {
    System.out.println(m);
}

输出结果:

匿名内部类

源码:

public class Candy {
   public static void main(String[] args) {
      Runnable runnable = new Runnable() {
         @Override
         public void run() {
            System.out.println("running...");
         }
      };
   }
}

转换后的代码:

public class Candy {
   public static void main(String[] args) {
      // 用额外创建的类来创建匿名内部类对象
      Runnable runnable = new Candy10$1();
   }
}

// 创建了一个额外的类, 实现了 Runnable 接口
final class Candy$1 implements Runnable {
   public Candy$1() {}

   @Override
   public void run() {
      System.out.println("running...");
   }
}

引用局部变量的匿名内部类, 源代码:

public class Candy { 
	public static void test(final int x) { 
		Runnable runnable = new Runnable() { 
			@Override 
			public void run() { 	
				System.out.println("ok:" + x); 
			} 
		}; 
	} 
}

转换后代码:

// 额外生成的类 
final class Candy$1 implements Runnable { 
	int val$x; 
	Candy$1(int x) { 
		this.val$x = x; 
	}
	public void run() { 
		System.out.println("ok:" + this.val$x); 
	} 
}

public class Candy { 
	public static void test(final int x) { 
		Runnable runnable = new Candy11$1(x); 
	} 
}

我的个人主页: www.ayu.link
本文连接: ┏ (゜ω゜)=☞

举报

相关推荐

0 条评论