JVM 研究02 锁优化-CFANZ编程社区

JVM锁优化技术

一、自旋锁与自适应锁

如果线程获取不到锁，第一时间不是去切换系统态进行等待，而是做一个循环操作，去等到锁的释放，循环到一定的次数终止循环，调入系统调用。

为了让线程等待，而不是阻塞，让线程执行一个忙循环（自旋），这项技术就是所谓的自旋锁。

1 为什么选择自旋去消耗CPU而不直接等待？

互斥同步对性能最大的影响是阻塞的实现，挂起线程和恢复线程的操作都需要转入内核态中完成，这些操作给操作系统的并发性能带来了很大的压力。

如果锁定状态只维持很短的一段时间，为了这段时间去挂起和恢复线程并不值得。所以就仍然留在用户态

但是，自旋不能代替阻塞，因为需要占用处理器时间。

2 自旋锁适应的场景？

锁占用的时间越短，自旋等待效果越好，反之，锁被占用的时间很长，那么自旋线程只会白白消耗处理器资源。

如果自旋超过了限定的次数仍然没有成功获得锁，就应当用传统方式去挂起线程，自旋次数的默认值是10次，用户可以通过-XX:PreBlockSpin更改。

3 什么是自适应自旋？

自适应自旋：自旋的时间不再固定，由前一次在同一个锁上的自旋时间及锁的拥有者状态来决定。如果在同一个锁对象上，自旋等待刚刚成功获得过锁，并且持有锁的线程正在运行中，那么虚拟机就会认为这次自旋也很有可能再次成功，进而它将允许自旋等待持续相对更长的时间，如果自旋很少成功获得过，那在以后获得这个锁时将可能省略掉自旋过程，以避免浪费处理器资源。

二、锁消除

指虚拟机即时编译器在运行时，对一些代码上要求同步，但是被检测到不可能存在共享数据竞争时，把锁进行消除。

1 如何判断代码是否需要进行锁消除？

主要判断依据来源于逃逸分析的数据支持，如果判断一段代码中，堆上的所有数据都不会逃逸出去从而被其他线程访问到，那就可以把它们当做栈上线程数据对待，认为它们是线程私有的，同步加锁自然就无须进行。

2 什么是逃逸分析？

分析对象动态作用域：当一个对象在方法中被定义后，它可能被外部方法所引用，例如作为调用参数传递到其他方法中，称为方法逃逸。甚至还有可能被外部线程访问到，譬如赋值给类变量或可以在其他线程中访问的实例变量，称为线程逃逸。

3 利用逃逸分析技术，可以做些什么？

如果能证明一个对象不会逃逸到方法或线程之外，也就是别的方法或线程无法通过任何途径访问到这个对象，则可能对这个变量进行一些高效的优化。

栈上分配。如果确定一个对象不会逃逸出方法之外，那让这个对象在栈上分配内存，对象所占用的内存空间可以随帧出栈而销毁，减少垃圾收集系统的压力。（目前Hotspot没有这方面的实现，因为实现的技术比较困难）

同步消除。也就是这里所说的锁消除

标量替换。把对象拆散，将其使用的成员变量恢复原始类型来访问就叫标量替换，如果一个对象不会被外部访问，并且这个对象可以被拆散的话，那程序员真正执行的时候将可能不创建这个对象，而改为直接创建它的若干个被这个方法使用到的成员变量来代替。将对象拆分后，除了可以让对象的成员变量在栈上（栈上存储的数据，有很大的概率会被虚拟机分配至物理机器的高速寄存器中存储）分配和读写之外，还可以为后续进一步的优化手段创建条件。

逃逸分析技术在虚拟机中并不成熟，不能保证逃逸分析的性能收益必定高于其消耗，因为分析的过程比较消耗性能

三、锁粗化

如果虚拟机探测到有这样一串零碎操作都对同一个对象加锁，将会把加锁同步范围扩展（粗化）到整个操作序列的外部，减少锁切换的消耗。

四、轻量级锁

1 为什么使用轻量级锁？

在没有多线程竞争的前提下，减少传统的重量级锁使用操作系统互斥量产生的性能消耗。

2 轻量级锁是通过对象头存储区域状态实现的，那对象头的内存布局是怎样的呢？

存储对象自身的运行时数据（Mark Word）（哈希码、GC分代年龄、是实现轻量级锁和偏向锁的关键）

存储指向方法区的对象类型数据指针

如果是数组对象，还会有一个额外的部分用于存储数组长度

3 轻量级锁的加锁过程？

在代码块进入同步块的时候，如果此同步对象没有被锁定，虚拟机首先将在当前线程的栈帧中建立一个名为锁记录（Lock Record）的空间，用于存储锁对象目前的Mark Word的拷贝（官方把这份拷贝加了一个Displaced前缀，即Displaced前缀，即Displaced Mark Word）

虚拟机将使用CAS操作尝试将对象的Mark Word更新为指向Lock Record 的指针。如果这个更新动作成功了，那么这个线程就拥有了该对象的锁，并且对象Mark Word的锁标志位将转变为“00”，即表示此对象处于轻量级锁定状态

如果这个更新操作失败了，虚拟机首先会检查对象的Mark Word 是否指向当前线程的栈帧，如果只说明当前线程已经拥有了这个对象锁，那就可以直接进入同步块继续执行，否则说明这个锁对象已经被其他线程抢占了。如果有两条以上的线程争用同一个锁，那轻量级锁不再有效，要膨胀为重量级锁，锁标志的状态值变为“10”，Mark Word 中存储的就是指向重量级锁（互斥量）的指针，后面等待的线程也要进入阻塞状态。

4 轻量级锁的解锁过程？

解锁过程也是通过CAS操作进行的，如果对象的Mark Word 任然指向着线程的锁记录，那就用CAS操作把对象当前的Mark Word和线程中复制的Displaced Mark Word替换回来，如果替换成功，整个同步过程就完成了。如果替换失败，说明有其他线程尝试过获取该锁，那就要在释放锁的同时，唤醒被挂起的线程。

5 轻量级锁的使用场景

提升程序同步性能的依据是“对于绝大部分的锁，在整个同步周期内都是不存在竞争的”。

如果没有竞争，轻量级锁使用CAS操作避免了使用互斥量的开销。

但如果存在锁竞争，除了互斥量的开销外，还额外发生了CAS操作，因此在有竞争的情况下，轻量级锁会比传统的重量级锁更慢。

五、偏向锁

1 偏向锁的存在目的？

目的：消除数据在无竞争情况下的同步原语，进一步提高程序的运行性能。

2 偏向锁与轻量级的关系？

如果说轻量级是在无竞争的情况下使用CAS操作去消除同步使用的互斥量，那偏向锁就是在无竞争的情况下把整个同步都消除掉，连CAS操作都不做了。

3 偏向锁说白了是什么？

偏向锁的“偏”，就是偏心，偏袒，它的意思是这个锁会偏向于第一个获得它的线程，如果在接下来的执行过程中，该锁没有被其他线程获取，则持有偏向锁的线程将永远不需要再进行同步。

4 偏向锁工作过程是怎样的？

当锁对象第一次被线程获取的时候，虚拟机将会把对象头中的标志位设为“01”，即偏向模式。同时使用CAS操作把获取到这个锁的线程的ID记录在对象的Mark Word之中，如果 CAS操作成功，持有偏向锁的线程以后每次进入这个锁相关的同步块时，虚拟机都可以不再进行任何同步操作

当有另一个线程去尝试获取这个锁时，偏向模式宣告结束。根据锁对象目前是否处于被锁定的状态，撤销偏向后恢复到未锁定或轻量级锁定的状态，后续的同步操作就如上面介绍的轻量级锁那样执行

5 偏向锁的使用场景

偏向锁可以提高带有同步但无竞争的程序性能。它同样是一个带有效益权衡性质的优化，也就是说，它并不一定总是对程序运行有利，如果程序中大多数的锁总是被多个不同的线程访问，那偏向模式就是多余的。

-XX:-UseBiasedLocking 禁止偏向锁优化

1.4 锁分离

将读写锁思想进一步延伸，就是锁分离。读写锁根据读写操作功能上的不同，进行了有效的锁分离。根据应用程序的功能特点，使用类似的分离思想，也可以对独占锁进行分离。

典型案例就是 LinkedBlockingQueue 的实现，take() 和 put() 分别实现了从队列中取得数据和往队列中增加数据的功能。虽两个数据都对当前队列进行了修改操作，但由于 LinkedBlockingQueue 是基于链表的，因此两个操作分别作用于队列的前端和尾端。

如果使用独占锁，则要求在两个操作进行时获取当前队列的独占锁，那么 take() 和 put() 操作不可能真正的并发，在运行时，它们会彼此等待对方释放资源。这种情况下，锁竞争会相对比较激烈，从而影响呈现的高并发时的性能。

JVM 研究02 锁优化_数据

无锁 -> 偏向锁 -->轻量级锁 --> 重量级锁，锁只能升级，不能降级

对象头

要理解轻量级锁和偏向锁的运行机制，还要从了解对象头（Object Header）开始。对象头分为两部分：

1、Mark Word：存储对象自身的运行时数据，如：Hash Code，GC 分代年龄、锁信息。这部分数据在32位和64位的 JVM 中分别为 32bit 和 64bit。考虑空间效率，Mark Word 被设计为非固定的数据结构，以便在极小的空间内存储尽量多的信息，32bit的 Mark Word 如下图所示：

JVM 研究02 锁优化_数据_02