0
点赞
收藏
分享

微信扫一扫

JVM 研究02 锁优化

JVM锁优化技术

一、自旋锁与自适应锁

如果线程获取不到锁,第一时间不是去切换系统态进行等待,而是做一个循环操作,去等到锁的释放,循环到一定的次数终止循环,调入系统调用。

为了让线程等待,而不是阻塞,让线程执行一个忙循环(自旋),这项技术就是所谓的自旋锁。


1 为什么选择自旋去消耗CPU而不直接等待?

互斥同步对性能最大的影响是阻塞的实现,挂起线程和恢复线程的操作都需要转入内核态中完成,这些操作给操作系统的并发性能带来了很大的压力。

如果锁定状态只维持很短的一段时间,为了这段时间去挂起和恢复线程并不值得。所以就仍然留在用户态

但是,自旋不能代替阻塞,因为需要占用处理器时间。


2 自旋锁适应的场景?

锁占用的时间越短,自旋等待效果越好,反之,锁被占用的时间很长,那么自旋线程只会白白消耗处理器资源。

如果自旋超过了限定的次数仍然没有成功获得锁,就应当用传统方式去挂起线程,自旋次数的默认值是10次,用户可以通过-XX:PreBlockSpin更改。


3 什么是自适应自旋?

自适应自旋:自旋的时间不再固定,由前一次在同一个锁上的自旋时间及锁的拥有者状态来决定。如果在同一个锁对象上,自旋等待刚刚成功获得过锁,并且持有锁的线程正在运行中,那么虚拟机就会认为这次自旋也很有可能再次成功,进而它将允许自旋等待持续相对更长的时间,如果自旋很少成功获得过,那在以后获得这个锁时将可能省略掉自旋过程,以避免浪费处理器资源。

二、锁消除

指虚拟机即时编译器在运行时,对一些代码上要求同步,但是被检测到不可能存在共享数据竞争时,把锁进行消除。


1 如何判断代码是否需要进行锁消除?

主要判断依据来源于逃逸分析的数据支持,如果判断一段代码中,堆上的所有数据都不会逃逸出去从而被其他线程访问到,那就可以把它们当做栈上线程数据对待,认为它们是线程私有的,同步加锁自然就无须进行。


2 什么是逃逸分析?

分析对象动态作用域:当一个对象在方法中被定义后,它可能被外部方法所引用,例如作为调用参数传递到其他方法中,称为方法逃逸。甚至还有可能被外部线程访问到,譬如赋值给类变量或可以在其他线程中访问的实例变量,称为线程逃逸。


3 利用逃逸分析技术,可以做些什么?

如果能证明一个对象不会逃逸到方法或线程之外,也就是别的方法或线程无法通过任何途径访问到这个对象,则可能对这个变量进行一些高效的优化。


栈上分配。如果确定一个对象不会逃逸出方法之外,那让这个对象在栈上分配内存,对象所占用的内存空间可以随帧出栈而销毁,减少垃圾收集系统的压力。(目前Hotspot没有这方面的实现,因为实现的技术比较困难)

同步消除。也就是这里所说的锁消除

标量替换。把对象拆散,将其使用的成员变量恢复原始类型来访问就叫标量替换,如果一个对象不会被外部访问,并且这个对象可以被拆散的话,那程序员真正执行的时候将可能不创建这个对象,而改为直接创建它的若干个被这个方法使用到的成员变量来代替。将对象拆分后,除了可以让对象的成员变量在栈上(栈上存储的数据,有很大的概率会被虚拟机分配至物理机器的高速寄存器中存储)分配和读写之外,还可以为后续进一步的优化手段创建条件。

逃逸分析技术在虚拟机中并不成熟,不能保证逃逸分析的性能收益必定高于其消耗,因为分析的过程比较消耗性能


三、锁粗化

如果虚拟机探测到有这样一串零碎操作都对同一个对象加锁,将会把加锁同步范围扩展(粗化)到整个操作序列的外部,减少锁切换的消耗。


四、轻量级锁

1 为什么使用轻量级锁?

在没有多线程竞争的前提下,减少传统的重量级锁使用操作系统互斥量产生的性能消耗。


2 轻量级锁是通过对象头存储区域状态实现的,那对象头的内存布局是怎样的呢?

存储对象自身的运行时数据(Mark Word)(哈希码、GC分代年龄、是实现轻量级锁和偏向锁的关键)

存储指向方法区的对象类型数据指针

如果是数组对象,还会有一个额外的部分用于存储数组长度

3 轻量级锁的加锁过程?

在代码块进入同步块的时候,如果此同步对象没有被锁定,虚拟机首先将在当前线程的栈帧中建立一个名为锁记录(Lock Record)的空间,用于存储锁对象目前的Mark Word的拷贝(官方把这份拷贝加了一个Displaced前缀,即Displaced前缀,即Displaced Mark Word)

虚拟机将使用CAS操作尝试将对象的Mark Word更新为指向Lock Record 的指针。如果这个更新动作成功了,那么这个线程就拥有了该对象的锁,并且对象Mark Word的锁标志位将转变为“00”,即表示此对象处于轻量级锁定状态

如果这个更新操作失败了,虚拟机首先会检查对象的Mark Word 是否指向当前线程的栈帧,如果只说明当前线程已经拥有了这个对象锁,那就可以直接进入同步块继续执行,否则说明这个锁对象已经被其他线程抢占了。如果有两条以上的线程争用同一个锁,那轻量级锁不再有效,要膨胀为重量级锁,锁标志的状态值变为“10”,Mark Word 中存储的就是指向重量级锁(互斥量)的指针,后面等待的线程也要进入阻塞状态。



4 轻量级锁的解锁过程?

解锁过程也是通过CAS操作进行的,如果对象的Mark Word 任然指向着线程的锁记录,那就用CAS操作把对象当前的Mark Word和线程中复制的Displaced Mark Word替换回来,如果替换成功,整个同步过程就完成了。如果替换失败,说明有其他线程尝试过获取该锁,那就要在释放锁的同时,唤醒被挂起的线程。


5 轻量级锁的使用场景

提升程序同步性能的依据是“对于绝大部分的锁,在整个同步周期内都是不存在竞争的”。


如果没有竞争,轻量级锁使用CAS操作避免了使用互斥量的开销。


但如果存在锁竞争,除了互斥量的开销外,还额外发生了CAS操作,因此在有竞争的情况下,轻量级锁会比传统的重量级锁更慢。


五、偏向锁

1 偏向锁的存在目的?

目的:消除数据在无竞争情况下的同步原语,进一步提高程序的运行性能。


2 偏向锁与轻量级的关系?

如果说轻量级是在无竞争的情况下使用CAS操作去消除同步使用的互斥量,那偏向锁就是在无竞争的情况下把整个同步都消除掉,连CAS操作都不做了。


3 偏向锁说白了是什么?

偏向锁的“偏”,就是偏心,偏袒,它的意思是这个锁会偏向于第一个获得它的线程,如果在接下来的执行过程中,该锁没有被其他线程获取,则持有偏向锁的线程将永远不需要再进行同步。


4 偏向锁工作过程是怎样的?

当锁对象第一次被线程获取的时候,虚拟机将会把对象头中的标志位设为“01”,即偏向模式。同时使用CAS操作把获取到这个锁的线程的ID记录在对象的Mark Word之中,如果 CAS操作成功,持有偏向锁的线程以后每次进入这个锁相关的同步块时,虚拟机都可以不再进行任何同步操作

当有另一个线程去尝试获取这个锁时,偏向模式宣告结束。根据锁对象目前是否处于被锁定的状态,撤销偏向后恢复到未锁定或轻量级锁定的状态,后续的同步操作就如上面介绍的轻量级锁那样执行

5 偏向锁的使用场景

偏向锁可以提高带有同步但无竞争的程序性能。它同样是一个带有效益权衡性质的优化,也就是说,它并不一定总是对程序运行有利,如果程序中大多数的锁总是被多个不同的线程访问,那偏向模式就是多余的。

-XX:-UseBiasedLocking 禁止偏向锁优化

1.4 锁分离

将读写锁思想进一步延伸,就是锁分离。读写锁根据读写操作功能上的不同,进行了有效的锁分离。根据应用程序的功能特点,使用类似的分离思想,也可以对独占锁进行分离。

典型案例就是 LinkedBlockingQueue 的实现,take() 和 put() 分别实现了从队列中取得数据和往队列中增加数据的功能。虽两个数据都对当前队列进行了修改操作,但由于 LinkedBlockingQueue 是基于链表的,因此两个操作分别作用于队列的前端和尾端。

如果使用独占锁,则要求在两个操作进行时获取当前队列的独占锁,那么 take() 和 put() 操作不可能真正的并发,在运行时,它们会彼此等待对方释放资源。这种情况下,锁竞争会相对比较激烈,从而影响呈现的高并发时的性能。

JVM 研究02   锁优化_数据

无锁 -> 偏向锁 -->轻量级锁 --> 重量级锁,锁只能升级,不能降级

对象头

要理解轻量级锁和偏向锁的运行机制,还要从了解对象头(Object Header)开始。对象头分为两部分:

1、Mark Word:存储对象自身的运行时数据,如:Hash Code,GC 分代年龄、锁信息。这部分数据在32位和64位的 JVM 中分别为 32bit 和 64bit。考虑空间效率,Mark Word 被设计为非固定的数据结构,以便在极小的空间内存储尽量多的信息,32bit的 Mark Word 如下图所示:

JVM 研究02   锁优化_数据_02


2、存储指向方法区对象类型数据的指针,如果是数组对象的话,额外会存储数组的长度

2.1 偏向锁

核心思想:当线程请求到锁对象后,将锁对象的状态标志位改为 01,即偏向模式。然后使用 CAS 操作将线程的 ID 记录在锁对象的 Mark Word 中。以后该线程可以直接进入同步块,连CAS操作都不需要。但是,一旦有第二条线程需要竞争锁,那么偏向模式立即结束,进入轻量级锁的状态。

与轻量级锁的区别:轻量级锁是在无竞争的情况下使用CAS操作来代替互斥量的使用,从而实现同步;而偏向锁是在无竞争的情况下完全取消同步。

作用:偏向锁是为了消除无竞争情况下的同步原语,进一步提升程序性能。

优点:偏向锁可以提高有同步但没有竞争的程序性能。但是如果锁对象时常被多条线程竞争,那偏向锁就是多余的。

2.2 轻量级锁

如果偏向锁失败,JVM 并不会立即挂起线程。他还会使用一种称为轻量级锁的优化手段。

核心思想:轻量级锁将对象头部作为指针,指向持有锁的线程堆栈的内部,来判断一个线程是否持有对象锁。如果线程获得轻量级锁成功,则可以顺利进入临界区,如果获取轻量级锁失败,则表示其它线程先抢到了锁,那么线程的锁请求就会膨胀为重量级锁。

前提:轻量级锁比重量级锁性能更高的前提是,在轻量级锁被占用的整个同步周期内,不存在其他线程的竞争。若在该过程中一旦有其他线程竞争,那么就会膨胀成重量级锁,从而除了使用互斥量以外,还额外发生了CAS操作,因此更慢!

轻量级锁与重量级锁的比较:

重量级锁是一种悲观锁,它认为总是有多条线程要竞争锁,所以它每次处理共享数据时,不管当前系统中是否真的有线程在竞争锁,它都会使用互斥同步来保证线程的安全;

而轻量级锁是一种乐观锁,它认为锁存在竞争的概率比较小,所以它不使用互斥同步,而是使用CAS操作来获得锁,这样能减少互斥同步所使用的『互斥量』带来的性能开销。

2.3 自旋锁

锁膨胀后,JVM 为避免线程真正在操作系统层面挂起,JVM 做了最后的努力 — 自旋锁。由于当前线程无法获取锁,但什么时候获取锁是一个未知数。

因此,系统会进行一次赌注:它会假设在不久的将来,线程可以得到这把锁,JVM 让当前线程做几个空循环(这是自旋的含义)。在经过若干次循环后,如果可以得到锁,那么久顺利进入临界区。如果还不能获得锁,才会真正将线程在系统层面挂起。

优点:由于自旋等待锁的过程线程并不会引起上下文切换,因此比较高效;

缺点:自旋等待过程线程一直占用 CPU 执行权但不处理任何任务,因此若该过程过长,那就会造成 CPU 资源的浪费。

自适应自旋:自适应自旋可以根据以往自旋等待时间的经验,计算出一个较为合理的本次自旋等待时间。

2.4 锁消除

锁消除是一种更彻底的锁优化,JVM 在 JIT 编译时,通过对运行上下文的扫描,去除不可能存在的共享资源竞争的锁,通过锁消除,可以节省毫无意义的请求锁的时间。

读者可能产生疑问,如果不可能产生竞争,为什么还要加锁?

在 Java 开发中,我们必然会使用 JDK 内置的 API,如 StringBuffer、Vector 等。你在使用这些类时,也许根本不会考虑这些对象到底内部是如何实现的。但是 Vector 内部使用了 synchronized 请求锁。


举报

相关推荐

0 条评论