说说你对JMM内存模型的理解?为什么需要JMM?
CPU的速度远快于内存
,所以现在的CPU加入了高速缓存
,高速缓存一般可以分为L1、L2、L3三级缓存。缓存一致性
的问题,所以加入了缓存一致性协议
,同时导致了内存可见性
的问题,而编译器和CPU的重排序
导致了原子性
和有序性
的问题,JMM内存模型正是对多线程操作下的一系列规范约束
,因为不可能让程序员的代码去兼容所有的CPU,通过 JMM 我们才屏蔽了不同硬件和操作系统内存的访问差异
,这样保证了Java程序在不同的平台下达到一致的内存访问效果
,同时也是保证在高效并发
的时候程序能够正确执行。说了半天,到底工作内存和主内存是什么?
JMM的关键技术点都是围绕多线程的原子性、可见性和有序性展开的
指一个操作是不可中断的,即多线程环境下,操作不能被其他线程干扰
Java内存模型通过read
、load
、assign
、use
、store
、write
来保证原子性操作,此外还有
lock 和 unlock
,直接对应着 synchronized 关键字的monitorenter和monitorexit字节码指令
是指当一个线程修改了某一个共享变量的值,其他线程是否能够立即知道该变更 ,JMM规定了所有的变量都存储在主内存中
Java保证可见性可以认为通过volatile
、synchronized
、final
来实现。
Java中普通的共享变量不保证可见性
,因为数据修改被写入内存的时机是不确定
的,多线程并发下很可能出现"脏读", 所以每个线程都有自己的工作内存,线程自己的工作内存中保存了该线程使用到的变量的主内存副本拷贝
,线程对变量的所有操作(读取,赋值等 )都必需在线程自己的工作内存中进行,而不能够直接读写主内存中的变量。不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成
对于一个线程的执行代码而言,我们总是习惯性认为代码的执行总是从上到下,有序执行。但为了提供性能,编译器和处理器通常会对指令序列进行重新排序
。Java规范规定JVM线程内部维持顺序化语义,即只要程序的最终结果与它顺序化执行的结果相等
,那么指令的执行顺序可以与代码顺序不一致,此过程叫指令的重排序。
小总结
单线程环境里面确保程序最终执行结果和代码顺序执行的结果一致。
处理器在进行重排序时必须要考虑指令之间的数据依赖性
多线程环境中线程交替执行,由于编译器优化重排的存在,两个线程中使用的变量能否保证一致性是无法确定的,结果无法预测
读取过程
由于 JVM 运行程序的实体是 线程,而每个线程创建时JVM都会为其创建一个工作内存
(有些地方称为栈空间),工作内存是每个线程的私有数据区域,而Java内存模型中规定所有变量都存储在主内存
,主内存是共享内存区域
,所有线程都可以访问,但线程对变量的操作(读取赋值等)必须在工作内存中
进行,首先要将变量从主内存拷贝到的线程自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存
,不能直接操作主内存中的变量,各个线程中的工作内存中存储着主内存中的变量副本拷贝
,因此不同的线程间无法访问对方的工作内存,线程间的通信(传值)必须通过主内存来完成,其简要访问过程如下图
共享变量存储在主内存中
(从硬件角度来说就是内存条)私有的本地工作内存
,本地工作内存中存储了该线程用来读/写共享变量的副本(从硬件角度来说就是CPU的缓存,比如寄存器、L1、L2、L3缓存等)在JMM中,如果一个操作执行的结果需要对另一个操作可见性或者代码重新排序
,那么这两个操作之间必须存在 happens-before(先行发生)原则。逻辑上的先后关系
happens-before总原则
如果一个操作 happens-before 另一个操作,那么第一个操作的执行结果将对第二个操作可见,而且第一个操作的执行顺序排在第二个操作之前。
两个操作之间存在happens-before关系,并不一定要按照happens-before原则制定的顺序来执行。如果重排序之后的执行结果与按照 happens-before 关系来执行的结果一致,那么这种重排序并不非法。
虽然指令重排提高了并发的性能,但是Java虚拟机会对指令重排做出一些规则限制,并不能让所有的指令都随意的改变执行位置
主要有以下几点:
单线程每个操作,happens-before于该线程中任意后续操作
volatile
写happens-before与后续对这个变量的读
synchronized
解锁 happens-before后续对这个锁的加锁
final
变量的写happens-before 于final域对象的读,happens-before后续对final变量的读
传递性规则,A先于B,B先于C,那么A一定先于C发生
次序规则:一个线程内,按照代码顺序,写在前面的操作先行发生于写在后面的操作。
锁定规则:锁的获取的先后顺序
一个unLock
操作先行发生于后面(这里的后面是指时间上的先后)对同一个锁的lock
操作(一个线程想要lock,肯定要等前面的锁unLock
释放这个资源)
public class HappenBeforeDemo
{static Object objectLock = new Object();public static void main(String[] args) throws InterruptedException{//对于同一把锁objectLock,threadA一定先unlock同一把锁后B才能获得该锁, A 先行发生于Bsynchronized (objectLock){}}
}
volatile变量规则
对一个volatile变量的读写操作先行发生于后面对这个变量的读操作
,前面的写对后面的读是可见的,这里的后面同样是指时间上的先后。
传递规则
如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C
线程启动规则(Thread Start Rule)
Thread对象的start()方法先行发生于此线程的每一个动作
Thread t1 = new Thread(()->{System.out.println("----hello thread")//后执行
},"t1");
t1.start();//-------------------先执行
线程中断规则(Thread Interruption Rule)
对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生
;可以通过Thread.interrupted()检测到是否发生中断。
也就是说你要先调用了interrupt()方法设置过中断标志位,我才能检测到中断发送。
线程终止规则(Thread Termination Rule)
线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过isAlive()等手段检测线程是否已经终止执行。
对象终结规则(Finalizer Rule)
一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始
finalize的通常目的是在对象被不可撤销的丢弃之前执行清理操作
。
案例
public class TestDemo
{private int value = 0;public int getValue(){return value; }public int setValue(){return ++value;}
}
问:假设存在线程A和B,线程A先(时间上的先后)调用了setValue(),然后线程B调用了同一个对象的getValue(),那么线程B收到的返回值是什么?是0还是1?
不一定
我们就这段简单的代码一次分析 happens-before的规则(规则5、6、7、8 可以忽略,因为他们和这段代码毫无关系):
1 由于两个方法是由不同的线程调用,不在同一个线程中,所以肯定不满足程序次序规则;
2 两个方法都没有使用锁,所以不满足锁定规则;
3 变量不是用volatile修饰的,所以volatile变量规则不满足;
4 传递规则肯定不满足;
所以我们无法通过happens-before原则推导出线程A happens-before线程B,虽然可以确认在时间上线程A优先于线程B指定,
但就是无法确认线程B获得的结果是什么,所以这段代码不是线程安全的。那么怎么修复这段代码呢?
修复
//1
public class TestDemo
{private int value = 0;public synchronized int getValue(){return value; }public synchronized int setValue(){return ++value;}
}
//synchronized太猛了,降低太多的效率
//2
public class TestDemo
{private int value = 0;public synchronized int getValue(){return value; }public synchronized int setValue(){return ++value;}
}
//把value定义为volatile变量,由于setter方法对value的修改不依赖value的值,满足volatile关键字使用场景
//理由:利用volatile保证读取操作的可见性;利用synchronized保证复合操作的原子性结合使用锁和volatile变量来减少同步的开销。