JMM(1.0)
JMM
为什么要有内存模型
要想回答这个问题,我们需要先弄懂传统计算机硬件内存架构
硬件内存架构
CPU
一般在大型服务器上会配置多个CPU,每个CPU还会有多个核,这就意味着多个CPU或者多个核可以同时(并发)工作。如果使用Java 起了一个多线程的任务,很有可能每个 CPU 都会跑一个线程,那么你的任务在某一刻就是真正并发执行了。
CPU Register
CPU Register 也就是 CPU 寄存器。CPU 寄存器是 CPU 内部集成的,在寄存器上执行操作的效率要比在主存上高出几个数量级。
CPU Cache Memory
CPU Cache Memory 也就是 CPU 高速缓存,相对于寄存器来说,通常也可以成为 L2 二级缓存。相对于硬盘读取速度来说内存读取的效率非常高,但是与 CPU 还是相差数量级,所以在 CPU 和主存间引入了多级缓存,目的是为了做一下缓冲。
Main Memory
Main Memory 就是主存,主存比 L1、L2 缓存要大很多。
部分高端机器还有 L3 三级缓存。
缓存一致性问题
由于主存与 CPU 处理器的运算能力之间有数量级的差距,所以在传统计算机内存架构中会引入高速缓存来作为主存和处理器之间的缓冲,CPU 将常用的数据放在高速缓存中,运算结束后 CPU 再将运算结果同步到主存中。
使用高速缓存解决了 CPU 和主存速率不匹配的问题,但同时又引入另外一个新问题:缓存一致性问题。
- 在多CPU的系统中(或者单CPU多核的系统),每个CPU内核都有自己的高速缓存,它们共享同一主内存(Main Memory)。当多个CPU的运算任务都涉及同一块主内存区域时,CPU 会将数据读取到缓存中进行运算,这可能会导致各自的缓存数据不一致。
- 因此需要每个 CPU 访问缓存时遵循一定的协议,在读写数据时根据协议进行操作,共同来维护缓存的一致性。这类协议有 MSI、MESI、MOSI、和 Dragon Protocol 等。
处理器优化和指令重排序
为了提升性能在 CPU 和主内存之间增加了高速缓存,但在多线程并发场景可能会遇到
缓存一致性问题
。那还有没有办法进一步提升 CPU 的执行效率呢?答案是:处理器优化。
为了使处理器内部的运算单元能够最大化被充分利用,处理器会对输入代码进行乱序执行处理,这就是处理器优化
。
除了处理器会对代码进行优化处理,很多现代编程语言的编译器也会做类似的优化,比如像 Java 的即时编译器(JIT)会做指令重排序。
处理器优化 其实也是重排序的一种类型,这里总结一下,重排序可以分为三种类型:
- 编译器优化的重排序。编译器在不改变单线程程序语义放入前提下,可以重新安排语句的执行顺序。
- 指令级并行的重排序。现代处理器采用了指令级并行技术来将多条指令重叠执行。如果不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序。
- 内存系统的重排序。由于处理器使用缓存和读写缓冲区,这使得加载和存储操作看上去可能是在乱序执行。
并发编程的问题
如果你熟悉 Java 并发的话,肯定对这三个问题很熟悉:可见性问题
、原子性问题
、有序性问题
。如果从更深层次看这三个问题,其实就是上面讲的 缓存一致性
、处理器优化
、指令重排序
造成的。
直白说就是,缓存一致性问题其实就是可见性问题,处理器优化可能会造成原子性问题,指令重排序会造成有序性问题
出了问题总是要解决的,那有什么办法呢?
所以技术前辈们想到了在物理机器上定义出一套内存模型, 规范内存的读写操作。内存模型解决并发问题主要采用两种方式:限制处理器优化
和使用内存屏障
。
Java 内存模型
Java 运行时数据区与硬件内存的关系
我们都知道,JVM 运行时内存区域是分片的,分为栈、堆等,其实这些都是 JVM 定义的逻辑概念。在传统的硬件内存架构中是没有栈和堆这种概念。
实际上,栈和堆既存在于 高速缓存 中又存在于 主内存 中,两者并没有很直接的关系。
Java 线程与主内存的关系
Java 内存模型是一种规范,定义了很多东西:
- 所有的变量都存储在主内存(Main Memory)中。
- 每个线程都有一个私有的本地内存(Local Memory),本地内存中存储了该线程以读/写共享变量的拷贝副本。
- 线程对变量的所有操作都必须在本地内存中进行,而不能直接读写主内存。
- 不同的线程之间无法直接访问对方本地内存中的变量。
线程间通信
如果两个线程都对一个共享变量进行操作,共享变量初始值为 1,每个线程都变量进行加 1,预期共享变量的值为 3。在 JMM 规范下会有一系列的操作。
为了更好的控制主内存和本地内存的交互,Java 内存模型定义了八种操作来实现:
- lock:锁定。作用于
主内存
的变量,把一个变量标识为一条线程独占状态。 - unlock:解锁。作用于
主内存
变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。 - read:读取。作用于
主内存
变量,把一个变量值从主内存传输到线程的工作内存中,以便随后的load动作使用 - load:载入。作用于
工作内存
的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中。 - use:使用。作用于
工作内存
的变量,把工作内存中的一个变量值传递给执行引擎,每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。 - assign:赋值。作用于
工作内存
的变量,它把一个从执行引擎接收到的值赋值给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。 - store:存储。作用于
工作内存
的变量,把工作内存中的一个变量的值传送到主内存中,以便随后的write的操作。 - write:写入。作用于
主内存
的变量,它把store操作从工作内存中一个变量的值传送到主内存的变量中。
注意:工作内存也就是本地内存的意思。
JMM原则之 happens-before
总原则
如果一个操作 happens-before 另一个操作,那么第一个操作的执行结果对第二个操作可见,而且第一个操作的执行顺序排在第二个操作之前(可见性,有序性)
两个操作之间存在 happens-before 关系,并不意外着一定要按照 happens-before 原则制定的顺序来执行。如果重排序之后的执行结果与按照 happens-before 关系来执行的结果一致,那么这种重排序并不非法(可以指令重排)
8条原则
- 次序规则
一个线程内,按照代码顺序,写在前面的操作先行发生于写在后面的操作(强调的是一个线程)
前一个操作的结果可以被后续的操作获取。说白了就是前面一个操作把变量X赋值为1,那后面一个操作肯定能知道X已经变成了1 - 锁定规则
一个unlock操作先行发生于后面((这里的”后面”是指时间上的先后)。对同一个锁的lock操作(上一个线程unlock了,下一个线程才能获取到锁,进行lock)) - volatile变量规则
对一个volatile变量的写操作先行发生于后面对这个变量的读操作,前面的写对后面的读是可见的,这里的”后面”同样是指时间是的先后 - 传递规则
如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出A先行发生于操作C - 线程启动规则(Thread Start Rule)
Thread对象的start( )方法先行发生于线程的每一个动作 - 线程中断规则(Thread Interruption Rule)
- 对线程interrupt( )方法的调用先发生于被中断线程的代码检测到中断事件的发生
- 可以通过Thread.interrupted( )检测到是否发生中断
- 线程终止规则(Thread Termination Rule)
线程中的所有操作都先行发生于对此线程的终止检测 - 对象终结规则(Finalizer Rule)
对象没有完成初始化之前,是不能调用finalized( )方法的