天天看点

02 - Java内存模型:看 Java 如何解决可见性和有序性问题

目录

1. 什么是Java内存模型

2. 使用 volatile 关键字

3. Happens-Before 规则

3.1. 程序的顺序性规则

3.2. volatile 变量规则

3.3. 传递性

3.4. 管程中锁的规则

3.5. 线程 start() 规则

3.6. 线程 join() 规则

4. 被我们忽视的 final

5. 总结

6. 思考

在 01- 可见性、原子性和有序性问题:并发编程 Bug 的源头中我们讲到在并发场景中,因可见性、原子性、有序性导致的问题常常会违背我们的直觉,从而成为并发编程的 Bug 之源。这三者在编程领域属于共性问题,所有的编程语言都会遇到,Java 在诞生之初就支持多线程,自然也有针对这三者的技术方案,而且在编程语言领域处于领先地位。理解 Java 解决并发问题的解决方案,对于理解其他语言的解决方案有触类旁通的效果。

那我们就先来聊聊如何解决其中的可见性和有序性导致的问题,这也就引出来了今天的主角——Java 内存模型。

1. 什么是Java内存模型

上篇文章已知,导致可见性的原因是缓存,导致有序性的原因是编译优化,那解决可见性、有序性最直接的方法就是禁用缓存和编译优化,这样虽然问题解决了,但是性能可能差强人意。

合理的方案应该是按需禁用缓存以及编译优化。那么,如何做到“按需禁用”呢?对于并发程序,何时禁用缓存以及编译优化只有程序员知道,那所谓“按需禁用”其实就是指按照程序员的要求来禁用。所以,为了解决可见性和有序性问题,只需要提供给程序员按需禁用缓存和编译优化的方法即可。

Java内存模型规范了JVM如何提供按需禁用缓存和编译优化的方法。具体说,这些方法包括volatile、synchronized 和 final 三个关键字,以及七项 Happens-Before 规则。

2. 使用 volatile 关键字

volatile 最原始的意义就是禁用 CPU 缓存。例如,我们声明一个 volatil e变量 volatile int x = 0,它表达的是:告诉编译器,对这个变量的读写,不能使用 CPU 缓存,必须从内存中读取或者写入。如上篇中利用双重检索单例一下,可以使用 volatile static Singleton instance 解决 instance 的可见性和有序性问题。

例如下面的示例代码,假设线程 A 执行 writer() 方法,按照 volatile 语义,会把变量 “v=true” 写入内存;假设线程 B 执行 reader() 方法,同样按照 volatile 语义,线程 B 会从内存中读取变量 v,如果线程 B 看到 “v == true” 时,那么线程 B 看到的变量 x 是多少呢?

直觉上看,应该是 42,那实际应该是多少呢?这个要看 Java 的版本,如果在低于 1.5 版本上运行,x 可能是 42,也有可能是 0;如果在 1.5 以上的版本上运行,x 就是等于 42。

class VolatileExample {
  int x = 0;
  volatile boolean v = false;
  public void writer() {
    x = 42;
    v = true;
  }
  public void reader() {
    if (v == true) {
      // 这里x会是多少呢?
    }
  }
}
           

分析一下,为什么 1.5 以前的版本会出现 x = 0 的情况呢?我相信你一定想到了,变量 x 可能被 CPU 缓存而导致可见性问题。这个问题在 1.5 版本已经被圆满解决了。Java 内存模型在 1.5 版本对 volatile 语义进行了增强。怎么增强的呢?答案是一项 Happens-Before 规则。

3. Happens-Before 规则

Happens-Before 规则所表达的意思是:前面一个操作的结果对后续操作都是可见的。Happens-Before 规则保证了线程之间的心灵感应,约束了编译器的优化行为,虽允许编译器优化,但是要求编译器优化后一定遵循 Happens-Before 规则。Happens-Before 规则是 Java 内存模型里面最晦涩的内容,和程序员相关的规则一共如下六项,都是关于可见性的。

class VolatileExample {
  int x = 0;
  volatile boolean v = false;
  public void writer() {
    x = 42;
    v = true;
  }
  public void reader() {
    if (v == true) {
      // 这里 x 会是多少呢?
    }
  }
}
           

3.1. 程序的顺序性规则

程序的顺序性规则是指在一个线程中,按照程序顺序,前面的操作可见于后续的任意操作。如上面代码,按照程序的顺序, x = 42 Happens-Before 可见于 v = true,这就是规则1的内容:程序前面对某个变量的修改一定是对后续操作可见的。

3.2. volatile 变量规则

这条规则是指对一个 volatile 变量的写操作,Happens-Before 可见于后续对这个 volatile 变量的读操作。乍一看,这个规则有点禁用缓存的意思,但看这个规则,的确是这样,但是如果关联规则 3,就有点不一样了。

3.3. 传递性

这条规则是指如果 A Happens-Before B 且 B Happens-Before C,那么 A Happens-Before C

02 - Java内存模型:看 Java 如何解决可见性和有序性问题

从图中,我们可以看到:

1. x = 42 Happens-Before 可见于写变量 v = true 这是规则1的内容;

2. 写变量 v = true Happens-Before 可见于读变量 v =true 这是规则2的内容

3.根据这个传递性的规则,x = 42 Happens-Before 可见于读变量 v = true

总之,如果线程 B 读到了 v = true,那么线程A设置的 x = 42 对线程 B 是可见的,这就是1.5版本对 volatile 语义的增强,1.5版本的并发工具包(java.util.concurrent)就是靠volatile语义来搞定可见性的。

3.4. 管程中锁的规则

这条规则是指对一个锁的解锁 Happens-Before 可见于后续对这个锁的加锁。管程是一种通用的同步原语,在 Java 中指的就是synchronized,synchronized 是 Java 里对管程的实现。管程中的锁在 Java 里是隐式实现的,例如下面的代码,在进入同步块之前,会自动加锁,而在代码块执行完会自动释放锁,加锁以及释放锁都是编译器帮我们实现的。

synchronized (this) { // 此处自动加锁
  // x 是共享变量, 初始值 =10
  if (this.x < 12) {
    this.x = 12; 
  }  
} // 此处自动解锁
           

所以结合规则 4——管程中锁的规则,可以这样理解:假设 x 的初始值是 10,线程 A 执行完代码块后 x 的值会变成 12(执行完自动释放锁),线程 B 进入代码块时,能够看到线程 A 对 x 的写操作,也就是线程 B 能够看到 x==12。这个也是符合我们直觉的,应该不难理解。

3.5. 线程 start() 规则

这条是关于线程启动的,指的是主线程 A 启动子线程B后,子线程 B 能够看到主线程在启动子线程 B 前的操作。也就是如果线程A调用线程 B 的 start() 方法(即在线程 A 中启动线程 B),那么该 start() 操作 Happens-Before 可见于子线程B中的任意操作。

Thread B = new Thread(()->{
  // 主线程调用 B.start() 之前
  // 所有对共享变量的修改,此处皆可见
  // 此例中,var==77
});
// 此处对共享变量 var 修改
var = 77;
// 主线程启动子线程
B.start();
           

3.6. 线程 join() 规则

这条是关于线程等待的,它是指线程 A 等待子线程 B 完成(主线程 A 通过调用子线程 B 的join() 方法实现),当子线程 B 完后后(主线程 A 中的 join() 方法返回),主线程能够看到子线程的操作。换句话说就是,如果在线程 A 中,调用线程 B 的join() 并成功返回,那么线程 B 中的任意操作 Happens-Before 可见于该 join() 操作的返回。

Thread B = new Thread(()->{
  // 此处对共享变量 var 修改
  var = 66;
});
// 例如此处对共享变量修改,
// 则这个修改结果对线程 B 可见
// 主线程启动子线程
B.start();
B.join()
// 子线程所有对共享变量的修改
// 在主线程调用 B.join() 之后皆可见
// 此例中,var==66
           

4. 被我们忽视的 final

前面我们讲 volatile 为的是禁用缓存以及编译优化,我们再从另外一个方面来看,有没有办法告诉编译器优化得更好一点呢?这个可以有,就是 final 关键字。final 修饰变量时,初衷是告诉编译器:这个变量生而不变,可以可劲儿优化。

5. 总结

在Java语言里面,Java 内存模型里面,最晦涩的部分就是 Happens-Before 规则了,Happens-Before 的语义本质上是一种可见性,A Happens-Before B 意味着 A 事件对 B 事件来说是可见的,无论A 事件和B 事件是否发生在同一个线程里。例如A 事件发生在线程1上,B 事件发生在线程2上, Happens-Before 规则保证线程2上能看到A事件的发生。

既然 Happens-Before 规则是最晦涩的部分,那我们就来简单总结一下 Happens-Before 六项原则:

1. 程序的顺序性规则:指在一个线程中,按照程序顺序,前面的操作可见于后续的任意操作;

2. Volatie 变量规则:指对一个 volatile 变量的写操作,Happens-Before 可见于后续对这个 volatile 变量的读操作;

3. 传递性:指如果 A Happens-Before B 且 B Happens-Before C,那么 A Happens-Before C;

4. 管程中锁的规则:指对一个锁的解锁 Happens-Before 可见于后续对这个锁的加锁

5. 线程 start() 规则:指的是主线程 A 启动子线程B后,子线程 B 能够看到主线程在启动子线程 B 前的操作

6. 线程 join()规则:指线程 A 等待子线程 B 完成(主线程 A 通过调用子线程 B 的join() 方法实现),当子线程 B 完后后(主线程 A 中的 join() 方法返回),主线程能够看到子线程的操作。

6. 思考

有一个共享变量abc,在一个线程里设置了abc 的值 abc = 3,思考一下,有哪些办法可以让其他线程能够看到 abc = 3?

  1. 保证共享变量的可见性,使用volatile关键字修饰。
  2. 使用synchronized关键字对 abc = 3 代码块解锁,由于 Happens-Before 管程锁的规则,使得后续的线程能够看到 abc 的值。
  3. A 线程启动后,使用A.join() 方法来完成运行,后续线程启动,则一定能看到 abc = 3。
  4. 使用原子变量,如AtomicInteger。

继续阅读