前言
上一篇文章說了 cas 原理,其中說到了 atomic* 類,他們實(shí)現(xiàn)原子操作的機(jī)制就依靠了 volatile 的內(nèi)存可見性特性。如果還不了解 cas 和 atomic*,建議看一下我們說的 cas 自旋鎖是什么
并發(fā)的三個(gè)特性
首先說我們?nèi)绻褂?volatile 了,那肯定是在多線程并發(fā)的環(huán)境下。我們常說的并發(fā)場景下有三個(gè)重要特性:原子性、可見性、有序性。只有在滿足了這三個(gè)特性,才能保證并發(fā)程序正確執(zhí)行,否則就會(huì)出現(xiàn)各種各樣的問題。
原子性,上篇文章說到的 cas 和 atomic* 類,可以保證簡單操作的原子性,對于一些負(fù)責(zé)的操作,可以使用synchronized 或各種鎖來實(shí)現(xiàn)。
可見性,指當(dāng)多個(gè)線程訪問同一個(gè)變量時(shí),一個(gè)線程修改了這個(gè)變量的值,其他線程能夠立即看得到修改的值。
有序性,程序執(zhí)行的順序按照代碼的先后順序執(zhí)行,禁止進(jìn)行指令重排序。看似理所當(dāng)然的事情,其實(shí)并不是這樣,指令重排序是jvm為了優(yōu)化指令,提高程序運(yùn)行效率,在不影響單線程程序執(zhí)行結(jié)果的前提下,盡可能地提高并行度。但是在多線程環(huán)境下,有些代碼的順序改變,有可能引發(fā)邏輯上的不正確。
而 volatile 做實(shí)現(xiàn)了兩個(gè)特性,可見性和有序性。所以說在多線程環(huán)境中,需要保證這兩個(gè)特性的功能,可以使用 volatile 關(guān)鍵字。
volatile 是如何保證可見性的
說到可見性,就要了解一下計(jì)算機(jī)的處理器和主存了。因?yàn)槎嗑€程,不管有多少個(gè)線程,最后還是要在計(jì)算機(jī)處理器中進(jìn)行的,現(xiàn)在的計(jì)算機(jī)基本都是多核的,甚至有的機(jī)器是多處理器的。我們看一下多處理器的結(jié)構(gòu)圖:
這是兩個(gè)處理器,四核的 cpu。一個(gè)處理器對應(yīng)一個(gè)物理插槽,多處理器間通過qpi總線相連。一個(gè)處理器包含多個(gè)核,一個(gè)處理器間的多核共享l3 cache。一個(gè)核包含寄存器、l1 cache、l2 cache。
在程序執(zhí)行的過程中,一定要涉及到數(shù)據(jù)的讀和寫。而我們都知道,雖然內(nèi)存的訪問速度已經(jīng)很快了,但是比起cpu執(zhí)行指令的速度來,還是差的很遠(yuǎn)的,因此,在內(nèi)核中,增加了l1、l2、l3 三級緩存,這樣一來,當(dāng)程序運(yùn)行的時(shí)候,先將所需要的數(shù)據(jù)從主存復(fù)制一份到所在核的緩存中,運(yùn)算完成后,再寫入主存中。下圖是 cpu 訪問數(shù)據(jù)的示意圖,由寄存器到高速緩存再到主存甚至硬盤的速度是越來越慢的。
了解了 cpu 結(jié)構(gòu)之后,我們來看一下程序執(zhí)行的具體過程,拿一個(gè)簡單的自增操作舉例。
i=i+1;
執(zhí)行這條語句的時(shí)候,在某個(gè)核上運(yùn)行的某線程將 i 的值拷貝一個(gè)副本到此核所在的緩存中,當(dāng)運(yùn)算執(zhí)行完成后,再回寫到主存中去。如果是多線程環(huán)境下,每一個(gè)線程都會(huì)在所運(yùn)行的核上的高速緩存區(qū)有一個(gè)對應(yīng)的工作內(nèi)存,也就是每一個(gè)線程都有自己的私有工作緩存區(qū),用來存放運(yùn)算需要的副本數(shù)據(jù)。那么,我們再來看這個(gè) i+1 的問題,假設(shè) i 的初始值為0,有兩個(gè)線程同時(shí)執(zhí)行這條語句,每個(gè)線程執(zhí)行都需要三個(gè)步驟:
1、從主存讀取 i 值到線程工作內(nèi)存,也就是對應(yīng)的內(nèi)核高速緩存區(qū);
2、計(jì)算 i+1 的值;
3、將結(jié)果值寫回主存中;
建設(shè)兩個(gè)線程各執(zhí)行 10,000 次后,我們預(yù)期的值應(yīng)該是 20,000 才對,可惜很遺憾,i 的值總是小于 20,000 的 。導(dǎo)致這個(gè)問題的其中一個(gè)原因就是緩存一致性問題,對于這個(gè)例子來說,一旦某個(gè)線程的緩存副本做了修改,其他線程的緩存副本應(yīng)該立即失效才對。
而使用了 volatile 關(guān)鍵字后,會(huì)有如下效果:
1、每次對變量的修改,都會(huì)引起處理器緩存(工作內(nèi)存)寫回到主存;
2、一個(gè)工作內(nèi)存回寫到主存會(huì)導(dǎo)致其他線程的處理器緩存(工作內(nèi)存)無效。
因?yàn)?volatile 保證內(nèi)存可見性,其實(shí)是用到了 cpu 保證緩存一致性的 mesi 協(xié)議。mesi 協(xié)議內(nèi)容較多,這里就不做說明,請各位同學(xué)自己去查詢一下吧。總之用了 volatile 關(guān)鍵字,當(dāng)某線程對 volatile 變量的修改會(huì)立即回寫到主存中,并且導(dǎo)致其他線程的緩存行失效,強(qiáng)制其他線程再使用變量時(shí),需要從主存中讀取。
那么我們把上面的 i 變量用 volatile 修飾后,再次執(zhí)行,每個(gè)線程執(zhí)行 10,000 次。很遺憾,還是小于 20,000 的。這是為什么呢?
volatile 利用 cpu 的 mesi 協(xié)議確實(shí)保證了可見性。但是,注意了,volatile 并沒有保證操作的原子性,因?yàn)檫@個(gè)自增操作是分三步的,假設(shè)線程 1 從主存中讀取了 i 值,假設(shè)是 10 ,并且此時(shí)發(fā)生了阻塞,但是還沒有對i進(jìn)行修改,此時(shí)線程 2 也從主存中讀取了 i 值,這時(shí)這兩個(gè)線程讀取的 i 值是一樣的,都是 10 ,然后線程 2 對 i 進(jìn)行了加 1 操作,并立即寫回主存中。此時(shí),根據(jù) mesi 協(xié)議,線程 1 的工作內(nèi)存對應(yīng)的緩存行會(huì)被置為無效狀態(tài),沒錯(cuò)。但是,請注意,線程 1 早已經(jīng)將 i 值從主存中拷貝過了,現(xiàn)在只要執(zhí)行加 1 操作和寫回主存的操作了。而這兩個(gè)線程都是在 10 的基礎(chǔ)上加 1 ,然后又寫回主存中,所以最后主存的值只是 11 ,而不是預(yù)期的 12 。
所以說,使用 volatile 可以保證內(nèi)存可見性,但無法保證原子性,如果還需要原子性,可以參考,之前的這篇文章。
volatile 是如何保證有序性的
java 內(nèi)存模型具備一些先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性,這個(gè)通常也稱為 happens-before 原則。如果兩個(gè)操作的執(zhí)行次序無法從 happens-before 原則推導(dǎo)出來,那么它們就不能保證它們的有序性,虛擬機(jī)可以隨意地對它們進(jìn)行重排序。
如下是 happens-before 的8條原則,摘自 《深入理解java虛擬機(jī)》。
- 程序次序規(guī)則:一個(gè)線程內(nèi),按照代碼順序,書寫在前面的操作先行發(fā)生于書寫在后面的操作;
- 鎖定規(guī)則:一個(gè) unlock 操作先行發(fā)生于后面對同一個(gè)鎖的 lock 操作;
- volatile 變量規(guī)則:對一個(gè)變量的寫操作先行發(fā)生于后面對這個(gè)變量的讀操作;
- 傳遞規(guī)則:如果操作a先行發(fā)生于操作b,而操作b又先行發(fā)生于操作c,則可以得出操作a先行發(fā)生于操作c;
- 線程啟動(dòng)規(guī)則:thread對象的start()方法先行發(fā)生于此線程的每個(gè)一個(gè)動(dòng)作;
- 線程中斷規(guī)則:對線程interrupt()方法的調(diào)用先行發(fā)生于被中斷線程的代碼檢測到中斷事件的發(fā)生;
- 線程終結(jié)規(guī)則:線程中所有的操作都先行發(fā)生于線程的終止檢測,我們可以通過thread.join()方法結(jié)束、thread.isalive()的返回值手段檢測到線程已經(jīng)終止執(zhí)行;
- 對象終結(jié)規(guī)則:一個(gè)對象的初始化完成先行發(fā)生于他的 finalize() 方法的開始;
這里主要說一下 volatile 關(guān)鍵字的規(guī)則,舉一個(gè)著名的單例模式中的雙重檢查的例子:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
class singleton{ private volatile static singleton instance = null ; private singleton() { } public static singleton getinstance() { if (instance== null ) { // step 1 synchronized (singleton. class ) { if (instance== null ) // step 2 instance = new singleton(); //step 3 } } return instance; } } |
如果 instance 不用 volatile 修飾,可能產(chǎn)生什么結(jié)果呢,假設(shè)有兩個(gè)線程在調(diào)用 getinstance() 方法,線程 1 執(zhí)行步驟 step1 ,發(fā)現(xiàn) instance 為 null ,然后同步鎖住 singleton 類,接著再次判斷 instance 是否為 null ,發(fā)現(xiàn)仍然是 null,然后執(zhí)行 step 3 ,開始實(shí)例化 singleton 。而在實(shí)例化的過程中,線程 2 走到 step 1,有可能發(fā)現(xiàn) instance 不為空,但是此時(shí) instance 有可能還沒有完全初始化。
什么意思呢,對象在初始化的時(shí)候分三個(gè)步驟,用下面的偽代碼表示:
1
2
3
|
memory = allocate(); //1. 分配對象的內(nèi)存空間 ctorinstance(memory); //2. 初始化對象 instance = memory; //3. 設(shè)置 instance 指向?qū)ο蟮膬?nèi)存空間 |
因?yàn)椴襟E 2 和步驟 3 需要依賴步驟 1,而步驟 2 和 步驟 3 并沒有依賴關(guān)系,所以這兩條語句有可能會(huì)發(fā)生指令重排,也就是或有可能步驟 3 在步驟 2 的之前執(zhí)行。在這種情況下,步驟 3 執(zhí)行了,但是步驟 2 還沒有執(zhí)行,也就是說 instance 實(shí)例還沒有初始化完畢,正好,在此刻,線程 2 判斷 instance 不為 null,所以就直接返回了 instance 實(shí)例,但是,這個(gè)時(shí)候 instance 其實(shí)是一個(gè)不完全的對象,所以,在使用的時(shí)候就會(huì)出現(xiàn)問題。
而使用 volatile 關(guān)鍵字,也就是使用了 “對一個(gè) volatile修飾的變量的寫,happens-before于任意后續(xù)對該變量的讀” 這一原則,對應(yīng)到上面的初始化過程,步驟2 和 3 都是對 instance 的寫,所以一定發(fā)生于后面對 instance 的讀,也就是不會(huì)出現(xiàn)返回不完全初始化的 instance 這種可能。
jvm 底層是通過一個(gè)叫做“內(nèi)存屏障”的東西來完成。內(nèi)存屏障,也叫做內(nèi)存柵欄,是一組處理器指令,用于實(shí)現(xiàn)對內(nèi)存操作的順序限制。
最后
通過 volatile 關(guān)鍵字,我們了解了一下并發(fā)編程中的可見性和有序性,當(dāng)然只是簡單的了解。更深入的了解,還得靠各位同學(xué)自己去鉆研。
相關(guān)文章
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,如果有疑問大家可以留言交流,謝謝大家對服務(wù)器之家的支持。
原文鏈接:https://www.cnblogs.com/fengzheng/p/9070268.html