有時僅僅為了讀寫一個或者兩個實例域就使用同步的話,顯得開銷過大,volatile關鍵字為實例域的同步訪問提供了免鎖的機制。如果聲明一個域為volatile,那麼編譯器和虛擬機就知道該域是可能被另一個線程並發更新的。再講到volatile關鍵字之前我們需要了解一下內存模型的相關概念以及並發編程中的三個特性:原子性,可見性和有序性。
Java內存模型規定所有的變量都是存在主存當中,每個線程都有自己的工作內存。線程對變量的所有操作都必須在工作內存中進行,而不能直接對主存進行操作。並且每個線程不能訪問其他線程的工作內存。
在java中,執行下面這個語句:
int i=3;
執行線程必須先在自己的工作線程中對變量i所在的緩存行進行賦值操作,然後再寫入主存當中。而不是直接將數值3寫入主存當中。
那麼Java語言 本身對 原子性、可見性以及有序性提供了哪些保證呢?
對基本數據類型的變量的讀取和賦值操作是原子性操作,即這些操作是不可被中斷的,要麼執行,要麼不執行。
來看一下下面的代碼:
x = 10; //語句1
y = x; //語句2
x++; //語句3
x = x + 1; //語句4
只有語句1是原子性操作,其他三個語句都不是原子性操作。
語句2實際上包含2個操作,它先要去讀取x的值,再將x的值寫入工作內存,雖然讀取x的值以及 將x的值寫入工作內存 這2個操作都是原子性操作,但是合起來就不是原子性操作了。
同樣的,x++和 x = x+1包括3個操作:讀取x的值,進行加1操作,寫入新的值。
也就是說,只有簡單的讀取、賦值(而且必須是將數字賦值給某個變量,變量之間的相互賦值不是原子操作)才是原子操作。
java.util.concurrent.atomic包中有很多類使用了很高效的機器級指令(而不是使用鎖)來保證其他操作的原子性。例如AtomicInteger類提供了方法incrementAndGet和decrementAndGet,它們分別以原子方式將一個整數自增和自減。可以安全地使用AtomicInteger類作為共享計數器而無需同步。
另外這個包還包含AtomicBoolean,AtomicLong和AtomicReference這些原子類僅供開發並發工具的系統程序員使用,應用程序員不應該使用這些類。
可見性,是指線程之間的可見性,一個線程修改的狀態對另一個線程是可見的。也就是一個線程修改的結果。另一個線程馬上就能看到。
當一個共享變量被volatile修飾時,它會保證修改的值會立即被更新到主存,所以對其他線程是可見的,當有其他線程需要讀取時,它會去內存中讀取新值。
而普通的共享變量不能保證可見性,因為普通共享變量被修改之後,什麼時候被寫入主存是不確定的,當其他線程去讀取時,此時內存中可能還是原來的舊值,因此無法保證可見性。
在Java內存模型中,允許編譯器和處理器對指令進行重排序,但是重排序過程不會影響到單線程程序的執行,卻會影響到多線程並發執行的正確性。
可以通過volatile關鍵字來保證一定的“有序性”。另外可以通過synchronized和Lock來保證有序性,很顯然,synchronized和Lock保證每個時刻是有一個線程執行同步代碼,相當於是讓線程順序執行同步代碼,自然就保證了有序性。
一旦一個共享變量(類的成員變量、類的靜態成員變量)被volatile修飾之後,那麼就具備了兩層語義:
保證了不同線程對這個變量進行操作時的可見性,即一個線程修改了某個變量的值,這新值對其他線程來說是立即可見的。 禁止進行指令重排序。先看一段代碼,假如線程1先執行,線程2後執行:
//線程1
boolean stop = false;
while(!stop){
doSomething();
}
//線程2
stop = true;
很多人在中斷線程時可能都會采用這種標記辦法。但是事實上,這段代碼會完全運行正確麼?即一定會將線程中斷麼?不一定,也許在大多數時候,這個代碼能夠把線程中斷,但是也有可能會導致無法中斷線程(雖然這個可能性很小,但是只要一旦發生這種情況就會造成死循環了)。
為何有可能導致無法中斷線程?每個線程在運行過程中都有自己的工作內存,那麼線程1在運行的時候,會將stop變量的值拷貝一份放在自己的工作內存當中。那麼當線程2更改了stop變量的值之後,但是還沒來得及寫入主存當中,線程2轉去做其他事情了,那麼線程1由於不知道線程2對stop變量的更改,因此還會一直循環下去。
但是用volatile修飾之後就變得不一樣了:
我們知道volatile關鍵字保證了操作的可見性,但是volatile能保證對變量的操作是原子性嗎?
public class Test {
public volatile int inc = 0;
public void increase() {
inc++;
}
public static void main(String[] args) {
final Test test = new Test();
for(int i=0;i<10;i++){
new Thread(){
public void run() {
for(int j=0;j<1000;j++)
test.increase();
};
}.start();
}
//保證前面的線程都執行完
while(Thread.activeCount()>1)
Thread.yield();
System.out.println(test.inc);
}
}
這段代碼每次運行結果都不一致,都是一個小於10000的數字,在前面已經提到過,自增操作是不具備原子性的,它包括讀取變量的原始值、進行加1操作、寫入工作內存。那麼就是說自增操作的三個子操作可能會分割開執行。
假如某個時刻變量inc的值為10,線程1對變量進行自增操作,線程1先讀取了變量inc的原始值,然後線程1被阻塞了;然後線程2對變量進行自增操作,線程2也去讀取變量inc的原始值,由於線程1只是對變量inc進行讀取操作,而沒有對變量進行修改操作,所以不會導致線程2的工作內存中緩存變量inc的緩存行無效,所以線程2會直接去主存讀取inc的值,發現inc的值時10,然後進行加1操作,並把11寫入工作內存,最後寫入主存。然後線程1接著進行加1操作,由於已經讀取了inc的值,注意此時在線程1的工作內存中inc的值仍然為10,所以線程1對inc進行加1操作後inc的值為11,然後將11寫入工作內存,最後寫入主存。那麼兩個線程分別進行了一次自增操作後,inc只增加了1。
自增操作不是原子性操作,而且volatile也無法保證對變量的任何操作都是原子性的。
在前面提到volatile關鍵字能禁止指令重排序,所以volatile能在一定程度上保證有序性。
volatile關鍵字禁止指令重排序有兩層意思:
synchronized關鍵字是防止多個線程同時執行一段代碼,那麼就會很影響程序執行效率,而volatile關鍵字在某些情況下性能要優於synchronized,但是要注意volatile關鍵字是無法替代synchronized關鍵字的,因為volatile關鍵字無法保證操作的原子性。通常來說,使用volatile必須具備以下2個條件:
對變量的寫操作不依賴於當前值 該變量沒有包含在具有其他變量的不變式中第一個條件就是不能是自增自減等操作,上文已經提到volatile不保證原子性。
第二個條件我們來舉個例子它包含了一個不變式 :下界總是小於或等於上界
public class NumberRange {
private volatile int lower, upper;
public int getLower() { return lower; }
public int getUpper() { return upper; }
public void setLower(int value) {
if (value > upper)
throw new IllegalArgumentException(...);
lower = value;
}
public void setUpper(int value) {
if (value < lower)
throw new IllegalArgumentException(...);
upper = value;
}
}
這種方式限制了范圍的狀態變量,因此將 lower 和 upper 字段定義為 volatile 類型不能夠充分實現類的線程安全,從而仍然需要使用同步。否則,如果湊巧兩個線程在同一時間使用不一致的值執行 setLower 和 setUpper 的話,則會使范圍處於不一致的狀態。例如,如果初始狀態是 (0, 5),同一時間內,線程 A 調用 setLower(4) 並且線程 B 調用 setUpper(3),顯然這兩個操作交叉存入的值是不符合條件的,那麼兩個線程都會通過用於保護不變式的檢查,使得最後的范圍值是 (4, 3),這顯然是不對的。
其實就是要保證操作的原子性就可以使用volatile,使用volatile主要有兩個場景:
volatile boolean shutdownRequested;
...
public void shutdown()
{
shutdownRequested = true;
}
public void doWork() {
while (!shutdownRequested) {
// do stuff
}
}
很可能會從循環外部調用 shutdown() 方法 —— 即在另一個線程中 —— 因此,需要執行某種同步來確保正確實現 shutdownRequested 變量的可見性。然而,使用 synchronized 塊編寫循環要比使用volatile 狀態標志編寫麻煩很多。由於 volatile 簡化了編碼,並且狀態標志並不依賴於程序內任何其他狀態,因此此處非常適合使用 volatile。
public class Singleton {
private volatile static Singleton instance = null;
public static Singleton getInstance() {
if (instance == null) {
synchronized(this) {
if (instance == null) {
instance = new Singleton();
}
}
}
return instance;
}
}
在這裡使用volatile會或多或少的影響性能,但考慮到程序的正確性,犧牲這點性能還是值得的。
DCL優點是資源利用率高,第一次執行getInstance時單例對象才被實例化,效率高。缺點是第一次加載時反應稍慢一些,在高並發環境下也有一定的缺陷,雖然發生的概率很小。
DCL雖然在一定程度解決了資源的消耗和多余的同步,線程安全等問題,但是他還是在某些情況會出現失效的問題,也就是DCL失效,在《java並發編程實踐》一書建議用以下的代碼(靜態內部類單例模式)來替代DCL:
public class Singleton {
private Singleton(){
}
public static Singleton getInstance(){
return SingletonHolder.sInstance;
}
private static class SingletonHolder {
private static final Singleton sInstance = new Singleton();
}
}
與鎖相比,Volatile 變量是一種非常簡單但同時又非常脆弱的同步機制,它在某些情況下將提供優於鎖的性能和伸縮性。如果嚴格遵循 volatile 的使用條件即變量真正獨立於其他變量和自己以前的值 ,在某些情況下可以使用 volatile 代替 synchronized 來簡化代碼。然而,使用 volatile 的代碼往往比使用鎖的代碼更加容易出錯。本文介紹了可以使用 volatile 代替 synchronized 的最常見的兩種用例,其他的情況我們最好還是去使用synchronized 。