並發編程是Java程序員最重要的技能之一,也是最難掌握的一種技能。它要求編程者對計算機最底層的運作原理有深刻的理解,同時要求編程者邏輯清晰、思維缜密,這樣才能寫出高效、安全、可靠的多線程並發程序。本系列會從線程間協調的方式(wait、notify、notifyAll)、Synchronized及Volatile的本質入手,詳細解釋JDK為我們提供的每種並發工具和底層實現機制。在此基礎上,我們會進一步分析java.util.concurrent包的工具類,包括其使用方式、實現源碼及其背後的原理。本文是該系列的第一篇文章,是這系列中最核心的理論部分,之後的文章都會以此為基礎來分析和解釋。
一、共享性
數據共享性是線程安全的主要原因之一。如果所有的數據只是在線程內有效,那就不存在線程安全性問題,這也是我們在編程的時候經常不需要考慮線程安全的主要原因之一。但是,在多線程編程中,數據共享是不可避免的。最典型的場景是數據庫中的數據,為了保證數據的一致性,我們通常需要共享同一個數據庫中數據,即使是在主從的情況下,訪問的也同一份數據,主從只是為了訪問的效率和數據安全,而對同一份數據做的副本。我們現在,通過一個簡單的示例來演示多線程下共享數據導致的問題:
代碼段一:
package com.paddx.test.concurrent; public class ShareData { public static int count = 0; public static void main(String[] args) { final ShareData data = new ShareData(); for (int i = 0; i < 10; i++) { new Thread(new Runnable() { @Override public void run() { try { //進入的時候暫停1毫秒,增加並發問題出現的幾率 Thread.sleep(1); } catch (InterruptedException e) { e.printStackTrace(); } for (int j = 0; j < 100; j++) { data.addCount(); } System.out.print(count + " "); } }).start(); } try { //主程序暫停3秒,以保證上面的程序執行完成 Thread.sleep(3000); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println("count=" + count); } public void addCount() { count++; } }
上述代碼的目的是對count進行加一操作,執行1000次,不過這裡是通過10個線程來實現的,每個線程執行100次,正常情況下,應該輸出1000。不過,如果你運行上面的程序,你會發現結果卻不是這樣。下面是某次的執行結果(每次運行的結果不一定相同,有時候也可能獲取到正確的結果):
二、互斥性
資源互斥是指同時只允許一個訪問者對其進行訪問,具有唯一性和排它性。我們通常允許多個線程同時對數據進行讀操作,但同一時間內只允許一個線程對數據進行寫操作。所以我們通常將鎖分為共享鎖和排它鎖,也叫做讀鎖和寫鎖。如果資源不具有互斥性,即使是共享資源,我們也不需要擔心線程安全。例如,對於不可變的數據共享,所有線程都只能對其進行讀操作,所以不用考慮線程安全問題。但是對共享數據的寫操作,一般就需要保證互斥性,上述例子中就是因為沒有保證互斥性才導致數據的修改產生問題。Java 中提供多種機制來保證互斥性,最簡單的方式是使用Synchronized。現在我們在上面程序中加上Synchronized再執行:
代碼段二:
package com.paddx.test.concurrent; public class ShareData { public static int count = 0; public static void main(String[] args) { final ShareData data = new ShareData(); for (int i = 0; i < 10; i++) { new Thread(new Runnable() { @Override public void run() { try { //進入的時候暫停1毫秒,增加並發問題出現的幾率 Thread.sleep(1); } catch (InterruptedException e) { e.printStackTrace(); } for (int j = 0; j < 100; j++) { data.addCount(); } System.out.print(count + " "); } }).start(); } try { //主程序暫停3秒,以保證上面的程序執行完成 Thread.sleep(3000); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println("count=" + count); } /** * 增加 synchronized 關鍵字 */ public synchronized void addCount() { count++; } }
現在再執行上述代碼,會發現無論執行多少次,返回的最終結果都是1000。
三、原子性
原子性就是指對數據的操作是一個獨立的、不可分割的整體。換句話說,就是一次操作,是一個連續不可中斷的過程,數據不會執行的一半的時候被其他線程所修改。保證原子性的最簡單方式是操作系統指令,就是說如果一次操作對應一條操作系統指令,這樣肯定可以能保證原子性。但是很多操作不能通過一條指令就完成。例如,對long類型的運算,很多系統就需要分成多條指令分別對高位和低位進行操作才能完成。還比如,我們經常使用的整數 i++ 的操作,其實需要分成三個步驟:(1)讀取整數 i 的值;(2)對 i 進行加一操作;(3)將結果寫回內存。這個過程在多線程下就可能出現如下現象:
這也是代碼段一執行的結果為什麼不正確的原因。對於這種組合操作,要保證原子性,最常見的方式是加鎖,如Java中的Synchronized或Lock都可以實現,代碼段二就是通過Synchronized實現的。除了鎖以外,還有一種方式就是CAS(Compare And Swap),即修改數據之前先比較與之前讀取到的值是否一致,如果一致,則進行修改,如果不一致則重新執行,這也是樂觀鎖的實現原理。不過CAS在某些場景下不一定有效,比如另一線程先修改了某個值,然後再改回原來值,這種情況下,CAS是無法判斷的。
四、可見性
要理解可見性,需要先對JVM的內存模型有一定的了解,JVM的內存模型與操作系統類似,如圖所示:
package com.paddx.test.concurrent; public class VisibilityTest { private static boolean ready; private static int number; private static class ReaderThread extends Thread { public void run() { try { Thread.sleep(10); } catch (InterruptedException e) { e.printStackTrace(); } if (!ready) { System.out.println(ready); } System.out.println(number); } } private static class WriterThread extends Thread { public void run() { try { Thread.sleep(10); } catch (InterruptedException e) { e.printStackTrace(); } number = 100; ready = true; } } public static void main(String[] args) { new WriterThread().start(); new ReaderThread().start(); } }
從直觀上理解,這段程序應該只會輸出100,ready的值是不會打印出來的。實際上,如果多次執行上面代碼的話,可能會出現多種不同的結果,下面是我運行出來的某兩次的結果:
五、順序性
為了提高性能,編譯器和處理器可能會對指令做重排序。重排序可以分為三種:
(1)編譯器優化的重排序。編譯器在不改變單線程程序語義的前提下,可以重新安排語句的執行順序。
(2)指令級並行的重排序。現代處理器采用了指令級並行技術(Instruction-Level Parallelism, ILP)來將多條指令重疊執行。如果不存在數據依賴性,處理器可以改變語句對應機器指令的執行順序。
(3)內存系統的重排序。由於處理器使用緩存和讀/寫緩沖區,這使得加載和存儲操作看上去可能是在亂序執行。
我們可以直接參考一下JSR 133 中對重排序問題的描述:
(1) (2)
先看上圖中的(1)源碼部分,從源碼來看,要麼指令 1 先執行要麼指令 3先執行。如果指令 1 先執行,r2不應該能看到指令 4 中寫入的值。如果指令 3 先執行,r1不應該能看到指令 2 寫的值。但是運行結果卻可能出現r2==2,r1==1的情況,這就是“重排序”導致的結果。上圖(2)即是一種可能出現的合法的編譯結果,編譯後,指令1和指令2的順序可能就互換了。因此,才會出現r2==2,r1==1的結果。Java 中也可通過Synchronized或Volatile來保證順序性。
六 總結
本文對Java 並發編程中的理論基礎進行了講解,有些東西在後續的分析中還會做更詳細的討論,如可見性、順序性等。後續的文章都會以本章內容作為理論基礎來討論。如果大家能夠很好的理解上述內容,相信無論是去理解其他並發編程的文章還是在平時的並發編程的工作中,都能夠對大家有很好的幫助。