如果兩個操作訪問同一個變量,且這兩個操作中有一個為寫操作,此時這兩個操作之間就存在數據依 賴性。數據依賴分下列三種類型:
上 面三種情況,只要重排序兩個操作的執行順序,程序的執行結果將會被改變。
前面提到過,編譯 器和處理器可能會對操作做重排序。編譯器和處理器在重排序時,會遵守數據依賴性,編譯器和處理器不 會改變存在數據依賴關系的兩個操作的執行順序。
注意,這裡所說的數據依賴性僅針對單個處理 器中執行的指令序列和單個線程中執行的操作,不同處理器之間和不同線程之間的數據依賴性不被編譯器 和處理器考慮。
as-if-serial語義
as-if-serial語義的意思指:不管怎麼重排序(編譯器 和處理器為了提高並行度),(單線程)程序的執行結果不能被改變。編譯器,runtime 和處理器都必須 遵守as-if-serial語義。
為了遵守as-if-serial語義,編譯器和處理器不會對存在數據依賴關系 的操作做重排序,因為這種重排序會改變執行結果。但是,如果操作之間不存在數據依賴關系,這些操作 可能被編譯器和處理器重排序。為了具體說明,請看下面計算圓面積的代碼示例:
double pi = 3.14; //A double r = 1.0; //B double area = pi * r * r; //C
上面三個操作的數據依賴關系如下圖所示:
如上圖所示,A和C之間存在數據依賴關系,同時B和C之間也存在數據依賴關系。因此在最終執 行的指令序列中,C不能被重排序到A和B的前面(C排到A和B的前面,程序的結果將會被改變)。但A和B之 間沒有數據依賴關系,編譯器和處理器可以重排序A和B之間的執行順序。下圖是該程序的兩種執行順序:
as-if-serial語義把單線程程序保護了起來,遵守as-if-serial語義的編譯器, runtime 和處理器共同為編寫單線程程序的程序員創建了一個幻覺:單線程程序是按程序的順序來執行的 。as-if-serial語義使單線程程序員無需擔心重排序會干擾他們,也無需擔心內存可見性問題。
程序順序規則
根據happens- before的程序順序規則,上面計算圓的面積的示例代碼存在三個 happens- before關系:
A happens- before B;
B happens- before C;
A happens- before C;
這裡的第3個happens- before關系,是根據happens- before的傳遞性推導出來的。
這裡A happens- before B,但實際執行時B卻可以排在A之前執行(看上面的重排序後的執行順序)。在第一章 提到過,如果A happens- before B,JMM並不要求A一定要在B之前執行。JMM僅僅要求前一個操作(執行 的結果)對後一個操作可見,且前一個操作按順序排在第二個操作之前。這裡操作A的執行結果不需要對 操作B可見;而且重排序操作A和操作B後的執行結果,與操作A和操作B按happens- before順序執行的結果 一致。在這種情況下,JMM會認為這種重排序並不非法(not illegal),JMM允許這種重排序。
在 計算機中,軟件技術和硬件技術有一個共同的目標:在不改變程序執行結果的前提下,盡可能的開發並行 度。編譯器和處理器遵從這一目標,從happens- before的定義我們可以看出,JMM同樣遵從這一目標。
重排序對多線程的影響
現在讓我們來看看,重排序是否會改變多線程程序的執行結果。請 看下面的示例代碼:
class ReorderExample { int a = 0; boolean flag = false; public void writer() { a = 1; //1 flag = true; //2 } Public void reader() { if (flag) { //3 int i = a * a; //4 …… } } }
flag變量是個標記,用來標識變量a是否已被寫入。這裡假設有兩個線程A和B,A首先執行 writer()方法,隨後B線程接著執行reader()方法。線程B在執行操作4時,能否看到線程A在操作1對共享 變量a的寫入?
答案是:不一定能看到。
由於操作1和操作2沒有數據依賴關系,編譯器和 處理器可以對這兩個操作重排序;同樣,操作3和操作4沒有數據依賴關系,編譯器和處理器也可以對這兩 個操作重排序。讓我們先來看看,當操作1和操作2重排序時,可能會產生什麼效果?請看下面的程序執行 時序圖:
如上圖所示,操作1和操作2做了重排序。程序執行時,線程A首先寫標記變量 flag,隨後線程B讀這個變量。由於條件判斷為真,線程B將讀取變量a。此時,變量a還根本沒有被線程A 寫入,在這裡多線程程序的語義被重排序破壞了!
※注:本文統一用紅色的虛箭線表示錯誤的讀 操作,用綠色的虛箭線表示正確的讀操作。
下面再讓我們看看,當操作3和操作4重排序時會產生 什麼效果(借助這個重排序,可以順便說明控制依賴性)。下面是操作3和操作4重排序後,程序的執行時 序圖:
在程序中,操作3和操作4存在控制依賴關系。當代碼中存在控制依賴性時,會影 響指令序列執行的並行度。為此,編譯器和處理器會采用猜測(Speculation)執行來克服控制相關性對 並行度的影響。以處理器的猜測執行為例,執行線程B的處理器可以提前讀取並計算a*a,然後把計算結果 臨時保存到一個名為重排序緩沖(reorder buffer ROB)的硬件緩存中。當接下來操作3的條件判斷為真 時,就把該計算結果寫入變量i中。
從圖中我們可以看出,猜測執行實質上對操作3和4做了重排序 。重排序在這裡破壞了多線程程序的語義!
在單線程程序中,對存在控制依賴的操作重排序,不 會改變執行結果(這也是as-if-serial語義允許對存在控制依賴的操作做重排序的原因);但在多線程程 序中,對存在控制依賴的操作重排序,可能會改變程序的執行結果。
查看本欄目