Java多線程面試問題
一個進程是一個獨立(self contained)的運行環境,它可以被看作一個程序或者一個應用。而線程是在進程中執行的一個任務。Java運行環境是一個包含了不同的類和程序的單一進程。線程可以被稱為輕量級進程。線程需要較少的資源來創建和駐留在進程中,並且可以共享進程中的資源。
在多線程程序中,多個線程被並發的執行以提高程序的效率,CPU不會因為某個線程需要等待資源而進入空閒狀態。多個線程共享堆內存(heap memory),因此創建多個線程去執行一些任務會比創建多個進程更好。舉個例子,Servlets比CGI更好,是因為Servlets支持多線程而CGI不支持。
當我們在Java程序中創建一個線程,它就被稱為用戶線程。一個守護線程是在後台執行並且不會阻止JVM終止的線程。當沒有用戶線程在運行的時候,JVM關閉程序並且退出。一個守護線程創建的子線程依然是守護線程。
有兩種創建線程的方法:一是實現Runnable接口,然後將它傳遞給Thread的構造函數,創建一個Thread對象;二是直接繼承Thread類。若想了解更多可以閱讀這篇關於如何在Java中創建線程的文章。
當我們在Java程序中新建一個線程時,它的狀態是New。當我們調用線程的start()方法時,狀態被改變為Runnable。線程調度器會為Runnable線程池中的線程分配CPU時間並且講它們的狀態改變為Running。其他的線程狀態還有Waiting,Blocked 和Dead。讀這篇文章可以了解更多關於線程生命周期的知識。
當然可以,但是如果我們調用了Thread的run()方法,它的行為就會和普通的方法一樣,為了在新的線程中執行我們的代碼,必須使用Thread.start()方法。
我們可以使用Thread類的Sleep()方法讓線程暫停一段時間。需要注意的是,這並不會讓線程終止,一旦從休眠中喚醒線程,線程的狀態將會被改變為Runnable,並且根據線程調度,它將得到執行。
每一個線程都是有優先級的,一般來說,高優先級的線程在運行時會具有優先權,但這依賴於線程調度的實現,這個實現是和操作系統相關的(OS dependent)。我們可以定義線程的優先級,但是這並不能保證高優先級的線程會在低優先級的線程前執行。線程優先級是一個int變量(從1-10),1代表最低優先級,10代表最高優先級。
線程調度器是一個操作系統服務,它負責為Runnable狀態的線程分配CPU時間。一旦我們創建一個線程並啟動它,它的執行便依賴於線程調度器的實現。時間分片是指將可用的CPU時間分配給可用的Runnable線程的過程。分配CPU時間可以基於線程優先級或者線程等待的時間。線程調度並不受到Java虛擬機控制,所以由應用程序來控制它是更好的選擇(也就是說不要讓你的程序依賴於線程的優先級)。
上下文切換是存儲和恢復CPU狀態的過程,它使得線程執行能夠從中斷點恢復執行。上下文切換是多任務操作系統和多線程環境的基本特征。
我們可以使用Thread類的joint()方法來確保所有程序創建的線程在main()方法退出前結束。這裡有一篇文章關於Thread類的joint()方法。
當線程間是可以共享資源時,線程間通信是協調它們的重要的手段。Object類中wait()\notify()\notifyAll()方法可以用於線程間通信關於資源的鎖的狀態。點擊這裡有更多關於線程wait, notify和notifyAll.
Java的每個對象中都有一個鎖(monitor,也可以成為監視器) 並且wait(),notify()等方法用於等待對象的鎖或者通知其他線程對象的監視器可用。在Java的線程中並沒有可供任何對象使用的鎖和同步器。這就是為什麼這些方法是Object類的一部分,這樣Java的每一個類都有用於線程間通信的基本方法
當一個線程需要調用對象的wait()方法的時候,這個線程必須擁有該對象的鎖,接著它就會釋放這個對象鎖並進入等待狀態直到其他線程調用這個對象上的notify()方法。同樣的,當一個線程需要調用對象的notify()方法時,它會釋放這個對象的鎖,以便其他在等待的線程就可以得到這個對象鎖。由於所有的這些方法都需要線程持有對象的鎖,這樣就只能通過同步來實現,所以他們只能在同步方法或者同步塊中被調用。
Thread類的sleep()和yield()方法將在當前正在執行的線程上運行。所以在其他處於等待狀態的線程上調用這些方法是沒有意義的。這就是為什麼這些方法是靜態的。它們可以在當前正在執行的線程中工作,並避免程序員錯誤的認為可以在其他非運行線程調用這些方法。
在Java中可以有很多方法來保證線程安全——同步,使用原子類(atomic concurrent classes),實現並發鎖,使用volatile關鍵字,使用不變類和線程安全類。在線程安全教程中,你可以學到更多。
當我們使用volatile關鍵字去修飾變量的時候,所以線程都會直接讀取該變量並且不緩存它。這就確保了線程讀取到的變量是同內存中是一致的。
同步塊是更好的選擇,因為它不會鎖住整個對象(當然你也可以讓它鎖住整個對象)。同步方法會鎖住整個對象,哪怕這個類中有多個不相關聯的同步塊,這通常會導致他們停止執行並需要等待獲得這個對象上的鎖。
使用Thread類的setDaemon(true)方法可以將線程設置為守護線程,需要注意的是,需要在調用start()方法前調用這個方法,否則會拋出IllegalThreadStateException異常。
ThreadLocal用於創建線程的本地變量,我們知道一個對象的所有線程會共享它的全局變量,所以這些變量不是線程安全的,我們可以使用同步技術。但是當我們不想使用同步的時候,我們可以選擇ThreadLocal變量。
每個線程都會擁有他們自己的Thread變量,它們可以使用get()\set()方法去獲取他們的默認值或者在線程內部改變他們的值。ThreadLocal實例通常是希望它們同線程狀態關聯起來是private static屬性。在ThreadLocal例子這篇文章中你可以看到一個關於ThreadLocal的小程序。
ThreadGroup是一個類,它的目的是提供關於線程組的信息。
ThreadGroup API比較薄弱,它並沒有比Thread提供了更多的功能。它有兩個主要的功能:一是獲取線程組中處於活躍狀態線程的列表;二是設置為線程設置未捕獲異常處理器(ncaught exception handler)。但在Java 1.5中Thread類也添加了setUncaughtExceptionHandler(UncaughtExceptionHandler eh) 方法,所以ThreadGroup是已經過時的,不建議繼續使用。
t1.setUncaughtExceptionHandler(new UncaughtExceptionHandler(){ @Override public void uncaughtException(Thread t, Throwable e) { System.out.println("exception occured:"+e.getMessage()); } });
線程轉儲是一個JVM活動線程的列表,它對於分析系統瓶頸和死鎖非常有用。有很多方法可以獲取線程轉儲——使用Profiler,Kill -3命令,jstack工具等等。我更喜歡jstack工具,因為它容易使用並且是JDK自帶的。由於它是一個基於終端的工具,所以我們可以編寫一些腳本去定時的產生線程轉儲以待分析。讀這篇文檔可以了解更多關於產生線程轉儲的知識。
死鎖是指兩個以上的線程永遠阻塞的情況,這種情況產生至少需要兩個以上的線程和兩個以上的資源。
分析死鎖,我們需要查看Java應用程序的線程轉儲。我們需要找出那些狀態為BLOCKED的線程和他們等待的資源。每個資源都有一個唯一的id,用這個id我們可以找出哪些線程已經擁有了它的對象鎖。
避免嵌套鎖,只在需要的地方使用鎖和避免無限期等待是避免死鎖的通常辦法,閱讀這篇文章去學習如何分析死鎖。
java.util.Timer是一個工具類,可以用於安排一個線程在未來的某個特定時間執行。Timer類可以用安排一次性任務或者周期任務。
java.util.TimerTask是一個實現了Runnable接口的抽象類,我們需要去繼承這個類來創建我們自己的定時任務並使用Timer去安排它的執行。
這裡有關於java Timer的例子。
一個線程池管理了一組工作線程,同時它還包括了一個用於放置等待執行的任務的隊列。
java.util.concurrent.Executors提供了一個 java.util.concurrent.Executor接口的實現用於創建線程池。線程池例子展現了如何創建和使用線程池,或者閱讀ScheduledThreadPoolExecutor例子,了解如何創建一個周期任務。
Java並發面試問題
原子操作是指一個不受其他操作影響的操作任務單元。原子操作是在多線程環境下避免數據不一致必須的手段。
int++並不是一個原子操作,所以當一個線程讀取它的值並加1時,另外一個線程有可能會讀到之前的值,這就會引發錯誤。
為了解決這個問題,必須保證增加操作是原子的,在JDK1.5之前我們可以使用同步技術來做到這一點。到JDK1.5,java.util.concurrent.atomic包提供了int和long類型的裝類,它們可以自動的保證對於他們的操作是原子的並且不需要使用同步。可以閱讀這篇文章來了解Java的atomic類。
Lock接口比同步方法和同步塊提供了更具擴展性的鎖操作。他們允許更靈活的結構,可以具有完全不同的性質,並且可以支持多個相關類的條件對象。
它的優勢有:
閱讀更多關於鎖的例子
Executor框架同java.util.concurrent.Executor 接口在Java 5中被引入。Executor框架是一個根據一組執行策略調用,調度,執行和控制的異步任務的框架。
無限制的創建線程會引起應用程序內存溢出。所以創建一個線程池是個更好的的解決方案,因為可以限制線程的數量並且可以回收再利用這些線程。利用Executors框架可以非常方便的創建一個線程池,閱讀這篇文章可以了解如何使用Executor框架創建一個線程池。
java.util.concurrent.BlockingQueue的特性是:當隊列是空的時,從隊列中獲取或刪除元素的操作將會被阻塞,或者當隊列是滿時,往隊列裡添加元素的操作會被阻塞。
阻塞隊列不接受空值,當你嘗試向隊列中添加空值的時候,它會拋出NullPointerException。
阻塞隊列的實現都是線程安全的,所有的查詢方法都是原子的並且使用了內部鎖或者其他形式的並發控制。
BlockingQueue 接口是java collections框架的一部分,它主要用於實現生產者-消費者問題。
閱讀這篇文章了解如何使用阻塞隊列實現生產者-消費者問題。
Java 5在concurrency包中引入了java.util.concurrent.Callable 接口,它和Runnable接口很相似,但它可以返回一個對象或者拋出一個異常。
Callable接口使用泛型去定義它的返回類型。Executors類提供了一些有用的方法去在線程池中執行Callable內的任務。由於Callable任務是並行的,我們必須等待它返回的結果。java.util.concurrent.Future對象為我們解決了這個問題。在線程池提交Callable任務後返回了一個Future對象,使用它我們可以知道Callable任務的狀態和得到Callable返回的執行結果。Future提供了get()方法讓我們可以等待Callable結束並獲取它的執行結果。
閱讀這篇文章了解更多關於Callable,Future的例子。
FutureTask是Future的一個基礎實現,我們可以將它同Executors使用處理異步任務。通常我們不需要使用FutureTask類,單當我們打算重寫Future接口的一些方法並保持原來基礎的實現是,它就變得非常有用。我們可以僅僅繼承於它並重寫我們需要的方法。閱讀Java FutureTask例子,學習如何使用它。
Java集合類都是快速失敗的,這就意味著當集合被改變且一個線程在使用迭代器遍歷集合的時候,迭代器的next()方法將拋出ConcurrentModificationException異常。
並發容器支持並發的遍歷和並發的更新。
主要的類有ConcurrentHashMap, CopyOnWriteArrayList 和CopyOnWriteArraySet,閱讀這篇文章了解如何避免ConcurrentModificationException。
Executors為Executor,ExecutorService,ScheduledExecutorService,ThreadFactory和Callable類提供了一些工具方法。
Executors可以用於方便的創建線程池。
原文:journaldev.com 譯文:ifeve 譯者:鄭旭東