一、線程概述
線程是程序運行的基本執行單元。當操作系統(不包括單線程的操作系統,如微軟早期的DOS)在執行一個程序時,會在系統中建立一個進程,而在這個進程中,必須至少建立一個線程(這個線程被稱為主線程)來作為這個程序運行的入口點。因此,在操作系統中運行的任何程序都至少有一個主線程。
進程和線程是現代操作系統中兩個必不可少的運行模型。在操作系統中可以有多個進程,這些進程包括系統進程(由操作系統內部建立的進程)和用戶進程(由用戶程序建立的進程);一個進程中可以有一個或多個線程。進程和進程之間不共享內存,也就是說系統中的進程是在各自獨立的內存空間中運行的。而一個進程中的線可以共享系統分派給這個進程的內存空間。
線程不僅可以共享進程的內存,而且還擁有一個屬於自己的內存空間,這段內存空間也叫做線程棧, 是在建立線程時由系統分配的,主要用來保存線程內部所使用的數據,如線程執行函數中所定義的變量。
注意:任何一個線程在建立時都會執行一個函數,這個函數叫做線程執行函數。也可以將這個函數看做線程的入口點(類似於程序中的main函數)。無論使用什麼語言或技術來建立線程,都必須執行這個函數(這個函數的表現形式可能不一樣,但都會有一個這樣的函數)。如在Windows中用於建立線程的API函數CreateThread的第三個參數就是這個執行函數的指針。
在操作系統將進程分成多個線程後,這些線程可以在操作系統的管理下並發執行,從而大大提高了程序的運行效率。雖然線程的執行從宏觀上看是多個線程同時執行,但實際上這只是操作系統的障眼法。由於一塊CPU同時只能執行一條指令,因此,在擁有一塊CPU的計算機上不可能同時執行兩個任務。而操作系統為了能提高程序的運行效率,在一個線程空閒時會撤下這個線程,並且會讓其他的線程來執行,這種方式叫做線程調度。我們之所以從表面上看是多個線程同時執行,是因為不同線程之間切換的時間非常短,而且在一般情況下切換非常頻繁。假設我們有線程A和B。在運行時,可能是A執行了1毫秒後,切換到B後,B又執行了1毫秒,然後又切換到了A,A又執行1毫秒。由於1毫秒的時間對於普通人來說是很難感知的,因此,從表面看上去就象A和B同時執行一樣,但實際上A和B是交替執行的。
二、線程給我們帶來的好處
如果能合理地使用線程,將會減少開發和維護成本,甚至可以改善復雜應用程序的性能。如在GUI應用程序中,還以通過線程的異步特性來更好地處理事件;在應用服務器程序中可以通過建立多個線程來處理客戶端的請求。線程甚至還可以簡化虛擬機的實現,如Java虛擬機(JVM)的垃圾回收器(garbage collector)通常運行在一個或多個線程中。因此,使用線程將會從以下五個方面來改善我們的應用程序:
1.充分利用CPU資源
現在世界上大多數計算機只有一塊CPU。因此,充分利用CPU資源顯得尤為重要。當執行單線程程序時,由於在程序發生阻塞時CPU可能會處於空閒狀態。這將造成大量的計算資源的浪費。而在程序中使用多線程可以在某一個線程處於休眠或阻塞時,而CPU又恰好處於空閒狀態時來運行其他的線程。這樣CPU就很難有空閒的時候。因此,CPU資源就得到了充分地利用。
2.簡化編程模型
如果程序只完成一項任務,那只要寫一個單線程的程序,並且按著執行這個任務的步驟編寫代碼即可。但要完成多項任務,如果還使用單線程的話,那就得在在程序中判斷每項任務是否應該執行以及什麼時候執行。如顯示一個時鐘的時、分、秒三個指針。使用單線程就得在循環中逐一判斷這三個指針的轉動時間和角度。如果使用三個線程分另來處理這三個指針的顯示,那麼對於每個線程來說就是指行一個單獨的任務。這樣有助於開發人員對程序的理解和維護。
3.簡化異步事件的處理
當一個服務器應用程序在接收不同的客戶端連接時最簡單地處理方法就是為每一個客戶端連接建立一個線程。然後監聽線程仍然負責監聽來自客戶端的請求。如果這種應用程序采用單線程來處理,當監聽線程接收到一個客戶端請求後,開始讀取客戶端發來的數據,在讀完數據後,read方法處於阻塞狀態,也就是說,這個線程將無法再監聽客戶端請求了。而要想在單線程中處理多個客戶端請求,就必須使用非阻塞的Socket連接和異步I/O。但使用異步I/O方式比使用同步I/O更難以控制,也更容易出錯。因此,使用多線程和同步I/O可以更容易地處理類似於多請求的異步事件。
4.使GUI更有效率
使用單線程來處理GUI事件時,必須使用循環來對隨時可能發生的GUI事件進行掃描,在循環內部除了掃描GUI事件外,還得來執行其他的程序代碼。如果這些代碼太長,那麼GUI事件就會被“凍結”,直到這些代碼被執行完為止。
在現代的GUI框架(如SWING、AWT和SWT)中都使用了一個單獨的事件分派線程(event dispatch thread,EDT)來對GUI事件進行掃描。當我們按下一個按鈕時,按鈕的單擊事件函數會在這個事件分派線程中被調用。由於EDT的任務只是對GUI事件進行掃描,因此,這種方式對事件的反映是非常快的。
5.節約成本
提高程序的執行效率一般有三種方法:
(1)增加計算機的CPU個數。
(2)為一個程序啟動多個進程
(3)在程序中使用多進程。
第一種方法是最容易做到的,但同時也是最昂貴的。這種方法不需要修改程序,從理論上說,任何程序都可以使用這種方法來提高執行效率。第二種方法雖然不用購買新的硬件,但這種方式不容易共享數據,如果這個程序要完成的任務需要必須要共享數據的話,這種方式就不太方便,而且啟動多個線程會消耗大量的系統資源。第三種方法恰好彌補了第一種方法的缺點,而又繼承了它們的優點。也就是說,既不需要購買CPU,也不會因為啟太多的線程而占用大量的系統資源(在默認情況下,一個線程所占的內存空間要遠比一個進程所占的內存空間小得多),並且多線程可以模擬多塊CPU的運行方式,因此,使用多線程是提高程序執行效率的最廉價的方式。
三、Java的線程模型
由於Java是純面向對象語言,因此,Java的線程模型也是面向對象的。Java通過Thread類將線程所必須的功能都封裝了起來。要想建立一個線程,必須要有一個線程執行函數,這個線程執行函數對應Thread類的run方法。Thread類還有一個start方法,這個方法負責建立線程,相當於調用Windows的建立線程函數CreateThread。當調用start方法後,如果線程建立成功,並自動調用Thread類的run方法。因此,任何繼承Thread的Java類都可以通過Thread類的start方法來建立線程。如果想運行自己的線程執行函數,那就要覆蓋Thread類的run方法。
在Java的線程模型中除了Thread類,還有一個標識某個Java類是否可作為線程類的接口Runnable,這個接口只有一個抽象方法run,也就是Java線程模型的線程執行函數。因此,一個線程類的唯一標准就是這個類是否實現了Runnable接口的run方法,也就是說,擁有線程執行函數的類就是線程類。
從上面可以看出,在Java中建立線程有兩種方法,一種是繼承Thread類,另一種是實現Runnable接口,並通過Thread和實現Runnable的類來建立線程,其實這兩種方法從本質上說是一種方法,即都是通過Thread類來建立線程,並運行run方法的。但它們的大區別是通過繼承Thread類來建立線程,雖然在實現起來更容易,但由於Java不支持多繼承,因此,這個線程類如果繼承了Thread,就不能再繼承其他的類了,因此,Java線程模型提供了通過實現Runnable接口的方法來建立線程,這樣線程類可以在必要的時候繼承和業務有關的類,而不是Thread類。