在.Net多線程編程這個系列我們講一起來探討多線程編程的各個方面。首先我將在本篇文章的開始向大家介紹多線程的有關概念以及多線程編程的基礎知識;在接下來的文章中,我將逐一講述。NET平台上多線程編程的知識,諸如System.Threading命名空間的重要類以及方法,並就一些例子程序來作說明。
引言
早期的計算硬件十分復雜,但是操作系統執行的功能確十分的簡單。那個時候的操作系統在任一時間點只能執行一個任務,也就是同一時間只能執行一個程序。多個任務的執行必須得輪流執行,在系統裡面進行排隊等候。由於計算機的發展,要求系統功能越來越強大,這個時候出現了分時操作的概念:每個運行的程序占有一定的處理機時間,當這個占有時間結束後,在等待隊列等待處理器資源的下一個程序就開始投入運行。注意這裡的程序在占有一定的處理器時間後並沒有運行完畢,可能需要再一次或多次分配處理器時間。那麼從這裡可以看出,這樣的執行方式顯然是多個程序的並行執行,但是在宏觀上,我們感覺到多個任務是同時執行的,因此多任務的概念就誕生了。每個運行的程序都有自己的內存空間,自己的堆棧和環境變量設置。每一個程序對應一個進程,代表著執行一個大的任務。一個進程可以啟動另外一個進程,這個被啟動的進程稱為子進程。父進程和子進程的執行只有邏輯上的先後關系,並沒有其他的關系,也就是說他們的執行是獨立的。但是,可能一個大的程序(代表著一個大的任務),可以分割成很多的小任務,為了功能上的需要也有可能是為了加快運行的速度,可能需要同一時間執行多個任務(每個任務分配一個多線程來執行相應的任務)。舉個例子來說,你正在通過你的web浏覽器查看一些精彩的文章,你需要把好的文章給下載下來,可能有些非常精彩的文章你需要收藏起來,你就用你的打印機打印這些在線的文章。在這裡,浏覽器一邊下載Html格式的文章,一邊還要打印文章。這就是一個程序同時執行多個任務,每個任務分配一個線程來完成。因此我們可以看出一個程序同時執行多個任務的能力是通過多線程來實現的。
多線程VS多任務
正如上面所說的,多任務是相對與操作系統而言,指的是同一時間執行多個程序的能力,雖然這麼說,但是實際上在只有一個CPU的條件下不可能同時執行兩個以上的程序。CPU在程序之間做高速的切換,使得所有的程序在很短的時間之內可以得到更小的CPU時間,這樣從用戶的角度來看就好象是同時在執行多個程序。多線程相對於操作系統而言,指的是可以同時執行同一個程序的不同部分的能力,每個執行的部分被成為線程。所以在編寫應用程序時,我們必須得很好的設計以 避免不同的線程執行時的相互干擾。這樣有助於我們設計健壯的程序,使得我們可以在隨時需要的時候添加線程。
線程的概念
線程可以被描述為一個微進程,它擁有起點,執行的順序系列和一個終點。它負責維護自己的堆棧,這些堆棧用於異常處理,優先級調度和其他一些系統重新恢復線程執行時需要的信息。從這個概念看來,好像線程與進程沒有任何的區別,實際上線程與進程是肯定有區別的:
一個完整的進程擁有自己獨立的內存空間和數據,但是同一個進程內的線程是共享內存空間和數據的。一個進程對應著一段程序,它是由一些在同一個程序裡面獨立的同時的運行的線程組成的。線程有時也被稱為並行運行在程序裡的輕量級進程,線程被稱為是輕量級進程是因為它的運行依賴與進程提供的上下文環境,並且使用的是進程的資源。
在一個進程裡,線程的調度有搶占式或者非搶占的模式。
在搶占模式下,操作系統負責分配CPU時間給各個進程,一旦當前的進程使用完分配給自己的CPU時間,操作系統將決定下一個占用CPU時間的是哪一個線程。因此操作系統將定期的中斷當前正在執行的線程,將CPU分配給在等待隊列的下一個線程。所以任何一個線程都不能獨占CPU。每個線程占用CPU的時間取決於進程和操作系統。進程分配給每個線程的時間很短,以至於我們感覺所有的線程是同時執行的。實際上,系統運行每個進程的時間有2毫秒,然後調度其他的線程。它同時他維持著所有的線程和循環,分配很少量的CPU時間給線程。 線程的的切換和調度是如此之快,以至於感覺是所有的線程是同步執行的。
調度是什麼意思?調度意味著處理器存儲著將要執行完CPU時間的進程的狀態和將來某個時間裝載這個進程的狀態而恢復其運行。然而這種方式也有不足之處,一個線程可以在任何給定的時間中斷另外一個線程的執行。假設一個線程正在向一個文件做寫操作,而另外一個線程中斷其運行,也向同一個文件做寫操作。 Windows 95/NT, UNIX使用的就是這種線程調度方式。
在非搶占的調度模式下,每個線程可以需要CPU多少時間就占用CPU多少時間。在這種調度方式下,可能一個執行時間很長的線程使得其他所有需要CPU的線程”餓死”。在處理機空閒,即該進程沒有使用CPU時,系統可以允許其他的進程暫時使用CPU。占用CPU的線程擁有對CPU的控制權,只有它自己主動釋放CPU時,其他的線程才可以使用CPU。一些I/O和Windows 3。x就是使用這種調度策略。
在有些操作系統裡面,這兩種調度策略都會用到。非搶占的調度策略在線程運行優先級一般時用到,而對於高優先級的線程調度則多采用搶占式的調度策略。如果你不確定系統采用的是那種調度策略,假設搶占的調度策略不可用是比較安全的。在設計應用程序的時候,我們認為那些占用CPU時間比較多的線程在一定的間隔是會釋放CPU的控制權的,這時候系統會查看那些在等待隊列裡面的與當前運行的線程同一優先級或者更高的優先級的線程,而讓這些線程得以使用CPU。如果系統找到一個這樣的線程,就立即暫停當前執行的線程和激活滿足條件的線程。如果沒有找到同一優先級或更高級的線程,當前線程還繼續占有CPU。當正在執行的線程想釋放CPU的控制權給一個低優先級的線程,當前線程就轉入睡眠狀態而讓低優先級的線程占有CPU。
在多處理器系統,操作系統會將這些獨立的線程分配給不同的處理器執行,這樣將會大大的加快程序的運行。線程執行的效率也會得到很大的提高,因為將線程的分時共享單處理器變成了分布式的多處理器執行。這種多處理器在三維建模和圖形處理是非常有用的。
需要多線程嗎
我們發出了一個打印的命令,要求打印機進行打印任務,假設這時候計算機停止了響應而打印機還在工作,那豈不是我們的停止手上的事情就等著這慢速的打印機打印?所幸的是,這種情況不會發生,我們在打印機工作的時候還可以同時聽音樂或者畫圖。因為我們使用了獨立的多線程來執行這些任務。你可能會對多個用戶同時訪問數據庫或者web服務器感到吃驚,他們是怎麼工作的?這是因為為每個連接到數據庫或者web服務器的用戶建立了獨立的線程來維護用戶的狀態。如果一個程序的運行有一定的順序,這時候采用這種方式可能會出現問題,甚至導致整個程序崩潰。如果程序可以分成獨立的不同的任務,使用多線程,即使某一部分任務失敗了,對其他的也沒有影響,不會導致整個程序崩潰。
毫無疑問的是,編寫多線程程序使得你有了一個利器可以駕奴非多線程的程序,但是多線程也可能成為一個負擔或者需要不小的代價。如果使用的不當,會帶來更多的壞處。如果一個程序有很多的線程,那麼其他程序的線程必然只能占用更少的CPU時間;而且大量的CPU時間是用於線程調度的;操作系統也需要足夠的內存空間來維護每個線程的上下文信息;因此,大量的線程會降低系統的運行效率。因此,如果使用多線程的話,程序的多線程必須設計的很好,否則帶來的好處將遠小於壞處。因此使用多線程我們必須小心的處理這些線程的創建,調度和釋放工作。
多線程程序設計提示
有多種方法可以設計多線程的應用程序。正如後面的文章所示,我將給出詳細的編程示例,通過這些例子,你將可以更好的理解多線程。線程可以有不同的優先級,舉例子來說,在我們的應用程序裡面,繪制圖形或者做大量運算的同時要接受用戶的輸入,顯然用戶的輸入需要得到第一時間的響應,而圖形繪制或者運算則需要大量的時間,暫停一下問題不大,因此用戶輸入線程將需要高的悠閒級,而圖形繪制或者運算低優先級即可。這些線程之間相互獨立,相互不影響。
在上面的例子中,圖形繪制或者大量的運算顯然是需要站用很多的CPU時間的,在這段時間,用戶沒有必要等著他們執行完畢再輸入信息,因此我們將程序設計成獨立的兩個線程,一個負責用戶的輸入,一個負責處理那些耗時很長的任務。這將使得程序更加靈活,能夠快速響應。同時也可以使得用戶在運行的任何時候取消任務的可能。在這個繪制圖形的例子中,程序應該始終負責接收系統發來的消息。如果由於程序忙於一個任務,有可能會導致屏幕變成空白,這顯然需要我們的程序來處理這樣的事件。所以我必須得有一個線程負責來處理這些消息,正如剛才所說的應該觸發重畫屏幕的工作。
我們應該把握一個原則,對於那些對時間要求比較緊迫需要立即得到相應的任務,我們因該給予高的優先級,而其他的線程優先級應該低於她的優先級。偵聽客戶端請求的線程應該始終是高的優先級,對於一個與用戶交互的用戶界面的任務來說,它需要得到第一時間的響應,其優先級因該高優先級。