所有的進程部分運行與用戶態,部分運行於系統態。底層的硬件如何支持這些狀態各不相同但是通常有一個安全機制從用戶態轉入系統態並轉回來。用戶態比系統態的權限低了很多。每一次進程執行一個系統調用,它都從用戶態切換到系統態並繼續執行。這時讓核心執行這個進程。
Linux 中,進程不是互相爭奪成為當前運行的進程,它們無法停止正在運行的其它進程然後執行自身。每一個進程在它必須等待一些系統事件的時候會放棄 CPU
。例如,一個進程可能不得不等待從一個文件中讀取一個字符。這個等待發生在系統態的系統調用中。進程使用了庫函數打開並讀文件,庫函數又執行系統調用從打開的文件中讀入字節。這時,等候的進程會被掛起,另一個更加值得的進程將會被選擇執行。進程經常調用系統調用,所以經常需要等待。即使進程執行到需要等待也有可能會用去不均衡的
CPU 事件,所以 Linux 使用搶先式的調度。用這種方案,每一個進程答應運行少量一段時間, 200
毫秒,當這個時間過去,選擇另一個進程運行,原來的進程等待一段時間直到它又重新運行。這個時間段叫做時間片。
需要調度程序選擇系統中所有可以運行的進程中最值得的進程。一個可以運行的進程是一個只等待 CPU 的進程。 Linux 使用合理而簡單的基於優先級的調度算法在系統當前的進程中進行選擇。當它選擇了預備運行的新進程,它就保存當前進程的狀態、和處理器相關的寄存器和其他需要保存的上下文信息到進程的 task_strUCt 數據結構中。然後恢復要運行的新的進程的狀態(又和處理器相關),把系統的控制交給這個進程。為了公平地在系統中所有可以運行( runnable )的進程之間分配 CPU 時間,調度程序在每一個進程的 task_struct 結構中保存了信息:
參見 kernel/sched.c schedule()
policy 進程的調度策略。 Linux 有兩種類型的進程:普通和實時。實時進程比所有其它進程的優先級高。假如有一個實時的進程預備運行,那麼它總是先被運行。實時進程有兩種策略:環或先進先出( round robin and first in first out )。在環的調度策略下,每一個實時進程依次運行,而在先進先出的策略下,每一個可以運行的進程按照它在調度隊列中的順序運行,這個順序不會改變。
Priority 進程的調度優先級。也是它答應運行的時候可以使用的時間量( jiffies )。你可以通過系統調用或者 renice 命令來改變一個進程的優先級。
Rt_priority Linux 支持實時進程。這些進程比系統中其他非實時的進程擁有更高的優先級。這個域答應調度程序賦予每一個實時進程一個相對的優先級。實時進程的優先級可以用系統調用來修改
Coutner 這時進程可以運行的時間量( jiffies )。進程啟動的時候等於優先級( priority ),每一次時鐘周期遞減。
調度程序從核心的多個地方運行。它可以在把當前進程放到等待隊列之後運行,也可以在系統調用之後進程從系統態返回進程態之前運行。需要運行調度程序的另一個原因是系統時鐘剛好把當前進程的計數器 (counter) 置成了 0 。每一次調度程序運行它做以下工作:
參見 kernel/sched.c schedule()
kernel work 調度程序運行 bottom half handler 並處理系統的調度任務隊列。這些輕量級的核心線程在第 11 章具體描述
Current pocess 在選擇另一個進程之前必須處理當前進程。
假如當前進程的調度策略是環則它放到運行隊列的最後。
假如任務是可中斷的而且它上次調度的時候收到過一個信號,它的狀態變為 RUNNING
假如當前進程超時,它的狀態成為 RUNNING
假如當前進程的狀態為 RUNNING 則保持此狀態
不是 RUNNING 或者 INTERRUPTIBLE 的進程被從運行隊列中刪除。這意味著當調度程序查找最值得運行的進程時不會考慮這樣的進程。
Process Selection 調度程序查看運行隊列中的進程,查找最值得運行的進程。假如有實時的進程(具有實時調度策略),就會比普通進程更重一些。普通進程的重量是它的 counter ,但是對於實時進程則是 counter 加 1000 。這意味著假如系統中存在可運行的實時進程,就總是在任何普通可運行的進程之前運行。當前的進程,因為用掉了一些時間片(它的 counter 減少了),所以假如系統中由其他同等優先級的進程,就會處於不利的位置:這也是應該的。假如幾個進程又同樣的優先級,最接近運行隊列前段的那個就被選中。當前進程被放到運行隊列的後面。假如一個平衡的系統,擁有大量相同優先級的進程,那麼回按照順序執行這些進程。這叫做環型調度策略。不過,因為進程需要等待資源,它們的運行順序可能會變化。
Swap Processes 假如最值得運行的進程不是當前進程,當前進程必須被掛起,運行新的進程。當一個進程運行的時候它使用了 CPU 和系統的寄存器和物理內存。每一次它調用例程都通過寄存器或者堆棧傳遞參數、保存數值比如調用例程的返回地址等。因此,當調度程序運行的時候它在當前進程的上下文運行。它可能是特權模式:核心態,但是它仍然是當前運行的進程。當這個進程要掛起時,它的所有機器狀態,包括程序計數器 (PC) 和所有的處理器寄存器,必須存到進程的 task_struct 數據結構中。然後,必須加載新進程的所有機器狀態。這種操作依靠於系統,不同的 CPU 不會完全相同地實現,不過經常都是通過一些硬件的幫助。
交換出去進程的上下文發生在調度的最後。前一個進程存儲的上下文,就是當這個進程在調度結束的時候系統的硬件上下文的快照。相同的,當加載新的進程的上下文時,仍然是調度結束時的快照,包括進程的程序計數器和寄存器的內容。
假如前一個進程或者新的當前進程使用虛擬內存,則系統的頁表需要更新。同樣,這個動作適合體系結構相關。 Alpha AXP 處理器,使用 TLT ( Translation Look-aside Table )或者緩存的頁表條目,必須清除屬於前一個進程的緩存的頁表條目。