0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Linux進程調(diào)度時機概念分析

汽車玩家 ? 來源:今日頭條 ? 作者:余生做酒長醉不憂 ? 2020-01-23 17:14 ? 次閱讀

Linux在眾多進程中是怎么進行調(diào)度的,這個牽涉到Linux進程調(diào)度時機的概念,由Linux內(nèi)核中Schedule()的函數(shù)來決定是否要進行進程的切換,如果要切換的話,切換到哪個進程等等。

Linux進程調(diào)度時機主要有:

1、進程狀態(tài)轉換的時刻:進程終止、進程睡眠;

2、當前進程的時間片用完時(current->counter=0);

3、設備驅動程序

4、進程從中斷、異常及系統(tǒng)調(diào)用返回到用戶態(tài)時;

時機1,進程要調(diào)用sleep()或exit()等函數(shù)進行狀態(tài)轉換,這些函數(shù)會主動調(diào)用調(diào)度程序進行進程調(diào)度;

時機2,由于進程的時間片是由時鐘中斷來更新的,因此,這種情況和時機4是一樣的。

時機3,當設備驅動程序執(zhí)行長而重復的任務時,直接調(diào)用調(diào)度程序。在每次反復循環(huán)中,驅動程序都檢查need_resched的值,如果必要,則調(diào)用調(diào)度程序schedule()主動放棄CPU。

時機4,如前所述,不管是從中斷、異常還是系統(tǒng)調(diào)用返回,最終都調(diào)用ret_from_sys_call(),由這個函數(shù)進行調(diào)度標志的檢測,如果必要,則調(diào)用調(diào)用調(diào)度程序。那么,為什么從系統(tǒng)調(diào)用返回時要調(diào)用調(diào)度程序呢?這當然是從效率考慮。從系統(tǒng)調(diào)用返回意味著要離開內(nèi)核態(tài)而返回到用戶態(tài),而狀態(tài)的轉換要花費一定的時間,因此,在返回到用戶態(tài)前,系統(tǒng)把在內(nèi)核態(tài)該處理的事全部做完。

對于直接執(zhí)行調(diào)度程序的時機,我們不討論,因為后面我們將會描述調(diào)度程序的工作過程。前面我們討論了時鐘中斷,知道了時鐘中斷的重要作用,下面我們就簡單看一下每個時鐘中斷發(fā)生時內(nèi)核要做的工作,首先對這個最頻繁的調(diào)度時機有一個大體了解,然后再詳細討論調(diào)度程序的具體工作過程。

每個時鐘中斷(timer interrupt)發(fā)生時,由三個函數(shù)協(xié)同工作,共同完成進程的選擇和切換,它們是:schedule()、do_timer()及ret_form_sys_call()。我們先來解釋一下這三個函數(shù):

schedule():進程調(diào)度函數(shù),由它來完成進程的選擇(調(diào)度);

do_timer():暫且稱之為時鐘函數(shù),該函數(shù)在時鐘中斷服務程序中被調(diào)用,是時鐘中斷服務程序的主要組成部分,該函數(shù)被調(diào)用的頻率就是時鐘中斷的頻率即每秒鐘100次(簡稱100赫茲或100Hz);

ret_from_sys_call():系統(tǒng)調(diào)用返回函數(shù)。當一個系統(tǒng)調(diào)用或中斷完成時,該函數(shù)被調(diào)用,用于處理一些收尾工作,例如信號處理、核心任務等等。

這三個函數(shù)是如何協(xié)調(diào)工作的呢?

前面我們看到,時鐘中斷是一個中斷服務程序,它的主要組成部分就是時鐘函數(shù)do_timer(),由這個函數(shù)完成系統(tǒng)時間的更新、進程時間片的更新等工作,更新后的進程時間片counter作為調(diào)度的主要依據(jù)。

在時鐘中斷返回時,要調(diào)用函數(shù)ret_from_sys_call(),前面我們已經(jīng)討論過這個函數(shù),在這個函數(shù)中有如下幾行:

cmpl $0, _need_resched

jne reschedule

……

restore_all:

RESTORE_ALL


reschedule:

call SYMBOL_NAME(schedule)

jmp ret_from_sys_call

這幾行的意思很明顯:檢測 need_resched 標志,如果此標志為非0,那么就轉到reschedule處調(diào)用調(diào)度程序schedule()進行進程的選擇。調(diào)度程序schedule()會根據(jù)具體的標準在運行隊列中選擇下一個應該運行的進程。當從調(diào)度程序返回時,如果發(fā)現(xiàn)又有調(diào)度標志被設置,則又調(diào)用調(diào)度程序,直到調(diào)度標志為0,這時,從調(diào)度程序返回時由RESTORE_ALL恢復被選定進程的環(huán)境,返回到被選定進程的用戶空間,使之得到運行。

以上就是時鐘中斷這個最頻繁的調(diào)度時機。討論這個的主要目的使讀者對時機4有個大致的了解。

另外,TIF_NEED_RESCHED的設置時機 :

設置這個標志的函數(shù)主要有兩個: resched_task(),set_tsk_need_resched().主要是resched_task,而resched_task的調(diào)用者 check_preempt_curr更是通過:try_to_wake_up/wake_up_new_task/pull_task /__migrate_task 這些被廣泛使用的函數(shù), 從而分布在內(nèi)核中大量的檢查點有機會搶占進程.

最后要說明的是,系統(tǒng)調(diào)用返回函數(shù)ret_from_sys_call()是從系統(tǒng)調(diào)用、異常及中斷返回函數(shù)通常要調(diào)用的函數(shù),但并不是非得調(diào)用,對于那些要經(jīng)常被響應的和要被盡快處理的中斷請求信號,為了減少系統(tǒng)開銷,處理完成后并不調(diào)用 ret_from_sys_call()(因為很顯然的,從這些中斷處理程序返回到的用戶空間肯定是那個被中斷的進程,無需重新選擇),并且,它們作的工作要盡可能少,因為響應的頻率太高了。

Linux進程調(diào)度和其他的UNIX進程調(diào)度不同,尤其是在“nice level”優(yōu)先級的處理上,與優(yōu)先權調(diào)度(priority高的進程最先運行)不同,Linux用的是時間片輪轉調(diào)度(Round Robing),但同時又保證了高優(yōu)先級的進程運行的既快、時間又長(both sooner and longer)。而標準的UNIX調(diào)度程序都用到了多級進程隊列。大多數(shù)的實現(xiàn)都用到了二級優(yōu)先隊列:一個標準隊列和一個實時(“real time”)隊列。一般情況下,如果實時隊列中的進程未被阻塞,它們都要在標準隊列中的進程之前被執(zhí)行,并且,每個隊列中,“nice level”高的進程先被執(zhí)行。

總體上,Linux 調(diào)度序程在交互性方面表現(xiàn)很出色,當然了,這是以犧牲一部分“吞吐量”為代價的。

Linux schedule框架(調(diào)度的時刻)

Linux進程調(diào)度時機概念分析

1.1、中心是rq(runqueue)

rq其實是runnable queue,即本cpu上所有可運行進程的隊列集合。每個cpu每種類型的rq(cfs/rt)只有一個,一個rq包含多個runnable的task,但是rq當前正在運行的進程(current running task)只有一個。

既然rq是中心,那么以下幾點就是關鍵路徑:

1、什么時候task入rq?

2、什么時候task出rq?

3、rq怎么樣從多個可運行的進程(runnable tasks)中選取一個進程作為當前的運行進程(current running task)?

我們下面就逐一解答這些疑問,理解了這些關鍵路徑,你就對linux的進程調(diào)度框架有了一個清晰的認識。

1.2、入rq(enqueue)

只有task新創(chuàng)建/或者task從blocked狀態(tài)被喚醒(wakeup),task才會被壓入rq。涉及到進程調(diào)度相關的步驟如下:

1、把task壓入rq(enqueue),且把task->state設置為TASK_RUNNING;

2、判斷壓入新task以后rq的負載情況,當前task需不需要被調(diào)度出去,如果需要把當前task的thread_info->flags其中TIF_NEED_RESCHED bit置位。

重點在這里:如果當前進程需要重新調(diào)度的條件成立,這里只是會設置TIF_NEED_RESCHED標志,并不會馬上調(diào)用schedule()來進行調(diào)度。真正的調(diào)度時機發(fā)生在從中斷/異常返回時,會判斷當前進程有沒有被設置TIF_NEED_RESCHED,如果設置則調(diào)用schedule()來進行調(diào)度。

為什么喚醒涉及到調(diào)度不會馬上執(zhí)行?而是只設置一個TIF_NEED_RESCHED,等到中斷/異常返回的時候才執(zhí)行?

我理解有幾點:(1)喚醒操作經(jīng)常在中斷上下文中執(zhí)行,在這個環(huán)境中直接調(diào)用schedule()進行調(diào)度是不行的;(2)為了維護非搶占內(nèi)核以來的一些傳統(tǒng),不要輕易中斷進程的處理邏輯除非他主動放棄;(3)在普通上下文中,喚醒后接著調(diào)用schedule()也是可以的,我們看到一些特殊函數(shù)就是這么干的(調(diào)用smp_send_reschedule()、resched_curr()的函數(shù))。

3、等待中斷/異常的發(fā)生、返回,在返回時判讀有TIF_NEED_RESCHED,則調(diào)用schedule()進行調(diào)度;

1.3、出rq(dequeue)

在當前進程調(diào)用系統(tǒng)函數(shù)進入blocked狀態(tài)是,task會出rq(dequeue)。具體的步驟如下:

1、當前進程把task->state設置為TASK_INTERRUPTIBLE/TASK_UNINTERRUPTIBLE;

2、立即調(diào)用schedule()進行調(diào)度;

這里block是和wakeup、scheduler_tick最大的不同,block是馬上調(diào)用schedule()進行調(diào)度,而wakeup、scheduler_tick是設置TIF_NEED_RESCHED標志,等待中斷/異常返回時才執(zhí)行真正的schedule()操作;

3、調(diào)用schedule()后,判斷當前進程task->state已經(jīng)非TASK_RUNNING,則進行dequeue操作,并且調(diào)度其他進程到rq->curr。

1.4、定時調(diào)度rq(scheduler_tick)

前面說了在rq的enqueue、dequeue時刻會計算rq負載,來決定把哪個runnable task放到current running task。除了enqueue/dequeue時候,系統(tǒng)還會周期性的計算rq負載來進行調(diào)度,確保多進程在1個cpu上都能得到服務。具體的步驟如下:

1、每1 tick,local timer產(chǎn)生一次中斷。中斷中調(diào)用scheduler_tick(),計算rq的負載重新調(diào)度;

2、如果當前進程需要被調(diào)度,則設置TIF_NEED_RESCHED標志;

3、在local timer中斷返回的時候,時判讀有TIF_NEED_RESCHED,則調(diào)用schedule()進行調(diào)度;

1.5、中斷/異常返回(Interrupt/Exception)

在前面幾節(jié)中有一個重要的概念,wakeup、scheduler_tick操作后,如果需要調(diào)度只會設置TIF_NEED_RESCHED,在中斷/異常返回時才執(zhí)行真正的調(diào)度schedule()操作;

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Linux
    +關注

    關注

    87

    文章

    11304

    瀏覽量

    209523
  • 進程
    +關注

    關注

    0

    文章

    203

    瀏覽量

    13961
收藏 人收藏

    評論

    相關推薦

    Linux內(nèi)核進程管理與調(diào)度:策略優(yōu)化與實踐分析

    今天給大家上點硬貨,關于Linux進程管理和調(diào)度是學習和理解Linux的必學知識。為協(xié)調(diào)多個進程 "同時" 運行,現(xiàn)代操作系統(tǒng)通常使用
    發(fā)表于 05-08 09:42 ?1132次閱讀
    <b class='flag-5'>Linux</b>內(nèi)核<b class='flag-5'>進程</b>管理與<b class='flag-5'>調(diào)度</b>:策略優(yōu)化與實踐<b class='flag-5'>分析</b>

    深入探討Linux進程調(diào)度

    Linux操作系統(tǒng)作為一個開源且廣泛應用的操作系統(tǒng),其內(nèi)核設計包含了許多核心功能,而進程調(diào)度器(Scheduler)就是其中一個至關重要的模塊。進程
    的頭像 發(fā)表于 08-13 13:36 ?949次閱讀
    深入探討<b class='flag-5'>Linux</b>的<b class='flag-5'>進程</b><b class='flag-5'>調(diào)度</b>器

    Linux內(nèi)核搶占和用戶搶占的概念和區(qū)別

    本文詳解了Linux內(nèi)核搶占實現(xiàn)機制。首先介紹了內(nèi)核搶占和用戶搶占的概念和區(qū)別,接著分析了不可搶占內(nèi)核的特點及實時系統(tǒng)中實現(xiàn)內(nèi)核搶占的必要性。然后分析了禁止內(nèi)核搶占的情況和內(nèi)核搶占的
    發(fā)表于 08-05 08:18

    干貨分享:基于嵌入式Linux進程調(diào)度實現(xiàn)方法

    調(diào)度策略,實現(xiàn)了高效、靈活的進程調(diào)度。 2.Linux 進程調(diào)度
    發(fā)表于 12-10 14:17

    Linux進程、線程以及調(diào)度

    報名:《Linux進程、線程以及調(diào)度》4節(jié)系列微課(522-25)
    發(fā)表于 05-15 14:44

    Linux進程管理

    Linux進程管理 本章主要介紹進程概念、狀態(tài)、構成以及Linux進程的相關知識。 掌握
    發(fā)表于 04-28 14:57 ?0次下載

    linux處理機調(diào)度與死鎖

    linux處理機調(diào)度與死鎖 掌握處理機的三級調(diào)度 掌握作業(yè)調(diào)度進程調(diào)度
    發(fā)表于 04-28 14:59 ?0次下載

    Linux 2.6進程調(diào)度

    分析了與Linux 2.6 進程調(diào)度密切相關的一些重要數(shù)據(jù)結構,詳細描述了進程調(diào)度
    發(fā)表于 06-13 10:13 ?11次下載

    Linux進程調(diào)度的原理解析

    進程調(diào)度依據(jù) 調(diào)度程序運行時,要在所有可運行狀態(tài)的進程中選擇最值得運行的進程投入運行。選擇進程
    發(fā)表于 11-02 11:01 ?1次下載

    uClinux進程調(diào)度器的實現(xiàn)分析

    分享到:標簽:uClinux 調(diào)度策略 進程調(diào)度器 摘要:針對操作系統(tǒng)中進程調(diào)度機制,依次對其調(diào)度
    發(fā)表于 11-06 14:30 ?0次下載

    Linux 進程調(diào)度淺析

    都比較低,但是linux作為一個通用操作系統(tǒng),不能假設系統(tǒng)負載低,必須為應付高負載下的進程調(diào)度做精心的設計。當然,這些設計對于低負載(且沒有什么實時性要求)的環(huán)境,沒多大用。極端情況下,如果CPU
    發(fā)表于 04-02 14:40 ?346次閱讀

    嵌入式Linux實時進程調(diào)度算法改進

    ,具有實時性的同時又具有嵌入 式系統(tǒng)的特點。2 實時進程調(diào)度算法分析2.1 Linux進程調(diào)度
    發(fā)表于 04-02 14:43 ?426次閱讀

    linux進程調(diào)度淺析

    桌面系統(tǒng)、網(wǎng)絡服務器、等)負載都比較低,但是linux作為一個通用操作系統(tǒng),不能假設系統(tǒng)負載低,必須為應付高負載下的進程調(diào)度做精心的設計。當然,這些設計對于低負載(且沒有什么實時性要求)的環(huán)境,沒多大
    發(fā)表于 04-02 14:45 ?346次閱讀

    Linux進程概念說明

    進程Linux 操作系統(tǒng)中最重要的基本概念之一,這一節(jié)我們將了解學習 Linux 進程的一些基礎知識。
    發(fā)表于 07-14 14:27 ?772次閱讀

    帶大家看看Linux內(nèi)核如何調(diào)度進程

    部分,打開調(diào)度器的黑匣子,來看看Linux內(nèi)核如何調(diào)度進程的。實際上,進程調(diào)度器主要做兩件事:選
    的頭像 發(fā)表于 07-26 15:14 ?2014次閱讀