0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Linux CPU上下文切換

jf_78858299 ? 來源:碼農(nóng)的荒島求生 ? 作者:碼農(nóng)的荒島求生 ? 2023-02-15 14:44 ? 次閱讀

我們都知道 Linux 是一個(gè)多任務(wù)操作系統(tǒng),它支持的任務(wù)同時(shí)運(yùn)行的數(shù)量遠(yuǎn)遠(yuǎn)大于 CPU 的數(shù)量。當(dāng)然,這些任務(wù)實(shí)際上并不是同時(shí)運(yùn)行的(Single CPU),而是因?yàn)橄到y(tǒng)在短時(shí)間內(nèi)將 CPU 輪流分配給任務(wù),造成了多個(gè)任務(wù)同時(shí)運(yùn)行的假象。

CPU 上下文(CPU Context)

在每個(gè)任務(wù)運(yùn)行之前,CPU 需要知道在哪里加載和啟動(dòng)任務(wù)。這意味著系統(tǒng)需要提前幫助設(shè)置 CPU 寄存器程序計(jì)數(shù)器

CPU 寄存器是內(nèi)置于 CPU 中的小型但速度極快的內(nèi)存。程序計(jì)數(shù)器用于存儲(chǔ) CPU 正在執(zhí)行的或下一條要執(zhí)行指令的位置。

它們都是 CPU 在運(yùn)行任何任務(wù)之前必須依賴的依賴環(huán)境,因此也被稱為 “CPU 上下文”。如下圖所示:

圖片

知道了 CPU 上下文是什么,我想你理解 CPU 上下文切換就很容易了?!癈PU上下文切換”指的是先保存上一個(gè)任務(wù)的 CPU 上下文(CPU寄存器和程序計(jì)數(shù)器),然后將新任務(wù)的上下文加載到這些寄存器和程序計(jì)數(shù)器中,最后跳轉(zhuǎn)到程序計(jì)數(shù)器。

這些保存的上下文存儲(chǔ)在系統(tǒng)內(nèi)核中,并在重新安排任務(wù)執(zhí)行時(shí)再次加載。這確保了任務(wù)的原始狀態(tài)不受影響,并且任務(wù)似乎在持續(xù)運(yùn)行。

CPU 上下文切換的類型

你可能會(huì)說 CPU 上下文切換無非就是更新 CPU 寄存器和程序計(jì)數(shù)器值,而這些寄存器是為了快速運(yùn)行任務(wù)而設(shè)計(jì)的,那為什么會(huì)影響 CPU 性能呢?

在回答這個(gè)問題之前,請(qǐng)問,你有沒有想過這些“任務(wù)”是什么?你可能會(huì)說一個(gè)任務(wù)就是一個(gè)進(jìn)程或者一個(gè) 線程 。是的,進(jìn)程和線程正是最常見的任務(wù),但除此之外,還有其他類型的任務(wù)。

別忘了硬件中斷也是一個(gè)常見的任務(wù),硬件觸發(fā)信號(hào),會(huì)引起中斷處理程序的調(diào)用。

因此,CPU 上下文切換至少有三種不同的類型:

  • 進(jìn)程上下文切換
  • 線程上下文切換
  • 中斷上下文切換

讓我們一一來看看。

進(jìn)程上下文切換

Linux 按照特權(quán)級(jí)別將進(jìn)程的運(yùn)行空間劃分為內(nèi)核空間和用戶空間,分別對(duì)應(yīng)下圖中 Ring 0Ring 3 的 CPU 特權(quán)級(jí)別的 。

  • 內(nèi)核空間Ring 0)擁有最高權(quán)限,可以直接訪問所有資源
  • 用戶空間Ring 3)只能訪問受限資源,不能直接訪問內(nèi)存等硬件設(shè)備。它必須通過系統(tǒng)調(diào)用陷入(trapped) 內(nèi)核中才能訪問這些特權(quán)資源。

從另一個(gè)角度看,一個(gè)進(jìn)程既可以在用戶空間也可以在內(nèi)核空間運(yùn)行。當(dāng)一個(gè)進(jìn)程在用戶空間運(yùn)行時(shí),稱為該進(jìn)程的 用戶態(tài) ,當(dāng)它落入內(nèi)核空間時(shí),稱為該進(jìn)程的 內(nèi)核態(tài) 。

用戶態(tài)內(nèi)核態(tài)的轉(zhuǎn)換需要通過系統(tǒng)調(diào)用來完成。例如,當(dāng)我們查看一個(gè)文件的內(nèi)容時(shí),我們需要以下系統(tǒng)調(diào)用:

  • open():打開文件
  • read():讀取文件的內(nèi)容
  • write():將文件的內(nèi)容寫入到輸出文件(包括標(biāo)準(zhǔn)輸出)
  • close():關(guān)閉文件

那么在上述系統(tǒng)調(diào)用過程中是否會(huì)發(fā)生 CPU 上下文切換呢?當(dāng)然是的。

這需要先保存 CPU 寄存器中原來的用戶態(tài)指令的位置。接下來,為了執(zhí)行內(nèi)核態(tài)的代碼,需要將 CPU 寄存器更新到內(nèi)核態(tài)指令的新位置。最后是跳轉(zhuǎn)到內(nèi)核態(tài)運(yùn)行內(nèi)核任務(wù)。

那么系統(tǒng)調(diào)用結(jié)束后,CPU 寄存器需要恢復(fù)原來保存的用戶狀態(tài),然后切換到用戶空間繼續(xù)運(yùn)行進(jìn)程。

因此,在一次系統(tǒng)調(diào)用的過程中,實(shí)際上有兩次 CPU 上下文切換。

但需要指出的是,系統(tǒng)調(diào)用進(jìn)程不會(huì)涉及進(jìn)程切換,也不會(huì)涉及虛擬內(nèi)存等系統(tǒng)資源切換。這與我們通常所說的“進(jìn)程上下文切換”不同。進(jìn)程上下文切換是指從一個(gè)進(jìn)程切換到另一個(gè)進(jìn)程,而系統(tǒng)調(diào)用期間始終運(yùn)行同一個(gè)進(jìn)程

系統(tǒng)調(diào)用過程通常被稱為 特權(quán)模式切換 ,而不是 上下文切換 。但實(shí)際上,在系統(tǒng)調(diào)用過程中,CPU 的上下文切換也是不可避免的。

進(jìn)程上下文切換 vs 系統(tǒng)調(diào)用

那么進(jìn)程上下文切換和系統(tǒng)調(diào)用有什么區(qū)別呢?首先,進(jìn)程是由內(nèi)核管理的,進(jìn)程切換只能發(fā)生在內(nèi)核態(tài)。因此,進(jìn)程上下文不僅包括 虛擬內(nèi)存 、全局變量等用戶空間資源,還包括內(nèi)核棧寄存器等內(nèi)核空間的狀態(tài)。

所以進(jìn)程上下文切換系統(tǒng)調(diào)用要多出一步:

在保存當(dāng)前進(jìn)程的內(nèi)核狀態(tài)和 CPU 寄存器之前,需要保存進(jìn)程的虛擬內(nèi)存、棧等;并加載下一個(gè)進(jìn)程的內(nèi)核狀態(tài)。

根據(jù) Tsuna 的測(cè)試報(bào)告,每次上下文切換需要幾十納秒至微秒的 CPU 時(shí)間。這個(gè)時(shí)間是相當(dāng)可觀的,尤其是在大量進(jìn)程上下文切換的情況下,很容易導(dǎo)致 CPU 花費(fèi)大量時(shí)間來保存和恢復(fù)寄存器、內(nèi)核棧、虛擬內(nèi)存等資源。這正是我們?cè)谏弦黄恼轮姓劦降?,一個(gè)導(dǎo)致平均負(fù)載上升的重要因素。

那么,該進(jìn)程何時(shí)會(huì)被調(diào)度/切換到在 CPU 上運(yùn)行?其實(shí)有很多場(chǎng)景,下面我為大家總結(jié)一下:

  • 當(dāng)一個(gè)進(jìn)程的 CPU 時(shí)間片用完時(shí),它會(huì)被系統(tǒng) 掛起 ,并切換到其他等待 CPU 運(yùn)行的進(jìn)程。
  • 當(dāng)系統(tǒng)資源不足(如內(nèi)存不足)時(shí),直到資源充足之前,進(jìn)程無法運(yùn)行。此時(shí)進(jìn)程也會(huì)被 掛起 ,系統(tǒng)會(huì)調(diào)度其他進(jìn)程運(yùn)行。
  • 當(dāng)一個(gè)進(jìn)程通過 sleep 函數(shù)自動(dòng)掛起自己時(shí),自然會(huì)被重新調(diào)度。
  • 當(dāng)優(yōu)先級(jí)較高的進(jìn)程運(yùn)行時(shí),為了保證高優(yōu)先級(jí)進(jìn)程的運(yùn)行,當(dāng)前進(jìn)程會(huì)被高優(yōu)先級(jí)進(jìn)程 掛起運(yùn)行 。
  • 當(dāng)發(fā)生硬件中斷時(shí),CPU 上的進(jìn)程會(huì)被 中斷掛起 ,轉(zhuǎn)而執(zhí)行內(nèi)核中的中斷服務(wù)程序。

了解這些場(chǎng)景是非常有必要的,因?yàn)橐坏┥舷挛那袚Q出現(xiàn)性能問題,它們就是幕后殺手。

線程上下文切換

線程和進(jìn)程最大的區(qū)別在于,線程是任務(wù)調(diào)度的基本單位,而進(jìn)程是資源獲取的基本單位。

說白了,內(nèi)核中所謂的任務(wù)調(diào)度,實(shí)際的調(diào)度對(duì)象是線程;而進(jìn)程只為線程提供虛擬內(nèi)存和全局變量等資源。所以,對(duì)于線程和進(jìn)程,我們可以這樣理解:

  • 當(dāng)一個(gè)進(jìn)程只有一個(gè)線程時(shí),可以認(rèn)為一個(gè)進(jìn)程等于一個(gè)線程
  • 當(dāng)一個(gè)進(jìn)程有多個(gè)線程時(shí),這些線程共享相同的資源,例如虛擬內(nèi)存和全局變量。
  • 此外,線程也有自己的私有數(shù)據(jù),比如棧和寄存器,在上下文切換時(shí)也需要保存。

這樣,線程的上下文切換其實(shí)可以分為兩種情況:

  • 首先,前后兩個(gè)線程屬于不同的進(jìn)程。此時(shí),由于資源不共享,切換過程與進(jìn)程上下文切換相同。
  • 其次,前后兩個(gè)線程屬于同一個(gè)進(jìn)程。此時(shí),由于虛擬內(nèi)存是共享的,所以切換時(shí)虛擬內(nèi)存的資源保持不變,只需要切換線程的私有數(shù)據(jù)、寄存器等未共享的數(shù)據(jù)。

顯然,同一個(gè)進(jìn)程內(nèi)的線程切換比切換多個(gè)進(jìn)程消耗的資源要少。這也是多線程替代多進(jìn)程的優(yōu)勢(shì)。

中斷上下文切換

除了前面兩種上下文切換之外,還有另外一種場(chǎng)景也輸出 CPU 上下文切換的,那就是 中斷 。

為了快速響應(yīng)事件,硬件中斷會(huì)中斷正常的調(diào)度和執(zhí)行過程,進(jìn)而調(diào)用 中斷處理程序 。

在中斷其他進(jìn)程時(shí),需要保存進(jìn)程的當(dāng)前狀態(tài),以便中斷后進(jìn)程仍能從原始狀態(tài)恢復(fù)。

與進(jìn)程上下文不同,中斷上下文切換不涉及進(jìn)程的用戶態(tài)。因此,即使中斷進(jìn)程中斷了處于用戶態(tài)的進(jìn)程,也不需要保存和恢復(fù)進(jìn)程的虛擬內(nèi)存、全局變量等用戶態(tài)資源。

另外,和進(jìn)程上下文切換一樣,中斷上下文切換也會(huì)消耗 CPU。過多的切換次數(shù)會(huì)消耗大量的 CPU 資源,甚至嚴(yán)重降低系統(tǒng)的整體性能。因此,當(dāng)發(fā)現(xiàn)中斷過多時(shí),需要注意排查它是否會(huì)對(duì)您的系統(tǒng)造成嚴(yán)重的性能問題。

小結(jié)
  • CPU上下文切換,是保證Linux系統(tǒng)正常工作的核心功能之一,一般情況下不需要我們特別關(guān)注。
  • 但過多的上下文切換,會(huì)把CPU時(shí)間消耗在寄存器,內(nèi)核棧以及虛擬內(nèi)存等數(shù)據(jù)的保存和恢復(fù)上,從而縮短進(jìn)程真正運(yùn)行的時(shí)間,導(dǎo)致系統(tǒng)的整體性能大幅下降。
  • 自愿上下文切換變多了,說明進(jìn)程都在等待資源,有可能發(fā)生了 I/O 等其他問題
  • 非自愿上下文切換變多了,說明進(jìn)程都在被強(qiáng)制調(diào)度,也就是都在爭(zhēng)搶 CPU,說明 CPU 的確成了瓶頸
  • 中斷次數(shù)變多了,說明 CPU 被中斷處理程序占用,還需要通過查看 /proc/interrupts 文件來分析具體的中斷類型。

參考

https://medium.com/geekculture/linux-cpu-context-switch-deep-dive-764bfdae4f01

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10863

    瀏覽量

    211761
  • Linux
    +關(guān)注

    關(guān)注

    87

    文章

    11304

    瀏覽量

    209496
  • 操作系統(tǒng)
    +關(guān)注

    關(guān)注

    37

    文章

    6825

    瀏覽量

    123331
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Linux CPU上下文切換的類型

    在回答這個(gè)問題之前,請(qǐng)問,你有沒有想過這些“任務(wù)”是什么?你可能會(huì)說一個(gè)任務(wù)就是一個(gè)進(jìn)程或者一個(gè)線程。是的,進(jìn)程和線程正是最常見的任務(wù),但除此之外,還有其他類型的任務(wù)。
    的頭像 發(fā)表于 05-17 10:40 ?4142次閱讀

    編寫一個(gè)任務(wù)調(diào)度程序,在上下文切換后遇到了一些問題求解

    大家好, 我正在編寫一個(gè)任務(wù)調(diào)度程序,在上下文切換后遇到了一些問題。 為下一個(gè)任務(wù)恢復(fù)上下文后: __builtin_tricore_mtcr_by_name(\"pcxi\"
    發(fā)表于 05-22 07:50

    BT堆棧上下文切換

    100ms就會(huì)產(chǎn)生一個(gè)上下文切換。上下文切換每秒似乎有點(diǎn)高。我想我真的不能抱怨10個(gè)開關(guān),但是有什么東西嗎?在BT協(xié)議中真的需要這個(gè)嗎?不能處理中斷驅(qū)動(dòng)嗎?(這是BT是可連接的,但既沒有連接,也沒有
    發(fā)表于 12-17 16:30

    多線程如何實(shí)現(xiàn)上下文切換

    處理系統(tǒng)中,CPU需要處理所有程序的操作,當(dāng)用戶來回切換它們時(shí),需要記錄這些程序執(zhí)行到哪里。上下文切換就是這樣一個(gè)過程,他允許CPU記錄并恢復(fù)各種正在運(yùn)行程序的狀態(tài),使它能夠完成
    發(fā)表于 08-02 08:21

    上下文切換簡(jiǎn)介

    處理系統(tǒng)中,CPU需要處理所有程序的操作,當(dāng)用戶來回切換它們時(shí),需要記錄這些程序執(zhí)行到哪里。上下文切換就是這樣一個(gè)過程,他允許CPU記錄并恢復(fù)各種正在運(yùn)行程序的狀態(tài),使它能夠完成
    發(fā)表于 08-06 08:08

    上下文切換的情況發(fā)生

    處理系統(tǒng)中,CPU需要處理所有程序的操作,當(dāng)用戶來回切換它們時(shí),需要記錄這些程序執(zhí)行到哪里。上下文切換就是這樣一個(gè)過程,他允許CPU記錄并恢復(fù)各種正在運(yùn)行程序的狀態(tài),使它能夠完成
    發(fā)表于 08-07 08:38

    討論ARM mbed OS(RTX) 的上下文切換

    來說,本文是一個(gè)回顧和總結(jié),如我在《淺談?wù){(diào)度相關(guān)的元問題》一文所述,mbed OS 是一個(gè)支持分態(tài)的內(nèi)核,其上下文切換實(shí)現(xiàn)的套路非常神似 linux,故而對(duì) mbed OS 上下文切換的探討有一定的推廣
    發(fā)表于 02-16 14:26

    rt-thread上下文切換函數(shù)的意義在哪?

    Cortex-M3內(nèi)核上下文切換函數(shù)rt_hw_context_switch()/ rt_hw_context_switch_interrupt()中有個(gè)判斷rt_thread_switch_interrupt_flag的地方,不知道意義在哪?
    發(fā)表于 03-10 11:28

    中斷中的上下文切換詳解

    ();  /* 發(fā)起一次在中斷中的上下文切換 */  cpu_irq_context_switch();  }  tos_knl_irq_enter接口(進(jìn)入ISR時(shí)調(diào)用)將一個(gè)標(biāo)識(shí)中斷嵌套次數(shù)的變量
    發(fā)表于 03-23 17:18

    CPU上下文切換的詳細(xì)資料講解

    當(dāng)UCOS-III轉(zhuǎn)向執(zhí)行另一項(xiàng)新任務(wù)的時(shí)候,他保存了當(dāng)前任務(wù)的CPU寄存器到堆棧,并從新任務(wù)的堆棧CPU寄存器載入CPU,這個(gè)過程叫做上下文切換
    發(fā)表于 08-16 17:31 ?2次下載
    <b class='flag-5'>CPU</b><b class='flag-5'>上下文切換</b>的詳細(xì)資料講解

    Linux CPU上下文切換

    在回答這個(gè)問題之前,請(qǐng)問,你有沒有想過這些“任務(wù)”是什么?你可能會(huì)說一個(gè)任務(wù)就是一個(gè)進(jìn)程或者一個(gè)線程。是的,進(jìn)程和線程正是最常見的任務(wù),但除此之外,還有其他類型的任務(wù)。
    的頭像 發(fā)表于 05-05 11:46 ?1879次閱讀

    如何分析Linux CPU上下文切換問題

    在我的上一篇文章:《探討 Linux CPU上下文切換》中,我談到了 CPU 上下文切換的工作原理。快速回顧一下,
    的頭像 發(fā)表于 05-05 20:11 ?1949次閱讀

    詳細(xì)解讀Linux CPU上下文切換過程

    我們都知道 Linux 是一個(gè)多任務(wù)操作系統(tǒng),它支持的任務(wù)同時(shí)運(yùn)行的數(shù)量遠(yuǎn)遠(yuǎn)大于 CPU 的數(shù)量。當(dāng)然,這些任務(wù)實(shí)際上并不是同時(shí)運(yùn)行的(Single CPU),而是因?yàn)橄到y(tǒng)在短時(shí)間內(nèi)將 CPU
    的頭像 發(fā)表于 02-09 15:30 ?1167次閱讀

    Linux技術(shù):什么是cpu上下文切換

    過多的上下文切換會(huì)消耗 CPU 的時(shí)間來保存和恢復(fù)寄存器、程序計(jì)數(shù)器、內(nèi)核棧和虛擬內(nèi)存等數(shù)據(jù),從而導(dǎo)致系統(tǒng)性能顯著下降。 既然上下文切換對(duì)系統(tǒng)性能的影響如此之大,那么我們?nèi)绾螜z查它呢?好了,你可以使用 vmstat 工具來查詢你
    發(fā)表于 09-01 09:31 ?477次閱讀
    <b class='flag-5'>Linux</b>技術(shù):什么是<b class='flag-5'>cpu</b><b class='flag-5'>上下文切換</b>

    FreeRTOS系列技術(shù)文章:上下文切換

    嵌入式實(shí)時(shí)操作系統(tǒng)(RTOS)中的上下文切換是指保存和恢復(fù)任務(wù)的狀態(tài),以使調(diào)度程序能夠切換到另一個(gè)任務(wù),從而促進(jìn)多任務(wù)處理。
    的頭像 發(fā)表于 11-21 15:48 ?1168次閱讀