0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

容器進程調(diào)度時是該優(yōu)先考慮CPU資源還是內(nèi)存資源

冬至配餃子 ? 來源:開發(fā)內(nèi)功修煉 ? 作者:張彥飛allen ? 2022-08-16 18:20 ? 次閱讀

問題是這樣的:有 A B 兩臺服務器,其中 A 服務器 cpu 快滿了,內(nèi)存很空閑。另外一臺 B 服務器 cpu 很空閑,但內(nèi)存快滿了。現(xiàn)在 k8s 有一個新的任務要調(diào)度,請問應該選擇哪臺服務器?這其實是現(xiàn)在非?;鸬?k8s 的經(jīng)典應用場景。

有的同學看到這個問題后的第一個想法是應該先評估一下新任務是計算密集型的業(yè)務還是 io 密集型的。然后再決定往哪個機器上調(diào)度。這么思考倒是也不能算錯,只不過是沒有抓到問題的關鍵點上。

這個問題的關鍵點是在于要思考一下調(diào)度到某個機器上可能會出現(xiàn)什么問題。

1. 調(diào)度到 CPU 比較滿的 A 服務器

假設我們調(diào)度到 CPU 比較滿的 A 機器上會出現(xiàn)什么狀況呢?因為 CPU 資源是分時來調(diào)度的,每個進程都會得到一些時間片進行執(zhí)行。所以 A 機器上不管 CPU 有多忙,再加一個的進程來運行話其實影響無非就是所有的進程都運行的更慢了一些。再換個說法,就是 CPU 資源是可以超賣的,是屬于可壓縮資源。

這里提一下,部分讀者反饋說自己的云虛機在 CPU 飆升到 100% 的時候,云廠商為了保護主機,直接宕機。這種情況在各大公司的 IDC 機房內(nèi)不太可能出現(xiàn),所以這種情況咱們暫時不考慮。

2. 調(diào)度到內(nèi)存比較滿的 B 服務器

再假設我們調(diào)度到內(nèi)存比較滿的 B 機器上會出現(xiàn)什么狀況呢?不知道你有沒有遭遇過線上進程被 oom kill 掉的場景。這種情況下就是當機器物理內(nèi)存不是很充足的時候,如果申請的內(nèi)存過大,操作系統(tǒng)就可能會挑選在運行的一些進程將其殺掉。

這里稍微展開說一下,操作系統(tǒng)選擇要殺掉的進程也不一定是內(nèi)存消耗最多的服務。而是會綜合內(nèi)存消耗和進程的 oom_score_adj(可配置) 值來進行選擇。在一些在離線混部的服務器上,往往會將在線服務進程的被殺的優(yōu)先級調(diào)的低一些,離線服務進程的被殺優(yōu)先級調(diào)高。這樣充分保障在線服務的穩(wěn)定運行。

先不考慮在離線混部的情況,假設都是在線服務,那么無論哪一個服務的進程被 Linux 給 oom kill掉影響都是非常大的。還得重新調(diào)度,而且還有可能影響服務的穩(wěn)定性,以及接口的正確返回。

這里有的同學可能會說,Linux 上不是支持將內(nèi)存 swap 到磁盤上嗎?但其實在線上服務器中,由于磁盤的性能比內(nèi)存低太多了,所以大部分的線上服務器都不會開啟 swap 這個特性。因為服務的內(nèi)存一旦被 swap 到內(nèi)存,即使是能運行,性能也會有急劇的下降。所以一般不怎么會開啟。

結論

所以對比來看,新任務在調(diào)度的時候應該優(yōu)先選擇 A 服務器,因為它的空閑內(nèi)存比較多,不太可能出現(xiàn)進程被殺死的情況。雖然它的 CPU 比較滿,但所有的服務仍然可以運行。

在實際中,k8s 的 API Server接受客戶端提交Pod對象創(chuàng)建請求后的操作過程中,有一個重要的步驟就是由調(diào)度器程序kube-scheduler從當前集群中選擇一個可用的最佳節(jié)點來接收并運行它。

當然實際中 k8s 的調(diào)度策略不是這么簡單的,系統(tǒng)默認的 kube-scheduler 調(diào)度器外還有直接指定Node主機名、節(jié)點親和性、Pod親和性、nodeSelector 等等調(diào)度策略。

就單拿系統(tǒng)默認的 kube-scheduler 調(diào)度器來說的話,還會綜合考慮單獨和整體的資源請求、硬件/軟件/策略限制、親和以及反親和要求、數(shù)據(jù)局域性、負載間的干擾等等這些因素對可調(diào)度節(jié)點打分,然后選出其中得分最高的 Node 來運行 Pod。


審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10876

    瀏覽量

    212122
  • 服務器
    +關注

    關注

    12

    文章

    9222

    瀏覽量

    85605
  • 操作系統(tǒng)

    關注

    37

    文章

    6846

    瀏覽量

    123419
  • Linux系統(tǒng)

    關注

    4

    文章

    594

    瀏覽量

    27438
  • SWAP
    +關注

    關注

    0

    文章

    51

    瀏覽量

    12839
收藏 人收藏

    評論

    相關推薦

    深入解析Linux程序與進程

    關于某個數(shù)據(jù)集合的一次運行活動。作為系統(tǒng)進行資源分配和調(diào)度的基本單位,是操作系統(tǒng)結構的基礎。 程序與進程的關系 進程的狀態(tài) 基礎進程狀態(tài) 創(chuàng)
    的頭像 發(fā)表于 12-18 11:01 ?103次閱讀
    深入解析Linux程序與<b class='flag-5'>進程</b>

    Linux之CPU調(diào)度策略和CPU親和性

    決定在某一時間點上哪個進程在運行。調(diào)度器必須平衡幾個選項: 快速決定下一個運行的進程 進程可以公平的活動
    的頭像 發(fā)表于 12-05 16:38 ?493次閱讀
    Linux之<b class='flag-5'>CPU</b><b class='flag-5'>調(diào)度</b>策略和<b class='flag-5'>CPU</b>親和性

    虛擬內(nèi)存溢出怎么處理 虛擬內(nèi)存在服務器中的應用

    在現(xiàn)代計算機系統(tǒng)中,虛擬內(nèi)存是一種重要的資源管理技術,它允許系統(tǒng)使用硬盤空間來擴展物理內(nèi)存的容量。然而,當系統(tǒng)運行的程序和進程超出了物理內(nèi)存
    的頭像 發(fā)表于 12-04 09:49 ?185次閱讀

    一文搞懂Linux進程的睡眠和喚醒

    的代碼和數(shù)據(jù),進而去執(zhí)行這個進程。下面列舉了一些進程狀態(tài): 注意:沒有+時,默認是后臺進程 進程調(diào)度
    發(fā)表于 11-04 15:15

    如何限制容器可以使用的CPU資源

    默認情況下容器可以使用的主機 CPU 資源是不受限制的。和內(nèi)存資源的使用一樣,如果不對容器可以使
    的頭像 發(fā)表于 10-24 17:04 ?257次閱讀
    如何限制<b class='flag-5'>容器</b>可以使用的<b class='flag-5'>CPU</b><b class='flag-5'>資源</b>

    android系統(tǒng)使用appe播放audio資源,相關進程被kill之后appe無法再次打開的原因?

    android系統(tǒng)使用appe播放audio資源,相關進程被kill之后appe無法再次打開,原因是appe資源被占用。 在Ti提供的demo中,通過 signal(SIGKILL
    發(fā)表于 10-23 07:56

    云服務器的購買資源和擴容資源的區(qū)別和聯(lián)系

    服務商處直接購買一定量的計算資源,如CPU、內(nèi)存或存儲空間等。而擴容資源則是指在現(xiàn)有的云服務器基礎上增加額外的資源。
    的頭像 發(fā)表于 10-18 11:21 ?230次閱讀

    深入探討Linux的進程調(diào)度

    Linux操作系統(tǒng)作為一個開源且廣泛應用的操作系統(tǒng),其內(nèi)核設計包含了許多核心功能,而進程調(diào)度器(Scheduler)就是其中一個至關重要的模塊。進程調(diào)度器負責決定在任何給定的時刻哪個
    的頭像 發(fā)表于 08-13 13:36 ?959次閱讀
    深入探討Linux的<b class='flag-5'>進程</b><b class='flag-5'>調(diào)度</b>器

    鴻蒙開發(fā)接口資源調(diào)度:【@ohos.workScheduler (延遲任務調(diào)度)】

    開發(fā)者在開發(fā)應用時,通過調(diào)用延遲任務注冊接口,注冊對實時性要求不高的延遲任務,任務默認由系統(tǒng)安排,在系統(tǒng)空閑時根據(jù)性能、功耗、熱等情況進行調(diào)度執(zhí)行。
    的頭像 發(fā)表于 06-04 10:01 ?933次閱讀
    鴻蒙開發(fā)接口<b class='flag-5'>資源</b><b class='flag-5'>調(diào)度</b>:【@ohos.workScheduler (延遲任務<b class='flag-5'>調(diào)度</b>)】

    選擇美國vps云主機時應該考慮哪些因素

     美國VPS云主機是指位于美國的虛擬私人服務器,它提供獨立的操作系統(tǒng)、內(nèi)存CPU資源,用戶可以根據(jù)自身需求進行配置。那么選擇美國vps云主機時應該考慮哪些因素,rak小編為您整理發(fā)布
    的頭像 發(fā)表于 03-26 09:21 ?355次閱讀

    HarmonyOS跨進程通信—IPC與RPC通信開發(fā)

    使用Binder驅動,用于設備內(nèi)的跨進程通信,后者使用軟總線驅動,用于跨設備跨進程通信。需要跨進程通信的原因是因為每個進程都有自己獨立的資源
    的頭像 發(fā)表于 02-02 17:47 ?1303次閱讀
    HarmonyOS跨<b class='flag-5'>進程</b>通信—IPC與RPC通信開發(fā)

    線程是什么的基本單位 進程與線程的本質(zhì)區(qū)別

    線程是操作系統(tǒng)中處理器調(diào)度的基本單位,它代表著獨立的執(zhí)行流。在一個進程中,可以包含多個線程,這些線程共享相同的進程資源,如內(nèi)存空間、文件描述
    的頭像 發(fā)表于 02-02 16:30 ?957次閱讀

    linux內(nèi)核主要由哪幾個部分組成,作用是什么

    Linux內(nèi)核主要由以下幾個部分組成: 進程管理:Linux內(nèi)核負責管理和調(diào)度系統(tǒng)中的進程。它通過進程調(diào)度算法來決定哪個
    的頭像 發(fā)表于 01-22 14:34 ?2714次閱讀

    鴻蒙原生應用/元服務開發(fā)-延遲任務說明(一)

    WORK_SCHEDULER資源,擴展單次回調(diào)運行時長,擴展后在充電狀態(tài)下為20分鐘,非充電狀態(tài)下為10分鐘。 調(diào)度延遲:系統(tǒng)會根據(jù)內(nèi)存、功耗、設備溫度、用戶使用習慣等統(tǒng)一調(diào)度,如當系
    發(fā)表于 01-16 14:57

    線程、進程、多線程、多進程和多任務之間有何關系?

    進程是程序執(zhí)行時的一個實例,即它是程序已經(jīng)執(zhí)行到課中程度的數(shù)據(jù)結構的匯集。從內(nèi)核的觀點看,進程的目的就是擔當分配系統(tǒng)資源CPU時間、內(nèi)存
    的頭像 發(fā)表于 01-11 13:39 ?370次閱讀
    線程、<b class='flag-5'>進程</b>、多線程、多<b class='flag-5'>進程</b>和多任務之間有何關系?