每一個 CPU 核心都會有一個 idle 進(jìn)程,idle 進(jìn)程是當(dāng)系統(tǒng)沒有調(diào)度 CPU 資源的時候,會進(jìn)入 idle 進(jìn)程,而 idle 進(jìn)程的作用就是不使用 CPU,以此達(dá)到省電的目的。
在ARM64架構(gòu)中,當(dāng)CPU Idle時,會調(diào)用WFI指令(wait for interrupt),關(guān)掉CPU的Clock以便降低功耗,當(dāng)有外設(shè)中斷觸發(fā)時,CPU又會恢復(fù)回來。
cpuidle core 是 cpuidle framework 的核心模塊,負(fù)責(zé)抽象出 cpuidle device、cpuidle driver 和 cpuidle governor 三個實體,如下所示:
cpuidle core 抽象出了 cpuidle device、cpuidle driver 和 cpuidle governor 三個數(shù)據(jù)結(jié)構(gòu)。
數(shù)據(jù)結(jié)構(gòu)
cpuidle_device
針對每個CPU核都對應(yīng)一個struct cpuidle_device結(jié)構(gòu),主要字段介紹如下
structcpuidle_device{ //該cpu核是否注冊進(jìn)內(nèi)核中 unsignedintregistered:1; //該cpu核是否已經(jīng)使能 unsignedintenabled:1; unsignedintuse_deepest_state:1; //對應(yīng)的cpunumber unsignedintcpu; //該cpu核上一次停留在cpuidle狀態(tài)的時間(us) intlast_residency; //記錄每個cpuidle狀態(tài)的統(tǒng)計信息,包括是否使能、進(jìn)入該cpuidle狀態(tài)的次數(shù),停留在該cpuidle狀態(tài)的總時間(us) structcpuidle_state_usagestates_usage[CPUIDLE_STATE_MAX]; ...... };
對應(yīng)的注冊接口是 cpuidle_register_device。
cpuidle_driver
cpuidle driver用于驅(qū)動一個或多個CPU核,關(guān)鍵字段描述如下:
structcpuidle_driver{ constchar*name; structmodule*owner; intrefcnt; //用于驅(qū)動注冊時判斷是否需要設(shè)置broadcasttimer unsignedintbctimer:1; //用于描述cpuidle的狀態(tài),需要按照功耗從大到小來排序,具體有多少個cpuidle狀態(tài) structcpuidle_statestates[CPUIDLE_STATE_MAX]; ...... };
//CPU有多種不同的idle級別。這些idle級別有不同的功耗和延遲,從而可以在不同的場景下使用 //主要包括exit_latency、power_usage、target_residency。這些特性是governor制定idle策略的依據(jù) structcpuidle_state{ charname[CPUIDLE_NAME_LEN]; chardesc[CPUIDLE_DESC_LEN]; unsignedintflags; //CPU從該idle state下返回運行狀態(tài)的延遲,單位為us。它決定了CPU在idle狀態(tài)和run狀態(tài)之間切換的效率,如果延遲過大,將會影響系統(tǒng)性能; unsignedintexit_latency;/*inUS*/ //CPU在該idlestate下的功耗,單位為mW intpower_usage;/*inmW*/ //期望的停留時間,單位為us。進(jìn)入和退出idle state是需要消耗額外的能量的,如果在idle狀態(tài)停留的時間過短,節(jié)省的功耗少于額外的消耗,則得不償失。governor會根據(jù)該字段,結(jié)合當(dāng)前的系統(tǒng)情況(如可以idle多久),選擇idle level; unsignedinttarget_residency;/*inUS*/ booldisabled;/*disabledonallCPUs*/ //進(jìn)入該state的回調(diào)函數(shù) int(*enter)(structcpuidle_device*dev, structcpuidle_driver*drv, intindex); //CPU長時間不需要工作時(稱作offline),可調(diào)用該回調(diào)函數(shù)。 int(*enter_dead)(structcpuidle_device*dev,intindex); ...... };
對應(yīng)的注冊接口是 cpuidle_register_driver。
cpuidle_governor
governor 結(jié)構(gòu)主要提供不同的回調(diào)函數(shù),最終由 menu_governor 填充,主要字段如下:
structcpuidle_governor{ charname[CPUIDLE_NAME_LEN]; structlist_headgovernor_list; //governor的級別,正常情況下,kernel會選擇系統(tǒng)中rating值最大的governor作為當(dāng)前governor unsignedintrating; //在設(shè)備驅(qū)動注冊和注銷的時候調(diào)用 int(*enable)(structcpuidle_driver*drv, structcpuidle_device*dev); void(*disable)(structcpuidle_driver*drv, structcpuidle_device*dev); //根據(jù)當(dāng)前系統(tǒng)的運行狀況,以及各個idlestate的特性,選擇一個state(即決策) int(*select)(structcpuidle_driver*drv, structcpuidle_device*dev, bool*stop_tick); //通過該回調(diào)函數(shù),可以告知governor,系統(tǒng)上一次所處的idlestate是哪個 void(*reflect)(structcpuidle_device*dev,intindex); };
對應(yīng)的注冊接口是 cpuidle_register_governor。
流程
我們先看下設(shè)備和驅(qū)動的注冊過程:
注冊之后便將設(shè)備和驅(qū)動建立起連接關(guān)系了,最終 cpuidle framework 的用戶便可通過接口來調(diào)用下層的接口,進(jìn)而完成具體的硬件操作。
下面看下 CPU 進(jìn)入 idle 狀態(tài)的流程圖:
可以看出,最終是通過 PSCI 來實現(xiàn) CPU 的 suspend。
PSCI
PSCI, Power State Coordination Interface,由ARM定義的電源管理接口規(guī)范,通常由Firmware來實現(xiàn),而Linux系統(tǒng)可以通過smc/hvc指令來進(jìn)入不同的Exception Level,進(jìn)而調(diào)用對應(yīng)的實現(xiàn)。
PSCI 支持如下功能:
CPU hotplug (on/off)
CPU idle (suspend/resume)
System suspend/resume
System shutdown and reset
每個功能和ATF之間的調(diào)用接口如下所示:
審核編輯:劉清
-
ARM
+關(guān)注
關(guān)注
134文章
9097瀏覽量
367611 -
電源管理
+關(guān)注
關(guān)注
115文章
6183瀏覽量
144513 -
cpu
+關(guān)注
關(guān)注
68文章
10863瀏覽量
211799
原文標(biāo)題:CPU 進(jìn)入 IDLE 都做了啥?
文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論