在探討這個(gè)問(wèn)題之前,我們先來(lái)弄清什么是進(jìn)程。
進(jìn)程(Process)是計(jì)算機(jī)中的程序關(guān)于某數(shù)據(jù)集合上的一次運(yùn)行活動(dòng),是系統(tǒng)進(jìn)行資源分配和調(diào)度的基本單位,是操作系統(tǒng)結(jié)構(gòu)的基礎(chǔ)。程序是指令、數(shù)據(jù)及其組織形式的描述,進(jìn)程是程序的實(shí)體。進(jìn)程是一個(gè)具有獨(dú)立功能的程序關(guān)于某個(gè)數(shù)據(jù)集合的一次運(yùn)行活動(dòng)。它可以申請(qǐng)和擁有系統(tǒng)資源,是一個(gè)動(dòng)態(tài)的概念,是一個(gè)活動(dòng)的實(shí)體。它不只是程序的代碼,還包括當(dāng)前的活動(dòng),通過(guò)程序計(jì)數(shù)器的值和處理寄存器的內(nèi)容來(lái)表示。通俗點(diǎn)講,進(jìn)程是一段程序的執(zhí)行過(guò)程,是個(gè)動(dòng)態(tài)概念。
一:進(jìn)程狀態(tài)
程序運(yùn)行必須加載在內(nèi)存中,當(dāng)有過(guò)多的就緒態(tài)或阻塞態(tài)進(jìn)程在內(nèi)存中沒有運(yùn)行,因?yàn)閮?nèi)存很小,有可能不足。系統(tǒng)需要把他們移動(dòng)到內(nèi)存外磁盤中,稱為掛起狀態(tài)。就緒狀態(tài)的進(jìn)程掛起就是掛起就緒狀態(tài),阻塞進(jìn)程掛起就稱為阻塞掛起狀態(tài)。
每個(gè)進(jìn)程的產(chǎn)生都有自己的唯一的ID號(hào)(pid),并且附帶有一個(gè)它父進(jìn)程的ID號(hào)(ppid)。進(jìn)程死亡時(shí),ID被回收。
進(jìn)程間靠?jī)?yōu)先級(jí)獲得CPU資源,時(shí)間片段輪換來(lái)更新優(yōu)先級(jí),以保證不會(huì)一個(gè)進(jìn)程占據(jù)CPU時(shí)間過(guò)長(zhǎng)。每個(gè)進(jìn)程都得到輪換運(yùn)行,因?yàn)檫@個(gè)時(shí)間非常短,所以給我們就好像是系統(tǒng)在同時(shí)運(yùn)行好多進(jìn)程。
二:僵尸進(jìn)程
那么什么稱為僵尸進(jìn)程呢?
即子進(jìn)程先于父進(jìn)程退出后,子進(jìn)程的PCB需要其父進(jìn)程釋放,但是父進(jìn)程并沒有釋放子進(jìn)程的PCB,這樣的子進(jìn)程就稱為僵尸進(jìn)程,僵尸進(jìn)程實(shí)際上是一個(gè)已經(jīng)死掉的進(jìn)程。我們用代碼來(lái)看一下
#include
#include
#include
#include
#include
int main()
{
pid_t pid=fork();
if(pid==0) //子進(jìn)程
{
printf("child id is %dn",getpid());
printf("parent id is %dn",getppid());
}
else //父進(jìn)程不退出,使子進(jìn)程成為僵尸進(jìn)程
{
while(1)
{}
}
exit(0);
}
我們將它掛在后臺(tái)執(zhí)行,可以看到結(jié)果,用ps可以看到子進(jìn)程后有一個(gè) ,defunct是已死的,僵尸的意思,可以看出這時(shí)的子進(jìn)程已經(jīng)是一個(gè)僵尸進(jìn)程了。因?yàn)樽舆M(jìn)程已經(jīng)結(jié)束,而其父進(jìn)程并未釋放其PCB,所以產(chǎn)生了這個(gè)僵尸進(jìn)程。
我們也可以用ps -aux | grep pid 查看進(jìn)程狀態(tài)
一個(gè)進(jìn)程在調(diào)用exit命令結(jié)束自己的生命的時(shí)候,其實(shí)它并沒有真正的被銷毀,而是留下一個(gè)稱為僵尸進(jìn)程(Zombie)的數(shù)據(jù)結(jié)構(gòu)(系統(tǒng)調(diào)用exit,它的作用是使進(jìn)程退出,但也僅僅限于將一個(gè)正常的進(jìn)程變成一個(gè)僵尸進(jìn)程,并不能將其完全銷毀)。在Linux進(jìn)程的狀態(tài)中,僵尸進(jìn)程是非常特殊的一種,它已經(jīng)放棄了幾乎所有內(nèi)存空間,沒有任何可執(zhí)行代碼,也不能被調(diào)度,僅僅在進(jìn)程列表中保留一個(gè)位置,記載該進(jìn)程的退出狀態(tài)等信息供其他進(jìn)程收集,除此之外,僵尸進(jìn)程不再占有任何內(nèi)存空間。這個(gè)僵尸進(jìn)程需要它的父進(jìn)程來(lái)為它收尸,如果他的父進(jìn)程沒有處理這個(gè)僵尸進(jìn)程的措施,那么它就一直保持僵尸狀態(tài),如果這時(shí)父進(jìn)程結(jié)束了,那么init進(jìn)程自動(dòng)會(huì)接手這個(gè)子進(jìn)程,為它收尸,它還是能被清除的。但是如果如果父進(jìn)程是一個(gè)循環(huán),不會(huì)結(jié)束,那么子進(jìn)程就會(huì)一直保持僵尸狀態(tài),這就是為什么系統(tǒng)中有時(shí)會(huì)有很多的僵尸進(jìn)程。
試想一下,如果有大量的僵尸進(jìn)程駐在系統(tǒng)之中,必然消耗大量的系統(tǒng)資源。但是系統(tǒng)資源是有限的,因此當(dāng)僵尸進(jìn)程達(dá)到一定數(shù)目時(shí),系統(tǒng)因缺乏資源而導(dǎo)致奔潰。所以在實(shí)際編程中,避免和防范僵尸進(jìn)程的產(chǎn)生顯得尤為重要。
三:孤兒進(jìn)程
一個(gè)父進(jìn)程退出,而它的一個(gè)或多個(gè)子進(jìn)程還在運(yùn)行,那么那些子進(jìn)程將成為孤兒進(jìn)程。孤兒進(jìn)程將被init進(jìn)程(進(jìn)程號(hào)為1)所收養(yǎng),并由init進(jìn)程對(duì)它們完成狀態(tài)收集工作。
子進(jìn)程死亡需要父進(jìn)程來(lái)處理,那么意味著正常的進(jìn)程應(yīng)該是子進(jìn)程先于父進(jìn)程死亡。當(dāng)父進(jìn)程先于子進(jìn)程死亡時(shí),子進(jìn)程死亡時(shí)沒父進(jìn)程處理,這個(gè)死亡的子進(jìn)程就是孤兒進(jìn)程。
但孤兒進(jìn)程與僵尸進(jìn)程不同的是,由于父進(jìn)程已經(jīng)死亡,系統(tǒng)會(huì)幫助父進(jìn)程回收處理孤兒進(jìn)程。所以孤兒進(jìn)程實(shí)際上是不占用資源的,因?yàn)樗K究是被系統(tǒng)回收了。不會(huì)像僵尸進(jìn)程那樣占用ID,損害運(yùn)行系統(tǒng)。
下來(lái)我們上代碼看看:
#include
#include
#include
#include
#include
int main()
{
pid_t pid=fork();
if(pid==0)
{
printf("child ppid is %dn",getppid());
sleep(10); //為了讓父進(jìn)程先結(jié)束
printf("child ppid is %dn",getppid());
}
else
{
printf("parent id is %dn",getpid());
}
exit(0);
}
從執(zhí)行結(jié)果來(lái)看,此時(shí)由pid == 4168父進(jìn)程創(chuàng)建的子進(jìn)程,其輸出的父進(jìn)程pid == 1,說(shuō)明當(dāng)其為孤兒進(jìn)程時(shí)被init進(jìn)程回收,最終并不會(huì)占用資源,這就是為什么要將孤兒進(jìn)程分配給init進(jìn)程。
四:僵尸進(jìn)程處理方式
任何一個(gè)子進(jìn)程(init除外)在exit()之后,并非馬上就消失掉,而是留下一個(gè)稱為僵尸進(jìn)程(Zombie)的數(shù)據(jù)結(jié)構(gòu),等待父進(jìn)程處理。這是每個(gè)子進(jìn)程在結(jié)束時(shí)都要經(jīng)過(guò)的階段。如果子進(jìn)程在exit()之后,父進(jìn)程沒有來(lái)得及處理,這時(shí)用ps命令就能看到子進(jìn)程的狀態(tài)是“defunct”。如果父進(jìn)程能及時(shí)處理,可能用ps命令就來(lái)不及看到子進(jìn)程的僵尸狀態(tài),但這并不等于子進(jìn)程不經(jīng)過(guò)僵尸狀態(tài)。如果父進(jìn)程在子進(jìn)程結(jié)束之前退出,則子進(jìn)程將由init接管。init將會(huì)以父進(jìn)程的身份對(duì)僵尸狀態(tài)的子進(jìn)程進(jìn)行處理。所以孤兒進(jìn)程不會(huì)占資源,僵尸進(jìn)程會(huì)占用資源危害系統(tǒng)。我們應(yīng)當(dāng)避免僵尸進(jìn)程的出現(xiàn)。
解決方式如下:
1):一種比較暴力的做法是將其父進(jìn)程殺死,那么它的子進(jìn)程,即僵尸進(jìn)程會(huì)變成孤兒進(jìn)程,由系統(tǒng)來(lái)回收。但是這種做法在大多數(shù)情況下都是不可取的,如父進(jìn)程是一個(gè)服務(wù)器程序,如果為了回收其子進(jìn)程的資源,而殺死服務(wù)器程序,那么將導(dǎo)致整個(gè)服務(wù)器崩潰,得不償失。顯然這種回收進(jìn)程的方式是不可取的,但其也有一定的存在意義。
2):SIGCHLD信號(hào)處理
我們都知道wait函數(shù)是用來(lái)處理僵尸進(jìn)程的,但是進(jìn)程一旦調(diào)用了wait,就立即阻塞自己,由wait自動(dòng)分析是否當(dāng)前進(jìn)程的某個(gè)子進(jìn)程已經(jīng)退出,如果讓它找到了這樣一個(gè)已經(jīng)變成僵尸的子進(jìn)程,wait就會(huì)收集這個(gè)子進(jìn)程的信息,并把它徹底銷毀后返回;如果沒有找到這樣一個(gè)子進(jìn)程,wait就會(huì)一直阻塞在這里,直到有一個(gè)出現(xiàn)為止。我們先來(lái)看看wait函數(shù)的定義
#include /* 提供類型pid_t的定義,實(shí)際就是int型 */
#include
pid_t wait(int *status)
參數(shù)status用來(lái)保存被收集進(jìn)程退出時(shí)的一些狀態(tài),它是一個(gè)指向int類型的指針。但如果我們對(duì)這個(gè)子進(jìn)程是如何死掉的毫不在意,只想把這個(gè)僵尸進(jìn)程消滅掉,(事實(shí)上絕大多數(shù)情況下,我們都會(huì)這樣想),我們就可以設(shè)定這個(gè)參數(shù)為NULL,就象下面這樣:pid=wait(NULL);如果成功,wait會(huì)返回被收集的子進(jìn)程的進(jìn)程ID,如果調(diào)用進(jìn)程沒有子進(jìn)程,調(diào)用就會(huì)失敗,此時(shí)wait返回-1,同時(shí)errno被置為ECHILD。
由于調(diào)用wait之后,就必須阻塞,直到有子進(jìn)程結(jié)束,所以,這樣來(lái)說(shuō)是非常不高效的,我們的父進(jìn)程難道要一直等待你子進(jìn)程完成,最后才能執(zhí)行自己的代碼嗎?難道就不能我父進(jìn)程執(zhí)行自己的代碼,你子進(jìn)程什么時(shí)候完成我就什么時(shí)候去處理你,不用一直等你?當(dāng)然是有這種方式了。
實(shí)際上當(dāng)子進(jìn)程終止時(shí),內(nèi)核就會(huì)向它的父進(jìn)程發(fā)送一個(gè)SIGCHLD信號(hào),父進(jìn)程可以選擇忽略該信號(hào),也可以提供一個(gè)接收到信號(hào)以后的處理函數(shù)。對(duì)于這種信號(hào)的系統(tǒng)默認(rèn)動(dòng)作是忽略它。我們不希望有過(guò)多的僵尸進(jìn)程產(chǎn)生,所以當(dāng)父進(jìn)程接收到SIGCHLD信號(hào)后就應(yīng)該調(diào)用 wait 或 waitpid 函數(shù)對(duì)子進(jìn)程進(jìn)行善后處理,釋放子進(jìn)程占用的資源。
下面是一個(gè)處理僵尸進(jìn)程的簡(jiǎn)單的例子:
#include
#include
#include
#include
#include
#include
#include
void deal_child(int num)
{
printf("deal_child inton");
wait(NULL);
}
int main()
{
signal(SIGCHLD,deal_child);
pid_t pid=fork();
int i;
if(pid==0)
{
printf("child is runningn");
sleep(2);
printf("child will endn");
}
else
{
sleep(1); //讓子進(jìn)程先執(zhí)行
printf("parent is runningn");
sleep(10); //一旦被打斷就不能再進(jìn)入睡眠
printf("sleep 10 s overn");
sleep(5);
printf("sleep 5s overn");
}
exit(0);
}
進(jìn)行測(cè)試后確定了是在父進(jìn)程睡眠10s時(shí)子進(jìn)程結(jié)束,父進(jìn)程接收到了SIGCHLD信號(hào),調(diào)用了deal_child函數(shù),釋放了子進(jìn)程的PCB后又回到自己本身的代碼中執(zhí)行。我們看看運(yùn)行結(jié)果
說(shuō)到這里,我們?cè)賮?lái)看看signal函數(shù)(不是阻塞函數(shù))
signal(參數(shù)1,參數(shù)2);
參數(shù)1:我們要進(jìn)行處理的信號(hào)。系統(tǒng)的信號(hào)我們可以再終端鍵入 kill -l查看(共64個(gè))。其實(shí)這些信號(hào)是系統(tǒng)定義的宏。
參數(shù)2:我們處理的方式(是系統(tǒng)默認(rèn)還是忽略還是捕獲)。
eg: signal(SIGINT ,SIG_ING ); //SIG_ING 代表忽略SIGINT信號(hào)
eg:signal(SIGINT,SIG_DFL); //SIGINT信號(hào)代表由InterruptKey產(chǎn)生,通常是CTRL +C或者是DELETE。發(fā)送給所有ForeGroundGroup的進(jìn)程。SIG_DFL代表執(zhí)行系統(tǒng)默認(rèn)操作,其實(shí)對(duì)于大多數(shù)信號(hào)的系統(tǒng)默認(rèn)動(dòng)作是終止該進(jìn)程。這與不寫此處理函數(shù)是一樣的。
我們也可以給參數(shù)2傳遞一個(gè)信號(hào)處理函數(shù)的地址,但是這個(gè)信號(hào)處理函數(shù)需要其返回值為void,并且默認(rèn)自帶一個(gè)int類型參數(shù)
這個(gè)int就是你所傳遞的第一個(gè)信號(hào)參數(shù)的值(你用kill -l可以查看)
我們測(cè)試了一下,如果創(chuàng)建了5個(gè)子進(jìn)程,但是銷毀的時(shí)候仍然有兩個(gè)仍是僵尸進(jìn)程,這又是為什么呢?
這是因?yàn)楫?dāng)5個(gè)進(jìn)程同時(shí)終止的時(shí)候,內(nèi)核都會(huì)向父進(jìn)程發(fā)送SIGCHLD信號(hào),而父進(jìn)程此時(shí)有可能仍然處于信號(hào)處理的deal_child函數(shù)中,那么在處理完之前,中間接收到的SIGCHLD信號(hào)就會(huì)丟失,內(nèi)核并沒有使用隊(duì)列等方式來(lái)存儲(chǔ)同一種信號(hào)
所以為了解決這一問(wèn)題,我們需要調(diào)用waitpid函數(shù)來(lái)清理子進(jìn)程。
{
for (;;) {
if (waitpid(-1, NULL, WNOHANG) == 0)
break;
}
}
這樣的話,只有檢驗(yàn)沒有僵尸進(jìn)程,他才會(huì)返回0,這樣就可以確保所有的僵尸進(jìn)程都被殺死了。
-
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7500瀏覽量
88032 -
程序
+關(guān)注
關(guān)注
117文章
3787瀏覽量
81074 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1208瀏覽量
24713 -
進(jìn)程
+關(guān)注
關(guān)注
0文章
203瀏覽量
13962
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論