計(jì)算機(jī)實(shí)際上可以做的事情實(shí)質(zhì)上非常簡(jiǎn)單,比如計(jì)算兩個(gè)數(shù)的和,再比如在內(nèi)存中尋找到某個(gè)地址等等。這些最基礎(chǔ)的計(jì)算機(jī)動(dòng)作被稱為指令 (instruction)。所謂的程序(program),就是這樣一系列指令的所構(gòu)成的集合。通過(guò)程序,我們可以讓計(jì)算機(jī)完成復(fù)雜的操作。程序大多數(shù)時(shí)候被存儲(chǔ)為可執(zhí)行的文件。這樣一個(gè)可執(zhí)行文件就像是一個(gè)菜譜,計(jì)算機(jī)可以按照菜譜作出可口的飯菜。
?
那么,程序和進(jìn)程(process)的區(qū)別又是什么呢?
進(jìn)程是程序的一個(gè)具體實(shí)現(xiàn)。只有食譜沒(méi)什么用,我們總要按照食譜的指點(diǎn)真正一步步實(shí)行,才能做出菜肴。進(jìn)程是執(zhí)行程序的過(guò)程,類似于按照食譜,真正去做菜的過(guò)程。同一個(gè)程序可以執(zhí)行多次,每次都可以在內(nèi)存中開(kāi)辟獨(dú)立的空間來(lái)裝載,從而產(chǎn)生多個(gè)進(jìn)程。不同的進(jìn)程還可以擁有各自獨(dú)立的IO接口。
操作系統(tǒng)的一個(gè)重要功能就是為進(jìn)程提供方便,比如說(shuō)為進(jìn)程分配內(nèi)存空間,管理進(jìn)程的相關(guān)信息等等,就好像是為我們準(zhǔn)備好了一個(gè)精美的廚房。
?
看一眼進(jìn)程
首先,我們可以使用$ps命令來(lái)查詢正在運(yùn)行的進(jìn)程,比如$ps -eo pid,comm,cmd,下圖為執(zhí)行結(jié)果:
(-e表示列出全部進(jìn)程,-o pid,comm,cmd表示我們需要PID,COMMAND,CMD信息)
?
每一行代表了一個(gè)進(jìn)程。每一行又分為三列。第一列PID(process IDentity)是一個(gè)整數(shù),每一個(gè)進(jìn)程都有一個(gè)唯一的PID來(lái)代表自己的身份,進(jìn)程也可以根據(jù)PID來(lái)識(shí)別其他的進(jìn)程。第二列COMMAND是這個(gè)進(jìn)程的簡(jiǎn)稱。第三列CMD是進(jìn)程所對(duì)應(yīng)的程序以及運(yùn)行時(shí)所帶的參數(shù)。
(第三列有一些由中括號(hào)[]括起來(lái)的。它們是內(nèi)核的一部分功能,被打扮成進(jìn)程的樣子以方便操作系統(tǒng)管理。我們不必考慮它們。)
?
我們看第一行,PID為1,名字為init。這個(gè)進(jìn)程是執(zhí)行/bin/init這一文件(程序)生成的。當(dāng)Linux啟動(dòng)的時(shí)候,init是系統(tǒng)創(chuàng)建的第一個(gè)進(jìn)程,這一進(jìn)程會(huì)一直存在,直到我們關(guān)閉計(jì)算機(jī)。這一進(jìn)程有特殊的重要性,我們會(huì)不斷提到它。
?
如何創(chuàng)建一個(gè)進(jìn)程
實(shí)際上,當(dāng)計(jì)算機(jī)開(kāi)機(jī)的時(shí)候,內(nèi)核(kernel)只建立了一個(gè)init進(jìn)程。Linux內(nèi)核并不提供直接建立新進(jìn)程的系統(tǒng)調(diào)用。剩下的所有進(jìn)程都是init進(jìn)程通過(guò)fork機(jī)制建立的。新的進(jìn)程要通過(guò)老的進(jìn)程復(fù)制自身得到,這就是fork。fork是一個(gè)系統(tǒng)調(diào)用。進(jìn)程存活于內(nèi)存中。每個(gè)進(jìn)程都在內(nèi)存中分配有屬于自己的一片空間 (address space)。當(dāng)進(jìn)程fork的時(shí)候,Linux在內(nèi)存中開(kāi)辟出一片新的內(nèi)存空間給新的進(jìn)程,并將老的進(jìn)程空間中的內(nèi)容復(fù)制到新的空間中,此后兩個(gè)進(jìn)程同時(shí)運(yùn)行。
老進(jìn)程成為新進(jìn)程的父進(jìn)程(parent process),而相應(yīng)的,新進(jìn)程就是老的進(jìn)程的子進(jìn)程(child process)。一個(gè)進(jìn)程除了有一個(gè)PID之外,還會(huì)有一個(gè)PPID(parent PID)來(lái)存儲(chǔ)的父進(jìn)程PID。如果我們循著PPID不斷向上追溯的話,總會(huì)發(fā)現(xiàn)其源頭是init進(jìn)程。所以說(shuō),所有的進(jìn)程也構(gòu)成一個(gè)以init為根的樹(shù)狀結(jié)構(gòu)。
如下,我們查詢當(dāng)前shell下的進(jìn)程:
?
root@vamei:~# ps -o pid,ppid,cmd PID PPID CMD16935 3101 sudo -i16939 16935 -bash23774 16939 ps -o pid,ppid,cmd
我們可以看到,第二個(gè)進(jìn)程bash是第一個(gè)進(jìn)程sudo的子進(jìn)程,而第三個(gè)進(jìn)程ps是第二個(gè)進(jìn)程的子進(jìn)程。
?
還可以用$pstree命令來(lái)顯示整個(gè)進(jìn)程樹(shù):
init─┬─NetworkManager─┬─dhclient │ └─2*[{NetworkManager}] ├─accounts-daemon───{accounts-daemon} ├─acpid ├─apache2─┬─apache2 │ └─2*[apache2───26*[{apache2}]] ├─at-spi-bus-laun───2*[{at-spi-bus-laun}] ├─atd ├─avahi-daemon───avahi-daemon ├─bluetoothd ├─colord───2*[{colord}] ├─console-kit-dae───64*[{console-kit-dae}] ├─cron ├─cupsd───2*[dbus] ├─2*[dbus-daemon] ├─dbus-launch ├─dconf-service───2*[{dconf-service}] ├─dropbox───15*[{dropbox}] ├─firefox───27*[{firefox}] ├─gconfd-2 ├─geoclue-master ├─6*[getty] ├─gnome-keyring-d───7*[{gnome-keyring-d}] ├─gnome-terminal─┬─bash │ ├─bash───pstree │ ├─gnome-pty-helpe │ ├─sh───R───{R} │ └─3*[{gnome-terminal}]
?
fork通常作為一個(gè)函數(shù)被調(diào)用。這個(gè)函數(shù)會(huì)有兩次返回,將子進(jìn)程的PID返回給父進(jìn)程,0返回給子進(jìn)程。實(shí)際上,子進(jìn)程總可以查詢自己的PPID來(lái)知道自己的父進(jìn)程是誰(shuí),這樣,一對(duì)父進(jìn)程和子進(jìn)程就可以隨時(shí)查詢對(duì)方。
通常在調(diào)用fork函數(shù)之后,程序會(huì)設(shè)計(jì)一個(gè)if選擇結(jié)構(gòu)。當(dāng)PID等于0時(shí),說(shuō)明該進(jìn)程為子進(jìn)程,那么讓它執(zhí)行某些指令,比如說(shuō)使用exec庫(kù)函數(shù)(library function)讀取另一個(gè)程序文件,并在當(dāng)前的進(jìn)程空間執(zhí)行 (這實(shí)際上是我們使用fork的一大目的: 為某一程序創(chuàng)建進(jìn)程);而當(dāng)PID為一個(gè)正整數(shù)時(shí),說(shuō)明為父進(jìn)程,則執(zhí)行另外一些指令。由此,就可以在子進(jìn)程建立之后,讓它執(zhí)行與父進(jìn)程不同的功能。
?
子進(jìn)程的終結(jié)(termination)
當(dāng)子進(jìn)程終結(jié)時(shí),它會(huì)通知父進(jìn)程,并清空自己所占據(jù)的內(nèi)存,并在內(nèi)核里留下自己的退出信息(exit code,如果順利運(yùn)行,為0;如果有錯(cuò)誤或異常狀況,為>0的整數(shù))。在這個(gè)信息里,會(huì)解釋該進(jìn)程為什么退出。父進(jìn)程在得知子進(jìn)程終結(jié)時(shí),有責(zé)任對(duì)該子進(jìn)程使用wait系統(tǒng)調(diào)用。這個(gè)wait函數(shù)能從內(nèi)核中取出子進(jìn)程的退出信息,并清空該信息在內(nèi)核中所占據(jù)的空間。但是,如果父進(jìn)程早于子進(jìn)程終結(jié),子進(jìn)程就會(huì)成為一個(gè)孤兒(orphand)進(jìn)程。孤兒進(jìn)程會(huì)被過(guò)繼給init進(jìn)程,init進(jìn)程也就成了該進(jìn)程的父進(jìn)程。init進(jìn)程負(fù)責(zé)該子進(jìn)程終結(jié)時(shí)調(diào)用wait函數(shù)。
當(dāng)然,一個(gè)糟糕的程序也完全可能造成子進(jìn)程的退出信息滯留在內(nèi)核中的狀況(父進(jìn)程不對(duì)子進(jìn)程調(diào)用wait函數(shù)),這樣的情況下,子進(jìn)程成為僵尸(zombie)進(jìn)程。當(dāng)大量僵尸進(jìn)程積累時(shí),內(nèi)存空間會(huì)被擠占。
?
進(jìn)程與線程(thread)
盡管在UNIX中,進(jìn)程與線程是有聯(lián)系但不同的兩個(gè)東西,但在Linux中,線程只是一種特殊的進(jìn)程。多個(gè)線程之間可以共享內(nèi)存空間和IO接口。所以,進(jìn)程是Linux程序的唯一的實(shí)現(xiàn)方式。
?
總結(jié)
程序,進(jìn)程,PID,內(nèi)存空間
子進(jìn)程,父進(jìn)程,PPID,fork, wait
?
?
評(píng)論
查看更多