0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從進(jìn)程啟動是怎么一步步到main函數(shù)的

strongerHuang ? 來源:strongerHuang ? 作者:軒轅之風(fēng) ? 2020-11-03 15:51 ? 次閱讀

首先先劃定一下這個問題的討論范圍:C/C++語言

這篇文章主要討論的是操作系統(tǒng)層面上對于進(jìn)程、線程的創(chuàng)建初始化等行為,而像Python、Java等基于解釋器、虛擬機的語言,如何進(jìn)入到main函數(shù)執(zhí)行,這背后的路徑則更長(包含了解釋器和虛擬機內(nèi)部的執(zhí)行流程),以后有機會再討論。所以這里就重點關(guān)注C/C++這類native語言的main函數(shù)是如何進(jìn)入的。

本文會兼顧敘述Linux和Windows兩個主要平臺上的詳細(xì)流程。

創(chuàng)建進(jìn)程

第一步,創(chuàng)建進(jìn)程。

在Linux上,我們要啟動一個新的進(jìn)程,一般通過fork+exec系列函數(shù)來實現(xiàn),前者將當(dāng)前進(jìn)程“分叉”出一個孿生子進(jìn)程,后者負(fù)責(zé)替換這個子進(jìn)程的執(zhí)行文件,來執(zhí)行子進(jìn)程的新程序文件。

這里的fork、exec系列函數(shù),是操作系統(tǒng)提供給應(yīng)用程序的API函數(shù),在其內(nèi)部最終都會通過系統(tǒng)調(diào)用,進(jìn)入操作系統(tǒng)內(nèi)核,通過內(nèi)核中的進(jìn)程管理機制,來完成一個進(jìn)程的創(chuàng)建。

操作系統(tǒng)內(nèi)核將負(fù)責(zé)進(jìn)程的創(chuàng)建,主要有下面幾個工作要做:

創(chuàng)建內(nèi)核中用于描述進(jìn)程的數(shù)據(jù)結(jié)構(gòu),在Linux上是task_struct

創(chuàng)建新進(jìn)程的頁目錄、頁表,用于構(gòu)建新進(jìn)程的內(nèi)存地址空間

在Linux內(nèi)核中,由于歷史原因,Linux內(nèi)核早期并沒有線程的概念,而是用任務(wù):task_struct來描述一個程序的執(zhí)行實例:進(jìn)程。

在內(nèi)核中,一個任務(wù)對應(yīng)就是一個task_struct,也就是一個進(jìn)程,內(nèi)核的調(diào)度單元也是一個個的個task_struct。

后來,多線程的概念興起,Linux內(nèi)核為了支持多線程技術(shù),task_struct實際上表示的變成了一個線程,通過將多個task_struct合并為一組(通過該結(jié)構(gòu)內(nèi)部的組id字段)再來描述一個進(jìn)程。因此,Linux上的線程,也稱為輕量級進(jìn)程。

系統(tǒng)調(diào)用fork的一個重要使命就是要去創(chuàng)建新進(jìn)程的task_struct結(jié)構(gòu),創(chuàng)建完成后,進(jìn)程就擁有了調(diào)度單元。隨后將開始可以參與調(diào)度并有機會獲得執(zhí)行。

加載可執(zhí)行文件

通過fork成功創(chuàng)建進(jìn)程后,此時的子進(jìn)程和父進(jìn)程相當(dāng)于一個細(xì)胞進(jìn)行了有絲分裂,兩個進(jìn)程“幾乎”是一模一樣的。

而要想子進(jìn)程執(zhí)行新的程序,在子進(jìn)程中還需要用到exec系列函數(shù)來實現(xiàn)對進(jìn)程可執(zhí)行程序的替換。

exec系列函數(shù)同樣是系統(tǒng)調(diào)用的封裝,通過調(diào)用它們,將進(jìn)入內(nèi)核sys_execve來執(zhí)行真正的工作。

這個工作細(xì)節(jié)比較多,其中有一個重要的工作就是加載可執(zhí)行文件到進(jìn)程空間并對其進(jìn)行分析,提取出可執(zhí)行文件的入口地址。

我們使用C、C++等高級語言編寫的代碼,最終通過編譯器會編譯生成可執(zhí)行文件,在Linux上,是ELF格式,在Windows上,稱之為PE文件。

無論是ELF文件還是PE文件,在各自的文件頭中,都記錄了這個可執(zhí)行文件的指令入口地址,它指示了程序該從哪里開始執(zhí)行。

這個入口指向哪里,是我們的main函數(shù)嗎?這里賣一個關(guān)子,先來解決在這之前的一個問題:進(jìn)程創(chuàng)建后,是如何來到這個入口地址的?

不管在Windows還是Linux上,應(yīng)用線程都會經(jīng)常在用戶空間和內(nèi)核空間來回穿梭,這可能出現(xiàn)在以下幾種情況發(fā)生時:

系統(tǒng)調(diào)用

中斷

異常

從內(nèi)核返回時,線程是如何知道自己從哪里進(jìn)來的,該回到應(yīng)用空間的哪里去繼續(xù)執(zhí)行呢?

答案是,在進(jìn)入內(nèi)核空間時,線程將自動保存上下文(其實就是一些寄存器的內(nèi)容,比如指令寄存器EIP)到線程的堆棧上,記錄自己從哪里來的,等到從內(nèi)核返回時,再從堆棧上加載這些信息,回到原來的地方繼續(xù)執(zhí)行。

前面提到,子進(jìn)程是通過sys_execve系統(tǒng)調(diào)用進(jìn)入到內(nèi)核中的,在后面完成可執(zhí)行文件的分析后,拿到了ELF文件的入口地址,將會去修改原來保存在堆棧上的上下文信息,將EIP指向ELF文件的入口地址。這樣等sys_execve系統(tǒng)調(diào)用結(jié)束時,返回到用戶空間后,就能夠直接轉(zhuǎn)到新的程序入口開始執(zhí)行代碼。

所以,一個非常重要的特點是:exec系列函數(shù)正常情況下是不會返回的,一旦進(jìn)入,完成使命后,執(zhí)行流程就會轉(zhuǎn)向新的可執(zhí)行文件入口。

另外需要提一下的是,在Linux上,除了ELF文件,還支持一些其他格式的可執(zhí)行文件,如MS-DOS、COFF

除了二進(jìn)制的可執(zhí)行文件,還支持shell腳本,這個情況下將會將腳本解釋器程序作為入口來啟動

從ELF入口到main函數(shù)

上面交代了,一個新的進(jìn)程,是如何執(zhí)行到可執(zhí)行文件的入口地址的。

同時也留了一個問題,這個入口地址是什么?是我們的main函數(shù)嗎?

這里有一個簡單的C程序,運行起來后輸出經(jīng)典的hello world:

#include intmain(){ printf("hello,world! "); return0; }

通過gcc編譯后,生成了一個ELF可執(zhí)行文件,通過readelf指令,可以實現(xiàn)對ELF文件的分析,這里可以看到ELF文件的入口地址是0x400430:

隨后,我們通過反匯編神器,IDA打開分析這個文件,看一下位于0x400430入口的地方是什么函數(shù)?

可以看到,入口地方是一個叫做_start的函數(shù),并不是我們的main函數(shù)。

在_start的結(jié)尾,調(diào)用了__libc_start_main函數(shù),而這個函數(shù),位于libc.so中。

你可能疑惑,這個函數(shù)是哪里冒出來的,我們的代碼中并沒有用到它呢?

其實,在進(jìn)入main函數(shù)之前,還有一個重要的工作要做,這就是:C/C++運行時庫的初始化。上面的__libc_start_main就是在完成這一工作。

在通過GCC進(jìn)行編譯時,編譯器將自動完成運行時庫的鏈接,將我們的main函數(shù)封裝起來,由它來調(diào)用。

glibc是開源的,我們可以在GitHub上找到這個項目的libc-start.c文件,一窺__libc_start_main的真面目,我們的main函數(shù)正是被它在調(diào)用。

完整流程

到這里,我們梳理了,從進(jìn)程創(chuàng)建fork,到通過exec系列函數(shù)完成可執(zhí)行文件的替換,再到執(zhí)行流程進(jìn)入到ELF文件的入口,再到我們的main函數(shù)的完整流程。

Windows上的一些區(qū)別

下面簡單介紹下Windows上這一流程的一些差異。

首先是創(chuàng)建進(jìn)程的環(huán)節(jié),Windows系統(tǒng)將fork+exec兩步合并了一步,通過CreateProcess系列函數(shù)一步到位,在其參數(shù)中指定子進(jìn)程的可執(zhí)行文件路徑。

不同于Linux上進(jìn)程和線程的邊界模糊,在Windows操作系統(tǒng)上,內(nèi)核是有明確的進(jìn)程和線程概念定義,進(jìn)程用EPROCESS結(jié)構(gòu)表示,線程用ETHREAD結(jié)構(gòu)表示。

所以在Windows上,進(jìn)程相關(guān)的工作準(zhǔn)備就緒后,還需要單獨創(chuàng)建一個參與內(nèi)核調(diào)度的執(zhí)行單元,也就是進(jìn)程中的第一個線程:主線程。當(dāng)然,這個工作也封裝在了CreateProcess系列函數(shù)中了。

新進(jìn)程的主線程創(chuàng)建完成后,便開始參與系統(tǒng)調(diào)度了。主線程從哪里開始執(zhí)行呢?內(nèi)核在創(chuàng)建時就明確進(jìn)行了指定:nt!KiThreadStartup,這是一個內(nèi)核函數(shù),線程啟動后就從這里開始執(zhí)行。

線程從這里啟動后,再通過Windows的異步過程調(diào)用APC機制執(zhí)行提前插入的APC,進(jìn)而將執(zhí)行流程引入應(yīng)用層,去執(zhí)行Windows進(jìn)程應(yīng)用程序的初始化工作,比如一些核心DLL文件的加載(Kernel32.dll、ntdll.dll)等等。

隨后,再次通過APC機制,再轉(zhuǎn)向去執(zhí)行可執(zhí)行文件的入口點。

這后面和Linux上的機制類似,同樣沒有直接到main函數(shù),而是需要先進(jìn)行C/C++運行時庫的初始化,這之后經(jīng)過運行時函數(shù)的包裝,才最終來到我們的main函數(shù)。

下面是Windows上,從創(chuàng)建進(jìn)程到我們的main函數(shù)的完整流程(高清大圖:https://bbs.pediy.com/upload/attach/201604/501306_qz5f5hi1n3107kt.png):

現(xiàn)在你清楚,從進(jìn)程啟動是怎么一步步到你的main函數(shù)的了嗎?

責(zé)任編輯:xj

原文標(biāo)題:從創(chuàng)建進(jìn)程到進(jìn)入main函數(shù),發(fā)生了什么?

文章出處:【微信公眾號:strongerHuang】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • WINDOWS
    +關(guān)注

    關(guān)注

    4

    文章

    3610

    瀏覽量

    91134
  • C語言
    +關(guān)注

    關(guān)注

    180

    文章

    7630

    瀏覽量

    140848
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4375

    瀏覽量

    64458
  • main
    +關(guān)注

    關(guān)注

    0

    文章

    38

    瀏覽量

    6372

原文標(biāo)題:從創(chuàng)建進(jìn)程到進(jìn)入main函數(shù),發(fā)生了什么?

文章出處:【微信號:strongerHuang,微信公眾號:strongerHuang】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 0人收藏

    評論

    相關(guān)推薦
    熱點推薦

    各位大佬,想問下為什么這個程序一步一步運行就可以讀出正確的讀數(shù),正常運行卻讀不出正確讀數(shù)

    各位大佬,想問下為什么這個程序一步一步運行就可以讀出正確的讀數(shù),正常運行卻讀不出正確讀數(shù)
    發(fā)表于 06-23 09:57

    智駕安全,發(fā)展一步了?

    智駕安全,發(fā)展一步了?
    的頭像 發(fā)表于 06-10 11:28 ?195次閱讀

    小白學(xué)大模型:零實現(xiàn) LLM語言模型

    ://github.com/FareedKhan-dev/train-llm-from-scratch本文將為你提供個簡單直接的方法,從下載數(shù)據(jù)生成文本,帶你一步步構(gòu)建大院模型。
    的頭像 發(fā)表于 04-30 18:34 ?420次閱讀
    小白學(xué)大模型:<b class='flag-5'>從</b>零實現(xiàn) LLM語言模型

    解鎖樹莓派集群:一步步打造你的超級計算陣列!

    樹莓派集群簡介樹莓派集群是由多臺聯(lián)網(wǎng)的樹莓派計算機組成的網(wǎng)絡(luò),它們作為個統(tǒng)、協(xié)調(diào)的單元協(xié)同工作。通過連接多臺樹莓派,用戶可以創(chuàng)建個低成本的并行計算環(huán)境,能夠處理基礎(chǔ)模擬和網(wǎng)頁托
    的頭像 發(fā)表于 04-25 16:17 ?496次閱讀
    解鎖樹莓派集群:<b class='flag-5'>一步步</b>打造你的超級計算陣列!

    CoT 數(shù)據(jù)集如何讓大模型學(xué)會一步一步思考?

    目前,大模型的回答路徑基本遵循 input-output 的方式,在面對復(fù)雜任務(wù)時表現(xiàn)不佳。反之,人類會遵循套有條理的思維流程,逐步推理得出正確答案。這種差異促使人們深入思考:如何才能讓大模型“智能涌現(xiàn)”,學(xué)會像人類樣“一步
    的頭像 發(fā)表于 04-24 16:51 ?455次閱讀
    CoT 數(shù)據(jù)集如何讓大模型學(xué)會<b class='flag-5'>一步</b><b class='flag-5'>一步</b>思考?

    【迅為電子】一步步教你完成iTOP-RK3568 EDP屏幕適配

    【迅為電子】一步步教你完成iTOP-RK3568 EDP屏幕適配
    的頭像 發(fā)表于 04-23 15:08 ?895次閱讀
    【迅為電子】<b class='flag-5'>一步步</b>教你完成iTOP-RK3568 EDP屏幕適配

    ST EDGE AI云服務(wù)最后一步無法下載工程是怎么回事?

    ST EDGE AI云服務(wù)我選擇使用ST提供的模型,使用cube ai 9.0.0,選擇STM32板卡。之后就按照文檔一步一步操作,基準(zhǔn)測試也能運行的結(jié)果(說明云端是生成工程并編譯下載到開發(fā)板中
    發(fā)表于 03-13 08:17

    如果需要將DDC112U設(shè)置為非連續(xù)模式工作,應(yīng)該如何一步一步正確地設(shè)置芯片?

    或狀態(tài)8,如果沒有CONV的切換發(fā)生,是否會直停留在上電時的這個狀態(tài)?如果需要將DDC112U設(shè)置為非連續(xù)模式工作,應(yīng)該如何一步一步正確地設(shè)置芯片?
    發(fā)表于 01-09 07:43

    沙子變芯片,一步步帶你走進(jìn)高科技的微觀世界

    在科技飛速發(fā)展的今天,芯片作為現(xiàn)代科技的核心元器件,其制造過程復(fù)雜且充滿挑戰(zhàn)。芯片不僅推動了信息技術(shù)、人工智能、物聯(lián)網(wǎng)等領(lǐng)域的進(jìn)步,還成為衡量個國家科技實力的重要指標(biāo)。然而,芯片制造并非易事,沙子芯片的每
    的頭像 發(fā)表于 12-19 10:44 ?712次閱讀
    沙子變芯片,<b class='flag-5'>一步步</b>帶你走進(jìn)高科技的微觀世界

    FaceTime成詐騙“幫兇”,蘋果是怎么一步步丟掉“安全”光環(huán)的?

    蘋果想要在AI時代,重新給自己貼上“安全”的標(biāo)簽,恐怕還學(xué)學(xué)安卓和鴻蒙。
    的頭像 發(fā)表于 11-03 17:39 ?3320次閱讀
    FaceTime成詐騙“幫兇”,蘋果是怎么<b class='flag-5'>一步步</b>丟掉“安全”光環(huán)的?

    TPA3128D2第3管腳輸出保護是什么原因?qū)е碌模?/a>

    TPA3128D2按照數(shù)據(jù)手冊第24頁圖36配置為MASTER模式,GAIN=26db,按典型應(yīng)用的電路圖畫的電路板,上電后第3管腳輸出低電平,請問 1.應(yīng)該怎樣一步步排除此故障? 2.是否按數(shù)據(jù)手冊第18頁中圖29的時序啟動芯片才能工作?
    發(fā)表于 10-22 06:17

    通過展頻進(jìn)一步優(yōu)化EMI

    電子發(fā)燒友網(wǎng)站提供《通過展頻進(jìn)一步優(yōu)化EMI.pdf》資料免費下載
    發(fā)表于 09-04 09:32 ?1次下載
    通過展頻進(jìn)<b class='flag-5'>一步</b>優(yōu)化EMI

    用XDS200仿真PGA900時候,單步執(zhí)行程序PC支持并沒有按照C語言一步一步執(zhí)行,為什么?

    我在用XDS200仿真PGA900時候,程序能正常引導(dǎo)main,單步執(zhí)行程序, PC支持并沒有按照C語言一步一步執(zhí)行, 這是什么原因? 以下是工程圖
    發(fā)表于 08-15 07:18

    昂科芯片燒錄高質(zhì)量出海 唱響越南一步步新技術(shù)研討會

    8月8日,迎來了場科技盛事-2024越南一步步新技術(shù)研討會在河內(nèi)·美利亞酒店隆重舉行。作為芯片燒錄領(lǐng)域的領(lǐng)導(dǎo)者,昂科技術(shù)應(yīng)邀參會,吸引了眾多國內(nèi)外業(yè)界專家和企業(yè)的關(guān)注。
    的頭像 發(fā)表于 08-10 09:20 ?1117次閱讀

    labview按名稱解綁簇報錯

    這是我在網(wǎng)上按照視頻一步步做的,請各位大神幫我看看,我打框的地方哪里錯了呀??為什么視頻老師做的就不報錯,我做的樣就錯了?
    發(fā)表于 07-14 12:06

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品