0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從最底層的內(nèi)存存儲(chǔ)空間開始帶你了解C語言指針

Q4MP_gh_c472c21 ? 來源:IoT物聯(lián)網(wǎng)小鎮(zhèn) ? 作者:IoT物聯(lián)網(wǎng)小鎮(zhèn) ? 2021-02-02 10:40 ? 次閱讀

一、前言

二、變量與指針的本質(zhì)

三、指針的幾個(gè)相關(guān)概念

四、指向不同數(shù)據(jù)類型的指針

五、總結(jié)

一、前言

如果問C語言中最重要、威力最大的概念是什么,答案必將是指針!威力大,意味著使用方便、高效,同時(shí)也意味著語法復(fù)雜、容易出錯(cuò)。指針用的好,可以極大的提高代碼執(zhí)行效率、節(jié)約系統(tǒng)資源;如果用的不好,程序中將會(huì)充滿陷阱、漏洞。

這篇文章,我們就來聊聊指針。從最底層的內(nèi)存存儲(chǔ)空間開始,一直到應(yīng)用層的各種指針使用技巧,循序漸進(jìn)、抽絲剝繭,以最直白的語言進(jìn)行講解,讓你一次看過癮。

說明:為了方便講解和理解,文中配圖的內(nèi)存空間的地址是隨便寫的,在實(shí)際計(jì)算機(jī)中是要遵循地址對(duì)齊方式的。

二、變量與指針的本質(zhì)

1. 內(nèi)存地址

我們編寫一個(gè)程序源文件之后,編譯得到的二進(jìn)制可執(zhí)行文件存放在電腦的硬盤上,此時(shí)它是一個(gè)靜態(tài)的文件,一般稱之為程序。

當(dāng)這個(gè)程序被啟動(dòng)的時(shí)候,操作系統(tǒng)將會(huì)做下面幾件事情:

把程序的內(nèi)容(代碼段、數(shù)據(jù)段)從硬盤復(fù)制到內(nèi)存中;

創(chuàng)建一個(gè)數(shù)據(jù)結(jié)構(gòu)PCB(進(jìn)程控制塊),來描述這個(gè)程序的各種信息(例如:使用的資源,打開的文件描述符。..);

在代碼段中定位到入口函數(shù)的地址,讓CPU從這個(gè)地址開始執(zhí)行。

a0d8a6dc-624f-11eb-8b86-12bb97331649.png

當(dāng)程序開始被執(zhí)行時(shí),就變成一個(gè)動(dòng)態(tài)的狀態(tài),一般稱之為進(jìn)程。

內(nèi)存分為:物理內(nèi)存和虛擬內(nèi)存。操作系統(tǒng)對(duì)物理內(nèi)存進(jìn)行管理、包裝,我們開發(fā)者面對(duì)的是操作系統(tǒng)提供的虛擬內(nèi)存。

這2個(gè)概念不妨礙文章的理解,因此就統(tǒng)一稱之為內(nèi)存。

在我們的程序中,通過一個(gè)變量名來定義變量、使用變量。變量本身是一個(gè)確確實(shí)實(shí)存在的東西,變量名是一個(gè)抽象的概念,用來代表這個(gè)變量。就比如:我是一個(gè)實(shí)實(shí)在在的人,是客觀存在與這個(gè)地球上的,道哥是我給自己起的一個(gè)名字,這個(gè)名字是任意取得,只要自己覺得好聽就行,如果我愿意還可以起名叫:鳥哥、龍哥等等。

那么,我們定義一個(gè)變量之后,這個(gè)變量放在哪里呢?那就是內(nèi)存的數(shù)據(jù)區(qū)。內(nèi)存是一個(gè)很大的存儲(chǔ)區(qū)域,被操作系統(tǒng)劃分為一個(gè)一個(gè)的小空間,操作系統(tǒng)通過地址來管理內(nèi)存。

a101ff96-624f-11eb-8b86-12bb97331649.png

內(nèi)存中的最小存儲(chǔ)單位是字節(jié)(8個(gè)bit),一個(gè)內(nèi)存的完整空間就是由這一個(gè)一個(gè)的字節(jié)連續(xù)組成的。在上圖中,每一個(gè)小格子代表一個(gè)字節(jié),但是好像大家在書籍中沒有這么來畫內(nèi)存模型的,更常見的是下面這樣的畫法:

a12acec6-624f-11eb-8b86-12bb97331649.png

也就是把連續(xù)的4個(gè)字節(jié)的空間畫在一起,這樣就便于表述和理解,特別是深入到代碼對(duì)齊相關(guān)知識(shí)時(shí)更容易理解。(我認(rèn)為根本原因應(yīng)該是:大家都這么畫,已經(jīng)看順眼了~~)

2. 32位與64位系統(tǒng)

我們平時(shí)所說的計(jì)算機(jī)是32位、64位,指的是計(jì)算機(jī)的CPU中寄存器的最大存儲(chǔ)長度,如果寄存器中最大存儲(chǔ)32bit的數(shù)據(jù),就稱之為32位系統(tǒng)。

在計(jì)算機(jī)中,數(shù)據(jù)一般都是在硬盤、內(nèi)存和寄存器之間進(jìn)行來回存取。CPU通過3種總線把各組成部分聯(lián)系在一起:地址總線、數(shù)據(jù)總線和控制總線。地址總線的寬度決定了CPU的尋址能力,也就是CPU能達(dá)到的最大地址范圍。

a1559f7a-624f-11eb-8b86-12bb97331649.png

剛才說了,內(nèi)存是通過地址來管理的,那么CPU想從內(nèi)存中的某個(gè)地址空間上存取一個(gè)數(shù)據(jù),那么CPU就需要在地址總線上輸出這個(gè)存儲(chǔ)單元的地址。假如地址總線的寬度是8位,能表示的最大地址空間就是256個(gè)字節(jié),能找到內(nèi)存中最大的存儲(chǔ)單元是255這個(gè)格子(從0開始)。即使內(nèi)存條的實(shí)際空間是2G字節(jié),CPU也沒法使用后面的內(nèi)存地址空間。如果地址總線的寬度是32位,那么能表示的最大地址就是2的32次方,也就是4G字節(jié)的空間。

【注意】:這里只是描述地址總線的概念,實(shí)際的計(jì)算機(jī)中地址計(jì)算方式要復(fù)雜的多,比如:虛擬內(nèi)存中采用分段、分頁、偏移量來定位實(shí)際的物理內(nèi)存,在分頁中還有大頁、小頁之分,感興趣的同學(xué)可以自己查一下相關(guān)資料。

3. 變量

我們?cè)贑程序中使用變量來“代表”一個(gè)數(shù)據(jù),使用函數(shù)名來“代表”一個(gè)函數(shù),變量名和函數(shù)名是程序員使用的助記符。變量和函數(shù)最終是要放到內(nèi)存中才能被CPU使用的,而內(nèi)存中所有的信息(代碼和數(shù)據(jù))都是以二進(jìn)制的形式來存儲(chǔ)的,計(jì)算機(jī)根據(jù)就不會(huì)從格式上來區(qū)分哪些是代碼、哪些是數(shù)據(jù)。CPU在訪問內(nèi)存的時(shí)候需要的是地址,而不是變量名、函數(shù)名。

問題來了:在程序代碼中使用變量名來指代變量,而變量在內(nèi)存中是根據(jù)地址來存放的,這二者之間如何映射(關(guān)聯(lián))起來的?

答案是:編譯器!編譯器在編譯文本格式的C程序文件時(shí),會(huì)根據(jù)目標(biāo)運(yùn)行平臺(tái)(就是編譯出的二進(jìn)制程序運(yùn)行在哪里?是x86平臺(tái)的電腦?還是ARM平臺(tái)的開發(fā)板?)來安排程序中的各種地址,例如:加載到內(nèi)存中的地址、代碼段的入口地址等等,同時(shí)編譯器也會(huì)把程序中的所有變量名,轉(zhuǎn)成該變量在內(nèi)存中的存儲(chǔ)地址。

變量有2個(gè)重要屬性:變量的類型和變量的值。

示例:代碼中定義了一個(gè)變量

int a = 20;

類型是int型,值是20。這個(gè)變量在內(nèi)存中的存儲(chǔ)模型為:

a19c4cd6-624f-11eb-8b86-12bb97331649.png

我們?cè)诖a中使用變量名a,在程序執(zhí)行的時(shí)候就表示使用0x11223344地址所對(duì)應(yīng)的那個(gè)存儲(chǔ)單元中的數(shù)據(jù)。因此,可以理解為變量名a就等價(jià)于這個(gè)地址0x11223344。換句話說,如果我們可以提前知道編譯器把變量a安排在地址0x11223344這個(gè)單元格中,我們就可以在程序中直接用這個(gè)地址值來操作這個(gè)變量。

在上圖中,變量a的值為20,在內(nèi)存中占據(jù)了4個(gè)格子的空間,也就是4個(gè)字節(jié)。為什么是4個(gè)字節(jié)呢?在C標(biāo)準(zhǔn)中并沒有規(guī)定每種數(shù)據(jù)類型的變量一定要占用幾個(gè)字節(jié),這是與具體的機(jī)器、編譯器有關(guān)。

比如:32位的編譯器中:

char: 1個(gè)字節(jié);

short int: 2個(gè)字節(jié);

int: 4個(gè)字節(jié);

long: 4個(gè)字節(jié)。

比如:64位的編譯器中:

char: 1個(gè)字節(jié);

short int: 2個(gè)字節(jié);

int: 4個(gè)字節(jié);

long: 8個(gè)字節(jié)。

為了方便描述,下面都以32位為例,也就是int型變量在內(nèi)存中占據(jù)4個(gè)字節(jié)。

另外,0x11223344,0x11223345,0x11223346,0x11223347這連續(xù)的、從低地址到高地址的4個(gè)字節(jié)用來存儲(chǔ)變量a的數(shù)值20。在圖示中,使用十六進(jìn)制來表示,十進(jìn)制數(shù)值20轉(zhuǎn)成16進(jìn)制就是:0x00000014,所以從開始地址依次存放0x00、0x00、0x00、0x14這4個(gè)字節(jié)(存儲(chǔ)順序涉及到大小端的問題,不影響文本理解)。

根據(jù)這個(gè)圖示,如果在程序中想知道變量a存儲(chǔ)在內(nèi)存中的什么位置,可以使用取地址操作符&,如下:

printf(“&a = 0x%x ”, &a);

這句話將會(huì)打印出:&a = 0x11223344。

考慮一下,在32位系統(tǒng)中:指針變量占用幾個(gè)字節(jié)?

4. 指針變量

指針變量可以分2個(gè)層次來理解:

指針變量首先是一個(gè)變量,所以它擁有變量的所有屬性:類型和值。它的類型就是指針,它的值是其他變量的地址。 既然是一個(gè)變量,那么在內(nèi)存中就需要為這個(gè)變量分配一個(gè)存儲(chǔ)空間。在這個(gè)存儲(chǔ)空間中,存放著其他變量的地址。

指針變量所指向的數(shù)據(jù)類型,這是在定義指針變量的時(shí)候就確定的。例如:int *p; 意味著指針指向的是一個(gè)int型的數(shù)據(jù)。

首先回答一下剛才那個(gè)問題,在32位系統(tǒng)中,一個(gè)指針變量在內(nèi)存中占據(jù)4個(gè)字節(jié)的空間。因?yàn)镃PU對(duì)內(nèi)存空間尋址時(shí),使用的是32位地址空間(4個(gè)字節(jié)),也就是用4個(gè)字節(jié)就能存儲(chǔ)一個(gè)內(nèi)存單元的地址。而指針變量中的值存儲(chǔ)的就是地址,所以需要4個(gè)字節(jié)的空間來存儲(chǔ)一個(gè)指針變量的值。

示例:

int a = 20; int *pa; pa = &a; printf(“value = %d ”, *pa);

在內(nèi)存中的存儲(chǔ)模型如下:

a1be1960-624f-11eb-8b86-12bb97331649.png

對(duì)于指針變量pa來說,首先它是一個(gè)變量,因此在內(nèi)存中需要有一個(gè)空間來存儲(chǔ)這個(gè)變量,這個(gè)空間的地址就是0x11223348;

其次,這個(gè)內(nèi)存空間中存儲(chǔ)的內(nèi)容是變量a的地址,而a的地址為0x11223344,所以指針變量pa的地址空間中,就存儲(chǔ)了0x11223344這個(gè)值。

這里對(duì)兩個(gè)操作符&和*進(jìn)行說明:

&:取地址操作符,用來獲取一個(gè)變量的地址。上面代碼中&a就是用來獲取變量a在內(nèi)存中的存儲(chǔ)地址,也就是0x11223344。

*:這個(gè)操作符用在2個(gè)場(chǎng)景中:定義一個(gè)指針的時(shí)候,獲取一個(gè)指針?biāo)赶虻淖兞恐档臅r(shí)候。

int pa; 這個(gè)語句中的表示定義的變量pa是一個(gè)指針,前面的int表示pa這個(gè)指針指向的是一個(gè)int類型的變量。不過此時(shí)我們沒有給pa進(jìn)行賦值,也就是說此刻pa對(duì)應(yīng)的存儲(chǔ)單元中的4個(gè)字節(jié)里的值是沒有初始化的,可能是0x00000000,也可能是其他任意的數(shù)字,不確定;

printf語句中的*表示獲取pa指向的那個(gè)int類型變量的值,學(xué)名叫解引用,我們只要記住是獲取指向的變量的值就可以了。

5. 操作指針變量

對(duì)指針變量的操作包括3個(gè)方面:

操作指針變量自身的值;

獲取指針變量所指向的數(shù)據(jù);

以什么樣數(shù)據(jù)類型來使用/解釋指針變量所指向的內(nèi)容。

5.1 指針變量自身的值

int a = 20;這個(gè)語句是定義變量a,在隨后的代碼中,只要寫下a就表示要操作變量a中存儲(chǔ)的值,操作有兩種:讀和寫。

printf(“a = %d ”, a); 這個(gè)語句就是要讀取變量a中的值,當(dāng)然是20;

a = 100;這個(gè)語句就是要把一個(gè)數(shù)值100寫入到變量a中。

同樣的道理,int *pa;語句是用來定義指針變量pa,在隨后的代碼中,只要寫下pa就表示要操作變量pa中的值:

printf(“pa = %d ”, pa); 這個(gè)語句就是要讀取指針變量pa中的值,當(dāng)然是0x11223344;

pa = &a;這個(gè)語句就是要把新的值寫入到指針變量pa中。再次強(qiáng)調(diào)一下,指針變量中存儲(chǔ)的是地址,如果我們可以提前知道變量a的地址是 0x11223344,那么我們也可以這樣來賦值:pa = 0x11223344;

思考一下,如果執(zhí)行這個(gè)語句printf(“&pa =0x%x ”, &pa);,打印結(jié)果會(huì)是什么?

上面已經(jīng)說過,操作符&是用來取地址的,那么&pa就表示獲取指針變量pa的地址,上面的內(nèi)存模型中顯示指針變量pa是存儲(chǔ)在0x11223348這個(gè)地址中的,因此打印結(jié)果就是:&pa = 0x11223348。

5.2 獲取指針變量所指向的數(shù)據(jù)

指針變量所指向的數(shù)據(jù)類型是在定義的時(shí)候就明確的,也就是說指針pa指向的數(shù)據(jù)類型就是int型,因此在執(zhí)行printf(“value = %d ”, *pa);語句時(shí),首先知道pa是一個(gè)指針,其中存儲(chǔ)了一個(gè)地址(0x11223344),然后通過操作符*來獲取這個(gè)地址(0x11223344)對(duì)應(yīng)的那個(gè)存儲(chǔ)空間中的值;又因?yàn)樵诙xpa時(shí),已經(jīng)指定了它指向的值是一個(gè)int型,所以我們就知道了地址0x11223344中存儲(chǔ)的就是一個(gè)int類型的數(shù)據(jù)。

5.3 以什么樣的數(shù)據(jù)類型來使用/解釋指針變量所指向的內(nèi)容

如下代碼:

int a = 30000; int *pa = &a; printf(“value = %d ”, *pa);

根據(jù)以上的描述,我們知道printf的打印結(jié)果會(huì)是value = 30000,十進(jìn)制的30000轉(zhuǎn)成十六進(jìn)制是0x00007530,內(nèi)存模型如下:

a1e118c0-624f-11eb-8b86-12bb97331649.png

現(xiàn)在我們做這樣一個(gè)測(cè)試:

char *pc = 0x11223344; printf(“value = %d ”, *pc);

指針變量pc在定義的時(shí)候指明:它指向的數(shù)據(jù)類型是char型,pc變量中存儲(chǔ)的地址是0x11223344。當(dāng)使用*pc獲取指向的數(shù)據(jù)時(shí),將會(huì)按照char型格式來讀取0x11223344地址處的數(shù)據(jù),因此將會(huì)打印value = 0(在計(jì)算機(jī)中,ASCII碼是用等價(jià)的數(shù)字來存儲(chǔ)的)。

這個(gè)例子中說明了一個(gè)重要的概念:在內(nèi)存中一切都是數(shù)字,如何來操作(解釋)一個(gè)內(nèi)存地址中的數(shù)據(jù),完全是由我們的代碼來告訴編譯器的。剛才這個(gè)例子中,雖然0x11223344這個(gè)地址開始的4個(gè)字節(jié)的空間中,存儲(chǔ)的是整型變量a的值,但是我們讓pc指針按照char型數(shù)據(jù)來使用/解釋這個(gè)地址處的內(nèi)容,這是完全合法的。

以上內(nèi)容,就是指針最根本的心法了。把這個(gè)心法整明白了,剩下的就是多見識(shí)、多練習(xí)的問題了。

三、指針的幾個(gè)相關(guān)概念

1. const屬性

const標(biāo)識(shí)符用來表示一個(gè)對(duì)象的不可變的性質(zhì),例如定義:

const int b = 20;

在后面的代碼中就不能改變變量b的值了,b中的值永遠(yuǎn)是20。同樣的,如果用const來修飾一個(gè)指針變量:

int a = 20; int b = 20; int * const p = &a;

內(nèi)存模型如下:

a22e068a-624f-11eb-8b86-12bb97331649.png

這里的const用來修飾指針變量p,根據(jù)const的性質(zhì)可以得出結(jié)論:p在定義為變量a的地址之后,就固定了,不能再被改變了,也就是說指針變量pa中就只能存儲(chǔ)變量a的地址0x11223344。如果在后面的代碼中寫p = &b;,編譯時(shí)就會(huì)報(bào)錯(cuò),因?yàn)閜是不可改變的,不能再被設(shè)置為變量b的地址。

但是,指針變量p所指向的那個(gè)變量a的值是可以改變的,即:*p = 21;這個(gè)語句是合法的,因?yàn)橹羔榩的值沒有改變(仍然是變量c的地址0x11223344),改變的是變量c中存儲(chǔ)的值。

與下面的代碼區(qū)分一下:

int a = 20; int b = 20; const int *p = &a; p = &b;

這里的const沒有放在p的旁邊,而是放在了類型int的旁邊,這就說明const符號(hào)不是用來修飾p的,而是用來修飾p所指向的那個(gè)變量的。所以,如果我們寫p = &b;把變量b的地址賦值給指針p,就是合法的,因?yàn)閜的值可以被改變。

但是這個(gè)語句*p = 21就是非法了,因?yàn)槎x語句中的const就限制了通過指針p獲取的數(shù)據(jù),不能被改變,只能被用來讀取。這個(gè)性質(zhì)常常被用在函數(shù)參數(shù)上,例如下面的代碼,用來計(jì)算一塊數(shù)據(jù)的CRC校驗(yàn),這個(gè)函數(shù)只需要讀取原始數(shù)據(jù),不需要(也不可以)改變?cè)紨?shù)據(jù),因此就需要在形參指針上使用const修飾符:

short int getDataCRC(const char *pData, int len) { short int crc = 0x0000; // 計(jì)算CRC return crc; }

2. void型指針

關(guān)鍵字void并不是一個(gè)真正的數(shù)據(jù)類型,它體現(xiàn)的是一種抽象,指明不是任何一種類型,一般有2種使用場(chǎng)景:

函數(shù)的返回值和形參;

定義指針時(shí)不明確規(guī)定所指數(shù)據(jù)的類型,也就意味著可以指向任意類型。

指針變量也是一種變量,變量之間可以相互賦值,那么指針變量之間也可以相互賦值,例如:

int a = 20; int b = a; int *p1 = &a; int *p2 = p1;

變量a賦值給變量b,指針p1賦值給指針p2,注意到它們的類型必須是相同的:a和b都是int型,p1和p2都是指向int型,所以可以相互賦值。那么如果數(shù)據(jù)類型不同呢?必須進(jìn)行強(qiáng)制類型轉(zhuǎn)換。例如:

int a = 20; int *p1 = &a; char *p2 = (char *)p1;

內(nèi)存模型如下:

a2747002-624f-11eb-8b86-12bb97331649.png

p1指針指向的是int型數(shù)據(jù),現(xiàn)在想把它的值(0x11223344)賦值給p2,但是由于在定義p2指針時(shí)規(guī)定它指向的數(shù)據(jù)類型是char型,因此需要把指針p1進(jìn)行強(qiáng)制類型轉(zhuǎn)換,也就是把地址0x11223344處的數(shù)據(jù)按照char型數(shù)據(jù)來看待,然后才可以賦值給p2指針。

如果我們使用void *p2來定義p2指針,那么在賦值時(shí)就不需要進(jìn)行強(qiáng)制類型轉(zhuǎn)換了,例如:

int a = 20; int *p1 = &a; void *p2 = p1;

指針p2是void*型,意味著可以把任意類型的指針賦值給p2,但是不能反過來操作,也就是不能把void*型指針直接賦值給其他確定類型的指針,而必須要強(qiáng)制轉(zhuǎn)換成被賦值指針?biāo)赶虻臄?shù)據(jù)類型,如下代碼,必須把p2指針強(qiáng)制轉(zhuǎn)換成int*型之后,再賦值給p3指針:

int a = 20; int *p1 = &a; void *p2 = p1; int *p3 = (int *)p2;

我們來看一個(gè)系統(tǒng)函數(shù):

void* memcpy(void* dest, const void* src, size_t len);

第一個(gè)參數(shù)類型是void*,這正體現(xiàn)了系統(tǒng)對(duì)內(nèi)存操作的真正意義:它并不關(guān)心用戶傳來的指針具體指向什么數(shù)據(jù)類型,只是把數(shù)據(jù)挨個(gè)存儲(chǔ)到這個(gè)地址對(duì)應(yīng)的空間中。

第二個(gè)參數(shù)同樣如此,此外還添加了const修飾符,這樣就說明了memcpy函數(shù)只會(huì)從src指針處讀取數(shù)據(jù),而不會(huì)修改數(shù)據(jù)。

3. 空指針和野指針

一個(gè)指針必須指向一個(gè)有意義的地址之后,才可以對(duì)指針進(jìn)行操作。如果指針中存儲(chǔ)的地址值是一個(gè)隨機(jī)值,或者是一個(gè)已經(jīng)失效的值,此時(shí)操作指針就非常危險(xiǎn)了,一般把這樣的指針稱作野指針,C代碼中很多指針相關(guān)的bug就來源于此。

3.1 空指針:不指向任何東西的指針

在定義一個(gè)指針變量之后,如果沒有賦值,那么這個(gè)指針變量中存儲(chǔ)的就是一個(gè)隨機(jī)值,有可能指向內(nèi)存中的任何一個(gè)地址空間,此時(shí)萬萬不可以對(duì)這個(gè)指針進(jìn)行寫操作,因?yàn)樗锌赡苤赶騼?nèi)存中的代碼段區(qū)域、也可能指向內(nèi)存中操作系統(tǒng)所在的區(qū)域。

一般會(huì)將一個(gè)指針變量賦值為NULL來表示一個(gè)空指針,而C語言中,NULL實(shí)質(zhì)是 ((void*)0) , 在C++中,NULL實(shí)質(zhì)是0。在標(biāo)準(zhǔn)庫頭文件stdlib.h中,有如下定義:

#ifdef __cplusplus #define NULL 0 #else #define NULL ((void *)0) #endif

3.2 野指針:地址已經(jīng)失效的指針

我們都知道,函數(shù)中的局部變量存儲(chǔ)在棧區(qū),通過malloc申請(qǐng)的內(nèi)存空間位于堆區(qū),如下代碼:

int *p = (int *)malloc(4); *p = 20;

內(nèi)存模型為:

a2ca9c7a-624f-11eb-8b86-12bb97331649.png

在堆區(qū)申請(qǐng)了4個(gè)字節(jié)的空間,然后強(qiáng)制類型轉(zhuǎn)換為int*型之后,賦值給指針變量p,然后通過*p設(shè)置這個(gè)地址中的值為14,這是合法的。如果在釋放了p指針指向的空間之后,再使用*p來操作這段地址,那就是非常危險(xiǎn)了,因?yàn)檫@個(gè)地址空間可能已經(jīng)被操作系統(tǒng)分配給其他代碼使用,如果對(duì)這個(gè)地址里的數(shù)據(jù)強(qiáng)行操作,程序立刻崩潰的話,將會(huì)是我們最大的幸運(yùn)!

int *p = (int *)malloc(4); *p = 20; free(p); // 在free之后就不可以再操作p指針中的數(shù)據(jù)了。 p = NULL; // 最好加上這一句。

四、指向不同數(shù)據(jù)類型的指針

1. 數(shù)值型指針

通過上面的介紹,指向數(shù)值型變量的指針已經(jīng)很明白了,需要注意的就是指針?biāo)赶虻臄?shù)據(jù)類型。

2. 字符串指針

字符串在內(nèi)存中的表示有2種:

用一個(gè)數(shù)組來表示,例如:char name1[8] = “zhangsan”;

用一個(gè)char *指針來表示,例如:char *name2 = “zhangsan”;

name1在內(nèi)存中占據(jù)8個(gè)字節(jié),其中存儲(chǔ)了8個(gè)字符的ASCII碼值;name2在內(nèi)存中占據(jù)9個(gè)字節(jié),因?yàn)槌舜鎯?chǔ)8個(gè)字符的ASCII碼值,在最后一個(gè)字符‘n’的后面還額外存儲(chǔ)了一個(gè)‘’,用來標(biāo)識(shí)字符串結(jié)束。

對(duì)于字符串來說,使用指針來操作是非常方便的,例如:變量字符串name2:

char *name2 = “zhangsan”; char *p = name2; while (*p != ‘’) { printf(“%c ”, *p); p = p + 1; }

在while的判斷條件中,檢查p指針指向的字符是否為結(jié)束符‘’。在循環(huán)體重,打印出當(dāng)前指向的字符之后,對(duì)指針比那里進(jìn)行自增操作,因?yàn)橹羔榩所指向的數(shù)據(jù)類型是char,每個(gè)char在內(nèi)存中占據(jù)一個(gè)字節(jié),因此指針p在自增1之后,就指向下一個(gè)存儲(chǔ)空間。

a5e9afd6-624f-11eb-8b86-12bb97331649.png

也可以把循環(huán)體中的2條語句寫成1條語句:

printf(“%c ”, *p++);

假如一個(gè)指針指向的數(shù)據(jù)類型為int型,那么執(zhí)行p = p + 1;之后,指針p中存儲(chǔ)的地址值將會(huì)增加4,因?yàn)橐粋€(gè)int型數(shù)據(jù)在內(nèi)存中占據(jù)4個(gè)字節(jié)的空間,如下所示:

a918861e-624f-11eb-8b86-12bb97331649.png

思考一個(gè)問題:void*型指針能夠遞增嗎?如下測(cè)試代碼:

int a[3] = {1, 2, 3}; void *p = a; printf(“1: p = 0x%x ”, p); p = p + 1; printf(“2: p = 0x%x ”, p);

打印結(jié)果如下:

1: p = 0x733748c0 2: p = 0x733748c1

說明void*型指針在自增時(shí),是按照一個(gè)字節(jié)的跨度來計(jì)算的。

3. 指針數(shù)組與數(shù)組指針

這2個(gè)說法經(jīng)常會(huì)混淆,至少我是如此,先看下這2條語句:

int *p1[3]; // 指針數(shù)組 int (*p2)[3]; // 數(shù)組指針

3.1 指針數(shù)組

第1條語句中:中括號(hào)[]的優(yōu)先級(jí)高,因此與p1先結(jié)合,表示一個(gè)數(shù)組,這個(gè)數(shù)組中有3個(gè)元素,這3個(gè)元素都是指針,它們指向的是int型數(shù)據(jù)??梢赃@樣來理解:如果有這個(gè)定義char p[3],很容易理解這是一個(gè)有3個(gè)char型元素的數(shù)組,那么把char換成int*,意味著數(shù)組里的元素類型是int*型(指向int型數(shù)據(jù)的指針)。內(nèi)存模型如下(注意:三個(gè)指針指向的地址并不一定是連續(xù)的):

a96fc532-624f-11eb-8b86-12bb97331649.png

如果向指針數(shù)組中的元素賦值,需要逐個(gè)把變量的地址賦值給指針元素:

int a = 1, b = 2, c = 3; char *p1[3]; p1[0] = &a; p1[1] = &b; p1[2] = &c;

3.2 數(shù)組指針

第2條語句中:小括號(hào)讓p2與*結(jié)合,表示p2是一個(gè)指針,這個(gè)指針指向了一個(gè)數(shù)組,數(shù)組中有3個(gè)元素,每一個(gè)元素的類型是int型??梢赃@樣來理解:如果有這個(gè)定義int p[3],很容易理解這是一個(gè)有3個(gè)char型元素的數(shù)組,那么把數(shù)組名p換成是*p2,也就是p2是一個(gè)指針,指向了這個(gè)數(shù)組。內(nèi)存模型如下(注意:指針指向的地址是一個(gè)數(shù)組,其中的3個(gè)元素是連續(xù)放在內(nèi)存中的):

a9997238-624f-11eb-8b86-12bb97331649.png

在前面我們說到取地址操作符&,用來獲得一個(gè)變量的地址。凡事都有特殊情況,對(duì)于獲取地址來說,下面幾種情況不需要使用&操作符:

字符串字面量作為右值時(shí),就代表這個(gè)字符串在內(nèi)存中的首地址;

數(shù)組名就代表這個(gè)數(shù)組的地址,也等于這個(gè)數(shù)組的第一個(gè)元素的地址;

函數(shù)名就代表這個(gè)函數(shù)的地址。

因此,對(duì)于一下代碼,三個(gè)printf語句的打印結(jié)果是相同的:

int a[3] = {1, 2, 3}; int (*p2)[3] = a; printf(“0x%x ”, a); printf(“0x%x ”, &a); printf(“0x%x ”, p2);

思考一下,如果對(duì)這里的p2指針執(zhí)行p2 = p2 + 1;操作,p2中的值將會(huì)增加多少?

答案是12個(gè)字節(jié)。因?yàn)閜2指向的是一個(gè)數(shù)組,這個(gè)數(shù)組中包含3個(gè)元素,每個(gè)元素占據(jù)4個(gè)字節(jié),那么這個(gè)數(shù)組在內(nèi)存中一共占據(jù)12個(gè)字節(jié),因此p2在加1之后,就跳過12個(gè)字節(jié)。

a9fe28ea-624f-11eb-8b86-12bb97331649.png

4. 二維數(shù)組和指針

一維數(shù)組在內(nèi)存中是連續(xù)分布的多個(gè)內(nèi)存單元組成的,而二維數(shù)組在內(nèi)存中也是連續(xù)分布的多個(gè)內(nèi)存單元組成的,從內(nèi)存角度來看,一維數(shù)組和二維數(shù)組沒有本質(zhì)差別。

和一維數(shù)組類似,二維數(shù)組的數(shù)組名表示二維數(shù)組的第一維數(shù)組中首元素的首地址,用代碼來說明:

int a[3][3] = {{1,2,3}, {4,5,6}, {7,8,9}}; // 二維數(shù)組 int (*p0)[3] = NULL; // p0是一個(gè)指針,指向一個(gè)數(shù)組 int (*p1)[3] = NULL; // p1是一個(gè)指針,指向一個(gè)數(shù)組 int (*p2)[3] = NULL; // p2是一個(gè)指針,指向一個(gè)數(shù)組 p0 = a[0]; p1 = a[1]; p2 = a[2]; printf(“0: %d %d %d ”, *(*p0 + 0), *(*p0 + 1), *(*p0 + 2)); printf(“1: %d %d %d ”, *(*p1 + 0), *(*p1 + 1), *(*p1 + 2)); printf(“2: %d %d %d ”, *(*p2 + 0), *(*p2 + 1), *(*p2 + 2));

打印結(jié)果是:

0: 1 2 3 1: 4 5 6 2: 7 8 9

我們拿第一個(gè)printf語句來分析:p0是一個(gè)指針,指向一個(gè)數(shù)組,數(shù)組中包含3個(gè)元素,每個(gè)元素在內(nèi)存中占據(jù)4個(gè)字節(jié)?,F(xiàn)在我們想獲取這個(gè)數(shù)組中的數(shù)據(jù),如果直接對(duì)p0執(zhí)行加1操作,那么p0將會(huì)跨過12個(gè)字節(jié)(就等于p1中的值了),因此需要使用解引用操作符*,把p0轉(zhuǎn)為指向int型的指針,然后再執(zhí)行加1操作,就可以得到數(shù)組中的int型數(shù)據(jù)了。

5. 結(jié)構(gòu)體指針

C語言中的基本數(shù)據(jù)類型是預(yù)定義的,結(jié)構(gòu)體是用戶定義的,在指針的使用上可以進(jìn)行類比,唯一有區(qū)別的就是在結(jié)構(gòu)體指針中,需要使用-》箭頭操作符來獲取結(jié)構(gòu)體中的成員變量,例如:

typedef struct { int age; char name[8]; } Student; Student s; s.age = 20; strcpy(s.name, “l(fā)isi”); Student *p = &s; printf(“age = %d, name = %s ”, p-》age, p-》name);

看起來似乎沒有什么技術(shù)含量,如果是結(jié)構(gòu)體數(shù)組呢?例如:

Student s[3]; Student *p = &s; printf(“size of Student = %d ”, sizeof(Student)); printf(“1: 0x%x, 0x%x ”, s, p); p++; printf(“2: 0x%x ”, p);

打印結(jié)果是:

size of Student = 12 1: 0x4c02ac00, 0x4c02ac00 2: 0x4c02ac0c

在執(zhí)行p++操作后,p需要跨過的空間是一個(gè)結(jié)構(gòu)體變量在內(nèi)存中占據(jù)的大小(12個(gè)字節(jié)),所以此時(shí)p就指向了數(shù)組中第2個(gè)元素的首地址,內(nèi)存模型如下:

aa5ed992-624f-11eb-8b86-12bb97331649.png

6. 函數(shù)指針

每一個(gè)函數(shù)在經(jīng)過編譯之后,都變成一個(gè)包含多條指令的集合,在程序被加載到內(nèi)存之后,這個(gè)指令集合被放在代碼區(qū),我們?cè)诔绦蛑惺褂煤瘮?shù)名就代表了這個(gè)指令集合的開始地址。

aace8f94-624f-11eb-8b86-12bb97331649.png

函數(shù)指針,本質(zhì)上仍然是一個(gè)指針,只不過這個(gè)指針變量中存儲(chǔ)的是一個(gè)函數(shù)的地址。函數(shù)最重要特性是什么?可以被調(diào)用!因此,當(dāng)定義了一個(gè)函數(shù)指針并把一個(gè)函數(shù)地址賦值給這個(gè)指針時(shí),就可以通過這個(gè)函數(shù)指針來調(diào)用函數(shù)。

如下示例代碼:

int add(int x,int y) { return x+y; } int main() { int a = 1, b = 2; int (*p)(int, int); p = add; printf(“%d + %d = %d ”, a, b, p(a, b)); }

前文已經(jīng)說過,函數(shù)的名字就代表函數(shù)的地址,所以函數(shù)名add就代表了這個(gè)加法函數(shù)在內(nèi)存中的地址。int (*p)(int, int);這條語句就是用來定義一個(gè)函數(shù)指針,它指向一個(gè)函數(shù),這個(gè)函數(shù)必須符合下面這2點(diǎn)(學(xué)名叫:函數(shù)簽名):

有2個(gè)int型的參數(shù);

有一個(gè)int型的返回值。

代碼中的add函數(shù)正好滿足這個(gè)要求,因此,可以把a(bǔ)dd賦值給函數(shù)指針p,此時(shí)p就指向了內(nèi)存中這個(gè)函數(shù)存儲(chǔ)的地址,后面就可以用函數(shù)指針p來調(diào)用這個(gè)函數(shù)了。

在示例代碼中,函數(shù)指針p是直接定義的,那如果想定義2個(gè)函數(shù)指針,難道需要像下面這樣定義嗎?

int (*p)(int, int); int (*p2)(int, int);

這里的參數(shù)比較簡(jiǎn)單,如果函數(shù)很復(fù)雜,這樣的定義方式豈不是要煩死?可以用typedef關(guān)鍵字來定義一個(gè)函數(shù)指針類型:

typedef int (*pFunc)(int, int);

然后用這樣的方式pFunc p1, p2;來定義多個(gè)函數(shù)指針就方便多了。注意:只能把與函數(shù)指針類型具有相同簽名的函數(shù)賦值給p1和p2,也就是參數(shù)的個(gè)數(shù)、類型要相同,返回值也要相同。

注意:這里有幾個(gè)小細(xì)節(jié)稍微了解一下:

在賦值函數(shù)指針時(shí),使用p = &a;也是可以的;

使用函數(shù)指針調(diào)用時(shí),使用(*p)(a, b);也是可以的。

這里沒有什么特殊的原理需要講解,最終都是編譯器幫我們處理了這里的細(xì)節(jié),直接記住即可。

函數(shù)指針整明白之后,再和數(shù)組結(jié)合在一起:函數(shù)指針數(shù)組。示例代碼如下:

int add(int a, int b) { return a + b; } int sub(int a, int b) { return a - b; } int mul(int a, int b) { return a * b; } int divide(int a, int b) { return a / b; } int main() { int a = 4, b = 2; int (*p[4])(int, int); p[0] = add; p[1] = sub; p[2] = mul; p[3] = divide; printf(“%d + %d = %d ”, a, b, p[0](a, b)); printf(“%d - %d = %d ”, a, b, p[1](a, b)); printf(“%d * %d = %d ”, a, b, p[2](a, b)); printf(“%d / %d = %d ”, a, b, p[3](a, b)); }

這條語句不太好理解:int (*p[4])(int, int);,先分析中間部分,標(biāo)識(shí)符p與中括號(hào)[]結(jié)合(優(yōu)先級(jí)高),所以p是一個(gè)數(shù)組,數(shù)組中有4個(gè)元素;然后剩下的內(nèi)容表示一個(gè)函數(shù)指針,那么就說明數(shù)組中的元素類型是函數(shù)指針,也就是其他函數(shù)的地址,內(nèi)存模型如下:

ab10e22c-624f-11eb-8b86-12bb97331649.png

如果還是難以理解,那就回到指針的本質(zhì)概念上:指針就是一個(gè)地址!這個(gè)地址中存儲(chǔ)的內(nèi)容是什么根本不重要,重要的是你告訴計(jì)算機(jī)這個(gè)內(nèi)容是什么。如果你告訴它:這個(gè)地址里存放的內(nèi)容是一個(gè)函數(shù),那么計(jì)算機(jī)就去調(diào)用這個(gè)函數(shù)。那么你是如何告訴計(jì)算機(jī)的呢,就是在定義指針變量的時(shí)候,僅此而已!

五、總結(jié)

我已經(jīng)把自己知道的所有指針相關(guān)的概念、語法、使用場(chǎng)景都作了講解,就像一個(gè)小酒館的掌柜,把自己的美酒佳肴都呈現(xiàn)給你,但愿你已經(jīng)酒足飯飽!

如果以上的內(nèi)容太多,一時(shí)無法消化,那么下面的這兩句話就作為飯后甜點(diǎn)為您奉上,在以后的編程中,如果遇到指針相關(guān)的困惑,就想一想這兩句話,也許能讓你茅塞頓開。

指針就是地址,地址就是指針。

指針就是指向內(nèi)存中的一塊空間,至于如何來解釋/操作這塊空間,由這個(gè)指針的類型來決定。

另外還有一點(diǎn)囑咐,那就是學(xué)習(xí)任何一門編程語言,一定要弄清楚內(nèi)存模型,內(nèi)存模型,內(nèi)存模型!

原文標(biāo)題:C語言指針:從底層原理到花式技巧,用圖文和代碼幫你講解透徹

文章出處:【微信公眾號(hào):嵌入式ARM】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • C語言
    +關(guān)注

    關(guān)注

    180

    文章

    7605

    瀏覽量

    136934
  • 指針
    +關(guān)注

    關(guān)注

    1

    文章

    480

    瀏覽量

    70569

原文標(biāo)題:C語言指針:從底層原理到花式技巧,用圖文和代碼幫你講解透徹

文章出處:【微信號(hào):gh_c472c2199c88,微信公眾號(hào):嵌入式微處理器】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    C語言程序設(shè)計(jì)教程第4版第8講:指針

    C語言指針講解
    發(fā)表于 11-20 14:10 ?0次下載

    一文帶你了解什么是SD NAND存儲(chǔ)芯片

    存儲(chǔ)芯片:   了解了EEPROM存儲(chǔ)芯片和NAND芯片以及EMMC存儲(chǔ)芯片他們都有各自的有點(diǎn),比如說現(xiàn)在需要一款芯片是擁有較大的存儲(chǔ)空間
    發(fā)表于 11-13 15:20

    C語言指針學(xué)習(xí)筆記

    本文底層內(nèi)存分析,徹底讓讀者明白C語言指針的本質(zhì)。
    的頭像 發(fā)表于 11-05 17:40 ?245次閱讀
    <b class='flag-5'>C</b><b class='flag-5'>語言</b><b class='flag-5'>指針</b>學(xué)習(xí)筆記

    C語言指針運(yùn)算符詳解

    C語言中,當(dāng)你有一個(gè)指向數(shù)組中某個(gè)元素的指針時(shí),你可以對(duì)該指針執(zhí)行某些算術(shù)運(yùn)算,例如加法或減法。這些運(yùn)算可以用來遍歷數(shù)組中的元素,如ptr[i]等價(jià)于*(ptr + i)。然而,如果
    的頭像 發(fā)表于 10-30 11:16 ?256次閱讀

    單片機(jī)的存儲(chǔ)空間不夠用了,有哪些解決辦法?

    當(dāng)單片機(jī)的存儲(chǔ)空間不足時(shí),可以考慮幾種解決方法。一種是優(yōu)化程序代碼,刪除不必要的代碼和變量,提高代碼的效率和緊湊性;可以采用外部存儲(chǔ)器擴(kuò)展,如使用外部的 EEPROM 或 Flash 存儲(chǔ)器來
    發(fā)表于 10-15 22:33

    Synology如何使用Nvme固態(tài)做存儲(chǔ)空間

    Synology 如何使用Nvme固態(tài)做存儲(chǔ)空間
    發(fā)表于 10-09 10:55 ?0次下載

    C語言指針詳細(xì)解析

    可以對(duì)數(shù)據(jù)本身,也可以對(duì)存儲(chǔ)數(shù)據(jù)的變量地址進(jìn)行操作。 指針是一個(gè)占據(jù)存儲(chǔ)空間的實(shí)體在這一段空間起始位置的相對(duì)距離值。在C/
    發(fā)表于 09-14 10:03

    技術(shù)干貨驛站 ▏深入理解C語言:基本數(shù)據(jù)類型和變量

    C語言中,數(shù)據(jù)類型和變量是編程的基礎(chǔ),也是理解更復(fù)雜概念的關(guān)鍵。數(shù)據(jù)類型決定了變量的內(nèi)存分配、存儲(chǔ)范圍和操作方式,而變量則是存儲(chǔ)數(shù)據(jù)的容器
    的頭像 發(fā)表于 07-26 17:53 ?2153次閱讀
    技術(shù)干貨驛站 ▏深入理解<b class='flag-5'>C</b><b class='flag-5'>語言</b>:基本數(shù)據(jù)類型和變量

    面試中的高頻問題:指針函數(shù)與函數(shù)指針,你能完美應(yīng)對(duì)嗎?

    一直覺得C語言較其他語言最偉大的地方就是C語言中的指針,有些人認(rèn)為
    的頭像 發(fā)表于 06-22 08:11 ?1735次閱讀
    面試中的高頻問題:<b class='flag-5'>指針</b>函數(shù)與函數(shù)<b class='flag-5'>指針</b>,你能完美應(yīng)對(duì)嗎?

    C語言內(nèi)存泄漏問題原理

    內(nèi)存泄漏問題只有在使用堆內(nèi)存的時(shí)候才會(huì)出現(xiàn),棧內(nèi)存不存在內(nèi)存泄漏問題,因?yàn)闂?b class='flag-5'>內(nèi)存會(huì)自動(dòng)分配和釋放。C
    發(fā)表于 03-19 11:38 ?530次閱讀
    <b class='flag-5'>C</b><b class='flag-5'>語言</b><b class='flag-5'>內(nèi)存</b>泄漏問題原理

    PCAN系列網(wǎng)關(guān)內(nèi)部存儲(chǔ)空間解析:EEPROM與Flash的集成應(yīng)用

    Flash的配置與利用,并解析如何通過C編程實(shí)現(xiàn)快速實(shí)時(shí)的信號(hào)存讀。通過虹科PCAN-Router FD的實(shí)例,我們將展示這些存儲(chǔ)空間如何助力網(wǎng)關(guān)設(shè)備在復(fù)雜環(huán)境中保持卓越性能。
    的頭像 發(fā)表于 03-18 13:45 ?531次閱讀
    PCAN系列網(wǎng)關(guān)內(nèi)部<b class='flag-5'>存儲(chǔ)空間</b>解析:EEPROM與Flash的集成應(yīng)用

    C語言指針用法

    C語言編程中善用指針可以簡(jiǎn)化一些任務(wù)的處理,而對(duì)于一些任務(wù)(比如動(dòng)態(tài)內(nèi)存分配),必須要有指針才行的。也就是說精通
    發(fā)表于 03-05 14:22 ?359次閱讀
    <b class='flag-5'>C</b><b class='flag-5'>語言</b>的<b class='flag-5'>指針</b>用法

    請(qǐng)問cyw20719b2的nvram的存儲(chǔ)空間有多少字節(jié)?

    1)請(qǐng)問cyw20719b2的nvram 的存儲(chǔ)空間有多少字節(jié)? 2)用wiced_hal_write_nvram()或wiced_hal_read_nvram()nvram 寫入或讀出一字節(jié)數(shù)據(jù)需要多少時(shí)間
    發(fā)表于 03-01 12:42

    記憶黑板與存儲(chǔ)空間:探討其限制與可能性

    記憶黑板與存儲(chǔ)空間:探討其限制與可能性 在當(dāng)今的數(shù)字化時(shí)代,信息的存儲(chǔ)和管理已經(jīng)成為一項(xiàng)重要的任務(wù)。記憶黑板作為一種信息存儲(chǔ)和展示工具,其存儲(chǔ)空間是否有限制,成為了許多用戶關(guān)心的問題。
    的頭像 發(fā)表于 01-17 19:16 ?338次閱讀

    C語言指針內(nèi)存是如何存放變量

    在程序中定義一個(gè)變量,那么在程序編譯的過程中,系統(tǒng)會(huì)根據(jù)你定義變量的類型來分配「相應(yīng)尺寸」的內(nèi)存空間。那么如果要使用這個(gè)變量,只需要用變量名去訪問即可。
    發(fā)表于 01-08 10:14 ?481次閱讀