最近在做通信協(xié)議相關(guān)項(xiàng)目,在通信過(guò)程中一般都會(huì)有包長(zhǎng),數(shù)據(jù)緩沖等等信息,而實(shí)際場(chǎng)景中,數(shù)據(jù)包長(zhǎng)度是不確定的,使用數(shù)組的定長(zhǎng)包或者指針數(shù)據(jù)包都有一定的缺陷,那么可變長(zhǎng)的數(shù)據(jù)緩存方法有嗎?
有的,這就是0長(zhǎng)度數(shù)組,又稱為柔性數(shù)組(flexible array),通常用來(lái)實(shí)現(xiàn)變長(zhǎng)數(shù)組。
變長(zhǎng)數(shù)組簡(jiǎn)介
變長(zhǎng)數(shù)組是數(shù)組大小待定的數(shù)組,C語(yǔ)言中結(jié)構(gòu)體的最后一個(gè)元素可以是大小未知的數(shù)組,也就是所謂的0長(zhǎng)度。
在標(biāo)準(zhǔn)C/C++中,不允許用0長(zhǎng)度數(shù)組,但在GNU C中,卻可以定義0長(zhǎng)度數(shù)組(在C99之前寫成長(zhǎng)度為0,C99中可以直接不寫索引),我們可以用結(jié)構(gòu)體來(lái)創(chuàng)建變長(zhǎng)數(shù)組。
?
typedef?struct?{ ????int?len; ????int?array[0];//int?array[]; }SoftArray;
?
它的主要用途是為了滿足需要變長(zhǎng)度的結(jié)構(gòu)體,為了解決使用數(shù)組時(shí)內(nèi)存的冗余和數(shù)組的越界問(wèn)題。
sizeof(SoftArray);的值在32位操作系統(tǒng)下剛好為4,也就是一個(gè)int型變量大小,這說(shuō)明結(jié)構(gòu)體中的數(shù)組沒(méi)有占用內(nèi)存。
對(duì)于編譯器來(lái)說(shuō),此時(shí)長(zhǎng)度為0的數(shù)組并不占用空間,因?yàn)閿?shù)組名本身不占空間,它只是一個(gè)偏移量,數(shù)組名這個(gè)符號(hào)本身代表了一個(gè)不可修改的地址常量 (注意:數(shù)組名永遠(yuǎn)都不會(huì)是指針?。?/p>
對(duì)于這個(gè)數(shù)組的大小,我們可以進(jìn)行動(dòng)態(tài)分配!
對(duì)于變長(zhǎng)數(shù)組的這個(gè)特點(diǎn),很容易構(gòu)造出變成結(jié)構(gòu)體,如緩沖區(qū),數(shù)據(jù)包等等
變長(zhǎng)度數(shù)組的優(yōu)缺點(diǎn)
這次的通信協(xié)議項(xiàng)目,假如使用數(shù)組來(lái)傳遞數(shù)據(jù),那么一般定義如下,其中包的長(zhǎng)度maxLen是一個(gè)定值,假設(shè)為1024。
?
typedef?struct?{ ????int?len; ????int?array[maxLen]; }SoftArray;
?
這包數(shù)據(jù)的大小為sizeof(int) + sizeof(int) * maxLen,由于考慮到數(shù)據(jù)的溢出, maxLen一般會(huì)設(shè)置得足夠長(zhǎng)足以容納最大的數(shù)據(jù), 因此數(shù)組很多情況下可能都沒(méi)有填滿數(shù)據(jù), 造成了浪費(fèi)。
而使用指針的話,則定義如下
?
typedef?struct? { ????int?len; ????char?*array; };
?
數(shù)據(jù)結(jié)構(gòu)的大小為sizeof(int) + sizeof(int *),使用指針結(jié)果作為緩沖區(qū), 只多使用了一個(gè)指針大小的空間,不會(huì)造成空間的大量浪費(fèi),但需要額外開辟和釋放數(shù)據(jù)域的空間,我們并不能假定使用者了解我們開辟的細(xì)節(jié), 并按照約定的操作釋放空間, 因此使用起來(lái)多有不便, 甚至造成內(nèi)存泄漏。
變成數(shù)組可以節(jié)約空間,解決使用數(shù)組時(shí)內(nèi)存的冗余和數(shù)組的越界問(wèn)題。但也有一個(gè)缺點(diǎn)就是結(jié)構(gòu)體中的變長(zhǎng)數(shù)組只能放在最后面。
?
typedef?struct?{ ????int?len; ????int?array[]; ????int?CRC; }SoftArray;
?
這種用法是不行的,不支持,會(huì)報(bào)以下錯(cuò)誤,如果后續(xù)要加上一些其他的數(shù)據(jù)就不能用了。
其實(shí)柔性數(shù)組成員在實(shí)現(xiàn)跳躍表時(shí)有它特別的用法,在Redis的SDS數(shù)據(jù)結(jié)構(gòu)中和跳躍表的實(shí)現(xiàn)上,也使用柔性數(shù)組成員。
為什么0長(zhǎng)度數(shù)組不占用存儲(chǔ)空間
由于0長(zhǎng)度數(shù)組是GNU C的擴(kuò)展,有一些巧妙編寫的詭異代碼, 其執(zhí)行結(jié)果就是依賴于編譯器和優(yōu)化策略的實(shí)現(xiàn)的,我們來(lái)看看以下代碼
?
#include?#include? int?main(void) { ????char?a[0]; ????printf("%p ",?a); ????char?b[0]; ????printf("%p ",?b); ????const?char?*c=?"Hello"; ????printf("%p ",?c); ????const?char?*d?=?"Hello"; ????printf("%p ",?d); ????return?EXIT_SUCCESS; }
?
編譯結(jié)果是:
可以看到a和b的地址就會(huì)被編譯器優(yōu)化到一處, 因?yàn)閍[0] 和 b[0] 對(duì)于程序來(lái)說(shuō)是無(wú)法使用的, 同樣編譯器對(duì)于相同字符串常量, 往往地址也是優(yōu)化到一處, 減少空間占用。
所以其本質(zhì)上涉及到的是一個(gè)C語(yǔ)言里面的數(shù)組和指針的區(qū)別問(wèn)題,Programming Abstractions in C一書中提到:
“arr is defined to be identical to &arr[0]”.
也就是說(shuō),char a[1]里面的a實(shí)際是一個(gè)常量,即a = &a[0]。而char *b是有一個(gè)實(shí)實(shí)在在的指針變量b存在。所以,a=b是不允許的,而b=a是允許的。
?
#include?char?a[1]; char?*b; int?main?()?{ ?b?=?a;? ??//a=b會(huì)報(bào)錯(cuò),incompatible?types?when?assigning?to?type?‘char[1]’?from?type?‘char?*’ ?a?=?b; ?return?0; }
?
兩種變量都支持下標(biāo)式的訪問(wèn),那么對(duì)于a[0]和b[0]本質(zhì)上是否有區(qū)別?我們可以通過(guò)一個(gè)例子來(lái)說(shuō)明。
變長(zhǎng)數(shù)組和動(dòng)態(tài)數(shù)組有什么區(qū)別?
動(dòng)態(tài)數(shù)組是指在聲明時(shí),沒(méi)有確定數(shù)組大小的數(shù)組,它可以隨程序需要而重新指定大小。動(dòng)態(tài)數(shù)組的內(nèi)存空間是從堆動(dòng)態(tài)分配的,當(dāng)程序執(zhí)行到我們編寫的分配語(yǔ)句時(shí),才為其分配存儲(chǔ)空間。
使用動(dòng)態(tài)數(shù)組的優(yōu)點(diǎn)是可以根據(jù)用戶需要,有效利用存儲(chǔ)空間。
?
int?a[10];//靜態(tài)數(shù)組,在堆棧上創(chuàng)建 int?n; //C語(yǔ)言的malloc函數(shù)進(jìn)行書寫 int?*p?=?(int?*)malloc(n?*?sizeof(int));
?
變長(zhǎng)數(shù)組的實(shí)際意思是以變量作為長(zhǎng)度的數(shù)組,區(qū)別于以常數(shù)作為長(zhǎng)度的數(shù)組。英文Variable-Length Array(后續(xù)都縮寫成VLA),注意這里有一個(gè)連接號(hào)。
連接號(hào)-代表的意思是,Variable不是一個(gè)用于修飾Length的形容詞,而是一個(gè)名字名詞(即變量的意思)。
了解了正確的含義后,不難理解VLA的目的就是數(shù)組的長(zhǎng)度是由一個(gè)變量指定的,而非常數(shù)。
小結(jié)
實(shí)際工程中不推薦使用VLA,程序中棧的大小是有限的,若需要的數(shù)組長(zhǎng)度很大,有造成爆棧的危險(xiǎn)。
審核編輯:劉清
評(píng)論
查看更多