“new”是C++的一個關(guān)鍵字,同時也是操作符。關(guān)于new的話題非常多,因?yàn)樗_實(shí)比較復(fù)雜,也非常神秘,下面我將把我了解到的與new有關(guān)的內(nèi)容做一個總結(jié)。
new的過程
當(dāng)我們使用關(guān)鍵字new在堆上動態(tài)創(chuàng)建一個對象時,它實(shí)際上做了三件事:獲得一塊內(nèi)存空間、調(diào)用構(gòu)造函數(shù)、返回正確的指針。當(dāng)然,如果我們創(chuàng)建的是簡單類型的變量,那么第二步會被省略。假如我們定義了如下一個類A:
class A{ int i;public: A(int _i) :i(_i*_i) {} void Say() { printf("i=%d/n", i); }};//調(diào)用new:A* pa = new A(3);
那么上述動態(tài)創(chuàng)建一個對象的過程大致相當(dāng)于以下三句話(只是大致上):
A* pa = (A*)malloc(sizeof(A));pa->A::A(3);return pa;
雖然從效果上看,這三句話也得到了一個有效的指向堆上的A對象的指針pa,但區(qū)別在于,當(dāng)malloc失敗時,它不會調(diào)用分配內(nèi)存失敗處理程序new_handler,而使用new的話會的。因此我們還是要盡可能的使用new,除非有一些特殊的需求。
new的三種形態(tài)
到目前為止,本文所提到的new都是指的“new operator”或稱為“new expression”,但事實(shí)上在C++中一提到new,至少可能代表以下三種含義:new operator、operator new、placement new。
new operator就是我們平時所使用的new,其行為就是前面所說的三個步驟,我們不能更改它。但具體到某一步驟中的行為,如果它不滿足我們的具體要求時,我們是有可能更改它的。三個步驟中最后一步只是簡單的做一個指針的類型轉(zhuǎn)換,沒什么可說的,并且在編譯出的代碼中也并不需要這種轉(zhuǎn)換,只是人為的認(rèn)識罷了。但前兩步就有些內(nèi)容了。
new operator的第一步分配內(nèi)存實(shí)際上是通過調(diào)用operator new來完成的,這里的new實(shí)際上是像加減乘除一樣的操作符,因此也是可以重載的。operator new默認(rèn)情況下首先調(diào)用分配內(nèi)存的代碼,嘗試得到一段堆上的空間,如果成功就返回,如果失敗,則轉(zhuǎn)而去調(diào)用一個new_hander,然后繼續(xù)重復(fù)前面過程。如果我們對這個過程不滿意,就可以重載operator new,來設(shè)置我們希望的行為。例如:
class A{public: void* operator new(size_t size) { printf("operator new called/n"); return ::operator new(size); }};A* a = new A();
這里通過::operator new調(diào)用了原有的全局的new,實(shí)現(xiàn)了在分配內(nèi)存之前輸出一句話。全局的operator new也是可以重載的,但這樣一來就不能再遞歸的使用new來分配內(nèi)存,而只能使用malloc了:
void* operator new(size_t size){ printf("global new/n");return malloc(size);}
相應(yīng)的,delete也有delete operator和operator delete之分,后者也是可以重載的。并且,如果重載了operator new,就應(yīng)該也相應(yīng)的重載operator delete,這是良好的編程習(xí)慣。
new的第三種形態(tài)——placement new是用來實(shí)現(xiàn)定位構(gòu)造的,因此可以實(shí)現(xiàn)new operator三步操作中的第二步,也就是在取得了一塊可以容納指定類型對象的內(nèi)存后,在這塊內(nèi)存上構(gòu)造一個對象,這有點(diǎn)類似于前面代碼中的“p->A::A(3);”這句話,但這并不是一個標(biāo)準(zhǔn)的寫法,正確的寫法是使用placement new:
#include
對頭文件
p->~A();
當(dāng)我們覺得默認(rèn)的new operator對內(nèi)存的管理不能滿足我們的需要,而希望自己手工的管理內(nèi)存時,placement new就有用了。STL中的allocator就使用了這種方式,借助placement new來實(shí)現(xiàn)更靈活有效的內(nèi)存管理。
處理內(nèi)存分配異常
正如前面所說,operator new的默認(rèn)行為是請求分配內(nèi)存,如果成功則返回此內(nèi)存地址,如果失敗則調(diào)用一個new_handler,然后再重復(fù)此過程。于是,想要從operator new的執(zhí)行過程中返回,則必然需要滿足下列條件之一:
l分配內(nèi)存成功
lnew_handler中拋出bad_alloc異常
lnew_handler中調(diào)用exit()或類似的函數(shù),使程序結(jié)束
于是,我們可以假設(shè)默認(rèn)情況下operator new的行為是這樣的:
void* operator new(size_t size){ void* p = null while(!(p = malloc(size))) { if(null == new_handler) throw bad_alloc(); try { new_handler(); } catch(bad_alloc e) { throw e; } catch(…) {} } return p;}
在默認(rèn)情況下,new_handler的行為是拋出一個bad_alloc異常,因此上述循環(huán)只會執(zhí)行一次。但如果我們不希望使用默認(rèn)行為,可以自定義一個new_handler,并使用std::set_new_handler函數(shù)使其生效。在自定義的new_handler中,我們可以拋出異常,可以結(jié)束程序,也可以運(yùn)行一些代碼使得有可能有內(nèi)存被空閑出來,從而下一次分配時也許會成功,也可以通過set_new_handler來安裝另一個可能更有效的new_handler。例如:
void MyNewHandler(){ printf(“New handler called!/n”); throw std::bad_alloc();}std::set_new_handler(MyNewHandler);
這里new_handler程序在拋出異常之前會輸出一句話。應(yīng)該注意,在new_handler的代碼里應(yīng)該注意避免再嵌套有對new的調(diào)用,因?yàn)槿绻@里調(diào)用new再失敗的話,可能會再導(dǎo)致對new_handler的調(diào)用,從而導(dǎo)致無限遞歸調(diào)用。——這是我猜的,并沒有嘗試過。
在編程時我們應(yīng)該注意到對new的調(diào)用是有可能有異常被拋出的,因此在new的代碼周圍應(yīng)該注意保持其事務(wù)性,即不能因?yàn)檎{(diào)用new失敗拋出異常來導(dǎo)致不正確的程序邏輯或數(shù)據(jù)結(jié)構(gòu)的出現(xiàn)。例如:
class SomeClass{ static int count; SomeClass() {}public: static SomeClass* GetNewInstance() { count++; return new SomeClass(); }};
靜態(tài)變量count用于記錄此類型生成的實(shí)例的個數(shù),在上述代碼中,如果因new分配內(nèi)存失敗而拋出異常,那么其實(shí)例個數(shù)并沒有增加,但count變量的值卻已經(jīng)多了一個,從而數(shù)據(jù)結(jié)構(gòu)被破壞。正確的寫法是:
static SomeClass* GetNewInstance(){ SomeClass* p = new SomeClass(); count++; return p;}
這樣一來,如果new失敗則直接拋出異常,count的值不會增加。類似的,在處理線程同步時,也要注意類似的問題:
void SomeFunc(){ lock(someMutex); //加一個鎖 delete p; p = new SomeClass(); unlock(someMutex);}
此時,如果new失敗,unlock將不會被執(zhí)行,于是不僅造成了一個指向不正確地址的指針p的存在,還將導(dǎo)致someMutex永遠(yuǎn)不會被解鎖。這種情況是要注意避免的。(參考:C++箴言:爭取異常安全的代碼)
STL的內(nèi)存分配與traits技巧
在《STL原碼剖析》一書中詳細(xì)分析了SGI STL的內(nèi)存分配器的行為。與直接使用new operator不同的是,SGI STL并不依賴C++默認(rèn)的內(nèi)存分配方式,而是使用一套自行實(shí)現(xiàn)的方案。首先SGI STL將可用內(nèi)存整塊的分配,使之成為當(dāng)前進(jìn)程可用的內(nèi)存,當(dāng)程序中確實(shí)需要分配內(nèi)存時,先從這些已請求好的大內(nèi)存塊中嘗試取得內(nèi)存,如果失敗的話再嘗試整塊的分配大內(nèi)存。這種做法有效的避免了大量內(nèi)存碎片的出現(xiàn),提高了內(nèi)存管理效率。
為了實(shí)現(xiàn)這種方式,STL使用了placement new,通過在自己管理的內(nèi)存空間上使用placement new來構(gòu)造對象,以達(dá)到原有new operator所具有的功能。
template
此函數(shù)接收一個已構(gòu)造的對象,通過拷貝構(gòu)造的方式在給定的內(nèi)存地址p上構(gòu)造一個新對象,代碼中后半截T1(value)便是placement new語法中調(diào)用構(gòu)造函數(shù)的寫法,如果傳入的對象value正是所要求的類型T1,那么這里就相當(dāng)于調(diào)用拷貝構(gòu)造函數(shù)。類似的,因使用了placement new,編譯器不會自動產(chǎn)生調(diào)用析構(gòu)函數(shù)的代碼,需要手工的實(shí)現(xiàn):
template
與此同時,STL中還有一個接收兩個迭代器的destory版本,可將某容器上指定范圍內(nèi)的對象全部銷毀。典型的實(shí)現(xiàn)方式就是通過一個循環(huán)來對此范圍內(nèi)的對象逐一調(diào)用析構(gòu)函數(shù)。如果所傳入的對象是非簡單類型,這樣做是必要的,但如果傳入的是簡單類型,或者根本沒有必要調(diào)用析構(gòu)函數(shù)的自定義類型(例如只包含數(shù)個int成員的結(jié)構(gòu)體),那么再逐一調(diào)用析構(gòu)函數(shù)是沒有必要的,也浪費(fèi)了時間。為此,STL使用了一種稱為“type traits”的技巧,在編譯器就判斷出所傳入的類型是否需要調(diào)用析構(gòu)函數(shù):
template
其中value_type()用于取出迭代器所指向的對象的類型信息,于是:
template
因上述函數(shù)全都是inline的,所以多層的函數(shù)調(diào)用并不會對性能造成影響,最終編譯的結(jié)果根據(jù)具體的類型就只是一個for循環(huán)或者什么都沒有。這里的關(guān)鍵在于__type_traits
struct __true_type {};struct __false_type {};template
如果要把一個自定義的類型MyClass也定義為不調(diào)用析構(gòu)函數(shù),只需要相應(yīng)的定義__type_traits
template<>struct __type_traits
模板是比較高級的C++編程技巧,模板特化、模板偏特化就更是技巧性很強(qiáng)的東西,STL中的type_traits充分借助模板特化的功能,實(shí)現(xiàn)了在程序編譯期通過編譯器來決定為每一處調(diào)用使用哪個特化版本,于是在不增加編程復(fù)雜性的前提下大大提高了程序的運(yùn)行效率。更詳細(xì)的內(nèi)容可參考《STL源碼剖析》第二、三章中的相關(guān)內(nèi)容。
帶有“[]”的new和delete
我們經(jīng)常會通過new來動態(tài)創(chuàng)建一個數(shù)組,例如:
char* s = new char[100];……delete s;
嚴(yán)格的說,上述代碼是不正確的,因?yàn)槲覀冊诜峙鋬?nèi)存時使用的是new[],而并不是簡單的new,但釋放內(nèi)存時卻用的是delete。正確的寫法是使用delete[]:
delete[] s;
但是,上述錯誤的代碼似乎也能編譯執(zhí)行,并不會帶來什么錯誤。事實(shí)上,new與new[]、delete與delete[]是有區(qū)別的,特別是當(dāng)用來操作復(fù)雜類型時。假如針對一個我們自定義的類MyClass使用new[]:
MyClass* p = new MyClass[10];
上述代碼的結(jié)果是在堆上分配了10個連續(xù)的MyClass實(shí)例,并且已經(jīng)對它們依次調(diào)用了構(gòu)造函數(shù),于是我們得到了10個可用的對象,這一點(diǎn)與Java、C#有區(qū)別的,Java、C#中這樣的結(jié)果只是得到了10個null。換句話說,使用這種寫法時MyClass必須擁有不帶參數(shù)的構(gòu)造函數(shù),否則會發(fā)現(xiàn)編譯期錯誤,因?yàn)榫幾g器無法調(diào)用有參數(shù)的構(gòu)造函數(shù)。
當(dāng)這樣構(gòu)造成功后,我們可以再將其釋放,釋放時使用delete[]:
delete[] p;
當(dāng)我們對動態(tài)分配的數(shù)組調(diào)用delete[]時,其行為根據(jù)所申請的變量類型會有所不同。如果p指向簡單類型,如int、char等,其結(jié)果只不過是這塊內(nèi)存被回收,此時使用delete[]與delete沒有區(qū)別,但如果p指向的是復(fù)雜類型,delete[]會針對動態(tài)分配得到的每個對象調(diào)用析構(gòu)函數(shù),然后再釋放內(nèi)存。因此,如果我們對上述分配得到的p指針直接使用delete來回收,雖然編譯期不報什么錯誤(因?yàn)榫幾g器根本看不出來這個指針p是如何分配的),但在運(yùn)行時(DEBUG情況下)會給出一個Debug assertion failed提示。
到這里,我們很容易提出一個問題——delete[]是如何知道要為多少個對象調(diào)用析構(gòu)函數(shù)的?要回答這個問題,我們可以首先看一看new[]的重載。
class MyClass{int a;public: MyClass() { printf("ctor/n"); } ~MyClass() { printf("dtor/n"); }};void* operator new[](size_t size){void* p = operator new(size); printf("calling new[] with size=%d address=%p/n", size, p);return p;}// 主函數(shù)MyClass* mc = new MyClass[3];printf("address of mc=%p/n", mc);delete[] mc;
運(yùn)行此段代碼,得到的結(jié)果為:(VC2005)
calling new[] with size=16address=003A5A58
ctor
ctor
ctor
address of mc=003A5A5C
dtor
dtor
dtor
雖然對構(gòu)造函數(shù)和析構(gòu)函數(shù)的調(diào)用結(jié)果都在預(yù)料之中,但所申請的內(nèi)存空間大小以及地址的數(shù)值卻出現(xiàn)了問題。我們的類MyClass的大小顯然是4個字節(jié),并且申請的數(shù)組中有3個元素,那么應(yīng)該一共申請12個字節(jié)才對,但事實(shí)上系統(tǒng)卻為我們申請了16字節(jié),并且在operator new[]返后我們得到的內(nèi)存地址是實(shí)際申請得到的內(nèi)存地址值加4的結(jié)果。也就是說,當(dāng)為復(fù)雜類型動態(tài)分配數(shù)組時,系統(tǒng)自動在最終得到的內(nèi)存地址前空出了4個字節(jié),我們有理由相信這4個字節(jié)的內(nèi)容與動態(tài)分配數(shù)組的長度有關(guān)。通過單步跟蹤,很容易發(fā)現(xiàn)這4個字節(jié)對應(yīng)的int值為0x00000003,也就是說記錄的是我們分配的對象的個數(shù)。改變一下分配的個數(shù)然后再次觀察的結(jié)果證實(shí)了我的想法。于是,我們也有理由認(rèn)為new[] operator的行為相當(dāng)于下面的偽代碼:
template
上述示意性的代碼省略了異常處理的部分,只是展示當(dāng)我們對一個復(fù)雜類型使用new[]來動態(tài)分配數(shù)組時其真正的行為是什么,從中可以看到它分配了比預(yù)期多4個字節(jié)的內(nèi)存并用它來保存對象的個數(shù),然后對于后面每一塊空間使用placement new來調(diào)用無參構(gòu)造函數(shù),這也就解釋了為什么這種情況下類必須有無參構(gòu)造函數(shù),最后再將首地址返回。類似的,我們很容易寫出相應(yīng)的delete[]的實(shí)現(xiàn)代碼:
template
由此可見,在默認(rèn)情況下operator new[]與operator new的行為是相同的,operator delete[]與operator delete也是,不同的是new operator與new[] operator、delete operator與delete[] operator。當(dāng)然,我們可以根據(jù)不同的需要來選擇重載帶有和不帶有“[]”的operator new和delete,以滿足不同的具體需求。
把前面類MyClass的代碼稍做修改——注釋掉析構(gòu)函數(shù),然后再來看看程序的輸出:
calling new[] with size=12 address=003A5A58
ctor
ctor
ctor
address of mc=003A5A58
這一次,new[]老老實(shí)實(shí)的申請了12個字節(jié)的內(nèi)存,并且申請的結(jié)果與new[] operator返回的結(jié)果也是相同的,看來,是否在前面添加4個字節(jié),只取決于這個類有沒有析構(gòu)函數(shù),當(dāng)然,這么說并不確切,正確的說法是這個類是否需要調(diào)用構(gòu)造函數(shù),因?yàn)槿缦聝煞N情況下雖然這個類沒聲明析構(gòu)函數(shù),但還是多申請了4個字節(jié):一是這個類中擁有需要調(diào)用析構(gòu)函數(shù)的成員,二是這個類繼承自需要調(diào)用析構(gòu)函數(shù)的類。于是,我們可以遞歸的定義“需要調(diào)用析構(gòu)函數(shù)的類”為以下三種情況之一:
1 顯式的聲明了析構(gòu)函數(shù)的
2 擁有需要調(diào)用析構(gòu)函數(shù)的類的成員的
3 繼承自需要調(diào)用析構(gòu)函數(shù)的類的
類似的,動態(tài)申請簡單類型的數(shù)組時,也不會多申請4個字節(jié)。于是在這兩種情況下,釋放內(nèi)存時使用delete或delete[]都可以,但為養(yǎng)成良好的習(xí)慣,我們還是應(yīng)該注意只要是動態(tài)分配的數(shù)組,釋放時就使用delete[]。
釋放內(nèi)存時如何知道長度
但這同時又帶來了新問題,既然申請無需調(diào)用析構(gòu)函數(shù)的類或簡單類型的數(shù)組時并沒有記錄個數(shù)信息,那么operator delete,或更直接的說free()是如何來回收這塊內(nèi)存的呢?這就要研究malloc()返回的內(nèi)存的結(jié)構(gòu)了。與new[]類似的是,實(shí)際上在malloc()申請內(nèi)存時也多申請了數(shù)個字節(jié)的內(nèi)容,只不過這與所申請的變量的類型沒有任何關(guān)系,我們從調(diào)用malloc時所傳入的參數(shù)也可以理解這一點(diǎn)——它只接收了要申請的內(nèi)存的長度,并不關(guān)系這塊內(nèi)存用來保存什么類型。下面運(yùn)行這樣一段代碼做個實(shí)驗(yàn):
char *p = 0;for(int i = 0; i < 40; i += 4){???char* s = new char[i];?? printf("alloc %2d bytes, address=%p distance=%d/n", i, s, s - p);?? p = s;}
我們直接來看VC2005下Release版本的運(yùn)行結(jié)果,DEBUG版因包含了較多的調(diào)試信息,這里就不分析了:
alloc0 bytes, address=003A36F0 distance=3815152
alloc4 bytes, address=003A3700 distance=16
alloc8 bytes, address=003A3710 distance=16
alloc 12 bytes, address=003A3720 distance=16
alloc 16 bytes, address=003A3738 distance=24
alloc 20 bytes, address=003A84C0 distance=19848
alloc 24 bytes, address=003A84E0 distance=32
alloc 28 bytes, address=003A8500 distance=32
alloc 32 bytes, address=003A8528 distance=40
alloc 36 bytes, address=003A8550 distance=40
每一次分配的字節(jié)數(shù)都比上一次多4,distance值記錄著與上一次分配的差值,第一個差值沒有實(shí)際意義,中間有一個較大的差值,可能是這塊內(nèi)存已經(jīng)被分配了,于是也忽略它。結(jié)果中最小的差值為16字節(jié),直到我們申請16字節(jié)時,這個差值變成了24,后面也有類似的規(guī)律,那么我們可以認(rèn)為申請所得的內(nèi)存結(jié)構(gòu)是如下這樣的:
圖中不難看出,當(dāng)我們要分配一段內(nèi)存時,所得的內(nèi)存地址和上一次的尾地址至少要相距8個字節(jié)(在DEBUG版中還要更多),那么我們可以猜想,這8個字節(jié)中應(yīng)該記錄著與這段所分配的內(nèi)存有關(guān)的信息。觀察這8個節(jié)內(nèi)的內(nèi)容,得到結(jié)果如下:
中右邊為每次分配所得的地址之前8個字節(jié)的內(nèi)容的16進(jìn)制表示,從圖中紅線所表示可以看到,這8個字節(jié)中的第一個字節(jié)乘以8即得到相臨兩次分配時的距離,經(jīng)過試驗(yàn)一次性分配更大的長度可知,第二個字節(jié)也是這個意義,并且代表高8位,也就說前面空的這8個字節(jié)中的前兩個字節(jié)記錄了一次分配內(nèi)存的長度信息,后面的六個字節(jié)可能與空閑內(nèi)存鏈表的信息有關(guān),在翻譯內(nèi)存時用來提供必要的信息。這就解答了前面提出的問題,原來C/C++在分配內(nèi)存時已經(jīng)記錄了足夠充分的信息用于回收內(nèi)存,只不過我們平常不關(guān)心它罷了。
-
C++
+關(guān)注
關(guān)注
22文章
2108瀏覽量
73651 -
變量
+關(guān)注
關(guān)注
0文章
613瀏覽量
28371 -
操作符
+關(guān)注
關(guān)注
0文章
21瀏覽量
9042
原文標(biāo)題:深入C++的new
文章出處:【微信號:C_Expert,微信公眾號:C語言專家集中營】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論