近幾年來,無論是國外的谷歌、Facebook,還是國內(nèi)的百度、阿里巴巴,我們可以看到全球的大型互聯(lián)網(wǎng)公司都開始涉足芯片設(shè)計領(lǐng)域了,且這股趨勢看起來有蔓延之勢。究竟是什么原因推動了這種情況的產(chǎn)生?日前,國外媒體The next platform寫了一篇文章,闡述了這種現(xiàn)象產(chǎn)生的原因。
據(jù)我們粗略統(tǒng)計得知,云巨頭亞馬遜、阿里巴巴、百度、Facebook、谷歌和微軟都在設(shè)計自己的AI加速器芯片。究竟這是當(dāng)下云行業(yè)的一種潮流還是短期現(xiàn)象?相信一千個人有一千個看法。但在我們看來,為特定任務(wù)設(shè)計定制芯片將成為云產(chǎn)業(yè)的主流,屆時處理器、網(wǎng)絡(luò)交換機、AI加速器等領(lǐng)域?qū)艿缴羁痰挠绊?。大膽點的觀點認為,該領(lǐng)域內(nèi)的大多數(shù)芯片市場將不能限免。
縱觀整個集成電路產(chǎn)業(yè)鏈,在一系列新的技術(shù)和經(jīng)濟因素推動下,傳統(tǒng)的芯片設(shè)計和制造模式正在破壞,云巨頭涉足AI芯片設(shè)計只是大規(guī)模定制芯片影響當(dāng)前集成電路供應(yīng)鏈的冰山一角,更多的可能性正在發(fā)生。但造成這種現(xiàn)象的原因并不止一個,很多因素的同時發(fā)生導(dǎo)致了今日的結(jié)果:
1)摩爾定律的死亡;
2)基于多芯片模塊(MCM)和系統(tǒng)級封裝(SIP)的新架構(gòu)方向;
3)芯片設(shè)計工具逐漸成熟為完整的開發(fā)工具鏈;
4)可授權(quán)IP使組裝芯片變得容易;
5)多項目晶圓(MPW)使得晶圓廠有能力實現(xiàn)原型制造和小批量生產(chǎn)客戶編寫的內(nèi)部軟件框架;
6)網(wǎng)絡(luò)巨頭創(chuàng)造的規(guī)模,新興的物聯(lián)網(wǎng)巨頭的影響力也漸增;
摩爾定律的死亡
雖然晶圓廠有不同的觀點,但在很多人看來,摩爾定律實際上已經(jīng)死了。經(jīng)過了數(shù)十年的發(fā)展,現(xiàn)在的晶圓廠已經(jīng)進入了一個瓶頸期,那就是如果繼續(xù)縮小晶體管的尺寸,晶體管將變得更不可靠,且功耗會劇增。且隨著晶體管的縮小,設(shè)計人員現(xiàn)在必須使用額外的晶體管來驗證邏輯塊是否能產(chǎn)生正確的結(jié)果。但是如果設(shè)計人員在芯片上封裝太多的邏輯,那么供電和散熱都會成為一項挑戰(zhàn)。正是這種困境讓芯片設(shè)計師進退兩難。
這就導(dǎo)致了以下結(jié)果:在追求高性能的前沿應(yīng)用里,對晶體管數(shù)量的需求正在爆炸,但這種爆炸卻催生了更大,更熱的芯片,但邏輯的速度的提升,卻不會變得如想象中那么快。與此同時,較老的制造工藝(例如28納米)卻繼續(xù)在發(fā)生余熱,對于越來越多的應(yīng)用來說,這甚至是最好的選擇。
在這種情況下,就使得現(xiàn)有的通用芯片不能滿足云服務(wù)商高性能和客制化的需求。
新的架構(gòu)方向
面對上述困境,設(shè)計工程師想提高芯片性能,還有一個選擇,那就是放棄推動半導(dǎo)體技術(shù)前進,而是轉(zhuǎn)向追求新架構(gòu),達到性能提升的目的。這樣的話,他們就可以退回到前一代甚至兩代的工藝上進行硅片制造。這樣也能夠獲得更小,更冷,更實惠的芯片。從現(xiàn)狀看來,架構(gòu)是硅設(shè)計的新“高地”,很多廠商早已投入其中以獲取領(lǐng)先競爭。
例如,英特爾在其14nm工藝上,將其高端的28核服務(wù)器處理器“SKYLAKE”至強可伸縮服務(wù)器處理器的面積做到了690 mm2。雖然英特爾不再披露其晶體管數(shù)量,但作為對比,Nvida采用臺積電12nm工藝制造的Volta GPU芯片在815 mm 2的硅面積上集成了210億個晶體管。
AMD則在其Epyc服務(wù)器產(chǎn)品線上采用了不同的方法。Epyc是基于AMD的八核Zeppelin die設(shè)計的。每個EPYC處理器中都封裝了四個由AMD proprietary 連接的四個Zeppelin die。
AMD創(chuàng)新的Epyc架構(gòu)是不同架構(gòu)和設(shè)計權(quán)衡的結(jié)果。與其他處理器設(shè)計相比,它使用了不同的互連、邏輯和存儲組合。這就使得EPYC的總晶體管數(shù)量和芯片面積與英特爾和Nvidia的產(chǎn)品處于相同的范圍,但制造成本卻要低得多。AMD暗示,在大芯片里,它們的架構(gòu)還有可能在在單個封裝中繼續(xù)實現(xiàn)微縮。
不同廠商在架構(gòu)上的嘗試,讓云服務(wù)供應(yīng)商看到了新的可能。
芯片設(shè)計工具日趨成熟
集成電路EDA產(chǎn)業(yè)到現(xiàn)在,eSilicon,Cadence,Mentor,Synopsys等供應(yīng)商能夠為擁有不同預(yù)算的開發(fā)者提供云托管設(shè)計平臺,虛擬原型設(shè)計和驗證服務(wù),降低開發(fā)者的預(yù)算。雖然設(shè)計芯片還做不到像設(shè)計網(wǎng)頁那樣簡單,但如果能夠從這些廠商獲得EDA和IP方面的更多支持,對于芯片新入者來說,是一個巨大的利好。尤其是如果能從他們身上獲得可重復(fù)結(jié)構(gòu)(repeatable structure)的支持,這更是成功的關(guān)鍵。
所謂的可重復(fù)結(jié)構(gòu)可以是高速緩存存儲器塊(cache memory block,),處理器核心(processor core),存儲控制器(memory controller)等部分,也就是那些你可以通過“復(fù)制”來增加總吞吐量的功能。這是擴展內(nèi)存容量和處理器內(nèi)核增加容量和性能的方式。
可以肯定的是,在未來,聘用足夠多的設(shè)計人才去設(shè)計獨特的、擁有高價值邏輯的十億級晶體管變得幾乎不可能。而可重復(fù)的結(jié)構(gòu)和并行架構(gòu)推動了市場需求,并能將數(shù)十億個晶體管放在芯片上。
可授權(quán)和開源的IP模塊
要獲得通用或?qū)S玫目芍貜?fù)結(jié)構(gòu)IP,有許多來源,上面提到的EDA公司是一個選擇,下面介紹的公司,又是另一個選擇。
Arm是數(shù)據(jù)中心可授權(quán)IP的可靠來源;
Wave Computing最近購買了MIPS,這對兩者都是好兆頭,因為人工智能(AI)IP在未來兩年乃至十年,會成為市場關(guān)注的熱點;
RISC-V旨在通過開源處理器內(nèi)核使計算密集型可重復(fù)結(jié)構(gòu)變得大眾化。這個相對新興的架構(gòu)吸引了阿里巴巴,Cadence,谷歌,GlobalFoundries,華為,IBM,Mellanox,Mentor,高通和三星等知名廠商成為他們的會員。
如果你所統(tǒng)治的市場影足夠大,那么在超現(xiàn)代處理器核心方面,你會有更多的選擇,屆時:
AMD可能會授權(quán)其Epyc服務(wù)器架構(gòu)。
Arm和Qualcomm可能會授權(quán)服務(wù)器級別的Arm 64位內(nèi)核。
IBM可能會授權(quán)其Power9服務(wù)器架構(gòu)。
另外,在互聯(lián)方向,雖然AMD憑借其Epyc MCM領(lǐng)先市場,但其他公司也在投資互連IP,這也讓你有了更多的選擇:
1)英特爾一直致力于其專有的嵌入式多芯片互連橋接(EMIB)點對點片上互連技術(shù)的開發(fā),他們還計劃將EMIB的子集作為高級接口總線(AIB)進行許可。
2)Arm也擁有各種互連設(shè)計,但對于高端基礎(chǔ)設(shè)施市場,Arm授權(quán)其專有的CoreLink CNN(Cache Coherent Network)產(chǎn)品產(chǎn)品。熟悉設(shè)計的人都知道,Arm的CCN設(shè)計針對其較大的Arm 64位Cortex處理器進行了優(yōu)化。
3)SiFive的TileLink是應(yīng)用在RISC-V處理器內(nèi)核上的片上互連。TileLink看起來就像是AMD的Infinity Fabric協(xié)議,而不是Intel的EMIB / AIB點對點互連。
4)USR聯(lián)盟正在向其會員推進和認證其超短距(USR)系統(tǒng)級芯片(SoC)的互連技術(shù)
Fab變得更親民
過去,芯片設(shè)計和制造是不可分割的,如果有任何一方對另一方不熟悉的話,合作就無法進行。但隨著行業(yè)的成熟,某些設(shè)計可以與工廠分開進行,只需要大量的專業(yè)知識去“轉(zhuǎn)移”。過去,有競爭力的處理器公司需要擁有自己的晶圓廠來推動更出色的性能。但去年AMD的表現(xiàn)證明,設(shè)計和工廠分離也可以實現(xiàn)出色的性能。
僅存的的挑戰(zhàn)是降低小型設(shè)計公司的制造驗證設(shè)計的價格。多項目晶圓(MPW)制造能力現(xiàn)已在全球范圍內(nèi)提供。MPW在普通晶圓上“放置”了許多不同的設(shè)計,因此原型和小批量生產(chǎn)就不必承擔(dān)生產(chǎn)晶圓的全部成本。現(xiàn)在開發(fā)者可以從最大的晶圓廠(如GlobalFoundries,三星和臺積電)以及小型和特殊工藝的專業(yè)晶圓廠(如KAST的WaferCatalyst,IMEC / Fraunhofer,Leti / CMP,MOSIS,Muse Semiconductor)獲得MPW服務(wù)和價格。
MPW使小型設(shè)計公司和學(xué)術(shù)研究的開發(fā)項目能從晶圓廠獲得更好的支持。大的設(shè)計客戶則可以通過過往的渠道來訂購大批量晶圓。
軟件框架使硬件加速器成為可能
開源操作環(huán)境和應(yīng)用程序代碼使Web巨頭能夠共同設(shè)計和優(yōu)化數(shù)據(jù)中心基礎(chǔ)架構(gòu)。隨著芯片設(shè)計和制造進一步商品化,這些公司會發(fā)現(xiàn),去體驗和部署包括AI加速器在內(nèi)的新處理器指令集變得越來越簡單。
事實上,人工智能芯片的部署已經(jīng)在進行中。大多數(shù)網(wǎng)絡(luò)巨頭都擁有內(nèi)部的深度學(xué)習(xí)模型開發(fā)環(huán)境,甚至有些還開放給其他開發(fā)者訪問。重要的一點是,他們當(dāng)中的大多數(shù)正在進行AI芯片設(shè)計:
1)AWS已投資Apache MXNet和由亞馬遜開發(fā)的用于消費設(shè)備的AI芯片;
2)百度創(chuàng)建了PaddlePaddle和昆侖芯片;
3)谷歌創(chuàng)造了TensorFlow和幾代TPU芯片
4)微軟創(chuàng)建了Cognitive Toolkit及其FPGA驅(qū)動的Brainwave附加卡;
5)騰訊創(chuàng)建了DI-X平臺(具有專有模型和算法)和ncnn(面向移動),并與芯片廠聯(lián)發(fā)科建立了合作關(guān)系;
6)阿里巴巴尚未加入軟件框架競賽,但他們已發(fā)表了許多關(guān)于深度學(xué)習(xí)架構(gòu)和算法的原創(chuàng)研究論文,并正在開發(fā)一個神經(jīng)處理單元(NPU);
在另一些云供應(yīng)商中,IBM擁有Cognitive Computing和Watson服務(wù),并與許多AI加速器公司在OpenPower方面進行合作。在社交媒體領(lǐng)域,F(xiàn)acebook推動了Caffe和Caffe2的發(fā)展。
然后有幾十家初創(chuàng)公司推出了AI加速器芯片,而Wave Computing在購買MIPS之后,則處于領(lǐng)先的地位。
另外,可以確認的是,很多網(wǎng)絡(luò)巨頭也在投資量子計算,因為他們把它當(dāng)做神經(jīng)網(wǎng)絡(luò)的潛在通配卡加速器,這也不是巧合。
規(guī)模效應(yīng)的推動
一旦網(wǎng)絡(luò)巨頭在其遍布其全球數(shù)據(jù)中心基礎(chǔ)架構(gòu)中部署大規(guī)模的定制芯片,這意味著它會買入數(shù)十十萬乃至百萬計的芯片。如果每個芯片能提高幾瓦的效率,那么整體效率提高則可以很容易就達到數(shù)十兆瓦。與此同時,還能解決盈利的新問題,還可以擁有更快的速度和更高的精度。
此外,網(wǎng)絡(luò)巨頭們往往有晶圓廠的關(guān)系,這就有利于其建立消費設(shè)備的定制芯片,如Google Home和Amazon Dot。如果這些廠商能夠有包括AI加速器在內(nèi)的多款芯片在晶圓廠生產(chǎn)的時候,龐大的數(shù)量將會帶來很大的經(jīng)濟規(guī)模效應(yīng)。
新趨勢帶來的可能影響
我們還沒有看到這些融合趨勢帶來的真正影響。和目前AI加速器的嘗試一樣。這也僅僅只是一個開始。
一個對軟件操作環(huán)境和深度學(xué)習(xí)建模語言有控制權(quán)的網(wǎng)絡(luò)巨頭也將進入芯片設(shè)計領(lǐng)域是一件很容易的事,且是一個很不錯的選擇。因為他們很容易就能獲得最好的EDA工具、開源和可授權(quán)的IP模塊,然后就可以構(gòu)建原型芯片,將其布置到全國各地的服務(wù)器上。
具體來說,網(wǎng)絡(luò)巨頭進入芯片領(lǐng)域,不但可以定制其整數(shù)和浮點的處理器內(nèi)核,還可以基于這些定制的處理器內(nèi)核、定制AI加速器、定制的I / O和內(nèi)存控制器等部件打造SoC。他還可以在其專有的芯片里面優(yōu)化其軟件性能,這在通用的大規(guī)模芯片上是很難做到的。
未來,網(wǎng)絡(luò)巨頭可能會設(shè)計完全不同的芯片。屆時那些專門面向標準化操作環(huán)境和標準指令集設(shè)計的病毒將不會在這些芯片上執(zhí)行。黑客需要更好的手段才能訪問網(wǎng)絡(luò)巨頭的系統(tǒng),尤其是這些系統(tǒng)還可能會定期更改的時候。
到時的數(shù)據(jù)中心,將會是一個截然不同的數(shù)據(jù)中心。
到時的芯片世界,也將會是一個不同的芯片世界。
-
芯片
+關(guān)注
關(guān)注
456文章
51019瀏覽量
425355 -
摩爾定律
+關(guān)注
關(guān)注
4文章
636瀏覽量
79132 -
網(wǎng)絡(luò)
+關(guān)注
關(guān)注
14文章
7586瀏覽量
89008
發(fā)布評論請先 登錄
相關(guān)推薦
評論