0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于自有芯片的性能分析和應(yīng)用

lC49_半導(dǎo)體 ? 來源:djl ? 作者:nextplatform ? 2019-08-30 15:14 ? 次閱讀

近幾年來,無論是國外的谷歌、Facebook,還是國內(nèi)的百度、阿里巴巴,我們可以看到全球的大型互聯(lián)網(wǎng)公司都開始涉足芯片設(shè)計領(lǐng)域了,且這股趨勢看起來有蔓延之勢。究竟是什么原因推動了這種情況的產(chǎn)生?日前,國外媒體The next platform寫了一篇文章,闡述了這種現(xiàn)象產(chǎn)生的原因。

據(jù)我們粗略統(tǒng)計得知,云巨頭亞馬遜、阿里巴巴、百度、Facebook、谷歌和微軟都在設(shè)計自己的AI加速器芯片。究竟這是當(dāng)下云行業(yè)的一種潮流還是短期現(xiàn)象?相信一千個人有一千個看法。但在我們看來,為特定任務(wù)設(shè)計定制芯片將成為云產(chǎn)業(yè)的主流,屆時處理器、網(wǎng)絡(luò)交換機、AI加速器等領(lǐng)域?qū)艿缴羁痰挠绊?。大膽點的觀點認為,該領(lǐng)域內(nèi)的大多數(shù)芯片市場將不能限免。

縱觀整個集成電路產(chǎn)業(yè)鏈,在一系列新的技術(shù)和經(jīng)濟因素推動下,傳統(tǒng)的芯片設(shè)計和制造模式正在破壞,云巨頭涉足AI芯片設(shè)計只是大規(guī)模定制芯片影響當(dāng)前集成電路供應(yīng)鏈的冰山一角,更多的可能性正在發(fā)生。但造成這種現(xiàn)象的原因并不止一個,很多因素的同時發(fā)生導(dǎo)致了今日的結(jié)果:

1)摩爾定律的死亡;

2)基于多芯片模塊(MCM)和系統(tǒng)級封裝(SIP)的新架構(gòu)方向;

3)芯片設(shè)計工具逐漸成熟為完整的開發(fā)工具鏈;

4)可授權(quán)IP使組裝芯片變得容易;

5)多項目晶圓(MPW)使得晶圓廠有能力實現(xiàn)原型制造和小批量生產(chǎn)客戶編寫的內(nèi)部軟件框架;

6)網(wǎng)絡(luò)巨頭創(chuàng)造的規(guī)模,新興的物聯(lián)網(wǎng)巨頭的影響力也漸增;

摩爾定律的死亡

雖然晶圓廠有不同的觀點,但在很多人看來,摩爾定律實際上已經(jīng)死了。經(jīng)過了數(shù)十年的發(fā)展,現(xiàn)在的晶圓廠已經(jīng)進入了一個瓶頸期,那就是如果繼續(xù)縮小晶體管的尺寸,晶體管將變得更不可靠,且功耗會劇增。且隨著晶體管的縮小,設(shè)計人員現(xiàn)在必須使用額外的晶體管來驗證邏輯塊是否能產(chǎn)生正確的結(jié)果。但是如果設(shè)計人員在芯片上封裝太多的邏輯,那么供電和散熱都會成為一項挑戰(zhàn)。正是這種困境讓芯片設(shè)計師進退兩難。

這就導(dǎo)致了以下結(jié)果:在追求高性能的前沿應(yīng)用里,對晶體管數(shù)量的需求正在爆炸,但這種爆炸卻催生了更大,更熱的芯片,但邏輯的速度的提升,卻不會變得如想象中那么快。與此同時,較老的制造工藝(例如28納米)卻繼續(xù)在發(fā)生余熱,對于越來越多的應(yīng)用來說,這甚至是最好的選擇。

在這種情況下,就使得現(xiàn)有的通用芯片不能滿足云服務(wù)商高性能和客制化的需求。

新的架構(gòu)方向

面對上述困境,設(shè)計工程師想提高芯片性能,還有一個選擇,那就是放棄推動半導(dǎo)體技術(shù)前進,而是轉(zhuǎn)向追求新架構(gòu),達到性能提升的目的。這樣的話,他們就可以退回到前一代甚至兩代的工藝上進行硅片制造。這樣也能夠獲得更小,更冷,更實惠的芯片。從現(xiàn)狀看來,架構(gòu)是硅設(shè)計的新“高地”,很多廠商早已投入其中以獲取領(lǐng)先競爭。

例如,英特爾在其14nm工藝上,將其高端的28核服務(wù)器處理器“SKYLAKE”至強可伸縮服務(wù)器處理器的面積做到了690 mm2。雖然英特爾不再披露其晶體管數(shù)量,但作為對比,Nvida采用臺積電12nm工藝制造的Volta GPU芯片在815 mm 2的硅面積上集成了210億個晶體管。

AMD則在其Epyc服務(wù)器產(chǎn)品線上采用了不同的方法。Epyc是基于AMD的八核Zeppelin die設(shè)計的。每個EPYC處理器中都封裝了四個由AMD proprietary 連接的四個Zeppelin die。

AMD創(chuàng)新的Epyc架構(gòu)是不同架構(gòu)和設(shè)計權(quán)衡的結(jié)果。與其他處理器設(shè)計相比,它使用了不同的互連、邏輯和存儲組合。這就使得EPYC的總晶體管數(shù)量和芯片面積與英特爾和Nvidia的產(chǎn)品處于相同的范圍,但制造成本卻要低得多。AMD暗示,在大芯片里,它們的架構(gòu)還有可能在在單個封裝中繼續(xù)實現(xiàn)微縮。

不同廠商在架構(gòu)上的嘗試,讓云服務(wù)供應(yīng)商看到了新的可能。

芯片設(shè)計工具日趨成熟

集成電路EDA產(chǎn)業(yè)到現(xiàn)在,eSilicon,CadenceMentor,Synopsys等供應(yīng)商能夠為擁有不同預(yù)算的開發(fā)者提供云托管設(shè)計平臺,虛擬原型設(shè)計和驗證服務(wù),降低開發(fā)者的預(yù)算。雖然設(shè)計芯片還做不到像設(shè)計網(wǎng)頁那樣簡單,但如果能夠從這些廠商獲得EDA和IP方面的更多支持,對于芯片新入者來說,是一個巨大的利好。尤其是如果能從他們身上獲得可重復(fù)結(jié)構(gòu)(repeatable structure)的支持,這更是成功的關(guān)鍵。

所謂的可重復(fù)結(jié)構(gòu)可以是高速緩存存儲器塊(cache memory block,),處理器核心(processor core),存儲控制器(memory controller)等部分,也就是那些你可以通過“復(fù)制”來增加總吞吐量的功能。這是擴展內(nèi)存容量和處理器內(nèi)核增加容量和性能的方式。

可以肯定的是,在未來,聘用足夠多的設(shè)計人才去設(shè)計獨特的、擁有高價值邏輯的十億級晶體管變得幾乎不可能。而可重復(fù)的結(jié)構(gòu)和并行架構(gòu)推動了市場需求,并能將數(shù)十億個晶體管放在芯片上。

可授權(quán)和開源的IP模塊

要獲得通用或?qū)S玫目芍貜?fù)結(jié)構(gòu)IP,有許多來源,上面提到的EDA公司是一個選擇,下面介紹的公司,又是另一個選擇。

Arm是數(shù)據(jù)中心可授權(quán)IP的可靠來源;

Wave Computing最近購買了MIPS,這對兩者都是好兆頭,因為人工智能(AI)IP在未來兩年乃至十年,會成為市場關(guān)注的熱點;

RISC-V旨在通過開源處理器內(nèi)核使計算密集型可重復(fù)結(jié)構(gòu)變得大眾化。這個相對新興的架構(gòu)吸引了阿里巴巴,Cadence,谷歌,GlobalFoundries,華為,IBM,Mellanox,Mentor,高通三星知名廠商成為他們的會員。

如果你所統(tǒng)治的市場影足夠大,那么在超現(xiàn)代處理器核心方面,你會有更多的選擇,屆時:

AMD可能會授權(quán)其Epyc服務(wù)器架構(gòu)。

Arm和Qualcomm可能會授權(quán)服務(wù)器級別的Arm 64位內(nèi)核。

IBM可能會授權(quán)其Power9服務(wù)器架構(gòu)。

另外,在互聯(lián)方向,雖然AMD憑借其Epyc MCM領(lǐng)先市場,但其他公司也在投資互連IP,這也讓你有了更多的選擇:

1)英特爾一直致力于其專有的嵌入式多芯片互連橋接(EMIB)點對點片上互連技術(shù)的開發(fā),他們還計劃將EMIB的子集作為高級接口總線(AIB)進行許可。

2)Arm也擁有各種互連設(shè)計,但對于高端基礎(chǔ)設(shè)施市場,Arm授權(quán)其專有的CoreLink CNN(Cache Coherent Network)產(chǎn)品產(chǎn)品。熟悉設(shè)計的人都知道,Arm的CCN設(shè)計針對其較大的Arm 64位Cortex處理器進行了優(yōu)化。

3)SiFive的TileLink是應(yīng)用在RISC-V處理器內(nèi)核上的片上互連。TileLink看起來就像是AMD的Infinity Fabric協(xié)議,而不是Intel的EMIB / AIB點對點互連。

4)USR聯(lián)盟正在向其會員推進和認證其超短距(USR)系統(tǒng)級芯片(SoC)的互連技術(shù)

Fab變得更親民

過去,芯片設(shè)計和制造是不可分割的,如果有任何一方對另一方不熟悉的話,合作就無法進行。但隨著行業(yè)的成熟,某些設(shè)計可以與工廠分開進行,只需要大量的專業(yè)知識去“轉(zhuǎn)移”。過去,有競爭力的處理器公司需要擁有自己的晶圓廠來推動更出色的性能。但去年AMD的表現(xiàn)證明,設(shè)計和工廠分離也可以實現(xiàn)出色的性能。

僅存的的挑戰(zhàn)是降低小型設(shè)計公司的制造驗證設(shè)計的價格。多項目晶圓(MPW)制造能力現(xiàn)已在全球范圍內(nèi)提供。MPW在普通晶圓上“放置”了許多不同的設(shè)計,因此原型和小批量生產(chǎn)就不必承擔(dān)生產(chǎn)晶圓的全部成本。現(xiàn)在開發(fā)者可以從最大的晶圓廠(如GlobalFoundries,三星和臺積電)以及小型和特殊工藝的專業(yè)晶圓廠(如KAST的WaferCatalyst,IMEC / Fraunhofer,Leti / CMP,MOSIS,Muse Semiconductor)獲得MPW服務(wù)和價格。

MPW使小型設(shè)計公司和學(xué)術(shù)研究的開發(fā)項目能從晶圓廠獲得更好的支持。大的設(shè)計客戶則可以通過過往的渠道來訂購大批量晶圓。

軟件框架使硬件加速器成為可能

開源操作環(huán)境和應(yīng)用程序代碼使Web巨頭能夠共同設(shè)計和優(yōu)化數(shù)據(jù)中心基礎(chǔ)架構(gòu)。隨著芯片設(shè)計和制造進一步商品化,這些公司會發(fā)現(xiàn),去體驗和部署包括AI加速器在內(nèi)的新處理器指令集變得越來越簡單。

事實上,人工智能芯片的部署已經(jīng)在進行中。大多數(shù)網(wǎng)絡(luò)巨頭都擁有內(nèi)部的深度學(xué)習(xí)模型開發(fā)環(huán)境,甚至有些還開放給其他開發(fā)者訪問。重要的一點是,他們當(dāng)中的大多數(shù)正在進行AI芯片設(shè)計:

1)AWS已投資Apache MXNet和由亞馬遜開發(fā)的用于消費設(shè)備的AI芯片;

2)百度創(chuàng)建了PaddlePaddle和昆侖芯片;

3)谷歌創(chuàng)造了TensorFlow和幾代TPU芯片

4)微軟創(chuàng)建了Cognitive Toolkit及其FPGA驅(qū)動的Brainwave附加卡;

5)騰訊創(chuàng)建了DI-X平臺(具有專有模型和算法)和ncnn(面向移動),并與芯片廠聯(lián)發(fā)科建立了合作關(guān)系;

6)阿里巴巴尚未加入軟件框架競賽,但他們已發(fā)表了許多關(guān)于深度學(xué)習(xí)架構(gòu)和算法的原創(chuàng)研究論文,并正在開發(fā)一個神經(jīng)處理單元(NPU);

在另一些云供應(yīng)商中,IBM擁有Cognitive Computing和Watson服務(wù),并與許多AI加速器公司在OpenPower方面進行合作。在社交媒體領(lǐng)域,F(xiàn)acebook推動了Caffe和Caffe2的發(fā)展。

然后有幾十家初創(chuàng)公司推出了AI加速器芯片,而Wave Computing在購買MIPS之后,則處于領(lǐng)先的地位。

另外,可以確認的是,很多網(wǎng)絡(luò)巨頭也在投資量子計算,因為他們把它當(dāng)做神經(jīng)網(wǎng)絡(luò)的潛在通配卡加速器,這也不是巧合。

規(guī)模效應(yīng)的推動

一旦網(wǎng)絡(luò)巨頭在其遍布其全球數(shù)據(jù)中心基礎(chǔ)架構(gòu)中部署大規(guī)模的定制芯片,這意味著它會買入數(shù)十十萬乃至百萬計的芯片。如果每個芯片能提高幾瓦的效率,那么整體效率提高則可以很容易就達到數(shù)十兆瓦。與此同時,還能解決盈利的新問題,還可以擁有更快的速度和更高的精度。

此外,網(wǎng)絡(luò)巨頭們往往有晶圓廠的關(guān)系,這就有利于其建立消費設(shè)備的定制芯片,如Google Home和Amazon Dot。如果這些廠商能夠有包括AI加速器在內(nèi)的多款芯片在晶圓廠生產(chǎn)的時候,龐大的數(shù)量將會帶來很大的經(jīng)濟規(guī)模效應(yīng)。

新趨勢帶來的可能影響

我們還沒有看到這些融合趨勢帶來的真正影響。和目前AI加速器的嘗試一樣。這也僅僅只是一個開始。

一個對軟件操作環(huán)境和深度學(xué)習(xí)建模語言有控制權(quán)的網(wǎng)絡(luò)巨頭也將進入芯片設(shè)計領(lǐng)域是一件很容易的事,且是一個很不錯的選擇。因為他們很容易就能獲得最好的EDA工具、開源和可授權(quán)的IP模塊,然后就可以構(gòu)建原型芯片,將其布置到全國各地的服務(wù)器上。

具體來說,網(wǎng)絡(luò)巨頭進入芯片領(lǐng)域,不但可以定制其整數(shù)和浮點的處理器內(nèi)核,還可以基于這些定制的處理器內(nèi)核、定制AI加速器、定制的I / O和內(nèi)存控制器等部件打造SoC。他還可以在其專有的芯片里面優(yōu)化其軟件性能,這在通用的大規(guī)模芯片上是很難做到的。

未來,網(wǎng)絡(luò)巨頭可能會設(shè)計完全不同的芯片。屆時那些專門面向標準化操作環(huán)境和標準指令集設(shè)計的病毒將不會在這些芯片上執(zhí)行。黑客需要更好的手段才能訪問網(wǎng)絡(luò)巨頭的系統(tǒng),尤其是這些系統(tǒng)還可能會定期更改的時候。

到時的數(shù)據(jù)中心,將會是一個截然不同的數(shù)據(jù)中心。

到時的芯片世界,也將會是一個不同的芯片世界。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    51019

    瀏覽量

    425355
  • 摩爾定律
    +關(guān)注

    關(guān)注

    4

    文章

    636

    瀏覽量

    79132
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7586

    瀏覽量

    89008
收藏 人收藏

    評論

    相關(guān)推薦

    Linux性能分析工具大全

    今天浩道跟大家分享關(guān)于linux性能分析過程中常用到的分析工具!
    發(fā)表于 01-05 09:52 ?615次閱讀

    關(guān)于MAX9247/MAX9218串行器/解串器芯片組的性能測試分析

    關(guān)于MAX9247/MAX9218串行器/解串器芯片組的性能測試詳細解析
    發(fā)表于 04-12 06:11

    關(guān)于FPGAs的DSP性能分析

    關(guān)于FPGAs的DSP性能分析
    發(fā)表于 05-07 06:12

    常用無線收發(fā)芯片性能對比分析哪個好?

    常用無線收發(fā)芯片性能對比分析哪個好?選擇收發(fā)芯片時有哪些注意事項?
    發(fā)表于 10-21 06:14

    三星擬在自有芯片家庭娛樂產(chǎn)品上使用Google TV

     據(jù)國外媒體報道,據(jù)知情人士稱,三星電子也許會在基于其自有芯片而非基于英特爾芯片的家庭娛樂產(chǎn)品上使用Google TV軟件。
    發(fā)表于 02-26 09:08 ?674次閱讀

    關(guān)于以色列芯片性能分析和應(yīng)用

    Mobileye 是以色列一家生產(chǎn)協(xié)助駕駛員在駕駛過程中保障乘客安全和減少交通事故的視覺系統(tǒng)的公司,成立于1999年,公司在單目視覺高級駕駛輔助系統(tǒng) (ADAS) 的開發(fā)方面走在世界前列,提供芯片搭載系統(tǒng)和計算機視覺算法運行 DAS 客戶端功能。
    的頭像 發(fā)表于 08-27 10:05 ?5154次閱讀

    關(guān)于小米處理器的性能分析和應(yīng)用

    但如果回頭看,小米雷軍其實在2015年就看到了這一點。在2017年2月28日舉行的澎湃S1發(fā)布會上,雷軍表示,你們看到的這是28號發(fā)布的芯片,其實我們早在28個月前,也就是2014年10月左右,就開始了自有芯片的研發(fā)。也是在這一
    的頭像 發(fā)表于 08-30 11:36 ?3159次閱讀

    關(guān)于圖像處理芯片性能分析和應(yīng)用

    A 股為數(shù)不多的安防芯片優(yōu)質(zhì)標的。公司成立于2004年,是國內(nèi)最早進入安防視頻監(jiān)控相關(guān)領(lǐng)域的企業(yè)之一,公司主要產(chǎn)品為安防視頻監(jiān)控多媒體處理芯片。其中,圖像信號處理(ISP)芯片產(chǎn)品種類覆蓋度高,2016年模擬攝像機ISP
    的頭像 發(fā)表于 08-30 15:33 ?1.9w次閱讀
    <b class='flag-5'>關(guān)于</b>圖像處理<b class='flag-5'>芯片</b>的<b class='flag-5'>性能</b><b class='flag-5'>分析</b>和應(yīng)用

    關(guān)于華芯通芯片“升龍”的性能分析和應(yīng)用

    據(jù)了解,升龍?zhí)幚砥魇侨A芯通第一代服務(wù)器芯片產(chǎn)品,它是兼容ARMv8架構(gòu)的48核處理器芯片,采用目前國際上先進的10納米工藝,在性能上媲美國際市場中高端服務(wù)器主流芯片產(chǎn)品水平。升龍?zhí)幚砥?/div>
    的頭像 發(fā)表于 09-02 10:33 ?2213次閱讀

    關(guān)于國產(chǎn)芯片性能分析和應(yīng)用

    北京中科網(wǎng)威信息技術(shù)有限公司副總裁李源曾于去年4月表示,在網(wǎng)安領(lǐng)域,中國自主研發(fā)的申威CPU開始全面替換Intel的CPU。當(dāng)年底,中科網(wǎng)威將會推出基于申威1621平臺的自主可控萬兆防火墻,這將填補我國在全自主可控安全產(chǎn)品中沒有萬兆防火墻的空白,一舉打破了國外芯片對防火墻的壟斷格局。
    的頭像 發(fā)表于 09-02 11:02 ?4186次閱讀

    關(guān)于阿里巴巴的芯片性能分析和應(yīng)用

    Barefoot Networks開發(fā)了世界上第一個SDN芯片,這種名為Tofino的芯片比現(xiàn)在市場上任何其他芯片都快,以6.5Tb/s的速度處理網(wǎng)絡(luò)數(shù)據(jù)包。這種SDN芯片是一種革命性
    的頭像 發(fā)表于 09-02 14:47 ?4037次閱讀

    關(guān)于蘋果自研Mac芯片的介紹和性能分析

    而如果蘋果開始自研芯片,就必然需要代工廠商,無論是哪一家代工,生產(chǎn)出來的產(chǎn)品不好則罷了,要是優(yōu)勢顯著或者即便是性能差不多,其他廠商都可能會開始自研芯片。這對于英特爾來說并不是一個好消息。
    的頭像 發(fā)表于 09-02 16:32 ?5863次閱讀

    關(guān)于IC芯片性能分析和應(yīng)用

    當(dāng)然,SoC也并非是萬能的。IC芯片在封裝的時候,各有各的外部保護,間隔較遠(才能達到減少對彼此的影響/干擾的效果)。但是將一定數(shù)量的IC封裝在一起,不但會增加工程師的工作量,而且還會出現(xiàn)高頻訊號影響其他IC的情況。
    的頭像 發(fā)表于 09-02 10:38 ?3632次閱讀

    關(guān)于數(shù)字標牌的性能分析和應(yīng)用

    除了硬件得到改進,還有新的軟件可以充分發(fā)揮硬件的功能,幫助改進與消費者的關(guān)系。英特爾匿名觀眾分析等軟件能夠利用芯片組強大的計算能力進行實時數(shù)據(jù)采集、實時分析消費人群數(shù)據(jù)。這款集成式軟件無需拍攝視頻或照片,就可檢測人口統(tǒng)計數(shù)據(jù),例
    的頭像 發(fā)表于 09-19 10:05 ?2022次閱讀

    聆思CSK6芯片性能與應(yīng)用前景分析

    聆思CSK6芯片性能與應(yīng)用前景分析
    的頭像 發(fā)表于 05-15 09:11 ?802次閱讀