0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

史上最大計算機(jī)芯片誕生 是普通芯片的100倍大小

半導(dǎo)體動態(tài) ? 來源:工程師吳畏 ? 2019-08-22 15:52 ? 次閱讀

目前,最大的計算機(jī)芯片通??梢苑旁谑终评?,有些小的可以放在指尖上。芯片越來越小似乎是行業(yè)整體發(fā)展趨勢和普遍理念?,F(xiàn)在,硅谷的一家創(chuàng)業(yè)公司Cerebras正在挑戰(zhàn)這一觀念。

本周一,該公司公布了據(jù)稱是有史以來最大的計算機(jī)芯片。它和餐盤一樣大——大約是一塊普通芯片的100倍——幾乎不能放在人的大腿上。開發(fā)該芯片的工程師相信它可以用于大型數(shù)據(jù)中心,并有助于加速人工智能AI)的發(fā)展,從自動駕駛汽車到亞馬遜的Alexa,都可以因它的出現(xiàn)而受益。

許多公司正在為AI制造新的芯片,包括傳統(tǒng)的芯片制造商,如英特爾Intel)和高通(Qualcomm),以及美國、英國和中國的其他初創(chuàng)企業(yè)。

谷歌已經(jīng)制造出了這種芯片,并將其應(yīng)用于多個人工智能項目中,包括谷歌助手(google assistant)和谷歌翻譯(google translate),后者可以識別安卓手機(jī)上的語音命令,并將一種語言翻譯成另一種語言。

Cerebras首席執(zhí)行官兼創(chuàng)始人Andrew Feldman稱,“這個領(lǐng)域的增長非常驚人?!八且晃恍酒袠I(yè)資深人士,此前曾將一家公司賣給芯片巨頭AMD。

新AI系統(tǒng)依賴于神經(jīng)網(wǎng)絡(luò)。這些復(fù)雜的數(shù)學(xué)系統(tǒng)松散地基于神經(jīng)元網(wǎng)絡(luò),可以通過分析大量數(shù)據(jù)來學(xué)習(xí)任務(wù)。例如,通過精確定位數(shù)千只貓照片中的模式,神經(jīng)網(wǎng)絡(luò)可以學(xué)會識別貓。

這需要一種特殊的計算能力。如今,大多數(shù)公司在GPU的幫助下分析數(shù)據(jù)。這些芯片最初是為游戲和其他軟件渲染圖像而設(shè)計的,但它們也擅長運(yùn)行驅(qū)動神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)運(yùn)算。

大約六年前,隨著谷歌、Facebook和微軟等科技巨頭在人工智能領(lǐng)域加大投入,它們開始大量購買英偉達(dá)的GPU。在截至2016年夏季的一年里,英偉達(dá)在美國的平均銷售額為1.43億美元,是前一年的兩倍多。但是這些公司想要更多的處理能力。

谷歌專門為神經(jīng)網(wǎng)絡(luò)(Tensor Processing Unit,簡稱TPU)開發(fā)了一種芯片,其他幾家芯片制造商也在追求同樣的目標(biāo)。AI系統(tǒng)與許多芯片協(xié)同工作。麻煩的是,在芯片之間移動大塊數(shù)據(jù)可能會很慢,并且會限制芯片分析該信息的速度。加州大學(xué)洛杉磯分校專門從事人工智能芯片設(shè)計的教授Subramanian Iyer表示,“將所有這些芯片連接在一起,實際上會減慢它們的速度,并消耗大量能量。”硬件制造商正在探索許多不同的選擇。有些人試圖拓寬芯片之間的管道。

Cerebras,一家僅有3年歷史、資金超過2億美元的公司,已經(jīng)采取了一種新穎的方法。這個想法是把所有的數(shù)據(jù)保存在一個巨大的芯片上,這樣系統(tǒng)就可以更快地運(yùn)行。

使用一個大的芯片是非常困難的。計算機(jī)芯片通常安裝在直徑約12英寸的圓形硅片上。每個晶圓片通常包含約100個芯片。許多這樣的芯片,當(dāng)從晶圓片中取出時,就會被扔掉,再也不用了。蝕刻電路進(jìn)入硅是一個如此復(fù)雜的過程,制造商無法消除缺陷。有些電路不起作用。這是芯片制造商保持芯片盡量小的原因之一 - 減少錯誤的空間,因此他們不必拋棄那么多。

Cerebras公司表示,他們已經(jīng)制造了一塊晶圓大小的芯片。其他人也嘗試過這種方法,最著名的是一家名為Trilogy的初創(chuàng)企業(yè),由著名的IBM芯片工程師Gene Amdahl于1980年創(chuàng)立。盡管獲得了2.3億多美元的資金支持,但最終還是覺得這個任務(wù)太難了,五年后就倒閉了。

Cerebras計劃下個月開始向少數(shù)客戶發(fā)貨硬件,F(xiàn)eldman說,這種芯片訓(xùn)練人工智能系統(tǒng)的速度可以比現(xiàn)有硬件快100到1000倍。他和他的工程師們已經(jīng)把他們的巨型芯片分成了更小的部分,或者說是核心,因為他們知道有些核心是不能工作的。該公司的硬件存在重大問題。費(fèi)爾德曼有關(guān)芯片性能的說法尚未得到證實,他也沒有透露芯片的價格。價格將取決于Cerebras及其制造合作伙伴臺積電(TSMC)生產(chǎn)該芯片的效率。

臺積電的高級副總裁BradPaulsen表示,這一過程“需要更多勞動力”。一個如此大的芯片會消耗大量的能量,這意味著保持它的冷卻將是困難和昂貴的。換句話說,構(gòu)建芯片只是任務(wù)的一部分?!斑@對我們來說是一個挑戰(zhàn),”鮑爾森說?!斑@對他們來說也是。”Cerebras計劃將該芯片作為一個更大機(jī)器的一部分出售,該機(jī)器包括用冷凍液體冷卻硅的精密設(shè)備。這與大型科技公司和政府機(jī)構(gòu)習(xí)慣于合作的方式完全不同。

“并不是說人們沒能制造出這種芯片,”伊利諾伊大學(xué)(University of Illinois)教授Rakesh Kumar說,他也在為人工智能研究大型芯片,“問題是他們沒能制造出一種商業(yè)上可行的芯片。”直到今天,新一代的隱形硅片公司Cerebras一直在尋求讓訓(xùn)練成為一種深度學(xué)習(xí)模式,就像從亞馬遜(Amazon)購買牙膏一樣快。

經(jīng)過近三年的靜悄悄的研發(fā),Cerebras今天推出了它的新芯片——這是一款出色的芯片?!熬A級引擎”是1.2萬億個晶體管(有史以來最多),46,225平方毫米(有史以來最大),包括18千兆字節(jié)的片上存儲器(目前市場上最多的芯片)和40萬個處理器核心(估計是最高級的)。

圖:Cerebras的晶片級引擎比典型的Mac鍵盤更大

在斯坦福大學(xué)(StanfordUniversity)的Hot Chips大會上,它引起了很大的轟動。Hot Chips大會是硅行業(yè)為產(chǎn)品介紹和路線圖而舉辦的大型會議之一,與會者中有不同級別的“ooh”和“aah”。你可以從《財富》雜志的Tiernan Ray那里了解更多關(guān)于這種芯片的信息,也可以閱讀Cerebras的白皮書。今天下午,我與公司創(chuàng)始人兼首席執(zhí)行官AndrewFeldman坐下來,討論了他手下的173名工程師在過去幾年里用Benchmark等公司1.12億美元的風(fēng)投資金,在這條街上悄悄做了什么。

做大意味著挑戰(zhàn)

首先,簡要介紹一下為手機(jī)電腦供電的芯片是如何制造的。像臺積電這樣的晶圓代工廠采用標(biāo)準(zhǔn)尺寸的硅片,利用光將晶體管蝕刻到晶圓上,然后將它們分割成單獨(dú)的芯片。晶圓是圓形的,芯片是正方形的,因此將圓細(xì)分成清晰的單個芯片陣列涉及到一些基本的幾何知識。光刻工藝的一大挑戰(zhàn)是,錯誤可能會滲透到制造過程中,需要大量的測試來驗證質(zhì)量,并迫使晶圓廠扔掉性能不佳的芯片。芯片越小、越緊湊,單個芯片失效的可能性就越小,晶圓廠的產(chǎn)量也就越高。高收益等于高利潤。

Cerebras提出了在單個晶圓片上蝕刻一系列單獨(dú)芯片的想法,而不是僅僅使用整個晶圓片本身作為一個巨大的芯片。這使得所有這些單獨(dú)的核心可以彼此直接連接——極大地加快了用于深度學(xué)習(xí)算法的關(guān)鍵反饋循環(huán)——但這是以巨大的制造和設(shè)計挑戰(zhàn)為代價來創(chuàng)建和管理這些芯片的。

Cerebras的技術(shù)架構(gòu)和設(shè)計由聯(lián)合創(chuàng)始人Sean Lie領(lǐng)導(dǎo)。Feldman和Lie之前合作創(chuàng)辦了一家名為SeaMicro的公司,2012年該公司以3.34億美元的價格賣給了AMD。

根據(jù)Feldman的說法,團(tuán)隊遇到的第一個挑戰(zhàn)是處理“劃線”之間的通信。雖然Cerebras芯片包含一個完整的晶圓,但今天的光刻設(shè)備仍然必須像在硅片上蝕刻單個芯片一樣工作。因此,該公司不得不發(fā)明新技術(shù),讓這些單獨(dú)的芯片能夠在整個晶圓上相互通信。在與臺積電合作中,他們不僅發(fā)明了新的通信通道,而且還不得不編寫新的軟件來處理擁有超過萬億晶體管的芯片。

第二個挑戰(zhàn)是良率。當(dāng)一個芯片覆蓋整個硅晶片時,晶片蝕刻上的任何一個缺陷都可能導(dǎo)致整個芯片無法運(yùn)作。這是整個晶圓技術(shù)幾十年來的難題:根據(jù)物理定律,幾乎不可能以完美的精確度反復(fù)蝕刻一萬億個晶體管。Cerebras通過在芯片中添加額外的核心來解決這個問題,當(dāng)核心附近的晶片出現(xiàn)錯誤時,這些核心將被用作備份。

Feldman向我解釋說:“你只需要持有占總量1%,1.5%的額外的核心。” 留下額外的核心使芯片基本上可以自我修復(fù),繞過光刻錯誤,使整個晶片硅芯片可行。

進(jìn)入芯片設(shè)計的未知領(lǐng)域

最初的兩個挑戰(zhàn)——芯片之間的劃線通信和處理良率——已經(jīng)困擾了芯片設(shè)計師幾十年。但它們都是已知的問題,F(xiàn)eldman說,通過使用現(xiàn)代工具重新處理它們,它們實際上更容易解決預(yù)期的問題。 不過,他把這項挑戰(zhàn)比作攀登珠穆朗瑪峰?!熬拖竦谝慌藳]能登上珠穆朗瑪峰一樣,他們說,‘該死,第一部分真的很難。’然后下一組人過來說: ‘那算什么。最后一百碼,才是個問題。”

事實上,根據(jù)Feldman的說法,對Cerebras來說,最困難的挑戰(zhàn)是接下來的三個,因為沒有其他芯片設(shè)計師能通過劃線通信來找出接下來發(fā)生了什么。芯片在運(yùn)行中會變得非常熱,但不同的材料會以不同的速度膨脹。這意味著連接芯片和主板的連接器也需要以同樣的速度進(jìn)行熱膨脹,以免兩者之間產(chǎn)生裂縫。Feldman說:“你如何找到一個可以承受這種壓力的連接器?以前從來沒有人這樣做過,所以我們需要發(fā)明一種材料。因此,我們擁有材料科學(xué)博士,我們必須發(fā)明一種材料,能夠化解其中的一些差異?!币坏┬酒恢圃斐鰜恚托枰?jīng)過測試和封裝,然后運(yùn)送給原始設(shè)備制造商(OEMs),由原始設(shè)備制造商將芯片添加到終端客戶(無論是數(shù)據(jù)中心還是消費(fèi)者筆記本電腦)使用的產(chǎn)品中。

不過,也存在一個挑戰(zhàn):市場上絕對沒有任何東西是為處理整個晶圓芯片而設(shè)計的。

圖: Cerebras設(shè)計了自己的測試和封裝系統(tǒng)來處理它的芯片

現(xiàn)階段,沒有人有這么大的印刷電路板、連接器、冷卻盤,也沒有軟件和工具來調(diào)試它們。Feldman解釋說?!八晕覀冊O(shè)計了整個生產(chǎn)流程,因為從來沒有人這樣做過?!癈erebras的技術(shù)不僅僅是它所銷售的芯片,它還包括所有相關(guān)的機(jī)械設(shè)備,這些機(jī)械設(shè)備是用來制造和封裝這些芯片的。Cerebras的芯片使用15千瓦的功率運(yùn)行,這對于單個芯片來說是一個巨大的功耗,盡管與現(xiàn)代大小的AI集群相當(dāng)。所有這些功能也需要冷卻,Cerebras必須設(shè)計一種新方法來為這么大的芯片提供這兩種功能。它基本上是通過將芯片翻轉(zhuǎn)過來來解決這個問題的,F(xiàn)eldman稱之為“使用z維度”。

“我們的想法是,與傳統(tǒng)的在芯片上橫向移動電源和冷卻設(shè)備不同,電源和冷卻設(shè)備在芯片上的所有點都是垂直傳輸?shù)模源_保兩者的訪問是均勻一致的。”因此,這就是該公司在過去幾年中日以繼夜努力解決的三個挑戰(zhàn)——熱膨脹、封裝和電源/冷卻。

從理論到現(xiàn)實

Cerebras有一個演示芯片(它和我們的頭差不多大),據(jù)報道,它已經(jīng)開始向客戶交付原型。然而,與所有新芯片一樣,最大的挑戰(zhàn)是擴(kuò)大生產(chǎn),以滿足客戶的需求。

對于Cerebras來說,這種情況有點不尋常。由于它在一個晶圓上融入了如此多的計算能力,客戶不必購買數(shù)十或數(shù)百個芯片并將它們拼接在一起來創(chuàng)建一個計算集群。相反,他們可能只需要少量的Cerebras芯片來滿足他們的深度學(xué)習(xí)需求。該公司的下一個階段是實現(xiàn)規(guī)?;⒋_保其芯片的穩(wěn)定交付。該公司將芯片封裝為一個完整的系統(tǒng)“設(shè)備”,其中還包括其專有的冷卻技術(shù)。預(yù)計在未來幾個月會聽到更多關(guān)于Cerebras技術(shù)的細(xì)節(jié),特別是在關(guān)于未來深度學(xué)習(xí)處理工作流程的爭論不斷升溫之際。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    50953

    瀏覽量

    424765
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5476

    瀏覽量

    134298
  • 臺積電
    +關(guān)注

    關(guān)注

    44

    文章

    5651

    瀏覽量

    166672
  • 晶圓
    +關(guān)注

    關(guān)注

    52

    文章

    4934

    瀏覽量

    128108
收藏 人收藏

    評論

    相關(guān)推薦

    飛利浦出售計算機(jī)芯片子公司Xiver

    的投資機(jī)構(gòu)Orange Mills Ventures牽頭的一個財團(tuán)完成。然而,關(guān)于此次交易的財務(wù)條款并未對外披露,因此具體金額和細(xì)節(jié)仍不得而知。 Xiver作為一家專注于計算機(jī)芯片研發(fā)的公司,雖然擁有100名優(yōu)秀的員工團(tuán)隊,但據(jù)稱目前處于虧損狀態(tài)。這或許是飛利浦決定出售其
    的頭像 發(fā)表于 01-09 15:55 ?67次閱讀

    量子計算機(jī)普通計算機(jī)工作原理的區(qū)別

    ? 本文介紹了量子計算機(jī)普通計算機(jī)工作原理的區(qū)別。 量子計算是一個新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計算機(jī)。雖然
    的頭像 發(fā)表于 11-24 11:00 ?361次閱讀
    量子<b class='flag-5'>計算機(jī)</b>與<b class='flag-5'>普通</b><b class='flag-5'>計算機(jī)</b>工作原理的區(qū)別

    工業(yè)中使用哪種類型的計算機(jī)

    工業(yè)計算機(jī):穩(wěn)健應(yīng)用的基本解決方案各行各業(yè)對強(qiáng)大計算解決方案的需求日益增長,導(dǎo)致人們高度依賴工業(yè)計算機(jī)。這些專用系統(tǒng)專為典型消費(fèi)級電腦無法適應(yīng)的環(huán)境而設(shè)計。從制造業(yè)到建筑業(yè),工業(yè)計算機(jī)
    的頭像 發(fā)表于 10-22 17:10 ?326次閱讀
    工業(yè)中使用哪種類型的<b class='flag-5'>計算機(jī)</b>?

    晶體管計算機(jī)和電子管計算機(jī)有什么區(qū)別

    晶體管計算機(jī)和電子管計算機(jī)作為計算機(jī)發(fā)展史上的兩個重要階段,它們在多個方面存在顯著的區(qū)別。以下是對這兩類計算機(jī)在硬件、性能、應(yīng)用以及技術(shù)發(fā)展
    的頭像 發(fā)表于 08-23 15:28 ?1900次閱讀

    晶體管計算機(jī)誕生和特點

    晶體管計算機(jī)誕生標(biāo)志著計算機(jī)技術(shù)的一個重要里程碑,它不僅推動了計算機(jī)硬件的革新,還促進(jìn)了計算機(jī)軟件技術(shù)的發(fā)展。以下是對晶體管
    的頭像 發(fā)表于 08-23 15:06 ?2385次閱讀

    《圖說本源產(chǎn)品》系列之五:“本源悟空”量子計算機(jī)整機(jī)

    1月6日,中國第三代自主超導(dǎo)量子計算機(jī)“本源悟空”上線運(yùn)行。這臺超導(dǎo)量子計算機(jī)搭載72位自主超導(dǎo)量子芯片“悟空芯”,這款芯片誕生于中國首條量
    的頭像 發(fā)表于 08-13 08:22 ?749次閱讀
    《圖說本源產(chǎn)品》系列之五:“本源悟空”量子<b class='flag-5'>計算機(jī)</b>整機(jī)

    龍芯中科亮相第二屆中國計算機(jī)學(xué)會芯片大會

    近日,由CCF體系結(jié)構(gòu)專業(yè)委員會、集成電路設(shè)計專業(yè)委員會、容錯計算專業(yè)委員會、計算機(jī)工程與工藝專業(yè)委員會聯(lián)合舉辦的第二屆中國計算機(jī)學(xué)會芯片大會在上海成功舉辦。大會以“發(fā)展芯技術(shù),智算芯
    的頭像 發(fā)表于 07-30 15:47 ?773次閱讀

    神經(jīng)網(wǎng)絡(luò)芯片普通芯片區(qū)別

    神經(jīng)網(wǎng)絡(luò)芯片普通芯片的區(qū)別是一個復(fù)雜而深入的話題,涉及到計算機(jī)科學(xué)、電子工程、人工智能等多個領(lǐng)域。 定義 神經(jīng)網(wǎng)絡(luò)芯片(Neural Ne
    的頭像 發(fā)表于 07-04 09:30 ?1250次閱讀

    拜登政府啟動新計劃,培育美國計算機(jī)芯片人才

    在全球半導(dǎo)體產(chǎn)業(yè)競爭日益激烈的背景下,美國政府正以前所未有的決心和行動力,推動本土計算機(jī)芯片產(chǎn)業(yè)的發(fā)展。北京時間7月2日,拜登政府宣布了一項重要計劃——勞動力伙伴聯(lián)盟(Workforce
    的頭像 發(fā)表于 07-02 11:40 ?1024次閱讀

    工業(yè)控制計算機(jī)普通個人計算機(jī)相比有何區(qū)別?

    引言 隨著科技的不斷發(fā)展,計算機(jī)在各個領(lǐng)域的應(yīng)用越來越廣泛。在眾多計算機(jī)類型中,工業(yè)控制計算機(jī)普通個人計算機(jī)是兩種常見的
    的頭像 發(fā)表于 06-11 10:45 ?1004次閱讀

    工業(yè)計算機(jī)普通計算機(jī)的區(qū)別

    在信息化和自動化日益發(fā)展的今天,計算機(jī)已經(jīng)成為了我們?nèi)粘I詈凸ぷ髦胁豢苫蛉钡墓ぞ摺H欢?,?b class='flag-5'>計算機(jī)領(lǐng)域中,工業(yè)計算機(jī)普通計算機(jī)雖然都具備基
    的頭像 發(fā)表于 06-06 16:45 ?1476次閱讀

    國產(chǎn)計算機(jī)平臺——兆芯

    兼容的微處理器,這讓兆芯得以開發(fā)X86計算機(jī)芯片。 兆芯堅持自主創(chuàng)新、兼容主流、好用不貴的發(fā)展理念,致力于為用戶提供高效、兼容、安全的自主通用處理器和芯片組產(chǎn)品,構(gòu)建從云到邊再到端等各種應(yīng)用場景下的計算接圈方案,支撐國家產(chǎn)
    的頭像 發(fā)表于 05-28 10:17 ?991次閱讀
    國產(chǎn)<b class='flag-5'>計算機(jī)</b>平臺——兆芯

    馬斯克宣布,將于10萬枚專用芯片中訓(xùn)練新一代聊天機(jī)器人與超級計算機(jī)

    此外,馬斯克計劃將這些芯片整合至一臺超大容量的超級計算機(jī),稱之為“算力超能工場”。他承諾,這個由NVIDIA H100組成的芯片組合將比現(xiàn)有的最大
    的頭像 發(fā)表于 05-27 16:05 ?742次閱讀

    國產(chǎn)計算機(jī)平臺介紹——龍芯

    你了解中國的自主平臺的計算機(jī)嗎?不僅是中國制造,而是由中國自主研發(fā),可以持續(xù)迭代產(chǎn)品,而且還能夠決定產(chǎn)品用途、決定技術(shù)歸屬權(quán)的國產(chǎn)計算機(jī)才是真正中國計算機(jī)。 而作為中國計算機(jī)產(chǎn)業(yè)中最基
    的頭像 發(fā)表于 03-05 11:40 ?807次閱讀
    國產(chǎn)<b class='flag-5'>計算機(jī)</b>平臺介紹——龍芯

    物聯(lián)網(wǎng)芯片普通芯片有什么不同?

    ,通常指的是微控制器芯片或者集成電路(IC),在計算機(jī)、手機(jī)、電視等設(shè)備中被使用。而物聯(lián)網(wǎng)芯片,是專門設(shè)計用于物聯(lián)網(wǎng)設(shè)備的芯片。 第二部分:物聯(lián)網(wǎng)
    的頭像 發(fā)表于 02-01 10:58 ?3015次閱讀