0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Cerebras Systems宣布推出有史以來(lái)最大的芯片Wafer Scale Engine

M8kW_icbank ? 來(lái)源:半導(dǎo)體行業(yè)觀察 ? 2019-12-10 14:05 ? 次閱讀

昨天,初創(chuàng)公司Cerebras Systems宣布推出有史以來(lái)最大的芯片Wafer Scale Engine(WSE)。

據(jù)悉,WSE擁有1.2萬(wàn)億個(gè)晶體管,這是一個(gè)什么概念呢?比較一下,1971年英特爾首款4004處理器擁有2300個(gè)晶體管,最近,AMD推出的最新處理器擁有320億個(gè)晶體管。由此可見(jiàn)WSE規(guī)模之龐大。

大多數(shù)芯片是在12英寸硅晶圓上制造的,并在芯片工廠(chǎng)中批量處理。但Cerebras Systems芯片是在單個(gè)晶圓上通過(guò)互聯(lián)實(shí)現(xiàn)的單芯片。這些互連設(shè)計(jì)使其全部保持高速運(yùn)行,可使萬(wàn)億個(gè)晶體管全部一起工作。

Cerebras Wafer Scale Engine專(zhuān)門(mén)針對(duì)處理人工智能應(yīng)用程序而設(shè)計(jì)的。該公司本周正在加利福尼亞州帕洛阿爾托的斯坦福大學(xué)舉行的Hot Chips會(huì)議上討論這項(xiàng)設(shè)計(jì)。

此前,三星已經(jīng)制造了一個(gè)閃存芯片,即eUFS,擁有2萬(wàn)億個(gè)晶體管。但Cerebras芯片擁有400,000個(gè)核心,42,225平方毫米。它比最大的Nvidia圖形處理單元大 56.7倍,該單元的尺寸為815平方毫米和211億個(gè)晶體管。

與傳統(tǒng)芯片相比,WSE還包含3000倍的高速片上存儲(chǔ)器,并且具有10000倍的存儲(chǔ)器帶寬。

該芯片來(lái)自Andrew Feldman領(lǐng)導(dǎo)的團(tuán)隊(duì),后者曾創(chuàng)建微型服務(wù)器公司SeaMicro,并以3.34億美元的價(jià)格出售給了AMD。

芯片尺寸在AI中非常重要,因?yàn)榇笮酒梢愿斓靥幚?a target="_blank">信息,在更短的時(shí)間內(nèi)產(chǎn)生答案。減少訓(xùn)練時(shí)間,使研究人員能夠測(cè)試更多想法,使用更多數(shù)據(jù)并解決新問(wèn)題。谷歌,F(xiàn)acebook,OpenAI,騰訊,百度和許多專(zhuān)業(yè)人士都認(rèn)為,今天人工智能的主要限制是訓(xùn)練需要很長(zhǎng)時(shí)間。因此,縮短訓(xùn)練時(shí)間就消除了整個(gè)行業(yè)進(jìn)步的主要瓶頸。

當(dāng)然,芯片制造商通常不會(huì)制造如此大的芯片。在單個(gè)晶圓上,在制造過(guò)程中通常會(huì)產(chǎn)生一些雜質(zhì),雜質(zhì)會(huì)導(dǎo)致芯片發(fā)生故障。如果晶圓上只有一個(gè)芯片,它有雜質(zhì)的幾率是100%,雜質(zhì)會(huì)使芯片失效。但Cerebras設(shè)計(jì)的芯片是有冗余的,因此一種雜質(zhì)不會(huì)破壞整個(gè)芯片。

WSE有很多創(chuàng)新,通過(guò)解決限制芯片尺寸的數(shù)十年的技術(shù)挑戰(zhàn) - 例如交叉光罩連接,良率,功率輸送,以及封裝等,Cerebras Systems首席執(zhí)行官費(fèi)爾德曼說(shuō)?!懊總€(gè)架構(gòu)決策都是為了優(yōu)化AI工作的性能。結(jié)果是,Cerebras WSE根據(jù)工作量提供了數(shù)百或數(shù)千倍于現(xiàn)有解決方案的性能,只需很小的功耗和空間?!?/p>

WSE通過(guò)加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練的所有元素來(lái)實(shí)現(xiàn)這些性能提升。神經(jīng)網(wǎng)絡(luò)是多級(jí)計(jì)算反饋回路。較快的輸入在循環(huán)中移動(dòng),循環(huán)學(xué)習(xí)的速度越快,從而減少了訓(xùn)練時(shí)間。

Linley Group首席分析師Linley Gwennap在一份聲明中說(shuō):“Cerebras憑借其晶圓級(jí)技術(shù)實(shí)現(xiàn)了巨大的飛躍,在單片晶圓上實(shí)現(xiàn)了更多的處理性能?!?為了實(shí)現(xiàn)這一壯舉,該公司已經(jīng)解決了一系列工程難題,包括實(shí)施高速芯片到芯片通信,解決制造缺陷,封裝如此大的芯片,以及電源和冷卻等問(wèn)題。通過(guò)將各種學(xué)科的頂級(jí)工程師聚集在一起,Cerebras在短短幾年內(nèi)創(chuàng)造了新技術(shù)并交付了產(chǎn)品

據(jù)悉,該芯片面積比最大的GPU多56.7倍,Cerebras WSE提供更多內(nèi)核進(jìn)行計(jì)算,更多內(nèi)存靠近內(nèi)核,因此內(nèi)核可以高效運(yùn)行。由于這些大量的內(nèi)核和內(nèi)存位于單個(gè)芯片上,因此所有通信都在芯片內(nèi)進(jìn)行,這意味著它的低延遲通信帶寬是巨大的,因此內(nèi)核組可以以最高效率進(jìn)行協(xié)作。

Cerebras WSE中的46,225平方毫米的硅包含400,000個(gè)AI優(yōu)化,無(wú)緩存,無(wú)開(kāi)銷(xiāo)的計(jì)算內(nèi)核和18千兆字節(jié)的本地、分布式、超高速SRAM內(nèi)存,內(nèi)存帶寬為每秒9 PB。這些內(nèi)核通過(guò)細(xì)粒度、全硬件、片上網(wǎng)狀連接通信網(wǎng)絡(luò)連接在一起,可提供每秒100 petabits的總帶寬。更多內(nèi)核,更多本地內(nèi)存和低延遲高帶寬結(jié)構(gòu)共同構(gòu)成了加速AI工作的最佳架構(gòu)。

更多核心

WSE包含400,000個(gè)AI優(yōu)化的計(jì)算核心。被稱(chēng)為稀疏線(xiàn)性代數(shù)核心的SLAC,計(jì)算核心靈活、可編程,并針對(duì)支持所有神經(jīng)網(wǎng)絡(luò)計(jì)算的稀疏線(xiàn)性代數(shù)進(jìn)行了優(yōu)化。SLAC的可編程性確保內(nèi)核可以在不斷變化的機(jī)器學(xué)習(xí)領(lǐng)域中運(yùn)行所有神經(jīng)網(wǎng)絡(luò)算法。

由于稀疏線(xiàn)性代數(shù)核心針對(duì)神經(jīng)網(wǎng)絡(luò)計(jì)算基元進(jìn)行了優(yōu)化,因此它們可實(shí)現(xiàn)最佳利用率 - 通常是GPU的三倍或四倍。此外,WSE核心包括Cerebras發(fā)明的稀疏性收集技術(shù),以加速稀疏工作負(fù)載(包含零的工作負(fù)載)的計(jì)算性能,如深度學(xué)習(xí)。

零在深度學(xué)習(xí)計(jì)算中很普遍。通常,要相乘的向量和矩陣中的大多數(shù)元素都是零。然而,乘以零是浪費(fèi)硅、功率和時(shí)間,因?yàn)闆](méi)有新的信息。

因?yàn)镚PU和張量處理單元是密集的執(zhí)行引擎 - 設(shè)計(jì)為永不遇到零的引擎 - 它們即使在零時(shí)也會(huì)乘以每個(gè)元素。當(dāng)50%-98%的數(shù)據(jù)為零時(shí),如深度學(xué)習(xí)中的情況一樣,大多數(shù)乘法都被浪費(fèi)了。由于Cerebras稀疏線(xiàn)性代數(shù)核不會(huì)乘以零,所有零數(shù)據(jù)都會(huì)被濾除,并且可以在硬件中跳過(guò)。

存儲(chǔ)

內(nèi)存是每個(gè)計(jì)算機(jī)體系結(jié)構(gòu)的關(guān)鍵組件。更接近計(jì)算的內(nèi)存轉(zhuǎn)換為更快的計(jì)算,更低的延遲和更好的數(shù)據(jù)移動(dòng)功效。高性能深度學(xué)習(xí)需要大量計(jì)算,并且頻繁訪(fǎng)問(wèn)數(shù)據(jù)。這需要計(jì)算核心和存儲(chǔ)器之間的緊密接近,這在GPU中并非如此,其中絕大多數(shù)存儲(chǔ)器是很緩慢的,且在片外。

Cerebras Wafer Scale Engine包含更多內(nèi)核,具有比迄今為止任何芯片更多的本地內(nèi)存,并且在一個(gè)時(shí)鐘周期內(nèi)可以通過(guò)其核心訪(fǎng)問(wèn)18GB的片上內(nèi)存。WSE上的核心本地內(nèi)存集合可提供每秒9PB的內(nèi)存帶寬 - 比領(lǐng)先的圖形處理單元多3,000倍的片上內(nèi)存和10,000倍的內(nèi)存帶寬。

通信

Swarm通信結(jié)構(gòu)是WSE上使用的處理器間通信結(jié)構(gòu),它可以傳統(tǒng)通信技術(shù)的功耗的一小部分實(shí)現(xiàn)突破性帶寬和低延遲。Swarm提供低延遲、高帶寬的2D網(wǎng)格,可連接WSE上的所有400,000個(gè)核心,每秒帶寬為100 petabits。

路由方面,Swarm為每個(gè)神經(jīng)網(wǎng)絡(luò)提供獨(dú)特的優(yōu)化通信路徑。軟件根據(jù)正在運(yùn)行的特定用戶(hù)定義的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),配置通過(guò)400,000個(gè)核心的最佳通信路徑以連接處理器。

Cerebras WSE的總帶寬為每秒100 petabits。不需要諸如TCP / IP和MPI之類(lèi)的通信協(xié)議支持,因此避免了它們的性能損失。該架構(gòu)中的通信能量成本遠(yuǎn)低于每比特1焦耳,這比GPU低近兩個(gè)數(shù)量級(jí)。通過(guò)結(jié)合大量帶寬和極低的延遲,Swarm通信結(jié)構(gòu)使Cerebras WSE能夠比任何當(dāng)前可用的解決方案更快地學(xué)習(xí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    51057

    瀏覽量

    425656
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    9723

    瀏覽量

    138620
  • Systems
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    20481

原文標(biāo)題:反其道而行,世界最大芯片誕生

文章出處:【微信號(hào):icbank,微信公眾號(hào):icbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Cerebras提交IPO申請(qǐng),估值達(dá)41億美元

    近日,晶圓級(jí)AI芯片領(lǐng)域的佼佼者Cerebras Systems正式啟動(dòng)了在美國(guó)納斯達(dá)克市場(chǎng)的首次公開(kāi)募股(IPO)程序,股票代碼定為「CBRS」。此次IPO的承銷(xiāo)商包括花旗集團(tuán)、巴克萊、瑞銀投資
    的頭像 發(fā)表于 10-09 17:04 ?544次閱讀

    X射線(xiàn)激光器發(fā)射有史以來(lái)強(qiáng)脈沖

    有史以來(lái)最強(qiáng)大的X射線(xiàn)脈沖達(dá)到近太瓦功率 據(jù)英國(guó)《新科學(xué)家》網(wǎng)站22日?qǐng)?bào)道,美國(guó)SLAC國(guó)家加速器實(shí)驗(yàn)室的直線(xiàn)加速器相干光源(LCLS)發(fā)出有史以來(lái)強(qiáng)X射線(xiàn)脈沖。該脈沖僅持續(xù)4.4萬(wàn)億分之一秒,產(chǎn)生
    的頭像 發(fā)表于 07-29 06:24 ?259次閱讀

    韓國(guó)芯片出口飆升,創(chuàng)下有史以來(lái)新高

    在2024年的盛夏七月,一個(gè)令人矚目的經(jīng)濟(jì)數(shù)字猶如一股清流,在炎熱的季節(jié)中為人們帶來(lái)了清新的氣息。韓國(guó)海關(guān)總署近日公布的初步數(shù)據(jù)顯示,2024年6月,韓國(guó)的芯片出口額達(dá)到了驚人的134億美元,同比激增50.9%,這一數(shù)字不僅刷新了歷史紀(jì)錄,也向世界展示了韓國(guó)高科技產(chǎn)業(yè)的強(qiáng)勁實(shí)力。
    的頭像 發(fā)表于 07-01 16:12 ?1012次閱讀

    AI初創(chuàng)公司Cerebras秘密申請(qǐng)IPO

    近日,全球科技圈再次掀起波瀾。據(jù)外媒最新報(bào)道,被譽(yù)為明星AI芯片獨(dú)角獸的Cerebras Systems,已經(jīng)悄然向證券監(jiān)管機(jī)構(gòu)遞交了首次公開(kāi)募股(IPO)的秘密申請(qǐng)。這一動(dòng)作無(wú)疑為當(dāng)前火爆的AI
    的頭像 發(fā)表于 06-27 17:44 ?750次閱讀

    AI初出企業(yè)Cerebras已申請(qǐng)IPO!稱(chēng)發(fā)布的AI芯片比GPU更適合大模型訓(xùn)練

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,據(jù)外媒報(bào)道,研發(fā)出世界最大芯片的明星AI芯片獨(dú)角獸Cerebras Systems已向證券監(jiān)管機(jī)構(gòu)秘密申
    的頭像 發(fā)表于 06-26 00:09 ?2952次閱讀
    AI初出企業(yè)<b class='flag-5'>Cerebras</b>已申請(qǐng)IPO!稱(chēng)發(fā)布的AI<b class='flag-5'>芯片</b>比GPU更適合大模型訓(xùn)練

    Power Integrations推出SCALE-iFlex XLT系列門(mén)極驅(qū)動(dòng)器

    近日,Power Integrations公司宣布推出全新的SCALE-iFlex? XLT系列雙通道即插即用型門(mén)極驅(qū)動(dòng)器。這一系列產(chǎn)品專(zhuān)注于中高壓逆變器應(yīng)用,能夠滿(mǎn)足市場(chǎng)對(duì)于高性能門(mén)極驅(qū)動(dòng)器的日益增長(zhǎng)的需求。
    的頭像 發(fā)表于 05-27 10:18 ?500次閱讀

    Groq籌資約3億美元,向Cerebras等對(duì)手看齊?

    這家由谷歌專(zhuān)屬芯片張量處理單元發(fā)明人之一的喬納森·羅斯于近8年前創(chuàng)建的公司,致力于研發(fā)可替代英偉達(dá)芯片的產(chǎn)品。據(jù)了解,包括Groq和Cerebras在內(nèi)的近20家AI芯片開(kāi)發(fā)商已累計(jì)籌
    的頭像 發(fā)表于 05-23 15:49 ?503次閱讀

    Power Integrations推出SCALE-iFlex XLT系列雙通道即插即用型門(mén)極驅(qū)動(dòng)器

    深耕于中高壓逆變器應(yīng)用門(mén)極驅(qū)動(dòng)器技術(shù)領(lǐng)域的知名公司Power Integrations(納斯達(dá)克股票代號(hào):POWI)今日宣布推出SCALE-iFlex XLT系列雙通道即插即用型門(mén)極驅(qū)動(dòng)器,適配單個(gè)
    的頭像 發(fā)表于 05-22 10:03 ?486次閱讀

    芯科科技宣布推出全新的xG22E系列無(wú)線(xiàn)片上系統(tǒng)(SoC)

    Silicon Labs(亦稱(chēng)“芯科科技”)今日宣布推出全新的xG22E系列無(wú)線(xiàn)片上系統(tǒng)(SoC),這是芯科科技有史以來(lái)首個(gè)設(shè)計(jì)目標(biāo)為可在無(wú)電池、能量采集應(yīng)用所需超低功耗范圍內(nèi)運(yùn)行的產(chǎn)品系列。
    的頭像 發(fā)表于 04-24 16:14 ?597次閱讀

    B200一經(jīng)面市,就只能做弟弟?Cerebras &apos;巨無(wú)霸&apos;能否逆襲成功?

    Cerebras Systems 發(fā)布全球最大芯片 WSE3 搭載4萬(wàn)億個(gè)晶體管。與英偉達(dá) B200 GPU 的2080億晶體管相比較,WSE3 的規(guī)模宛如巨人面對(duì)侏儒。其打破常規(guī),不
    的頭像 發(fā)表于 04-09 10:46 ?372次閱讀
    B200一經(jīng)面市,就只能做弟弟?<b class='flag-5'>Cerebras</b> &apos;巨無(wú)霸&apos;能否逆襲成功?

    世界第一AI芯片發(fā)布!世界紀(jì)錄直接翻倍 晶體管達(dá)4萬(wàn)億個(gè)

    3月14日消息,今天,美國(guó)芯片初創(chuàng)公司Cerebras Systems,推出了全球最強(qiáng)的第三代晶圓級(jí)AI加速芯片“WSE-3”(
    的頭像 發(fā)表于 03-21 17:34 ?643次閱讀

    Cerebras推出性能翻倍的WSE-3 AI芯片

    Cerebras Systems近日推出Wafer Scale Engine 3(WSE-3)
    的頭像 發(fā)表于 03-20 11:32 ?951次閱讀

    Cerebras Systems推出迄今最快AI芯片,搭載4萬(wàn)億晶體管

    美國(guó)芯片初創(chuàng)企業(yè)Cerebras Systems近日在人工智能領(lǐng)域取得了重大突破,成功推出了全新的5納米級(jí)“晶圓級(jí)引擎3”(WSE-3)芯片
    的頭像 發(fā)表于 03-19 11:29 ?835次閱讀

    最強(qiáng)AI芯片發(fā)布,Cerebras推出性能翻倍的WSE-3 AI芯片

    近日,芯片行業(yè)的領(lǐng)軍企業(yè)Cerebras Systems宣布推出其革命性的產(chǎn)品——Wafer
    的頭像 發(fā)表于 03-19 09:31 ?1181次閱讀
    最強(qiáng)AI<b class='flag-5'>芯片</b>發(fā)布,<b class='flag-5'>Cerebras</b><b class='flag-5'>推出</b>性能翻倍的WSE-3 AI<b class='flag-5'>芯片</b>

    Cerebras推出WSE-3 AI芯片,比NVIDIA H100大56倍

    Cerebras 是一家位于美國(guó)加利福尼亞州的初創(chuàng)公司,2019 年進(jìn)入硬件市場(chǎng),其首款超大人工智能芯片名為 Wafer Scale Engine
    的頭像 發(fā)表于 03-14 17:11 ?2069次閱讀
    <b class='flag-5'>Cerebras</b><b class='flag-5'>推出</b>WSE-3 AI<b class='flag-5'>芯片</b>,比NVIDIA H100大56倍