0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

B200一經(jīng)面市,就只能做弟弟?Cerebras '巨無(wú)霸'能否逆襲成功?

Leena ? 來(lái)源:jf_69140917 ? 作者:jf_69140917 ? 2024-04-09 10:46 ? 次閱讀

Cerebras Systems 發(fā)布全球最大芯片 WSE3 搭載4萬(wàn)億個(gè)晶體管。與英偉達(dá) B200 GPU 的2080億晶體管相比較,WSE3 的規(guī)模宛如巨人面對(duì)侏儒。其打破常規(guī),不再將一個(gè)晶圓切割為多個(gè)單獨(dú)芯片,而是巧妙地將一整個(gè)12英寸的晶圓轉(zhuǎn)化為一塊龐大芯片,總面積達(dá)到 46225 平方毫米,相當(dāng)于84個(gè)常規(guī)芯片組合在一起。

wKgZomYCnJ6APUQWAAAAK9URceg088.gif

Cerebras 自2015年成立以來(lái),堅(jiān)持不懈地推出一系列 WSE 芯片,到如今第三代 WSE3,每一步都標(biāo)志著其對(duì)制程工藝的深化掌握,這次更是采用了5納米工藝,承臺(tái)積電的技術(shù)優(yōu)勢(shì)。WSE系列以“世界最大芯片”而馳名,專注于滿足AI大模型訓(xùn)練的高性能需求,同時(shí)具備出色的推理能力。在這一領(lǐng)域,Cerebras 不僅自立門戶,更與高通展開合作,以其推理芯片進(jìn)一步增強(qiáng)WSE3功能范疇。

wKgZomYCnJ6APUQWAAAAK9URceg088.gif

WSE3發(fā)布還伴隨一系列承載其強(qiáng)勁計(jì)算力的服務(wù)器產(chǎn)品——CS1、CS2和CS3,這些服務(wù)器產(chǎn)品由AMDCPU賦能,共同構(gòu)成高效的計(jì)算生態(tài),旨在加速現(xiàn)代AI研究及實(shí)用性能向前邁進(jìn)。

憑借其獨(dú)特的設(shè)計(jì)理念和規(guī)模優(yōu)勢(shì),WSE3預(yù)示著 AI 硬件技術(shù)的一次飛躍。異常強(qiáng)大的算力背后,是Cerebras對(duì)芯片工藝的極致追求與不被常規(guī)限制的創(chuàng)新膽識(shí),WSE3正將這份精神通過(guò)每一次AI模型的訓(xùn)練和推理,傳遞至整個(gè)科技行業(yè)。

盡管有些人可能懷疑 WSE3 不過(guò)是一張巨型晶圓,但其真正的價(jià)值并不在于其體積,而在于其背后獨(dú)特的設(shè)計(jì)理念和架構(gòu)。WSE3 構(gòu)造包括84個(gè)區(qū)域,其中包含高達(dá)90萬(wàn)個(gè)計(jì)算核心,每個(gè)區(qū)域內(nèi)含有超過(guò)1萬(wàn)個(gè)核心。從架構(gòu)層面來(lái)看,由核心(Cores)、芯片單元(Die)以及晶圓(Wafer)共同構(gòu)成。

wKgZomYCnJ6APUQWAAAAK9URceg088.gif

wKgaomYCnKCAUuHKAAsg70N80iU841.png

Cerebras的計(jì)算架構(gòu)大致可以劃分為WSE、SwarmX 和 MemoryX三個(gè)部分。在處理大模型訓(xùn)練時(shí),MemoryX存儲(chǔ)設(shè)備儲(chǔ)存權(quán)重?cái)?shù)據(jù),這些數(shù)據(jù)由DDR和Flash技術(shù)共同構(gòu)成,最大提供高達(dá)1200TB存儲(chǔ)空間。該設(shè)計(jì)意味著巨大數(shù)量級(jí)的模型參數(shù)可以一次性加載到設(shè)備中進(jìn)行處理。在訓(xùn)練過(guò)程中,MemoryX上的權(quán)重?cái)?shù)據(jù)將通過(guò)SwarmX傳輸至每個(gè)CS系統(tǒng)中的WSE,由WSE處理數(shù)據(jù)并完成向前傳播計(jì)算過(guò)程,生產(chǎn)出預(yù)測(cè)值。然后,通過(guò)損失函數(shù)計(jì)算出預(yù)測(cè)值與真實(shí)值間的梯度,用這些梯度進(jìn)行反向傳播計(jì)算所有權(quán)重的梯度。計(jì)算得出的梯度數(shù)據(jù)隨后回到SwarmX,經(jīng)過(guò)匯總處理為全局梯度后送回MemoryX,MemoryX內(nèi)的計(jì)算單元會(huì)直接更新權(quán)重,為下一輪的訓(xùn)練做準(zhǔn)備。

wKgZomYCnJ6APUQWAAAAK9URceg088.gif

wKgZomYCnKCAAwB5AAgVr6DBGP8239.png

Cerebras Systems把一個(gè)晶圓的全部晶體管都用上,并未按常規(guī)將其切割,而是構(gòu)建一個(gè)具有90萬(wàn)個(gè)計(jì)算核心的密集網(wǎng)絡(luò)進(jìn)行集中處理。松散耦合的計(jì)算和存儲(chǔ)設(shè)計(jì)讓 Cerebras 的 CS 系列服務(wù)器能夠輕松實(shí)現(xiàn)數(shù)據(jù)并行,不使用其他復(fù)雜的并行訓(xùn)練方法。Cerebras 這一獨(dú)特設(shè)計(jì)理念使其成為AI 訓(xùn)練領(lǐng)域的強(qiáng)勁競(jìng)爭(zhēng)者。

深入探究Cerebras革命性 WSE 芯片會(huì)發(fā)現(xiàn),每一顆計(jì)算核心都擁有一塊48KB的SRAM存儲(chǔ)單元。令人驚訝的是48KB被巧妙劃分為八個(gè)6KB小區(qū)域,每個(gè)小區(qū)以32位寬數(shù)據(jù)通道進(jìn)行操作,合起來(lái)就是一條256位寬數(shù)據(jù)高速公路。計(jì)算核心在每一個(gè)時(shí)鐘周期都能夠處理高達(dá)兩個(gè)64位的讀取通道以及一個(gè)64位的寫入通道,合計(jì)可達(dá)192位。

wKgZomYCnJ6APUQWAAAAK9URceg088.gif

wKgaomYCnKGAB97sAAnpRZFsrgw582.png

Cerebras的真正威力還在于它的分布式存儲(chǔ)與計(jì)算架構(gòu),使之擅長(zhǎng)高效解決非結(jié)構(gòu)化的稀疏計(jì)算問(wèn)題,尤其是那些需要處理海量零值或接近零值數(shù)據(jù)的場(chǎng)景。為此,WSE3 提供令人震撼的 21PB每秒的片上存儲(chǔ)帶寬,以及超乎想象的214PB每秒的網(wǎng)絡(luò)交互帶寬。

wKgZomYCnJ6APUQWAAAAK9URceg088.gif

wKgaomYCnKKAO6kRABFzghBM77w378.png

Cerebras的設(shè)計(jì)理念深入人心,無(wú)需切割晶圓,就將所有晶體管整合成一個(gè)緊密相連的網(wǎng)絡(luò),該網(wǎng)絡(luò)由高達(dá)90萬(wàn)個(gè)計(jì)算核心組成,實(shí)現(xiàn)集中加工處理。與此同時(shí),Cerebras系列的CS服務(wù)器得益于計(jì)算與存儲(chǔ)分離的創(chuàng)新設(shè)計(jì),輕松實(shí)現(xiàn)數(shù)據(jù)并行處理,省去其他復(fù)雜并行訓(xùn)練方案的需要。這一設(shè)計(jì)不光為Cerebras贏得了與英偉達(dá)抗衡的實(shí)力,也為面對(duì)越來(lái)越龐大的模型規(guī)?!覀冋f(shuō)的是達(dá)到萬(wàn)億級(jí)參數(shù)——提供解決方案。在AI訓(xùn)練領(lǐng)域,Cerebras的 Wafer Scale Engine 設(shè)計(jì)無(wú)疑是它的巔峰時(shí)刻。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    455

    文章

    50818

    瀏覽量

    423716
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    9693

    瀏覽量

    138201
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30898

    瀏覽量

    269128
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    北美運(yùn)營(yíng)商AT&T認(rèn)證中的VoLTE測(cè)試項(xiàng)

    北美運(yùn)營(yíng)商AT&T的認(rèn)證測(cè)試內(nèi)容涵蓋了多個(gè)方面,以確保設(shè)備和服務(wù)的質(zhì)量、兼容性以及用戶體驗(yàn)。在AT&T的認(rèn)證測(cè)試中,VoLTE(VoiceoverLTE)測(cè)試項(xiàng)是個(gè)重要的組成部分
    的頭像 發(fā)表于 12-06 16:52 ?145次閱讀
    北美運(yùn)營(yíng)商AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T認(rèn)證中的VoLTE測(cè)試項(xiàng)

    NVIDIA DGX B200首次面向零售市場(chǎng):配備8塊B200 GPU

    10月13日最新消息,NVIDIA的DGX B200 AI服務(wù)器近期已在Broadberry上架,標(biāo)價(jià)515,410美元(相當(dāng)于約364.2萬(wàn)元人民幣)。   自發(fā)布以來(lái),Blackwell架構(gòu)就備受業(yè)界矚目,NVIDIA首席執(zhí)行官黃仁勛對(duì)其贊譽(yù)有加,微軟、Meta等科技巨頭也迅速跟進(jìn)采用。
    的頭像 發(fā)表于 10-14 14:34 ?621次閱讀

    onsemi LV/MV MOSFET 產(chǎn)品介紹 &amp;amp;amp; 行業(yè)應(yīng)用

    系列MOSFET介紹。4.onsemiLV/MVMOSFET市場(chǎng)&amp;應(yīng)用。技術(shù)亮點(diǎn)onsemi最新代T10系列MOSFET優(yōu)勢(shì)&amp;市場(chǎng)前景。學(xué)習(xí)收獲期望了解onsemiSi
    的頭像 發(fā)表于 10-13 08:06 ?398次閱讀
    onsemi LV/MV MOSFET 產(chǎn)品介紹 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; 行業(yè)應(yīng)用

    無(wú)人駕駛遇上&amp;apos;超級(jí)WiFi&amp;apos;,低速無(wú)人駕駛已成為了主要趨勢(shì)?

    嘿,各位工業(yè)大佬們!今天咱們來(lái)聊個(gè)又酷又實(shí)用的話題 - 工業(yè)無(wú)人駕駛!不過(guò),別以為這只是在工廠里溜達(dá)溜達(dá)的小推車,我們要聊的可是能在礦山里"跑酷"的大家伙! 想象下,在個(gè)塵土飛揚(yáng)的露天礦場(chǎng),幾輛
    的頭像 發(fā)表于 09-10 10:28 ?239次閱讀
    無(wú)人駕駛遇上&<b class='flag-5'>amp</b>;<b class='flag-5'>apos</b>;超級(jí)WiFi&<b class='flag-5'>amp</b>;<b class='flag-5'>apos</b>;,低速無(wú)人駕駛已成為了主要趨勢(shì)?

    FS201資料(pcb &amp;amp; DEMO &amp;amp; 原理圖)

    電子發(fā)燒友網(wǎng)站提供《FS201資料(pcb &amp; DEMO &amp; 原理圖).zip》資料免費(fèi)下載
    發(fā)表于 07-16 11:24 ?0次下載

    北美運(yùn)營(yíng)商AT&amp;amp;amp;T認(rèn)證入庫(kù)產(chǎn)品范圍名單相關(guān)

    AT&amp;T作為全球領(lǐng)先的通信服務(wù)運(yùn)營(yíng)商之,通過(guò)AT&amp;T認(rèn)證不僅是對(duì)產(chǎn)品質(zhì)量的認(rèn)可,更是產(chǎn)品打開北美市場(chǎng)大門的重要憑證。然而,或許您還不清楚AT&amp;T認(rèn)證入庫(kù)的產(chǎn)品
    的頭像 發(fā)表于 06-28 16:58 ?457次閱讀
    北美運(yùn)營(yíng)商AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T認(rèn)證入庫(kù)產(chǎn)品范圍名單相關(guān)

    解讀北美運(yùn)營(yíng)商,AT&amp;amp;amp;T的認(rèn)證分類與認(rèn)證內(nèi)容分享

    在數(shù)字化日益深入的今天,通信技術(shù)的穩(wěn)定與安全對(duì)于個(gè)人、企業(yè)乃至整個(gè)國(guó)家都至關(guān)重要。作為北美通信領(lǐng)域的領(lǐng)軍者,AT&amp;T直致力于為用戶提供高效、可靠的通信服務(wù)。而在這背后,AT&amp;T
    的頭像 發(fā)表于 06-05 17:27 ?610次閱讀
    解讀北美運(yùn)營(yíng)商,AT&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;T的認(rèn)證分類與認(rèn)證內(nèi)容分享

    特斯拉加碼AI布局:xAI將采購(gòu)30萬(wàn)塊英偉達(dá)B200芯片

    特斯拉CEO埃隆·馬斯克近日在社交平臺(tái)上公布了項(xiàng)重要消息,旗下的人工智能初創(chuàng)公司xAI計(jì)劃采購(gòu)30萬(wàn)塊英偉達(dá)B200 AI芯片。這大規(guī)模采購(gòu)計(jì)劃標(biāo)志著特斯拉在人工智能領(lǐng)域布局的進(jìn)
    的頭像 發(fā)表于 06-05 09:21 ?660次閱讀

    英特爾任命Kevin O&amp;apos;Buckley為代工部門負(fù)責(zé)人

    英特爾近日宣布了項(xiàng)重要的人事任命,Kevin O&apos;Buckley被正式任命為代工部門的新負(fù)責(zé)人。他將接替即將退休的Stuart Pann,后者在英特爾新的運(yùn)營(yíng)模式下,成功創(chuàng)建了代工部門并為其發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。
    的頭像 發(fā)表于 05-15 09:48 ?411次閱讀

    智向未來(lái),2024高通&amp;amp;廣和通邊緣智能技術(shù)進(jìn)化日成功舉辦

    3月28日,2024高通&amp;廣和通邊緣智能技術(shù)進(jìn)化日在深圳成功舉辦,多位行業(yè)嘉賓和技術(shù)專家齊聚堂,深度探討如何利用多技術(shù)融合邊緣智能打造數(shù)智化社會(huì)、推動(dòng)新質(zhì)生產(chǎn)力發(fā)展。
    的頭像 發(fā)表于 03-29 10:41 ?985次閱讀
    智向未來(lái),2024高通&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;廣和通邊緣智能技術(shù)進(jìn)化日<b class='flag-5'>成功</b>舉辦

    英偉達(dá)發(fā)布新代AI芯片B200

    在美國(guó)加州圣何塞舉辦的英偉達(dá)GTC生態(tài)大會(huì)上,英偉達(dá)CEO黃仁勛以場(chǎng)震撼人心的演講,正式推出了公司的新代GPU——Blackwell。作為Blackwell家族的首款芯片,B200以其前所未有的性能表現(xiàn)和革命性的技術(shù)創(chuàng)新,再
    的頭像 發(fā)表于 03-20 10:07 ?978次閱讀

    英偉達(dá)發(fā)布性能大幅提升的新款B200 AI GPU

    英偉達(dá)宣稱,B200在性能上比以往最好的GPU快30倍不止。由它構(gòu)成的服務(wù)器集群相比上代,運(yùn)算能力飛躍性提升,甚至能使大語(yǔ)言模型的訓(xùn)練速度翻番。
    的頭像 發(fā)表于 03-20 09:37 ?801次閱讀

    C程序中可用的存儲(chǔ)類有哪些?

    register 存儲(chǔ)類用于定義存儲(chǔ)在寄存器中而不是 RAM 中的局部變量。這意味著變量的最大尺寸等于寄存器的大小(通常是個(gè)詞),且不能對(duì)它應(yīng)用元的 &apos;&amp;&
    發(fā)表于 03-15 12:32 ?380次閱讀

    深維科技-北京大學(xué)合作團(tuán)隊(duì)在FPGA&amp;apos;24布線加速競(jìng)賽中奪得佳績(jī)!

    美國(guó)西部時(shí)間2024年3月4日,我司與北大合作團(tuán)隊(duì)在FPGA&apos;24布線加速競(jìng)賽中獲得優(yōu)異的成績(jī)。
    的頭像 發(fā)表于 03-07 11:43 ?1178次閱讀
    深維科技-北京大學(xué)合作團(tuán)隊(duì)在FPGA&<b class='flag-5'>amp</b>;<b class='flag-5'>apos</b>;24布線加速競(jìng)賽中奪得佳績(jī)!

    戴爾發(fā)布英偉達(dá)B200 AI GPU:高功耗達(dá)1000W,創(chuàng)新性冷卻工程設(shè)計(jì)必要

    市場(chǎng)傳言,這款B200雖然運(yùn)算性能更強(qiáng),卻又面臨著驚人的能耗,最高或可至1000W,同比H100增長(zhǎng)超過(guò)40%。由于搭載Hopper架構(gòu)及HBM3e高帶寬內(nèi)存,英偉達(dá)B200被行業(yè)視為運(yùn)行速度最高的AI芯片;
    的頭像 發(fā)表于 03-05 09:30 ?1943次閱讀