0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“網(wǎng)紅”芯片Groq讓英偉達(dá)蒸發(fā)5600億

AI芯天下 ? 來源:AI芯天下 ? 2024-02-27 15:10 ? 次閱讀

前言: 鑒于ChatGPT的廣泛應(yīng)用,引發(fā)了AI算力需求的迅猛增長(zhǎng),使得英偉達(dá)的AI芯片供不應(yīng)求,出現(xiàn)大規(guī)模短缺。如今,英偉達(dá)似乎在面對(duì)更多挑戰(zhàn)。

比英偉達(dá)GPU快10倍的LPU

近兩天,一家名為Groq的美國(guó)人工智能公司受到了廣泛關(guān)注,其主要原因在于其自主研發(fā)的LPU芯片在人工智能推理技術(shù)上取得了突破。

通過優(yōu)化架構(gòu)和減少內(nèi)存瓶頸,Groq的LPU芯片在大模型處理方面展現(xiàn)出高效率和低延遲的特點(diǎn),速度遠(yuǎn)超英偉達(dá)GPU,每秒生成速度接近500 tokens,而GPT-4僅40 tokens。

因此,Groq LPU被譽(yù)為[史上最快的大模型技術(shù)]。

81f18d12-d4a5-11ee-a297-92fbcf53809c.png

Groq LPU的工作原理與英偉達(dá)的GPU不同,它采用了名為時(shí)序指令集計(jì)算機(jī)(Temporal Instruction Set Computer)架構(gòu),使用存儲(chǔ)器為靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),其速度比GPU所用的高帶寬存儲(chǔ)器(HBM)快約20倍。

據(jù)Groq在2024年1月的第一個(gè)公開基準(zhǔn)測(cè)試,由Groq LPU驅(qū)動(dòng)的Meta Llama 2-70B模型,推理性能比其他頂級(jí)云計(jì)算供應(yīng)商快18倍。

artificialanalysis.ai給出的測(cè)評(píng)結(jié)果也顯示,Groq的吞吐量速度稱得上是[遙遙領(lǐng)先]。

總結(jié)起來,Groq的架構(gòu)建立在小內(nèi)存,大算力上,因此有限的被處理的內(nèi)容對(duì)應(yīng)著極高的算力,導(dǎo)致其速度非??臁?/p>

有分析人士稱,在A100和H100相對(duì)緊缺的時(shí)代,LPU或許會(huì)成為大模型開發(fā)商的新選擇。

820d6802-d4a5-11ee-a297-92fbcf53809c.png

Grop部署起來甚至比英偉達(dá)要貴

當(dāng)初Groq以其閃電般的速度令A(yù)I行業(yè)為之震撼。

然而,在震撼之余,許多業(yè)界人士核算后發(fā)現(xiàn),這種速度背后的代價(jià)可能過于高昂。

Groq的LPU芯片摒棄了HBM,僅依賴SRAM進(jìn)行計(jì)算。

盡管這種方式確實(shí)帶來了令人矚目的計(jì)算速度,但其成本效益問題卻備受質(zhì)疑。

值得關(guān)注的是,盡管Groq在速度上表現(xiàn)出色,但其背后的成本卻相當(dāng)高昂。

若以未來三年運(yùn)行成本計(jì)算,Groq的硬件采購(gòu)成本高達(dá)1144萬美元,而運(yùn)營(yíng)成本至少為76.2萬美元。

據(jù)此估算,在同等吞吐量下,Groq的硬件成本約為H100的40倍,能耗成本則是10倍。

若考慮運(yùn)營(yíng)三年,Groq硬件的購(gòu)買成本為114.4萬美元,運(yùn)營(yíng)成本為76.2萬。

另一方面,對(duì)于一個(gè)8卡的H100盒子,硬件購(gòu)買成本為30萬美元,運(yùn)營(yíng)成本約為7.2萬或稍低。

由于Groq內(nèi)存容量相對(duì)較?。?30MB),在運(yùn)行Llama-270b模型時(shí),需配備305張Groq卡才能滿足需求,而使用H100僅需8張卡。

因此,從當(dāng)前價(jià)格來看,在同等吞吐量下,Groq的硬件成本是H100的40倍,能耗成本是10倍。

換言之,Groq的高速性能是建立在有限的單卡吞吐能力基礎(chǔ)之上的。

為實(shí)現(xiàn)與H100相同的吞吐量,Groq需采用更多張顯卡。

在此背景下,[速度]成為了Groq的一把雙刃劍。

8222e222-d4a5-11ee-a297-92fbcf53809c.png

Groq喊話[三年內(nèi)趕超英偉達(dá)]

近期,一位自稱為Groq員工的用戶在與網(wǎng)絡(luò)用戶互動(dòng)時(shí)表示,Groq致力于成為最快速的大規(guī)模模型硬件,并誓言在三年內(nèi)超越英偉達(dá)。

然而,截至2月20日美股收盤,英偉達(dá)股價(jià)單日跌幅達(dá)4.35%,創(chuàng)下去年10月以來最大單日跌幅,市值一夜之間縮水780億美元(約合5600億元人民幣)。

盡管Groq速度迅猛,但價(jià)格較高,目前尚不能與英偉達(dá)抗衡。SRAM技術(shù)面積大、功耗高,早已以IP內(nèi)核形式集成至系統(tǒng)級(jí)芯片(SoC),而非單獨(dú)應(yīng)用,其未來發(fā)展?jié)摿h(yuǎn)不及HBM(高帶寬內(nèi)存)。

在單位容量?jī)r(jià)格、性能及功耗方面,英偉達(dá)GPU所采用的HBM技術(shù)均優(yōu)于SRAM。

從技術(shù)和性能角度看,Groq目前尚無法撼動(dòng)英偉達(dá)的地位。

原因在于,英偉達(dá)GPU產(chǎn)品具有通用性,而Groq產(chǎn)品為ASIC(專用集成電路),并非通用產(chǎn)品,而是定制產(chǎn)品。

換言之,任何人工智能算法均可使用英偉達(dá)的H200,但僅Mixtral和Llama2能采用Groq的LPU。

欲使用Groq產(chǎn)品,大模型公司需先明確需求、指定規(guī)格,然后進(jìn)行功能驗(yàn)證,最終生產(chǎn)出的產(chǎn)品方可投入使用。

英偉達(dá)財(cái)報(bào)再次印證了其在人工智能浪潮中成為最大贏家的地位。

英偉達(dá)于北京時(shí)間2月22日發(fā)布截至2024年1月28日的四季度業(yè)績(jī)報(bào)告。

報(bào)告顯示,公司季度營(yíng)收創(chuàng)紀(jì)錄達(dá)到221億美元,遠(yuǎn)超英偉達(dá)自身及華爾街預(yù)期,同比增長(zhǎng)265%。

全年?duì)I收同樣創(chuàng)下新高,達(dá)到609億美元,同比增長(zhǎng)126%。

英偉達(dá)預(yù)計(jì)本季度營(yíng)收將進(jìn)一步攀升至240億美元。財(cái)報(bào)發(fā)布后,其股價(jià)盤后一度漲超10%。

82387736-d4a5-11ee-a297-92fbcf53809c.png

結(jié)尾:

Groq架構(gòu)的特點(diǎn)是小內(nèi)存和大算力,適合頻繁數(shù)據(jù)搬運(yùn)的場(chǎng)景,速度快但單卡吞吐能力有限,需要更多卡來保證同等吞吐量,速度既是優(yōu)勢(shì)也是劣勢(shì)。

此外,由于GPU的生態(tài)極為發(fā)達(dá),其中英偉達(dá)的GPU不僅性能強(qiáng)大,在性能卓越的同時(shí),還聚集了大量用戶和豐富的生態(tài)環(huán)境。

相比之下,Groq 目前僅能為少數(shù)大型模型提供服務(wù),想要在低延遲領(lǐng)域建立持續(xù)優(yōu)勢(shì),需要拓寬服務(wù)范圍并進(jìn)一步減少總體成本。


審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7578

    瀏覽量

    165367
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3894

    瀏覽量

    92628
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    1

    文章

    398

    瀏覽量

    14968
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    304

    瀏覽量

    6033
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1580

    瀏覽量

    8403

原文標(biāo)題:熱點(diǎn)丨“網(wǎng)紅”芯片Groq讓英偉達(dá)蒸發(fā)5600億

文章出處:【微信號(hào):World_2078,微信公眾號(hào):AI芯天下】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦

    英偉達(dá)市值一夜蒸發(fā)近2萬億 英偉達(dá)股價(jià)下跌超8%

    在美東時(shí)間周一,美股三大指數(shù)集體收跌,截至收盤,英偉達(dá)股價(jià)下跌超8%,英偉達(dá)市值一夜蒸發(fā)2650
    的頭像 發(fā)表于 03-04 10:19 ?357次閱讀

    突發(fā)!英偉達(dá)H20芯片在華訂單大增,買家曝光

    人們對(duì) DeepSeek 可能致使人工智能芯片需求下滑的擔(dān)憂。 此前,DeepSeek 爆火給英偉達(dá)帶來了不小的沖擊。2025 年 1 月,DeepSeek 發(fā)布 R1 模型的開源版本,英偉
    的頭像 發(fā)表于 02-26 00:10 ?2347次閱讀

    剛剛!英偉達(dá)最新回應(yīng)!

    12月10日消息,據(jù)報(bào)道,英偉達(dá)市值一夜蒸發(fā)掉了889美元(約合人民幣6460元)。 據(jù)此前媒體報(bào)道,近日
    的頭像 發(fā)表于 12-10 18:13 ?598次閱讀

    英偉達(dá)市值一夜蒸發(fā)1.13萬億 ASML暴跌16.26%創(chuàng)最大的單日跌幅

    10月15日,美股三大指數(shù)集體收跌,科技股多數(shù)下跌;費(fèi)城半導(dǎo)體指數(shù)跌超5%。 英偉達(dá)股價(jià)跌超4%;英偉達(dá)公司的市值蒸發(fā)1587.1
    的頭像 發(fā)表于 10-16 14:28 ?730次閱讀

    英偉達(dá)Blackwell芯片量產(chǎn)加速,Q4預(yù)計(jì)出貨達(dá)45萬片

    摩根士丹利最新發(fā)布的報(bào)告揭示了英偉達(dá)在AI芯片領(lǐng)域的重大進(jìn)展,其最新力作Blackwell芯片已成功步入量產(chǎn)階段,預(yù)示著英偉
    的頭像 發(fā)表于 09-27 15:02 ?1028次閱讀

    英偉達(dá)市值蒸發(fā)近2000美元

    英偉達(dá)(Nvidia)在周四的美股交易中遭遇了重大挫折,股價(jià)暴跌超過6%,市值瞬間蒸發(fā)近2000美元。這一戲劇性下滑源于公司最新財(cái)報(bào)未能滿足華爾街的超高預(yù)期,盡管其上一季度收入實(shí)現(xiàn)了
    的頭像 發(fā)表于 08-30 15:38 ?571次閱讀

    AI芯片巨頭英偉達(dá)漲超4% 英偉達(dá)市值暴增7500

    誰(shuí)是美股最靚的仔?在人工智能浪潮之下AI芯片巨頭英偉達(dá)肯定有一席之地,特別是現(xiàn)在全球資本市場(chǎng)動(dòng)蕩之際,業(yè)界分析師多認(rèn)為英偉達(dá)是最佳“反彈股”
    的頭像 發(fā)表于 08-13 15:33 ?1250次閱讀

    科技看點(diǎn):摩根大通詳解“英偉達(dá)芯片問題”馬斯克560薪酬方案引爭(zhēng)議

    給大家分享一些科技巨頭的最新消息: 摩根大通詳解“英偉達(dá)芯片問題” 在摩根大通的一份研報(bào)透露出“英偉達(dá)
    的頭像 發(fā)表于 08-05 16:18 ?822次閱讀

    英偉達(dá)或面臨重大技術(shù)性拋售 英偉達(dá)市值一夜蒸發(fā)1.4萬億

    我們都知道英偉達(dá)芯片大賣使得英偉達(dá)股價(jià)不斷飆升,持續(xù)創(chuàng)新高,但是依然有空頭存在,在當(dāng)?shù)貢r(shí)間7月30日美股半導(dǎo)體指數(shù)大跌,
    的頭像 發(fā)表于 07-31 16:11 ?1047次閱讀

    英偉達(dá)市值三日暴跌,芯片市場(chǎng)震動(dòng)

    在近期科技股市場(chǎng)的波動(dòng)中,英偉達(dá)(NVDA)成為了備受關(guān)注的焦點(diǎn)。這家以圖形處理器(GPU)技術(shù)聞名的科技巨頭,在短短三日內(nèi)經(jīng)歷了市值的大幅蒸發(fā),累計(jì)損失高達(dá)4300美元,創(chuàng)造了史上
    的頭像 發(fā)表于 06-25 17:48 ?947次閱讀

    Groq籌資約3美元,向Cerebras等對(duì)手看齊?

    這家由谷歌專屬芯片張量處理單元發(fā)明人之一的喬納森·羅斯于近8年前創(chuàng)建的公司,致力于研發(fā)可替代英偉達(dá)芯片的產(chǎn)品。據(jù)了解,包括Groq和Cere
    的頭像 發(fā)表于 05-23 15:49 ?621次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    2024年3月19日,[英偉達(dá)]CEO[黃仁勛]在GTC大會(huì)上公布了新一代AI芯片架構(gòu)BLACKWELL,并推出基于該架構(gòu)的超級(jí)芯片GB200,將助推數(shù)據(jù)處理、工程模擬、電子設(shè)計(jì)自動(dòng)化
    發(fā)表于 05-13 17:16

    英偉達(dá)市值一夜蒸發(fā)6116英偉達(dá)員工分走6200萬美元

    在這場(chǎng)股市風(fēng)暴中,英偉達(dá)股價(jià)暴跌3.87%,市值一夜蒸發(fā)約845美元,折合人民幣高達(dá)6116元。
    的頭像 發(fā)表于 04-18 14:52 ?2392次閱讀

    英偉達(dá)市值一夜蒸發(fā)6116

    英偉達(dá)市值一夜蒸發(fā)6116元 周三,美股三大指數(shù)集體下跌,科技巨頭英偉達(dá)領(lǐng)跌。
    的頭像 發(fā)表于 04-18 14:41 ?602次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品