国产又猛又粗又黄又爽,91精品国产91久无码网站软件,影视大全高清版中文字幕

電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）AI大模型似乎陷入了一個(gè)怪圈，盡管對(duì)于深度學(xué)習(xí)、數(shù)據(jù)優(yōu)化和爆款應(yīng)用的研究從來(lái)沒(méi)有終止，但大多數(shù)人開(kāi)口問(wèn)的第一句話就是，“你有卡嗎”？從行業(yè)對(duì)GPU的狂熱追求來(lái)看，未來(lái)繼續(xù)擴(kuò)展大模型的機(jī)會(huì)，似乎只會(huì)被大公司掌握在手中。

xAI拉攏戴爾和超微打造AI超算，馬斯克繼續(xù)買(mǎi)買(mǎi)買(mǎi)

xAI作為2023年3月才成立的一家初創(chuàng)公司，在構(gòu)建算力基礎(chǔ)設(shè)施的投入上卻一點(diǎn)也不含糊，不過(guò)這也多虧了背后的金主埃隆馬斯克。近日，戴爾CEO Michael Dell宣布他們正在打造一個(gè)由英偉達(dá)GPU驅(qū)動(dòng)的AI工廠，為xAI的Grok模型提供動(dòng)力。不過(guò)馬斯克隨即表示，戴爾只是其中一半服務(wù)器集群的供應(yīng)商，另外一半的超算系統(tǒng)則是由超微打造。

由此推測(cè)，這一AI工廠應(yīng)該就是馬斯克在月初提到的10萬(wàn)塊H100液冷訓(xùn)練集群了，盡管有兩家供應(yīng)商同時(shí)為xAI打造服務(wù)器，但市面上的GPU需求依然維持在高位，還需要幾個(gè)月這一集群才會(huì)正式上線，用于Grok的下一代大模型迭代。

H100這張2023年發(fā)布的GPU可以說(shuō)是目前全球大模型算力供應(yīng)的主力，無(wú)論是OpenAI還是xAI，其最新模型都是基于該GPU訓(xùn)練迭代的。H100無(wú)論是顯存容量、帶寬和算力性能都實(shí)現(xiàn)了一輪新的突破，甚至可以說(shuō)H100帶動(dòng)了這一代AI大模型的發(fā)展，然而在GTC之后，馬斯克已經(jīng)開(kāi)始眼饞最新的B200了。他認(rèn)為考慮到目前的技術(shù)演進(jìn)速度，實(shí)在不值得把1GW的電力供應(yīng)給H100。

為此xAI也已經(jīng)開(kāi)始在規(guī)劃下一代系統(tǒng)，據(jù)馬斯克透露，該系統(tǒng)將由30萬(wàn)塊B200 GPU組成，但上線時(shí)間需要等到明年夏天了。B200速度高達(dá)H100的4倍，更是可以輕松做到單機(jī)柜1exaflop的算力表現(xiàn)，更何況在能耗成本上，B200相比H100改善了20多倍，即便是大規(guī)模部署，也不會(huì)讓廠商面臨供電和碳足跡的雙重困擾。

盡管xAI的AI超算目標(biāo)已經(jīng)明確，但對(duì)于馬斯克旗下的另一家公司特斯拉而言，其技術(shù)路線依舊不算明朗。雖然特斯拉也開(kāi)啟了新一輪的英偉達(dá)GPU采購(gòu)潮，但其內(nèi)部也在繼續(xù)發(fā)展自研的Dojo超算。只不過(guò)近年來(lái)Dojo的情報(bào)越來(lái)越少，就連馬斯克自己也將其列入“遠(yuǎn)景計(jì)劃”之列。

OpenAI與微軟，“鯨級(jí)”超算已在全速運(yùn)轉(zhuǎn)中

相信不少人都還記得去年11月首度上榜TOP500的微軟超算Eagle，這臺(tái)空降第三的AI超算憑借14400個(gè)英偉達(dá)H100和561PFlop/s的算力，不僅讓Azure系統(tǒng)再次闖進(jìn)了前十，還拿下了當(dāng)下云端超算最高的排名。而當(dāng)時(shí)的Azure還未部署完成，雖然最新的排名中Eagle依然維持在第三的位置，但其核心數(shù)已經(jīng)近乎翻倍。

這臺(tái)超算為OpenAI的GPT-4訓(xùn)練和推理提供了極大的助力，但這遠(yuǎn)沒(méi)有達(dá)到微軟的財(cái)力極限。早在3月底，就有消息傳出微軟和OpenAI正在打造一個(gè)代號(hào)名為“星門(mén)”的AI超算，耗資高達(dá)1000億美元。微軟CTO Kevin Scott稱不少有關(guān)其超算計(jì)劃的推測(cè)簡(jiǎn)直錯(cuò)得可笑，但也指出他們確實(shí)會(huì)為這一計(jì)劃付出不少努力和成本。

在上個(gè)月舉辦的Microsoft Build中，Kevin Scott公開(kāi)透露了他們未來(lái)的超算擴(kuò)展計(jì)劃。2020年，微軟為OpenAI打造了第一臺(tái)AI超算，正是因?yàn)檫@臺(tái)機(jī)器才孕育了GPT-3。而他們構(gòu)建的下一個(gè)系統(tǒng)，也就是Eagle，則用于訓(xùn)練GPT-4。Kevin Scott選擇了用海洋生物來(lái)描述這些超算的規(guī)模，比如首臺(tái)超算可以用鯊魚(yú)來(lái)描述，Eagle則是虎鯨，而他們的下一臺(tái)超算規(guī)模則可以比擬藍(lán)鯨。

Kevin Scott更是強(qiáng)調(diào)，別看現(xiàn)在Eagle可以排到第三名的位置，從現(xiàn)在開(kāi)始微軟每個(gè)月都會(huì)部署五臺(tái)同樣規(guī)模的超算，也就是說(shuō)每月都有至少搭載72000個(gè)H100 GPU或同等規(guī)模系統(tǒng)投入應(yīng)用，每月帶來(lái)2.8exaflops的算力增長(zhǎng)。同時(shí)，他們用來(lái)連接GPU的高速和InfiniBand線纜可以繞地球至少五周，也就是說(shuō)長(zhǎng)度在20萬(wàn)公里以上總線纜長(zhǎng)度。

很明顯，作為已經(jīng)憑借OpenAI獲得成功的微軟來(lái)說(shuō)，接下來(lái)需要贏下的就是這場(chǎng)Scaling之戰(zhàn)。

TPU和GPU并用，谷歌的Hypercomputer

盡管不少巨頭都在考慮如何自研芯片來(lái)降低購(gòu)置海量GPU帶來(lái)的成本，但真的成功將其用于大模型的訓(xùn)練中去的，已經(jīng)迭代至第六代的谷歌TPU，恰好就為谷歌解決了這個(gè)問(wèn)題。TPU作為谷歌和博通聯(lián)合設(shè)計(jì)了幾代的產(chǎn)品，在谷歌自己推出的各種新模型訓(xùn)練與推理中，重要性已經(jīng)等同于英偉達(dá)的GPU了。

谷歌本身作為在AI算法和大模型上耕耘了諸多時(shí)間的巨頭，從設(shè)計(jì)芯片之初就知道他們需要何種計(jì)算資源，正因如此，TPU幾乎將所有的面積都分給了低精度的張量計(jì)算單元。這種ASIC方案也讓谷歌大幅降低了打造AI Hypercomputer的成本。

但谷歌作為云服務(wù)廠商巨頭還是逃不開(kāi)通用性的問(wèn)題，谷歌的TPU更多是為Gemini的模型做了優(yōu)化，盡管TPU支持PyTorch、Tensorflow等常見(jiàn)AI模型，但在追求極致性能的選擇上，還是難以媲美GPU。正因如此，在谷歌和其他大模型開(kāi)發(fā)者的眼中，TPU固然性能不弱，但更像是一個(gè)性價(jià)比之選。用于已經(jīng)成功商業(yè)化模型的降本增效屬于不錯(cuò)的選擇，但如果想要在這個(gè)競(jìng)爭(zhēng)激烈的大模型市場(chǎng)殺出重圍，那就只有谷歌能將TPU物盡其用。

在不少AI芯片廠商的宣傳中，為了抬高自己的專用產(chǎn)品定位，將英偉達(dá)的GPU還是定性為圖形處理單元?？稍贖100這種規(guī)模的GPU上，無(wú)論是性能和能效，也毫不輸某些專用開(kāi)發(fā)環(huán)境下的ASIC，至于未來(lái)更復(fù)雜的圖形處理，英偉達(dá)也推出了L4 GPU這樣的對(duì)應(yīng)方案。

在今年GTC上，谷歌的云服務(wù)部門(mén)也宣布和英偉達(dá)達(dá)成深度合作關(guān)系，通過(guò)英偉達(dá)的H100和L4 GPU支持使用其云服務(wù)的AI開(kāi)發(fā)者。同時(shí)谷歌也將購(gòu)置GB200 NVL72系統(tǒng)，基于谷歌云的A3實(shí)例為開(kāi)發(fā)者提供DGX Cloud的云端LLM托管方案，這也是對(duì)現(xiàn)有H100機(jī)器的升級(jí)。除此之外，就連谷歌自己的JAX框架，也在雙方的合作之下，在英偉達(dá)的GPU上得到了支持。可以看出，谷歌還是采取兩手抓的策略，TPU和GPU一并重要。

全力追逐Scaling Laws的大廠們

對(duì)于AI大模型而言，模型大小、數(shù)據(jù)集大小和計(jì)算成本之間不僅組成了三元關(guān)系，也代表了模型性能。而Scaling Laws這一擴(kuò)展法則定義了三者之間勢(shì)必會(huì)存在某種比例擴(kuò)展，只不過(guò)如今看來(lái)，其邊際效應(yīng)已經(jīng)變得越來(lái)越大。以GPT為例，如果GPT-6繼續(xù)按照這樣的比例擴(kuò)展下去，且不說(shuō)性能提升有限，即便微軟這樣的商業(yè)巨頭也很難撐起成本的劇增。

可就是這樣微不可察的差距，甚至對(duì)于AI大模型的常見(jiàn)應(yīng)用聊天機(jī)器人來(lái)說(shuō)只是速度和精度上的一些差距，卻決定了他們?cè)谥蟮氖畮啄昀锬芊窭^續(xù)制霸下去。微軟作為已經(jīng)在操作系統(tǒng)上實(shí)現(xiàn)霸權(quán)地位的廠商，自然也明白先入為主的重要性。

在邊際效應(yīng)的影響下，即便后入局的巨頭，也有不少迎頭趕上的機(jī)會(huì)，比如近期傳出正在秘密研發(fā)Metis聊天機(jī)器人的亞馬遜。亞馬遜同樣擁有自研服務(wù)器芯片的技術(shù)積累，但主要優(yōu)勢(shì)還是在CPU上，AI加速器相關(guān)的產(chǎn)品（Inferentia和Trainium）依舊有比較大的改進(jìn)空間，而且與亞馬遜自己的業(yè)務(wù)還沒(méi)有緊密結(jié)合起來(lái)。如果亞馬遜愿意去打造這樣一個(gè)聊天機(jī)器人應(yīng)用，很有可能后續(xù)也會(huì)加強(qiáng)在GPU上的投入，而不再緊緊作為云托管方案。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
4764

瀏覽量
129172
AI

AI

+關(guān)注

關(guān)注
87

文章
31338

瀏覽量
269740

評(píng)論

相關(guān)推薦

AI算力GPU開(kāi)始騰飛，背后是電源管理的持續(xù)支持

為AI PC元年。 ? 不僅是AI PC，還包括AI服務(wù)器、AI手機(jī)、AI汽車(chē)等，眾多AI實(shí)際應(yīng)

發(fā)表于 03-30 00:12 ?4866次閱讀

<b class='flag-5'>AI</b><b class='flag-5'>算</b>力<b class='flag-5'>GPU</b>開(kāi)始騰飛，背后是電源管理的持續(xù)支持

超算智算融合南京信易達(dá)發(fā)布全新“智能算力融合平臺(tái)”

1月7日,南京信易達(dá)發(fā)布了旗下最新算力平臺(tái)“C-MOM智能算力融合平臺(tái)V3.0”,并更新了全新的UI視覺(jué)與交互系統(tǒng)。該平臺(tái)集成了HPC

發(fā)表于 01-08 10:56 ?121次閱讀

<b class='flag-5'>超</b><b class='flag-5'>算</b>智<b class='flag-5'>算</b>融合南京信易達(dá)發(fā)布全新“智能<b class='flag-5'>算</b>力融合平臺(tái)”

小米加速布局AI大模型，搭建GPU萬(wàn)卡集群

近日，有消息稱小米正在緊鑼密鼓地搭建自己的GPU萬(wàn)卡集群，旨在加大對(duì)AI大模型的投入力度。據(jù)悉，小米的大模型團(tuán)隊(duì)在成立之初就已經(jīng)擁有了6500張GP

發(fā)表于 12-28 14:25 ?231次閱讀

《算力芯片高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得：GPU革命：從圖形引擎到AI加速器的蛻變

在數(shù)據(jù)挖掘工作中，我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù)，這讓我對(duì)GPU架構(gòu)和張量運(yùn)算充滿好奇。閱讀《算力芯片》第7-9章，讓我對(duì)這些關(guān)鍵技術(shù)有了全新認(rèn)識(shí)。 GPU架構(gòu)從早期的固定功能流

發(fā)表于 11-24 17:12

一文梳理：如何構(gòu)建并優(yōu)化GPU云算力中心？

目前最常見(jiàn)的AI算力中心部署的GPU集群大小為 2048、1024、512 和 256，且部署成本隨 GPU 數(shù)量線性增長(zhǎng)。本文將以相對(duì)折中的1024

發(fā)表于 11-15 11:59 ?464次閱讀

GPU算力開(kāi)發(fā)平臺(tái)是什么

隨著AI技術(shù)的廣泛應(yīng)用，算力需求呈現(xiàn)出爆發(fā)式增長(zhǎng)。AI算力租賃作為一種新興的服務(wù)模式，正逐漸成為企業(yè)獲取算力資源的重要途徑。

發(fā)表于 10-31 10:31 ?221次閱讀

【一文看懂】大白話解釋“GPU與GPU算力”

隨著大模型的興起，“GPU算力”這個(gè)詞正頻繁出現(xiàn)在人工智能、游戲、圖形設(shè)計(jì)等工作場(chǎng)景中，什么是GPU，它與CPU的區(qū)別是什么？以及到底什么是GPU算

發(fā)表于 10-29 08:05 ?854次閱讀

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書(shū)概覽

、GPU、NPU,給我們剖析了算力芯片的微架構(gòu)。書(shū)中有對(duì)芯片方案商處理器的講解，理論聯(lián)系實(shí)際，使讀者能更好理解算力芯片。全書(shū)共11章，由淺入深，較系統(tǒng)全面進(jìn)行講解。下面目錄對(duì)全書(shū)

發(fā)表于 10-15 22:08

名單公布！【書(shū)籍評(píng)測(cè)活動(dòng)NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

這個(gè)想法被否決了，因?yàn)橥度胼^大、難以落地，且客戶對(duì)算力的認(rèn)同遠(yuǎn)不及今天這種高度。這幾年間其實(shí)我們聯(lián)系甚少，但是作者一直沒(méi)有脫離對(duì)芯片的應(yīng)用和關(guān)注。特別是目睹GPU從消費(fèi)電子轉(zhuǎn)向算力芯

發(fā)表于 09-02 10:09

算力服務(wù)器為什么選擇GPU

隨著人工智能技術(shù)的快速普及，算力需求日益增長(zhǎng)。智算中心的服務(wù)器作為支撐大規(guī)模數(shù)據(jù)處理和計(jì)算的核心設(shè)備，其性能優(yōu)化顯得尤為關(guān)鍵。而GPU服務(wù)器也進(jìn)入了大眾的視野，成為高性能計(jì)算的首選。那么，為什么

發(fā)表于 07-25 08:28 ?734次閱讀

摩爾線程與師者AI攜手完成70億參數(shù)教育AI大模型訓(xùn)練測(cè)試

近日，國(guó)內(nèi)知名的GPU制造商摩爾線程與全學(xué)科教育AI大模型“師者AI”聯(lián)合宣布，雙方已成功完成了一項(xiàng)重要的大模型訓(xùn)練測(cè)試。此次測(cè)試依托摩爾線程夸娥（KUAE）千

發(fā)表于 06-14 16:31 ?618次閱讀

萬(wàn)卡集群解決大模型訓(xùn)算力需求，建設(shè)面臨哪些挑戰(zhàn)

解決大模型訓(xùn)練對(duì)算力需求的巨大增長(zhǎng)問(wèn)題，尤其是現(xiàn)在模型參數(shù)量從百億級(jí)、千億級(jí)邁向萬(wàn)億級(jí)。 ? 國(guó)內(nèi)外企業(yè)積極構(gòu)建萬(wàn)卡集群 ? 目前，在國(guó)際上，包括微軟、Google、Meta等AI領(lǐng)域的巨頭，都已落子

發(fā)表于 06-02 06:18 ?4811次閱讀

科學(xué)計(jì)算的下一輪創(chuàng)新，AI超算與數(shù)字孿生

應(yīng)用的行列中來(lái)。 ? AI 超算與數(shù)字孿生 ? 在過(guò)去通用計(jì)算負(fù)載的時(shí)代，我們難以采用更大規(guī)模的計(jì)算集群來(lái)打造數(shù)字孿生?？呻S著AI技術(shù)，尤其是生成式

發(fā)表于 05-07 00:16 ?2035次閱讀

“捷智算”正式入駐國(guó)家超算互聯(lián)網(wǎng)平臺(tái)

ABSTRACT摘要2024年4月2日，本公司旗下算力服務(wù)品牌“捷智算”正式入駐國(guó)家超算互聯(lián)網(wǎng)平臺(tái)，開(kāi)設(shè)云gpu旗艦店。我們將借助國(guó)家

發(fā)表于 04-12 08:26 ?631次閱讀

千億美元打造一個(gè)系統(tǒng)，成本越來(lái)越高的AI超算

電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）從近年來(lái)新發(fā)布的超算機(jī)器和新的HPC AI性能榜單可以看出，AI算力已經(jīng)在超

發(fā)表于 04-09 00:19 ?3083次閱讀