3d动漫精品专区久久,国产在线不卡视频免费,黑人巨大精品欧美一区二区..

Exaflop 是衡量超級(jí)計(jì)算機(jī)性能的單位，表示該計(jì)算機(jī)每秒可至少進(jìn)行百億億次浮點(diǎn)運(yùn)算。

為了解決這個(gè)時(shí)代最復(fù)雜的問(wèn)題，比如如何治療像新冠肺炎和癌癥這樣的疾病、以及如何緩解氣候變化等。計(jì)算機(jī)的計(jì)算量正在不斷增加。

所有這些重大挑戰(zhàn)將計(jì)算帶入了現(xiàn)今的百億億次級(jí)時(shí)代，頂級(jí)性能通常以 exaflops 來(lái)衡量。

什么是 Exaflop？

Exaflop 是衡量超級(jí)計(jì)算機(jī)性能的單位，表示該計(jì)算機(jī)每秒可以至少進(jìn)行 10^18 或百億億次浮點(diǎn)運(yùn)算。

Exaflop 中的 exa-前綴表示“百億億”，即 10 億乘以 10 億或1的后面有 18 個(gè)零。同樣，單個(gè) exabyte 的內(nèi)存子系統(tǒng)可以儲(chǔ)存百億億字節(jié)的數(shù)據(jù)。

exaflop 中的“flop”是浮點(diǎn)運(yùn)算的縮寫(xiě)。exaflop/s 是表示系統(tǒng)每秒浮點(diǎn)運(yùn)算次數(shù)的單位。

浮點(diǎn)是指所有數(shù)字都用小數(shù)點(diǎn)表示的計(jì)算方法。

1000 Petaflop = 1 Exaflop

前綴 peta- 表示 10^15，即 1 的后面有 15 個(gè)零。因此 1 exaflop 等于 1000 petaflop。

1 exaflop 的計(jì)算量到底有多大？相當(dāng)于十億人中的每個(gè)人都拿著十億個(gè)計(jì)算器。

如果他們同時(shí)按下等號(hào)，就是進(jìn)行了 1 個(gè) exaflop。

擁有 Big Red 200 和其他幾臺(tái)超級(jí)計(jì)算機(jī)的印第安納大學(xué)表示，exaflop 計(jì)算機(jī)的速度相當(dāng)于一個(gè)人每秒鐘進(jìn)行一次計(jì)算，并一直計(jì)算 31,688,765,000 年。

Exaflop 簡(jiǎn)史

在超級(jí)計(jì)算發(fā)展史的大部分時(shí)間里，一次浮點(diǎn)運(yùn)算就是一次，但隨著工作負(fù)載引入 AI ，這種情況也發(fā)生了變化。

人們開(kāi)始使用最高的精度格式來(lái)表示數(shù)字，這種格式被稱為雙精度，由 IEEE 浮點(diǎn)運(yùn)算標(biāo)準(zhǔn)定義。它之所以被稱為雙精度或 FP64，是因?yàn)橛?jì)算中的每個(gè)數(shù)字都需要以 64 位用 0 或 1 表示的數(shù)據(jù)塊表示，而單精度為 32 位。

雙精度使用 64 位確保每個(gè)數(shù)字都精確到很細(xì)微的部分，比如 1.0001 + 1.0001 = 2.0002，而不是 1 + 1 = 2。

這種格式非常適合當(dāng)時(shí)的大部分工作負(fù)載，比如從原子到飛機(jī)等全部需要確保模擬結(jié)果接近于真實(shí)的模擬。

因此，當(dāng) 1993 年全球最強(qiáng)大的超級(jí)計(jì)算機(jī)榜單 TOP500 首次發(fā)布時(shí)，衡量 FP64 數(shù)學(xué)性能的 LINPACK 基準(zhǔn)（又稱HPL）自然成為了默認(rèn)的衡量標(biāo)準(zhǔn)。

AI 大爆炸

十年前，計(jì)算行業(yè)發(fā)生了 NVIDIA 首席執(zhí)行官黃仁勛所說(shuō)的 AI 大爆炸。

這種強(qiáng)大的新計(jì)算形式開(kāi)始在科學(xué)和商業(yè)應(yīng)用上展現(xiàn)出重大成果，而且它運(yùn)用了一些非常不同的數(shù)學(xué)方法。

深度學(xué)習(xí)并不是模擬真實(shí)世界中的物體，而是在堆積如山的數(shù)據(jù)中篩選，以找到能夠帶來(lái)新洞察的模式。

這種數(shù)學(xué)方法需要很高的吞吐量，所以用經(jīng)過(guò)簡(jiǎn)化的數(shù)字（比如使用 1.01 而不是 1.0001）進(jìn)行大量計(jì)算要比用更復(fù)雜的數(shù)字進(jìn)行少量計(jì)算好得多。

因此 AI 使用 FP32、FP16 和 FP8 等低精度格式，通過(guò) 32 位、16 位和 8 位數(shù)讓用戶更快地進(jìn)行更多計(jì)算。

混合精度不斷發(fā)展

AI 使用 64 位數(shù)就如同在周末外出時(shí)帶著整個(gè)衣柜。

研究人員一直在積極地為 AI 尋找理想的低精度技術(shù)。

例如首個(gè) NVIDIA Tensor Core GPU——Volta，它使用了混合精度，并以 FP16 格式執(zhí)行矩陣乘法，然后用 FP32 累積結(jié)果以獲得更高的精度。

Hopper 通過(guò) FP8 加速

最近，NVIDIA Hopper 架構(gòu)首次發(fā)布了速度更快的低精度 AI 訓(xùn)練方法。Hopper Transformer Engine 能夠自動(dòng)分析工作負(fù)載，盡可能采用 FP8 并以 FP32 累積結(jié)果。

在進(jìn)行計(jì)算密集度較低的推理工作，比如在生產(chǎn)中運(yùn)行 AI 模型時(shí)，TensorFlow 和 PyTorch 等主要框架通過(guò)支持 8 位整數(shù)實(shí)現(xiàn)快速性能，因?yàn)檫@樣就不需要使用小數(shù)點(diǎn)來(lái)完成工作。

好消息是，NVIDIA GPU 支持上述所有精度格式，因此用戶可以實(shí)現(xiàn)每個(gè)工作負(fù)載的最優(yōu)加速。

去年，IEEE P3109 委員會(huì)開(kāi)始為機(jī)器學(xué)習(xí)中使用的精度格式制定行業(yè)標(biāo)準(zhǔn)。這項(xiàng)工作可能還需要一到兩年的時(shí)間才能完成。

一些模擬軟件在低精度工作中大放異彩

雖然 FP64 在模擬工作中仍然很受歡迎，但當(dāng)?shù)途葦?shù)學(xué)能夠更快提供可用結(jié)果時(shí)，許多人會(huì)使用后者。

影響 HPC 應(yīng)用程序性能的因素各不相同

例如，研究人員用 FP32 運(yùn)行廣受歡迎的汽車碰撞模擬器——Ansys LS-Dyna。基因組學(xué)也傾向于使用低精度數(shù)學(xué)。

此外，許多傳統(tǒng)的模擬開(kāi)始在部分工作流程中采用 AI。隨著越來(lái)越多的工作負(fù)載使用 AI，超級(jí)計(jì)算機(jī)需要支持較低的精度才能有效運(yùn)行這些新興應(yīng)用。

基準(zhǔn)與工作負(fù)載同步發(fā)展

在認(rèn)識(shí)到這些變化后，包括 Jack Dongarra（2021 年圖靈獎(jiǎng)得主和 HPL 的貢獻(xiàn)者）在內(nèi)的研究人員在 2019 年首次發(fā)布了 HPL-AI，這項(xiàng)新基準(zhǔn)更適合測(cè)量新的工作負(fù)載。

Dongarra 在 2019 年的博客中表示：“無(wú)論是技術(shù)不斷優(yōu)化的傳統(tǒng)模擬，還是 AI 應(yīng)用，混合精度技術(shù)對(duì)于提高超級(jí)計(jì)算機(jī)的計(jì)算效率越來(lái)越重要。正如 HPL 實(shí)現(xiàn)了對(duì)雙精度能力的基準(zhǔn)測(cè)試一樣，這種基于 HPL 的新方法可以對(duì)超級(jí)計(jì)算機(jī)的混合精度能力進(jìn)行大規(guī)?；鶞?zhǔn)測(cè)試。”

尤利希超級(jí)計(jì)算中心主任 Thomas Lippert 同意了這一觀點(diǎn)。

他在去年發(fā)表的一篇博客中表示：“我們使用 HPL-AI 基準(zhǔn)是因?yàn)樗饶軌驕?zhǔn)確地衡量日益增加的 AI 和科學(xué)工作負(fù)載中的混合精度工作，也能反映準(zhǔn)確的 64 位浮點(diǎn)計(jì)算結(jié)果?！?/p>

現(xiàn)今的 Exaflop 系統(tǒng)

在 6 月的一份報(bào)告中，全球 20 個(gè)超級(jí)計(jì)算機(jī)中心提交了 HPL-AI 結(jié)果，其中有三個(gè)中心提供了超過(guò) 1 exaflop 的性能。

在這些系統(tǒng)中，橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室的超級(jí)計(jì)算機(jī)在 HPL 上的 FP64 性能也超過(guò)了 1 exaflop。

2022 年 6 月 HPL-AI 結(jié)果的采樣器

兩年前，一非傳統(tǒng)系統(tǒng)首次達(dá)到 1 exaflop。這臺(tái)由 Folding@home 聯(lián)盟組裝的眾源超級(jí)計(jì)算機(jī)在呼吁幫助抵御新冠疫情后，達(dá)到了這一里程碑，到現(xiàn)在已有超過(guò) 100 萬(wàn)臺(tái)計(jì)算機(jī)加入其中。

理論和實(shí)踐中的Exaflop

許多組織從那時(shí)起就已開(kāi)始安裝理論峰值性能超過(guò) 1 exaflop 的超級(jí)計(jì)算機(jī)。需要注意的是，TOP500 榜單同時(shí)發(fā)布 Rmax（實(shí)際）和 Rpeak（理論）分?jǐn)?shù)。

Rmax 指計(jì)算機(jī)實(shí)際表現(xiàn)出的最佳性能。

Rpeak 是一切系統(tǒng)都處于高水平運(yùn)行時(shí)的最高理論性能，而這幾乎從未發(fā)生過(guò)。該數(shù)值的計(jì)算方法通常是將系統(tǒng)中的處理器數(shù)量乘以其時(shí)鐘速度，然后再將結(jié)果乘以處理器在一秒鐘內(nèi)可執(zhí)行的浮點(diǎn)運(yùn)算數(shù)。

因此，如果有人說(shuō)他們的系統(tǒng)達(dá)到 1 exaflop，請(qǐng)?jiān)儐?wèn)他說(shuō)的是 Rmax（實(shí)際）還是Rpeak（理論）。

Exaflop 時(shí)代的眾多指標(biāo)

這也是新百億億次時(shí)代的眾多細(xì)微變化之一。

值得注意的是，HPL 和 HPL-AI 屬于合成基準(zhǔn)，即它們衡量的是數(shù)學(xué)程序的性能，而不是真實(shí)世界的應(yīng)用。MLPerf 等其他基準(zhǔn)則基于真實(shí)世界中的工作負(fù)載。

最后，衡量系統(tǒng)性能的最佳標(biāo)準(zhǔn)當(dāng)然是它運(yùn)行用戶應(yīng)用程序的情況。該衡量標(biāo)準(zhǔn)不是基于 exaflop，而是基于投資回報(bào)率。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4989

瀏覽量
103077
計(jì)算機(jī)

計(jì)算機(jī)

+關(guān)注

關(guān)注
19

文章
7494

瀏覽量
87981
AI

AI

+關(guān)注

關(guān)注
87

文章
30898

瀏覽量
269133

原文標(biāo)題：什么是 Exaflop？

文章出處：【微信號(hào)：NVIDIA-Enterprise，微信公眾號(hào)：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

人形機(jī)器人“造車”，車企扎堆布局！

電子發(fā)燒友網(wǎng)報(bào)道（文/黃晶晶）12月26日，廣汽集團(tuán)正式發(fā)布自主研發(fā)的第三代具身智能人形機(jī)器人——GoMate。在業(yè)界引發(fā)新一輪人形機(jī)器人的關(guān)注。實(shí)際上，已經(jīng)有不少車企進(jìn)入了人形機(jī)器人這一賽道，并且人形機(jī)器人率先落地于汽車制造應(yīng)用已被看好，這將加速人形機(jī)器人的商用進(jìn)程。 ? 圖源：廣汽集團(tuán) ? 廣汽 GoMate 多項(xiàng)零部件自研 ? GoMate是一款全尺寸的輪足人形機(jī)器人，全身?yè)碛?8個(gè)自由度。機(jī)器人采用了可變輪足移動(dòng)結(jié)構(gòu)，融合了四輪足、兩輪

發(fā)表于 12-30 01:31 ?19次閱讀

TOP500第二臺(tái)E級(jí)超算出現(xiàn)，AMD要在HPC上逆襲英特爾？

Exaflop/s的HPL算力成績(jī)，在開(kāi)發(fā)人員的優(yōu)化下，相較上次提交的1.194 Exflop/s成績(jī)還有所提升。Frontier集成

發(fā)表于 05-15 09:11 ?2412次閱讀

TOP500第二臺(tái)E級(jí)超算出現(xiàn)，AMD要在HPC上逆襲英特爾？

超級(jí)電容器正在成為儲(chǔ)能領(lǐng)域新的藍(lán)海市場(chǎng)

電子發(fā)燒友網(wǎng)報(bào)道（文/黃山明）電容器，顧名思義是一種能夠?qū)㈦娔軆?chǔ)存在電場(chǎng)中的電子元器件，這種產(chǎn)品幾乎存在于所有的電子設(shè)備中。但普通的電容器如何才能做到儲(chǔ)存更多的電能呢，為此開(kāi)發(fā)者們做了許多努力，比如更換不同的電介質(zhì)，或?qū)㈦娙葑龀啥询B的薄片等，但都無(wú)法讓電容器的電容值實(shí)現(xiàn)量級(jí)上的突破。 ? 而超級(jí)電容器的出現(xiàn)，不僅解決了電容值的問(wèn)題，甚至有望推動(dòng)儲(chǔ)能的技術(shù)發(fā)展。 ? 超級(jí)電容器的發(fā)展 ? 所謂超級(jí)電容器，就是一種

發(fā)表于 12-30 01:07 ?19次閱讀

英諾賽科沖刺港股上市！盈利能力逐年上升，估值超234億元

電子發(fā)燒友網(wǎng)報(bào)道（文/莫婷婷）2024年6月，英諾賽科（珠海）科技有限公司（以下簡(jiǎn)稱“英諾賽科”）向港交所遞交了上市申請(qǐng)。同年12月，英諾賽科通過(guò)IPO備案。英諾賽科的港交所上市之路進(jìn)展順利。此次IPO，英諾賽科擬募資13.999億港元。 ? 氮化鎵全球第一，虧損幅度逐年收窄英諾賽科是全球首家實(shí)現(xiàn)量產(chǎn)8英吋硅基氮化鎵晶圓的公司，也是唯一具備產(chǎn)業(yè)規(guī)模提供全電壓譜系的硅基氮化鎵半導(dǎo)體產(chǎn)品的公司。其產(chǎn)品包括氮化鎵晶圓、氮化鎵分立器件、

發(fā)表于 12-30 00:11 ?87次閱讀

安森美(onsemi)的超聲波傳感器解決方案的未來(lái)趨勢(shì)和創(chuàng)新

簡(jiǎn)要介紹超聲波傳感器的發(fā)展歷程，并結(jié)合當(dāng)前和未來(lái)的應(yīng)用，預(yù)測(cè)未來(lái)幾年超聲波傳感器的應(yīng)用領(lǐng)域。? ? ? 汽車超聲波傳感器簡(jiǎn)史 超聲波技術(shù)常用于檢測(cè)物體和發(fā)現(xiàn)固體材料中的缺陷，其首項(xiàng)專利可以追溯到上世紀(jì)30年代。一直

發(fā)表于 11-23 14:53 ?1024次閱讀

名單公布！【書(shū)籍評(píng)測(cè)活動(dòng)NO.50】親歷芯片產(chǎn)線，輕松圖解芯片制造，揭秘芯片工廠的秘密

的知識(shí)門檻低，又獨(dú)家揭秘了芯片制造工廠的運(yùn)營(yíng)到管理，適用于更大讀者群。本書(shū)非常適合對(duì)芯片這個(gè)話題(不管是技術(shù)還是產(chǎn)業(yè)運(yùn)營(yíng)等)感興趣的IC從業(yè)者和大眾讀者。相信閱讀過(guò)《芯路》《半導(dǎo)體簡(jiǎn)史》《圖解

發(fā)表于 11-04 15:38

【「ARM MCU嵌入式開(kāi)發(fā) | 基于國(guó)產(chǎn)GD32F10x芯片」閱讀體驗(yàn)】+書(shū)籍整體概況

系統(tǒng)的概念，ARM簡(jiǎn)史，以及前期的準(zhǔn)備工作，視頻時(shí)長(zhǎng)112min。第二章介紹GD32F10x的架構(gòu)，包含計(jì)算機(jī)架構(gòu)，Cortex-M3架構(gòu)；第三章通用輸入/輸出端口GPIO介紹，內(nèi)容非常豐富，介紹

發(fā)表于 08-25 22:48

Perforce靜態(tài)代碼分析專家解讀MISRA C++：2023?新標(biāo)準(zhǔn)：如何安全、高效地使用基于范圍的for循環(huán)，防范未定義行

Frank van den Beuken博士的博客系列，本期為第三篇。在前兩篇系列文章中，我們向您介紹了新的MISRA C++ 標(biāo)準(zhǔn) 和 C++簡(jiǎn)史 。本文，我們將仔細(xì)研究C++中以for循環(huán)為中心

發(fā)表于 06-18 12:57 ?425次閱讀

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

72個(gè) NVLink 連接的Blackwell GPU 和 30TB 的統(tǒng)一內(nèi)存，在130TB/s 的計(jì)算結(jié)構(gòu)上運(yùn)行，GB200 NVL72 在單個(gè)機(jī)架中創(chuàng)造了一個(gè)exaFLOP 級(jí)別的 AI 超級(jí)

發(fā)表于 05-13 17:16

寬帶上網(wǎng)技術(shù)簡(jiǎn)史（2024版）

在如今這個(gè)數(shù)字時(shí)代，寬帶已經(jīng)成為我們每個(gè)人、每個(gè)家庭的生活必需品。如果沒(méi)有它，我們會(huì)坐立難安、心緒不寧。那么，你知道寬帶背后的技術(shù)原理嗎？從最早期的56k“貓”撥號(hào)，到現(xiàn)在的千兆城市、千兆家庭，我們的寬帶技術(shù)到底經(jīng)歷了怎樣的變革？今天這篇文章，我們就來(lái)詳細(xì)了解一下——“寬帶的故事”。█xDSL和ISDN下面這個(gè)界面，你見(jiàn)過(guò)嗎？我相信很多70后80后的小伙伴，

發(fā)表于 04-20 08:05 ?1059次閱讀

寬帶上網(wǎng)技術(shù)<b class='flag-5'>簡(jiǎn)史</b>（2024版）

算力簡(jiǎn)史，是一段波瀾壯闊的歷史

今天這篇文章，我將給大家詳細(xì)介紹一下人類算力的演進(jìn)過(guò)程。這是一段波瀾壯闊的歷史，值得我們駐足與回憶。Chrent人工算力時(shí)代人類對(duì)算力的利用，從遠(yuǎn)古時(shí)期就已經(jīng)開(kāi)始了。大腦，是我們最原生的算力工具。依靠大腦所提供的算力，我們才得以生存。動(dòng)物也有大腦，也有算力，但是遠(yuǎn)遠(yuǎn)不如人類強(qiáng)勁。在漫長(zhǎng)的進(jìn)化過(guò)程中，人類的大腦越來(lái)越發(fā)達(dá)，最終幫助自己從萬(wàn)物生靈中脫穎而出，成為

發(fā)表于 04-04 08:26 ?668次閱讀

算力<b class='flag-5'>簡(jiǎn)史</b>，是一段波瀾壯闊的歷史

什么是SaaS？中國(guó)SaaS發(fā)展簡(jiǎn)史

SaaS融合了軟件與云計(jì)算的優(yōu)勢(shì)，在這種服務(wù)模式下，用戶不僅獲得了軟件的功能，更重要的是，用戶擁有數(shù)據(jù)與隱私權(quán)。

發(fā)表于 03-14 11:30 ?726次閱讀

什么是SaaS？中國(guó)SaaS發(fā)展<b class='flag-5'>簡(jiǎn)史</b>

單片機(jī)發(fā)展簡(jiǎn)史

單片機(jī)出現(xiàn)的歷史并不長(zhǎng)，但發(fā)展十分迅猛。它的產(chǎn)生與發(fā)展和微處理器（CPU）的產(chǎn)生與發(fā)展大體同步，自1971年美國(guó)英特爾公司首先推出4位微處理器以來(lái)，它的發(fā)展到目前為止大致可分為5個(gè)階段。

發(fā)表于 03-14 11:22 ?1367次閱讀

全球AGV發(fā)展簡(jiǎn)史

AGV（自動(dòng)引導(dǎo)車）是一種自動(dòng)化材料搬運(yùn)機(jī)器人，自上世紀(jì)50年代發(fā)展至今，應(yīng)用范圍不斷擴(kuò)大，已廣泛應(yīng)用于制造、倉(cāng)庫(kù)、醫(yī)院和機(jī)場(chǎng)等領(lǐng)域?，F(xiàn)代AGV具備更高安全性和承載能力，可運(yùn)輸更多種物品，并可通過(guò)與云計(jì)算和大數(shù)據(jù)分析結(jié)合實(shí)現(xiàn)更智能的自動(dòng)化控制。未來(lái)，AGV技術(shù)將持續(xù)改進(jìn)和完善，成為制造業(yè)和物流業(yè)智能化發(fā)展的重要力量。

發(fā)表于 02-27 18:20 ?1274次閱讀

C++簡(jiǎn)史：C++是如何開(kāi)始的

MISRA C++：2023，MISRA? C++ 標(biāo)準(zhǔn)的下一個(gè)版本，來(lái)了！為了幫助您做好準(zhǔn)備，我們介紹了 Perforce 首席技術(shù)支持工程師 Frank van den Beuken 博士撰寫(xiě)的 MISRA C++：2023 博客系列的第二部分。在這篇博客中，我們將深入探討 C++ 的歷史、編程語(yǔ)言多年來(lái)的發(fā)展歷程以及它的下一步發(fā)展方向。

發(fā)表于 01-11 09:00 ?598次閱讀