高潮又爽又黄又无遮挡免费软件,99久久精品免费看国产一区二区,亚洲Av无码专区国产乱码不卡

Arm早前曾宣布其ArmV8-A架構(gòu)的下一版本將包括對(duì)bfloat16的支持，現(xiàn)在透露了更多細(xì)節(jié)。

bfloat16是一種越來越多被應(yīng)用于加速機(jī)器學(xué)習(xí)應(yīng)用的浮點(diǎn)格式。谷歌、英特爾和不少新創(chuàng)公司都將bfloat16作為其AI加速架構(gòu)的核心功能之一。

Bfloat16是由Google發(fā)明，最初在其第三代Tensor處理單元（TPU）中導(dǎo)入，作為加速機(jī)器學(xué)習(xí)之用。英特爾也認(rèn)為該格式在未來AI計(jì)算中也有龐大的應(yīng)用潛力，因此整合到其即將推出的“Cooper Lake”Xeon SP處理器，以及“Spring Crest”神經(jīng)網(wǎng)絡(luò)處理器中，未來的Xe GPU也會(huì)支持。而包括Wave Computing、Habana Labs和Flex Logix等AI芯片新創(chuàng)公司也采用了支持該計(jì)算格式的定制AI處理器。

bfloat16的主要想法是提供動(dòng)態(tài)范圍與標(biāo)準(zhǔn)IEEE-FP32相同的16位浮點(diǎn)格式，精度較低。相當(dāng)于將8位的FP32指數(shù)字段的大小匹配，并將FP32分?jǐn)?shù)字段的大小縮小到7位。

根據(jù)Arm首席架構(gòu)師和研究員Nigel Stephens的說法，在大多數(shù)情況下，bfloat16格式與FP32一樣準(zhǔn)確，用于神經(jīng)網(wǎng)絡(luò)計(jì)算，但是以一半的位址就可以完成任務(wù)。因此，與32位相比，吞吐量可以翻倍，內(nèi)存需求可以減半。在多數(shù)情況下，blfloat16可以成為這些機(jī)器學(xué)習(xí)算法中FP32的“插入式”替代品。由于神經(jīng)網(wǎng)絡(luò)的計(jì)算性質(zhì)，只要數(shù)據(jù)類型具有足夠的范圍和精度，就可以很好地適應(yīng)少量噪聲，精準(zhǔn)的完成模型訓(xùn)練工作。

Arm將bfloat16的支持被放到ArmV8-A下的所有浮點(diǎn)處理的相關(guān)指令集，包含SVE（可擴(kuò)展矢量擴(kuò)展）、AArch64 Neon（64位SIMD）和AArch32 Neon（32位SIMD）。通過相關(guān)擴(kuò)展的支持，加速基于Arm的客戶端和服務(wù)器的機(jī)器學(xué)習(xí)推理和培訓(xùn)練過程。雖然Arm服務(wù)器市占率仍然很小，但其在智能手機(jī)等客戶端方面擁有幾乎絕對(duì)的統(tǒng)治地位，這意味著未來的手持式和物聯(lián)網(wǎng)設(shè)備將很快能夠利用更緊湊的數(shù)字格式來處理機(jī)器學(xué)習(xí)。

當(dāng)然，Arm如果越強(qiáng)，那么采用自有AI架構(gòu)的芯片設(shè)計(jì)業(yè)者壓力其實(shí)也會(huì)越大，就好比華為先后使用寒武紀(jì)與達(dá)芬奇架構(gòu)，都是封閉的專有架構(gòu)，高通也是采用DSP結(jié)合NPU計(jì)算，如果Arm官方架構(gòu)性能有飛躍性的改進(jìn)，那么這些采用定制AI架構(gòu)的芯片設(shè)計(jì)者可能最終會(huì)被迫放棄自己的封閉架構(gòu)，轉(zhuǎn)而擁抱Arm的開放架構(gòu)。而這也有助于發(fā)展整體AI生態(tài)，畢竟使用相同開發(fā)環(huán)境的硬件基數(shù)越大，就能吸引更多應(yīng)用開發(fā)者共同耕耘相關(guān)生態(tài)。

值得注意的是，Arm決定在SVE中加入bfloat16的支持這點(diǎn)。由于SVE是專門針對(duì)高性能計(jì)算的矢量指令集，截至目前為止，僅有富士通一家采用，并應(yīng)用于其A64FX芯片上。Arm方面表示，由于HPC用戶對(duì)機(jī)器學(xué)習(xí)的興趣持續(xù)增加，過去只能依靠GPU方案來進(jìn)行加速，若能在單一架構(gòu)處理完機(jī)器學(xué)習(xí)的工作，那么就不用再額外花費(fèi)成本添購專用的加速硬件。

使用bfloat16還有另一個(gè)好處，那就是它具有與FP32相同的動(dòng)態(tài)范圍，這使得轉(zhuǎn)換現(xiàn)有使用FP32的現(xiàn)有計(jì)算代碼非常簡(jiǎn)單，可以大規(guī)模無痛轉(zhuǎn)換既有的FP32應(yīng)用到blfloat16數(shù)據(jù)格式下。

然而，SVE原本就可以針對(duì)從128位到2048位等不同的矢量長(zhǎng)度來實(shí)現(xiàn)計(jì)算工作，理論上，bfloat16應(yīng)該放在128位的Neon計(jì)算單元內(nèi)比較合理。但實(shí)際上，數(shù)據(jù)的吞吐量其實(shí)還是要取決于硬件的實(shí)現(xiàn)選擇，比如說SVE執(zhí)行單元的數(shù)量，以及Neon計(jì)算單元的數(shù)量。

而隨著Arm增加了bfloat16這個(gè)數(shù)據(jù)格式的支持，借以加速AI計(jì)算，這也讓GPU成為目前主流機(jī)器學(xué)習(xí)加速硬件中唯一不支持這種數(shù)據(jù)格式的架構(gòu)，而英特爾即將推出的Xe GPU也會(huì)加入該格式的支持，包含AMD或NVIDIA，應(yīng)該都會(huì)在下一代產(chǎn)品中增加此數(shù)據(jù)格式的支持。

根據(jù)ARM做的模擬，不同類型的運(yùn)算中bfloat16帶來的性能提升不等，少的有1.6倍性能，多的可達(dá)4倍性能，性能成長(zhǎng)相當(dāng)驚人。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

ARM

ARM

+關(guān)注

關(guān)注
134

文章
9107

瀏覽量
367982
神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4774

瀏覽量
100891
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8425

瀏覽量
132766

評(píng)論

相關(guān)推薦

應(yīng)用于活細(xì)胞成像的一次性細(xì)胞培養(yǎng)芯片

盡管最近幾年我們對(duì)細(xì)胞內(nèi)過程的了解越來越多，但近期內(nèi)100年來細(xì)胞培養(yǎng)的基本過程沒有根本性的改變。然而，觀察細(xì)胞的方法，卻在近些年進(jìn)行一場(chǎng)革命，如相差，差分干涉對(duì)照，共聚集和熒光等都應(yīng)用于所有細(xì)胞

發(fā)表于 12-17 09:41 ?117次閱讀

為何越來越多的應(yīng)用場(chǎng)景都會(huì)用到溫濕度控制器？

一、定義溫濕度控制器是一種用于監(jiān)測(cè)和控制環(huán)境溫度和濕度的設(shè)備。? 二、工作原理溫濕度控制器通常由傳感器、控制器和執(zhí)行機(jī)構(gòu)組成。傳感器用于檢測(cè)環(huán)境中的溫度和濕度，并將檢測(cè)到的信號(hào)傳輸

發(fā)表于 10-14 14:28 ?307次閱讀

llm模型有哪些格式

LLM（Large Language Model，大型語言模型）是一種深度學(xué)習(xí)模型，主要用于處理自然語言處理（NLP）任務(wù)。LLM模型的格式多種多樣，以下是

發(fā)表于 07-09 09:59 ?660次閱讀

隨著戶儲(chǔ)的發(fā)展推進(jìn)，相關(guān)技術(shù)要求也越來越多

戶用儲(chǔ)能是一種在家庭或住宅環(huán)境中使用的儲(chǔ)能系統(tǒng)，通常是電池儲(chǔ)能系統(tǒng)。它們的主要目的是存儲(chǔ)電能以供日常用電或在需要時(shí)使用。戶用儲(chǔ)能系統(tǒng)可以與太陽能光伏電池板或風(fēng)力發(fā)電機(jī)等可再生能源系統(tǒng)結(jié)合使用

發(fā)表于 07-05 09:38 ?338次閱讀

隨著戶儲(chǔ)的發(fā)展推進(jìn)，相關(guān)技術(shù)要求也<b class='flag-5'>越來越多</b>

態(tài)勢(shì)數(shù)據(jù)有哪些格式和內(nèi)容呢

和內(nèi)容。特點(diǎn)：具有良好的可讀性和可擴(kuò)展性，在態(tài)勢(shì)數(shù)據(jù)交換和共享中較為常見。 JSON：定義：一種輕量級(jí)的數(shù)據(jù)交換格式，易于閱讀和編寫，也易于機(jī)器解析和生成。特點(diǎn)：在Web服務(wù)和API中，JSON

發(fā)表于 06-11 16:57 ?525次閱讀