0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新的數(shù)字表示方法將減輕AI數(shù)學(xué)計算負(fù)擔(dān)

中科院半導(dǎo)體所 ? 來源:悅智網(wǎng) ? 2023-02-24 11:27 ? 次閱讀

訓(xùn)練支撐許多現(xiàn)代人工智能AI)工具的大型神經(jīng)網(wǎng)絡(luò)都需要真實(shí)強(qiáng)大的計算能力。例如,OpenAI最先進(jìn)的語言模型GPT-3訓(xùn)練就需要驚人的10億億次運(yùn)算,其計算時間耗資約500萬美元。工程師們認(rèn)為他們已經(jīng)找到了一種方法,通過使用不同的方式表示數(shù)字,進(jìn)而減輕計算負(fù)擔(dān)。

早在2017年,當(dāng)時在A*STAR計算資源中心和新加坡國立大學(xué)就職的約翰?古斯塔夫森(John Gustafson)以及在星際機(jī)器人電腦公司任職的艾薩克?約莫托(Isaac Yonemoto)就開發(fā)了一種新的數(shù)字表示方法。這些數(shù)字稱為“posit”,他們提議將這些數(shù)字作為對目前使用的標(biāo)準(zhǔn)浮點(diǎn)算數(shù)處理器的改進(jìn)表示。

現(xiàn)在,馬德里康普頓斯大學(xué)的一個研究團(tuán)隊開發(fā)了首個可在硬件中實(shí)現(xiàn)posit標(biāo)準(zhǔn)的處理器內(nèi)核,并表明,與使用標(biāo)準(zhǔn)浮點(diǎn)數(shù)字計算相比,基本計算任務(wù)的位對位(bit-for-bit)精度提高了4個數(shù)量級。他們在2022年9月的IEEE計算機(jī)算數(shù)研討會上發(fā)表了其研究結(jié)果。

“如今,摩爾定律似乎已開始衰落?!笨灯疹D斯大學(xué)ArTeCS小組的研究生研究員大衛(wèi)?馬拉森?金塔納(David Mallasén Quintana)說,“所以我們需要找到其他方法來提高機(jī)器的性能。其中一種方法就是改變我們的實(shí)數(shù)編碼方式,以及如何表示實(shí)數(shù)?!?/p>

用數(shù)字表示方法來突破極限的并非只有康普頓斯團(tuán)隊。早在2022年9月,Arm、英特爾英偉達(dá)就形成了一項(xiàng)技術(shù)規(guī)范,在機(jī)器學(xué)習(xí)應(yīng)用程序中,使用8位浮點(diǎn)數(shù)字替代通常的32位或16位浮點(diǎn)數(shù)字,即使用短小、低精度的格式,以降低計算精度為代價,提高計算效率和內(nèi)存使用率。

實(shí)數(shù)不能在硬件中完美表示,因?yàn)閷?shí)數(shù)的數(shù)量是無限的。為了適應(yīng)指定的位數(shù),許多實(shí)數(shù)必須四舍五入。posit的優(yōu)勢在于,這種方法表示數(shù)字的精度是沿著數(shù)軸分布的。在數(shù)軸中間,1和-1周圍,posit表示的精度比浮點(diǎn)的高。在數(shù)軸兩翼會逐漸出現(xiàn)較大的負(fù)數(shù)和正數(shù),posit精度比浮點(diǎn)下降得更平穩(wěn)。

古斯塔夫森說:“這與數(shù)字在計算中的自然分布相吻合。動態(tài)范圍是合適的,在需要更高精度時,它的精度可以滿足需求。浮點(diǎn)運(yùn)算中有很多從來沒有用過的位串,這是一種浪費(fèi)。”

posit之所以能實(shí)現(xiàn)1和-1周圍精度的提高,是因?yàn)樵摫硎痉椒ㄓ幸粋€額外組成部分。浮點(diǎn)數(shù)由3個部分組成:一個符號位(0為正,1為負(fù)),幾個“尾數(shù)”(小數(shù))位表示二進(jìn)制小數(shù)點(diǎn)后面的數(shù),其余的位用來定義指數(shù)(2exp)。

posit保留了浮點(diǎn)數(shù)的所有組成部分,但添加了一個額外的“regime”部分,即指數(shù)的指數(shù)。regime的優(yōu)點(diǎn)在于它的位長度可以變化。對于較小的數(shù)字,它可以只需要2位,為尾數(shù)留下更高的精度。這樣posit可以在1和-1周圍的“甜蜜點(diǎn)”位置實(shí)現(xiàn)更高的精度。

深度神經(jīng)網(wǎng)絡(luò)通常使用被稱為權(quán)重的歸一化參數(shù),因此它們是從posit獲益的完美候選者。許多神經(jīng)網(wǎng)絡(luò)計算都由乘積累加運(yùn)算組成。每次執(zhí)行這種計算,每個求和都必須再次截斷,導(dǎo)致精度損失。采用posit,一個名為quire的專用寄存器能夠有效地執(zhí)行累加步驟,減少精度損失。但目前的硬件應(yīng)用的是浮點(diǎn),而且到目前為止,在軟件中使用posit帶來的計算收益在很大程度上被格式轉(zhuǎn)換的損耗掩蓋了。

0407a83c-b372-11ed-bfe3-dac502259ad0.jpg

使用他們用現(xiàn)場可編程門陣列(FPGA)合成的新硬件,康普頓斯團(tuán)隊對32位浮點(diǎn)和32位posit的計算進(jìn)行并列比較。

該團(tuán)隊還將結(jié)果與更精確但計算成本較高的64位浮點(diǎn)格式的結(jié)果進(jìn)行比較,對結(jié)果的精度進(jìn)行評估。對于矩陣乘法(神經(jīng)網(wǎng)絡(luò)訓(xùn)練中固有的一連串乘積累加)的精度,posit比浮點(diǎn)運(yùn)算驚人地提高了4個數(shù)量級。

該團(tuán)隊還發(fā)現(xiàn),提高精度并沒有以計算時間為代價,只是芯片使用面積和功耗略有增加。

盡管提高數(shù)字精度是不可否認(rèn)的,但確切地說,它對訓(xùn)練GPT-3等大型AI有怎樣的影響還有待觀察。

馬拉森說:“posit可能會提高訓(xùn)練速度,因?yàn)樵谟?xùn)練的過程中不會丟失太多信息。但這些事我們還不知道。有人已經(jīng)在軟件中試過了,現(xiàn)在也要在我們的硬件中試一下?!?/p>

其他團(tuán)隊正在研究實(shí)現(xiàn)自己的硬件,促進(jìn)posit的使用。“這正是我所希望的,它被瘋狂地接受了?!惫潘顾蛏f,“posit數(shù)字格式爆火,正在使用posit的有幾十個團(tuán)隊,公司和大學(xué)的團(tuán)隊都有?!?/p>





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19342

    瀏覽量

    230221
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47409

    瀏覽量

    238923
  • 深度神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    0

    文章

    61

    瀏覽量

    4541
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1100

    瀏覽量

    6573

原文標(biāo)題:新的數(shù)字表示方法將改進(jìn)AI數(shù)學(xué)運(yùn)算

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    智慧交通AI監(jiān)控視頻分析應(yīng)用方案

    隨著社會的進(jìn)步和科技的不斷發(fā)展,互聯(lián)網(wǎng)技術(shù)和AI視覺分析技術(shù)日益成熟,為傳統(tǒng)交通監(jiān)控領(lǐng)域帶來了新的發(fā)展機(jī)遇。AI視覺分析技術(shù)的引入,不僅提升了交通監(jiān)控的智能化和自動化水平,還顯著減輕了交管部門的工作
    的頭像 發(fā)表于 11-29 14:12 ?206次閱讀
    智慧交通<b class='flag-5'>AI</b>監(jiān)控視頻分析應(yīng)用方案

    使用 AMD Versal AI 引擎釋放 DSP 計算的潛力

    “Versal AI 引擎可以在降低功耗預(yù)算的情況下提高 DSP 計算密度,”高級產(chǎn)品營銷經(jīng)理 Udayan Sinha 表示。這種效率使 Versal AI 引擎能夠在嚴(yán)格的功耗預(yù)算
    的頭像 發(fā)表于 11-29 14:07 ?547次閱讀

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    CPU、GPU的演進(jìn)歷程,AI專用芯片或引領(lǐng)未來計算平臺的新方向。正如愛因斯坦所說:\"想象力比知識更重要\" —— 在芯片設(shè)計領(lǐng)域,創(chuàng)新思維帶來的突破往往令人驚嘆。
    發(fā)表于 11-24 17:12

    NVIDIA與德勤共同部署適用于醫(yī)療健康的數(shù)字AI智能體

    渥太華醫(yī)院使用 NVIDIA AI 驅(qū)動的德勤 Frontline AI Teammate 來部署 AI 助手,以提供更好的患者體驗(yàn)并減輕管理負(fù)擔(dān)
    的頭像 發(fā)表于 11-13 11:37 ?382次閱讀

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術(shù)發(fā)展的基石,更是推動AI應(yīng)用落地、加速產(chǎn)業(yè)升級的重要工具。以下,是對AI高性能
    的頭像 發(fā)表于 11-11 09:56 ?218次閱讀

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    計算的結(jié)合 我深刻體會到高性能計算(HPC)在AI for Science中的重要性。傳統(tǒng)的科學(xué)計算往往面臨計算量大、
    發(fā)表于 10-14 09:16

    數(shù)字信號包括哪些 數(shù)字信號的特點(diǎn)是什么

    數(shù)字表示信號,如4進(jìn)制、8進(jìn)制等。 模擬信號的數(shù)字表示模擬信號通過采樣、量化和編碼轉(zhuǎn)換為數(shù)字信號。 脈沖編碼調(diào)制(PCM)信號 :
    的頭像 發(fā)表于 08-11 10:44 ?2296次閱讀

    神經(jīng)網(wǎng)絡(luò)在數(shù)學(xué)建模中的應(yīng)用

    數(shù)學(xué)建模是一種利用數(shù)學(xué)方法和工具來描述和分析現(xiàn)實(shí)世界問題的過程。神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元結(jié)構(gòu)和功能的計算模型,可以用于解決各種復(fù)雜問題。在數(shù)學(xué)建模中,神經(jīng)網(wǎng)絡(luò)可以作為一種有效的工具
    的頭像 發(fā)表于 07-02 11:29 ?980次閱讀

    科學(xué)計算的下一輪創(chuàng)新,AI超算與數(shù)字孿生

    應(yīng)用的行列中來。 ? AI 超算與數(shù)字孿生 ? 在過去通用計算負(fù)載的時代,我們難以采用更大規(guī)模的計算集群來打造數(shù)字孿生??呻S著
    的頭像 發(fā)表于 05-07 00:16 ?2022次閱讀
    科學(xué)<b class='flag-5'>計算</b>的下一輪創(chuàng)新,<b class='flag-5'>AI</b>超算與<b class='flag-5'>數(shù)字</b>孿生

    請問DMA控制器可以減輕CPU負(fù)擔(dān)嗎?

    直接存儲器訪問 ( DMA )控制器,可以在內(nèi)存和/或外設(shè)之間傳輸數(shù)據(jù),而不需要 CPU 參與每次傳輸。合理利用 DMA 控制器,可以減輕CPU的負(fù)擔(dān)
    的頭像 發(fā)表于 03-28 09:41 ?737次閱讀
    請問DMA控制器可以<b class='flag-5'>減輕</b>CPU<b class='flag-5'>負(fù)擔(dān)</b>嗎?

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術(shù),旨在人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳
    發(fā)表于 03-12 08:09

    高通NPU和異構(gòu)計算提升生成式AI性能?

    異構(gòu)計算的重要性不可忽視。根據(jù)生成式AI的獨(dú)特需求和計算負(fù)擔(dān),需要配備不同的處理器,如專注于AI工作負(fù)載的定制設(shè)計的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?825次閱讀

    如何實(shí)現(xiàn)二進(jìn)制和BCD碼數(shù)據(jù)的相互轉(zhuǎn)變?

    如何實(shí)現(xiàn)二進(jìn)制和BCD碼數(shù)據(jù)的相互轉(zhuǎn)變? 二進(jìn)制碼是十進(jìn)制數(shù)字表示為二進(jìn)制數(shù)和十進(jìn)制數(shù)的一種表示方法。在計算機(jī)系統(tǒng)中,二進(jìn)制數(shù)是最基本的數(shù)
    的頭像 發(fā)表于 02-18 14:51 ?3725次閱讀

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗(yàn)】(原創(chuàng))5.FPGA的AI加速源代碼

    計算進(jìn)程 start : instd_logic;-- 開始信號,當(dāng)AI說“開始做題”時,我們就行動起來 A_in: inmatrix_type; -- 輸入矩陣A,就像一堆待解的數(shù)學(xué)謎題 B_in
    發(fā)表于 02-12 16:18

    什么是AI邊緣計算,AI邊緣計算的特點(diǎn)和優(yōu)勢介紹

    隨著人工智能的迅猛發(fā)展,AI邊緣計算成為了熱門話題。那么什么是AI邊緣計算呢?簡單來說,它是人工智能技術(shù)引入邊緣
    的頭像 發(fā)表于 02-01 11:42 ?917次閱讀