隨著消費(fèi)、生物醫(yī)學(xué)和 IoT/IIoT 市場(chǎng)中始終監(jiān)聽設(shè)備的爆炸式增長(zhǎng),似乎每個(gè)人都在嘗試使用模擬來(lái)節(jié)省設(shè)計(jì)中的功耗。借助使用“模擬內(nèi)存計(jì)算”來(lái)降低處理器功率的新型機(jī)器學(xué)習(xí) (ML) 數(shù)字芯片,半導(dǎo)體供應(yīng)商正在發(fā)明新方法來(lái)利用模擬計(jì)算的固有功率和計(jì)算效率。那么,有什么問(wèn)題呢?事實(shí)是,盡管這些芯片利用模擬電路的固有優(yōu)勢(shì)來(lái)節(jié)省芯片內(nèi)用于神經(jīng)網(wǎng)絡(luò)處理的功率,但它們最終是在數(shù)字域中對(duì)數(shù)字?jǐn)?shù)據(jù)進(jìn)行操作的數(shù)字處理芯片——這意味著它們只為系統(tǒng)提供有限的節(jié)能。幸運(yùn)的是,模擬ML ) 內(nèi)核——現(xiàn)在可以在系統(tǒng)級(jí)實(shí)現(xiàn)更高的功率效率。
雖然模擬內(nèi)存計(jì)算和模擬ML 有時(shí)都被標(biāo)記為“模擬計(jì)算”,但它們絕不是一回事。設(shè)計(jì)人員需要了解模擬內(nèi)存計(jì)算和模擬ML 內(nèi)核之間的差異,以便他們能夠創(chuàng)建更節(jié)能的終端設(shè)備?
內(nèi)存模擬計(jì)算的芯片級(jí)效率
模擬內(nèi)存計(jì)算通常是指在其他數(shù)字機(jī)器學(xué)習(xí)處理器的神經(jīng)網(wǎng)絡(luò)中使用模擬電路,以便以較低的功率執(zhí)行乘法累加 (MAC) 功能。但是利用這種方法的芯片仍然是在標(biāo)準(zhǔn)數(shù)字處理范式內(nèi)運(yùn)行的時(shí)鐘處理器,需要立即對(duì)所有模擬傳感器數(shù)據(jù)進(jìn)行數(shù)字化,無(wú)論是否相關(guān)。事實(shí)上,使用模擬內(nèi)存計(jì)算的芯片實(shí)際上需要三個(gè)單獨(dú)的數(shù)據(jù)轉(zhuǎn)換才能確定數(shù)據(jù)的重要性。傳感器數(shù)據(jù)立即轉(zhuǎn)換為數(shù)字進(jìn)行初始處理(數(shù)字化優(yōu)先架構(gòu)),然后將它們轉(zhuǎn)換為芯片內(nèi)的模擬數(shù)據(jù)以實(shí)現(xiàn) MAC 功能,最后,它們?cè)谛酒瑑?nèi)被轉(zhuǎn)換回?cái)?shù)字,以進(jìn)行推理、分類和其他功能所需的額外數(shù)字處理。因此,大量的數(shù)據(jù)轉(zhuǎn)換,但沒(méi)有太多的實(shí)際模擬處理。
雖然模擬內(nèi)存計(jì)算可能會(huì)降低單個(gè)推理芯片的功率,但它僅以非常有限的方式使用模擬,因此它只能為整個(gè)系統(tǒng)提供同樣有限的功率降低。
AnalogML 的系統(tǒng)級(jí)效率
相比之下,analogML 內(nèi)核完全在模擬域內(nèi)運(yùn)行,不需要時(shí)鐘,并且在對(duì)任何數(shù)據(jù)進(jìn)行數(shù)字化之前使用原始模擬傳感器數(shù)據(jù)進(jìn)行推理和分類。集成到始終監(jiān)聽的設(shè)備中,analogML 內(nèi)核在花費(fèi)任何精力進(jìn)行單個(gè)數(shù)據(jù)轉(zhuǎn)換之前確定數(shù)據(jù)的重要性。我們稱其為“先分析”,因?yàn)閍nalogML 核心保持?jǐn)?shù)字系統(tǒng)關(guān)閉,除非檢測(cè)到相關(guān)數(shù)據(jù)。
與包含模擬內(nèi)存計(jì)算的 ML 芯片相比,analogML 內(nèi)核處理模擬傳感器數(shù)據(jù)的更簡(jiǎn)化方法對(duì)系統(tǒng)級(jí)效率產(chǎn)生重大影響。(見圖 1。)
圖 1:使用具有模擬內(nèi)存計(jì)算的 ML 芯片的數(shù)字化優(yōu)先系統(tǒng)架構(gòu)(頂部模塊)與使用模擬ML 內(nèi)核的分析優(yōu)先系統(tǒng)架構(gòu)(底部模塊)的比較
例如,在典型的語(yǔ)音優(yōu)先系統(tǒng)中,analogML 內(nèi)核 100% 的時(shí)間都處于開啟狀態(tài),在始終偵聽模式下消耗低至 10μA 的電流以確定哪些數(shù)據(jù)是重要的(分析優(yōu)先架構(gòu)),然后再消耗任何功率關(guān)于數(shù)字化。這會(huì)使系統(tǒng)的其余部分保持休眠狀態(tài),直到檢測(cè)到相關(guān)數(shù)據(jù)。與在數(shù)字域中 100% 的時(shí)間(數(shù)字化優(yōu)先架構(gòu))運(yùn)行并消耗高達(dá) 3000-4000μA 的更傳統(tǒng)的 ML 芯片相比,使用模擬ML 的分析優(yōu)先方法可將電池壽命延長(zhǎng)多達(dá) 10 倍。這就是持續(xù)數(shù)天而不是數(shù)小時(shí)的智能耳塞與一次充電即可持續(xù)數(shù)年而不是數(shù)月的聲控電視遙控器之間的區(qū)別。
AnalogML Core 中有什么?
深入analogML 核心的底層揭示了模擬內(nèi)存計(jì)算(模擬計(jì)算僅用于神經(jīng)網(wǎng)絡(luò))與analogML 核心(由多個(gè)軟件控制的模擬處理塊組成,我們可以啟用、重新配置)之間的區(qū)別,并針對(duì)各種分析優(yōu)先應(yīng)用程序進(jìn)行調(diào)整。這些模塊——可以在需要時(shí)獨(dú)立供電——實(shí)現(xiàn)了一系列功能。(見圖 2)。
圖 2:analogML 內(nèi)核的框圖
傳感器接口——可以為特定傳感器類型(麥克風(fēng)、加速度計(jì)等)合成接口電路
模擬特征提取——從原始的模擬傳感器數(shù)據(jù)中挑選出顯著特征,大大減少進(jìn)入神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)量
模擬神經(jīng)網(wǎng)絡(luò)——高效、小尺寸、可編程模擬推理模塊
模擬數(shù)據(jù)壓縮——模擬傳感器數(shù)據(jù)的連續(xù)收集和壓縮支持低功耗數(shù)據(jù)緩沖
模擬范式轉(zhuǎn)變
AnalogML 遠(yuǎn)遠(yuǎn)超出了在整個(gè) ML 芯片計(jì)算的一小部分中使用一點(diǎn)點(diǎn)模擬計(jì)算來(lái)節(jié)省功耗。這是一個(gè)完整的模擬前端解決方案,它使用接近零的功率來(lái)確定信號(hào)鏈中最早點(diǎn)的數(shù)據(jù)的重要性——而數(shù)據(jù)仍然是模擬的——以最大限度地減少通過(guò)系統(tǒng)運(yùn)行的數(shù)據(jù)量和數(shù)字系統(tǒng) (ADC/MCU/DSP) 開啟的時(shí)間量。在某些應(yīng)用中,例如玻璃破碎檢測(cè),事件可能每十年發(fā)生一次(或從不發(fā)生),使用模擬ML 內(nèi)核使數(shù)字系統(tǒng)在 99% 以上的時(shí)間內(nèi)保持關(guān)閉可以將電池壽命延長(zhǎng)數(shù)年。這開辟了新類別的持久遠(yuǎn)程應(yīng)用程序,如果所有相關(guān)或不相關(guān)的數(shù)據(jù)在處理之前都被數(shù)字化,這些應(yīng)用程序?qū)o(wú)法實(shí)現(xiàn)。
底線是所有模擬計(jì)算都不相等。無(wú)論芯片中包含多少模擬處理來(lái)降低其功耗,除非該芯片在模擬域中運(yùn)行,在模擬數(shù)據(jù)上,它并沒(méi)有做我們所知道的最能節(jié)省系統(tǒng)功耗的一件事——減少數(shù)字處理數(shù)據(jù)。
審核編輯:郭婷
-
芯片
+關(guān)注
關(guān)注
456文章
50889瀏覽量
424229 -
mcu
+關(guān)注
關(guān)注
146文章
17171瀏覽量
351461 -
adc
+關(guān)注
關(guān)注
98文章
6503瀏覽量
544881
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論