雖然自動(dòng)駕駛還沒(méi)有走向千家萬(wàn)戶(hù),但是自動(dòng)駕駛芯片的大戰(zhàn)早已開(kāi)始。
這里面有 Mobileye 這樣的行業(yè)先驅(qū),有英偉達(dá)這樣的跨界巨頭,有特斯拉這樣的別樣車(chē)廠,還有地平線這樣的國(guó)內(nèi)新銳企業(yè)。
然而,我們也不應(yīng)該忽略一些原本在芯片領(lǐng)域赫赫有名的面孔,比如英特爾——雖然早在 2017 年就收購(gòu)了Mobileye,但這并不影響英特爾工程師們對(duì)自動(dòng)駕駛的獨(dú)特追求。
目前我們見(jiàn)到的自動(dòng)駕駛芯片,本質(zhì)上依然沒(méi)有脫離一臺(tái)計(jì)算機(jī)的基本結(jié)構(gòu),比如 CPU/GPU/DRAM 這些常見(jiàn)于你我桌上電腦、掌上手機(jī)的零件。而一臺(tái)計(jì)算機(jī)在面對(duì)自動(dòng)駕駛計(jì)算的時(shí)候,它的工作模式和人類(lèi)司機(jī)的大腦相比是很不一樣的。
舉個(gè)例子吧,特斯拉新一代 Autopilot 硬件的功耗,官方描述是 250W 每英里,也就是說(shuō)自動(dòng)駕駛硬件在開(kāi)啟狀態(tài)下會(huì)一直處于全速運(yùn)行。但是人類(lèi)司機(jī)并不會(huì)一直燒腦式駕駛,在自己熟稔的、交通狀況良好的路段上,人類(lèi)大腦的負(fù)擔(dān)會(huì)明顯更低。
所以,有沒(méi)有辦法讓自動(dòng)駕駛也能像人類(lèi)一樣,具有更高的能耗效率呢?
英特爾實(shí)驗(yàn)室給出了他們的答案:用造芯片的方法造一個(gè)大腦就好了。
將芯片造成大腦模樣
上圖這一坨東西叫做 Pohoiki Beach,主板里面密密麻麻的芯片叫做Loihi(跟我用粵語(yǔ)讀一次,老嗨),來(lái)自于當(dāng)?shù)貢r(shí)間 15 號(hào)在底特律舉行的2019 DARPA 電子復(fù)興計(jì)劃峰會(huì)。
注:DARPA,全稱(chēng)DefenseAdvanced Research Projects Agency,即美國(guó)國(guó)防高級(jí)研究計(jì)劃局,是美國(guó)國(guó)防部屬下的一個(gè)行政機(jī)構(gòu),負(fù)責(zé)研發(fā)用于軍事用途的高新科技。成立于 1958 年的 DARPA,一開(kāi)始主要是為了應(yīng)對(duì)蘇聯(lián) 1957 年人造地球衛(wèi)星成功發(fā)射而設(shè)立的部門(mén)。
一塊 Pohoiki Beach 主板可以根據(jù)需求的不同搭載 8-32 塊芯片,兩塊主板與左下角那個(gè) Arria 10 FPGA 開(kāi)發(fā)模塊互聯(lián)之后,Pohoiki Beach 最多可以成為一個(gè)擁有 64 個(gè) Loihi 芯片的 AI 深度學(xué)習(xí)計(jì)算系統(tǒng)。
與這個(gè)世界上所有的硅芯片類(lèi)似,Loihi 芯片的基本構(gòu)成依然是晶體管。但是在 Loihi 里面,晶體管的工作形式并非傳統(tǒng)的邏輯門(mén)架構(gòu),Loihi 的計(jì)算原理也并非傳統(tǒng)計(jì)算機(jī)恪守?cái)?shù)十年的馮諾依曼原理,而是以更接近人腦架構(gòu)的神經(jīng)元方式計(jì)算。
注:馮·諾依曼教授提出過(guò)現(xiàn)代電子計(jì)算機(jī)的三大原理,分別是1. 計(jì)算機(jī)由控制器、運(yùn)算器、存儲(chǔ)器、輸入設(shè)備、輸出設(shè)備五大部分組成;2.程序和數(shù)據(jù)以二進(jìn)制代碼形式不加區(qū)別地存放在存儲(chǔ)器中,存放位置由地址確定;3. 控制器根據(jù)存放在存儲(chǔ)器中地指令序列(程序)進(jìn)行工作,并由一個(gè)程序計(jì)數(shù)器控制指令地執(zhí)行。控制器具有判斷能力,能根據(jù)計(jì)算結(jié)果選擇不同的工作流程。
馮諾依曼架構(gòu)雖然奠定了半個(gè)多世紀(jì)的電子計(jì)算機(jī)芯片基本框架,但這個(gè)架構(gòu)也有其自身的瓶頸,那就是在處理器性能飛速發(fā)展的今天,緩存的讀寫(xiě)速度出現(xiàn)了跟不上處理器運(yùn)行速度的瓶頸——這個(gè)瓶頸就叫馮諾依曼瓶頸。
當(dāng)然,我們無(wú)法真正的用硅元素「造」出一個(gè)神經(jīng)元,Loihi 芯片的基本組成形式依然是晶體管,只是 Loihi 芯片內(nèi)置晶體管的工作方式更接近于大腦神經(jīng)元。64 個(gè) Loihi 芯片一共包含了接近 1320 億個(gè)硅晶體管,與之相比,英偉達(dá) RTX 2080Ti GPU 內(nèi)置晶體管數(shù)量為 186 億個(gè)。
在 Pohoiki Beach 系統(tǒng)中,基于 14 納米工藝打造的每塊 Loihi 芯片可以模擬 13 萬(wàn)個(gè)硅神經(jīng)元,以及 1.3 億個(gè)硅神經(jīng)突觸。64 個(gè) Loihi 芯片互聯(lián)就是 830 萬(wàn)個(gè)神經(jīng)元,已經(jīng)相當(dāng)于一個(gè)小老鼠大腦內(nèi)所含有的神經(jīng)元總量。
英特爾的目標(biāo)遠(yuǎn)不止于此,今年年底即將推出的 Pohoiki Spring 系統(tǒng)會(huì)將 Loihi 芯片的性能發(fā)揮到極致,最多可以疊加 768 顆芯片,也就是模擬 1 億個(gè)神經(jīng)元,相當(dāng)于一只未成年小貓的大腦神經(jīng)元數(shù)量。
雖然 Pohoiki Beach 系統(tǒng)的神經(jīng)元總量和人腦的 860 億個(gè)神經(jīng)元比起來(lái)還有很大的一段距離,但這并不妨礙它成為目前人類(lèi)神經(jīng)擬態(tài)計(jì)算的新里程碑。2015 年我國(guó)浙江大學(xué)研發(fā)的「達(dá)爾文」芯片是當(dāng)時(shí)比較先進(jìn)的神經(jīng)擬態(tài)計(jì)算芯片,內(nèi)置的硅神經(jīng)元也才 2048 個(gè)。
在 2017 年 9 月份,Loihi 芯片剛發(fā)布的時(shí)候,英特爾專(zhuān)門(mén)為它打造了一個(gè)視頻宣傳片:
視頻里面充斥著英特爾對(duì) Loihi,乃至神經(jīng)擬態(tài)芯片光輝未來(lái)的期望——可是為什么呢?
AI 的未來(lái),就在我們的大腦里面嗎?
先來(lái)說(shuō)說(shuō)神經(jīng)元的工作原理。
當(dāng)人腦的神經(jīng)元接收到信號(hào)的時(shí)候,神經(jīng)元樹(shù)突上的電位差會(huì)輕微升高,這個(gè)反應(yīng)被稱(chēng)為神經(jīng)元突觸的激發(fā)。如果對(duì)該神經(jīng)元的刺激達(dá)到一定閾值,就會(huì)產(chǎn)生動(dòng)作電位(actional potential),產(chǎn)生動(dòng)作電位的過(guò)程被稱(chēng)為放電(discharge)。
我們大腦產(chǎn)生和傳遞信息的原理,就隱藏在神經(jīng)元之間的放電反應(yīng)之中,比如放電的頻率,放電的持久時(shí)間,放電反應(yīng)中不同的電壓等等。
與電子計(jì)算機(jī)芯片中使用的邏輯門(mén)不一樣,大腦神經(jīng)元只在接收到脈沖信號(hào)時(shí)才會(huì)產(chǎn)生動(dòng)作電位并放射生物電脈沖。也就是說(shuō),大腦神經(jīng)元的計(jì)算方式,在處理任務(wù)的時(shí)候會(huì)明顯更高效。
最終的結(jié)果就是,大腦的功耗理論上會(huì)比同樣運(yùn)算能力的電子計(jì)算機(jī)低得多——實(shí)際上,作為人類(lèi)文明的基石,人腦的「功耗」僅為 20W。
注:我們一開(kāi)始認(rèn)為 20W 這個(gè)結(jié)論是以訛傳訛,然后我們?cè)赼rXiv一篇探討深度學(xué)習(xí)功耗的論文(arXiv 編號(hào) 1602.04019)的一處引用中找到了這個(gè)數(shù)字的根本出處——德國(guó)海德堡大學(xué)(1386 年創(chuàng)立,德國(guó)最古老的大學(xué))Karlheinz Meier 教授的一項(xiàng)研究。
注:arXiv 是目前世界上最大的免費(fèi)自然科學(xué)論文及其預(yù)印本閱讀和交流平臺(tái),始創(chuàng)于 1991 年,目前由康奈爾大學(xué)管理。
如果不是鐵證如山,相信很多人難以相信大腦的能耗如此之低——所以基于硅神經(jīng)元打造的類(lèi)人腦神經(jīng)擬態(tài)芯片也能達(dá)到這樣高的能耗比嗎?
答案是可以的。
滑鐵盧大學(xué)從事人工智能研究的教授 Chris Eliasmith 是 Loihi 芯片和 Pohoiki Beach 的首批合作使用者。根據(jù) Chris 教授的實(shí)驗(yàn)室數(shù)據(jù),同樣實(shí)時(shí)運(yùn)行一個(gè)深度學(xué)習(xí)模型并保持相同運(yùn)算速度的情況下,Loihi 芯片的綜合能耗水平僅為 GPU 的 109 分之一(相關(guān)研究成果在 arXiv 上可查論文,編號(hào)1812.01739),CPU 的 23.2 分之一。
注:滑鐵盧大學(xué)位于加拿大安大略省西南部滑鐵盧市,創(chuàng)建于 1957 年,計(jì)算機(jī)科學(xué)專(zhuān)業(yè)在 2017 年名列 USNEWS 世界大學(xué)排名第 18 位。
而當(dāng) Chris 教授將深度學(xué)習(xí)模型的規(guī)模擴(kuò)大 50 倍之后,Poihiki Beach 在保持相同學(xué)習(xí)速度的基礎(chǔ)上,功耗只增加了 30%,而能保持速度的傳統(tǒng)智能芯片功耗增加了 5 倍。
考慮到上文提及的 64 核心 Poihiki Beach 系統(tǒng)一共內(nèi)置了 1320 億個(gè)晶體管,這樣的功耗水平實(shí)在是低得恐怖。
也許這一章節(jié)硬核得有些過(guò)分,我們可以用非常生動(dòng)形象的例子解釋一下。
我們算 1+1 和算 76x89 的時(shí)候,思考的速度是差不多的,因?yàn)檫@兩個(gè)算式的算法我們都知道(就像深度學(xué)習(xí)模型的訓(xùn)練)——但你算 100 道 1+1 級(jí)別的算術(shù)題,和你算 100 道 76x89 級(jí)別的算術(shù)題之后,你肚子餓的程度和你精神疲憊的程度,不會(huì)相差太遠(yuǎn)。
而神經(jīng)元擬態(tài)計(jì)算,乃至幾乎所有的神經(jīng)網(wǎng)絡(luò)計(jì)算,都是在特定的環(huán)境下運(yùn)行的——這個(gè)環(huán)境叫矩陣運(yùn)算。我們?cè)?jīng)在4個(gè)月之前的文章里面討論過(guò)矩陣運(yùn)算的基本原理,這里不詳細(xì)展開(kāi),感興趣的朋友可以在公眾號(hào)后臺(tái)回復(fù)「TPU」查看原文。
張量矩陣運(yùn)算示意圖
針對(duì)神經(jīng)網(wǎng)絡(luò)優(yōu)化的芯片,絕大部分都是在矩陣運(yùn)算方面有針對(duì)性?xún)?yōu)化的,所以其他神經(jīng)網(wǎng)絡(luò)芯片,比如谷歌的 TPU ,在深度學(xué)習(xí)方面都會(huì)比傳統(tǒng)的CPU 和 GPU 能耗比更強(qiáng)——只是沒(méi)有 Loihi 芯片這么出眾而已。
而能耗比,恰好是車(chē)載智能硬件的一大硬傷。
舉個(gè)例子,車(chē)載電子元件的工作溫度要求一般在-40℃~55℃,更高的標(biāo)準(zhǔn)甚至?xí)⑸舷拊O(shè)置在 110℃。也就是說(shuō),電子元件需要在極高的溫度范圍內(nèi)保持正常的性能水平和質(zhì)量水準(zhǔn),這就需要芯片廠商對(duì)每一代工藝做大量的優(yōu)化和試驗(yàn)。
比如英偉達(dá)的 Drive PX 系列在改名為 AGX 系列的同時(shí),也經(jīng)受了 ASIL-D 級(jí)別標(biāo)準(zhǔn)的認(rèn)定。黃仁勛在 GTC 大會(huì)上面的原話是「這個(gè)過(guò)程大概要一年多」。
為了適應(yīng)車(chē)載級(jí)別的溫度要求,功耗為 250W 的特斯拉 Autopilot 硬件 3.0 上面使用了復(fù)雜的水冷散熱,功耗達(dá)到 500W 的英偉達(dá) Drive AGX Pegasus 甚至根本沒(méi)有車(chē)企敢用。
然而我們可以看一下在 Chris 教授論文里面,Loihi 芯片的功耗表現(xiàn):
最大的差距體現(xiàn)在 Running,也就是運(yùn)行中的功耗比較里,Loihi 以0.11W的功耗就可以達(dá)到英偉達(dá) Quadro K4000 專(zhuān)業(yè)級(jí) GPU 在37.83W功耗下同樣的 AI 性能——0.11W 的功耗水平,意味著 Loihi 芯片根本不需要主動(dòng)散熱(就像我們的腦殼子也沒(méi)有進(jìn)化出一個(gè)風(fēng)扇),省略了大量的結(jié)構(gòu)成本。
可惜,目前 Loihi 芯片的成本和工藝依然是一個(gè)短板,14 納米工藝下,英特爾需要極大量的芯片疊加才足以構(gòu)建不到人腦萬(wàn)分之一的神經(jīng)元矩陣。所以 Loihi 芯片現(xiàn)階段的主要應(yīng)用,還是在于智能義肢,或者是深度模型訓(xùn)練。
但這并不影響英特爾成為目前最接近「人造人腦」這一目標(biāo)的公司。
結(jié)語(yǔ)
1960 年,美國(guó)醫(yī)學(xué)博士 Jack E.Steele 根據(jù)古希臘語(yǔ)和拉丁文里面「生命」共同的詞根「bio」和表示性質(zhì)的「nic」詞根,創(chuàng)造出「bionic」,也就是仿生學(xué)(仿生學(xué)這一中文詞匯來(lái)自于大陸 1963 年的翻譯)。
但人類(lèi)應(yīng)用仿生學(xué)的歷史早已有之。大禹治水時(shí)期,人們模仿魚(yú)類(lèi)在水中自由游動(dòng)的特性,在船尾造木槳,這就是世界上最早的櫓和舵?!俄n非子》中記載的魯班以竹木作鳥(niǎo)「成而飛之,三日不下」,這是世界上最早的人造飛行器記錄。
人類(lèi)的生產(chǎn)力在不斷提高,野心也在不斷提高,最終就是人越來(lái)越懶,什么都不希望自己干,甚至于思考本身,都希望找到代勞者。半個(gè)世紀(jì)以來(lái)的電子計(jì)算機(jī),便是人類(lèi)對(duì)終極仿生學(xué)追求的縮影——如果能造一個(gè)大腦就好了。
無(wú)論是你我手中的電腦,或者是 Model 3 里面裝著的 Autopilot 硬件,它們都只是以科技的手段實(shí)現(xiàn)了大腦的「運(yùn)算」能力,而并未真正發(fā)揮大腦的優(yōu)勢(shì)。
依照大腦結(jié)構(gòu)依葫蘆畫(huà)瓢的英特爾新芯片,會(huì)是自動(dòng)駕駛領(lǐng)域尚未升起的朝陽(yáng)嗎?由此延伸開(kāi)去,它會(huì)是人類(lèi)真正掌握「思考」這一命題的普羅米修斯嗎?
只有時(shí)間能給我們解答。
-
芯片
+關(guān)注
關(guān)注
456文章
51027瀏覽量
425445 -
AI
+關(guān)注
關(guān)注
87文章
31280瀏覽量
269642
原文標(biāo)題:關(guān)注丨最像人腦的AI芯片來(lái)了,你的車(chē)子以后會(huì)有自己的想法?!
文章出處:【微信號(hào):e700_org,微信公眾號(hào):汽車(chē)工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論