8月1日消息,又一支清華芯片團(tuán)隊(duì)取得重大突破!來自清華的“天機(jī)”類腦芯片架構(gòu)登上了頂級學(xué)術(shù)雜志《自然(Nature)》封面。
28nm的天機(jī)芯片由156個(gè)FCores組成,面積為3.8×3.8毫米,包含大約40000個(gè)神經(jīng)元和1000萬個(gè)突觸,可以同時(shí)支持機(jī)器學(xué)習(xí)算法和類腦電路。
據(jù)智東西了解,“天機(jī)”類腦芯片項(xiàng)目脫胎于清華精密儀器系,是清華精密儀器系教授、腦計(jì)算中心主任施路平教授帶隊(duì)主導(dǎo)的類腦芯片項(xiàng)目之一。
2018年1月,“天機(jī)”團(tuán)隊(duì)注冊成立了北京靈汐科技,董事長兼CEO為祝夭龍。靈汐科技于2018年8月披露了其天使輪融資,投資方來自華控基石基金、優(yōu)選資本、清華控股。
而本篇Nature論文的第一作者裴京也是靈汐科技的監(jiān)事,施路平教授則為靈汐科技公司董事。
脫身清華,落地靈汐科技
這篇論文名為《面向通用人工智能的異構(gòu)融合芯片架構(gòu)“天機(jī)”(Towards artificial general intelligence with hybrid Tianjic chip architecture)》
這篇論文中介紹了清華團(tuán)隊(duì)的“天機(jī)”類腦芯片架構(gòu),它不僅算力高、功耗低、支持多種不同AI算法、而且采用了存算一體技術(shù),不需要外掛DDR,能夠節(jié)省成本功耗和空間。
在論文中,研究團(tuán)隊(duì)描述了這種芯片如何幫助機(jī)器響應(yīng)語音命令,識別周圍世界,避開障礙并保持平衡。
而在附上的視頻中,“天機(jī)”團(tuán)隊(duì)還展示了搭載該芯片的自動(dòng)駕駛自行車
是如何自動(dòng)控制平衡、并在操場上對目標(biāo)人物進(jìn)行識別、跟隨、自動(dòng)避障。
施路平教授表示,此次發(fā)表在《自然》的論文是一個(gè)非常初步的研究,人工通用智能是一項(xiàng)非常具有挑戰(zhàn)性的工作,目前還處于起步階段。他和團(tuán)隊(duì)的研究愿景是——“發(fā)展類腦計(jì)算,支撐人工通用智能,賦能各行各業(yè)”。
據(jù)他透露,目前,團(tuán)隊(duì)已經(jīng)啟動(dòng)了下一代芯片的研究,預(yù)期明年年初可以完成研發(fā)工作。
未來,天機(jī)芯片有望部署在自動(dòng)駕駛汽車和智能機(jī)器人中。
“天機(jī)”芯片技術(shù)拆解
“天機(jī)”是一種推進(jìn)人工通用智能(AGI)發(fā)展的異構(gòu)融合芯片架構(gòu),結(jié)合了神經(jīng)科學(xué)導(dǎo)向和計(jì)算機(jī)科學(xué)導(dǎo)向方法的優(yōu)點(diǎn)。
在論文中,作者用一個(gè)無人自行車系統(tǒng)驗(yàn)證了這一異構(gòu)融合芯片的處理能力。試驗(yàn)中,僅用一個(gè)芯片,無人駕駛自行車系統(tǒng)即可同時(shí)處理多種算法和模型,不僅可以識別語音指令、實(shí)現(xiàn)自平衡控制,還能完成對前方行人的實(shí)時(shí)檢測和跟蹤,并完成自動(dòng)過障、避障和平衡控制等任務(wù)。
據(jù)論文介紹,發(fā)展人工通用智能的方法主要有兩種,一種基于計(jì)算機(jī)科學(xué)導(dǎo)向,另一種基于神經(jīng)科學(xué)導(dǎo)向。
據(jù)負(fù)責(zé)芯片設(shè)計(jì)和算法細(xì)節(jié)的論文作者鄧?yán)诮榻B,此前,市面上的深度學(xué)習(xí)加速器通常只支持計(jì)算機(jī)科學(xué)模型,神經(jīng)形態(tài)芯片只支持神經(jīng)科學(xué)模型。
兩類方法依賴不同且不兼容的平臺,在一定程度上延緩了人工通用智能的發(fā)展,因此需要一個(gè)可以支持通用的基于計(jì)算機(jī)科學(xué)的人工神經(jīng)網(wǎng)絡(luò)以及神經(jīng)科學(xué)啟發(fā)的模型和算法的通用平臺。
研究團(tuán)隊(duì)由此提出天機(jī)芯片(Tianjic chip),同時(shí)支持計(jì)算機(jī)科學(xué)模型和神經(jīng)網(wǎng)絡(luò)模型。
鄧?yán)诒硎?,天機(jī)芯片能做到兩者都支持,同時(shí)支持神經(jīng)科學(xué)發(fā)現(xiàn)的眾多神經(jīng)回路網(wǎng)絡(luò)和異構(gòu)網(wǎng)絡(luò)的混合建模。因?yàn)閮深惸P退褂玫恼Z言、計(jì)算原理、編碼方式和應(yīng)用場景都不相同,實(shí)現(xiàn)這兩種模型深度高效的融合,是天機(jī)芯片設(shè)計(jì)中最大的挑戰(zhàn)。
天機(jī)芯片采用多核架構(gòu)、可重構(gòu)的構(gòu)建模塊和采用混合編碼方案的流線型數(shù)據(jù)流,不僅可以適應(yīng)基于計(jì)算機(jī)科學(xué)的機(jī)器學(xué)習(xí)算法,還可以輕松實(shí)現(xiàn)腦啟動(dòng)電路和多種編碼方案。
研究團(tuán)隊(duì)的一項(xiàng)重要?jiǎng)?chuàng)新是高度可重構(gòu)的的統(tǒng)一功能核(FCore),它結(jié)合了人工神經(jīng)網(wǎng)絡(luò)和生物網(wǎng)絡(luò)的基本構(gòu)建模塊——軸突、突觸、樹突和體細(xì)胞塊。
28nm的天機(jī)芯片由156個(gè)FCores組成,面積為3.8×3.8毫米,包含大約40000個(gè)神經(jīng)元和1000萬個(gè)突觸,可以同時(shí)支持機(jī)器學(xué)習(xí)算法和類腦電路。
天機(jī)芯片提供超過每秒610千兆字節(jié)(GB)的內(nèi)部存儲器帶寬,以及運(yùn)行人工神經(jīng)網(wǎng)絡(luò)的1.28 TOPS的峰值性能。
在生物啟發(fā)的尖峰神經(jīng)網(wǎng)絡(luò)模式中,天機(jī)芯片實(shí)現(xiàn)了每瓦約650千兆每秒突觸操作(GSOPS)的峰值性能。該研究團(tuán)隊(duì)還展示了與GPU相比的卓越性能,其中新芯片的吞吐量提高了1.6-100倍,電源效率提高了12-10000倍。
研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)無人駕駛自行車實(shí)驗(yàn),來評估芯片整合多模態(tài)信息和做出迅速?zèng)Q策的能力。
該自行車配備天機(jī)芯片和IMU傳感器、攝像頭、轉(zhuǎn)向電機(jī)、驅(qū)動(dòng)電機(jī)、調(diào)速電機(jī)、電池。自行車可以執(zhí)行實(shí)時(shí)物體檢測、跟蹤、語音命令識別、騎行減速帶、避障,平衡控制和決策等任務(wù)。
研究小組開發(fā)了各種神經(jīng)網(wǎng)絡(luò)(CNN、CANN、SNN和MLP網(wǎng)絡(luò))來完成每項(xiàng)任務(wù)。這些模型經(jīng)過預(yù)訓(xùn)練并編程到天機(jī)芯片上,可以并行處理模型,實(shí)現(xiàn)不同模型之間的無縫片上通信。
在實(shí)驗(yàn)中,采用天機(jī)芯片的無人駕駛自行車順利完成了所有分配的任務(wù),這標(biāo)志著加速AGI發(fā)展的巨大飛躍。
研究小組還指出:“通過隨機(jī)將新變量實(shí)時(shí)引入環(huán)境中可以產(chǎn)生高時(shí)空復(fù)雜性,例如不同的道路條件、噪聲、天氣因素、多種語言、更多人等等。通過探索允許適應(yīng)這些環(huán)境變化的解決方案,可以檢查對AGI至關(guān)重要的問題,比如概括、穩(wěn)健性和自主學(xué)習(xí)?!?/p>
低功耗、低成本、高算力
在去年10月的安博會上,靈汐科技也向智東西展示了其110nm工藝的第一代、28nm的第二代“天機(jī)”架構(gòu)的類腦芯片,主打云端智能市場。
靈汐科技告訴智東西,由于繞過了HBM內(nèi)存技術(shù)對AI芯片性能和成本的限制,靈汐科技的芯片與市場同類產(chǎn)品比起來,具備低功耗、低成本、高計(jì)算力的優(yōu)勢。
“天機(jī)”架構(gòu)采用優(yōu)化過的眾核架構(gòu),由一系列核構(gòu)成陣列完成神經(jīng)網(wǎng)絡(luò)的計(jì)算。在摩爾定律即將失效的今天,在現(xiàn)有的工藝基礎(chǔ)上,從優(yōu)化架構(gòu)入手可能是提高芯片性能最重要的手段。
據(jù)靈汐科技介紹,“天機(jī)”架構(gòu)已經(jīng)超越了傳統(tǒng)的馮諾伊曼結(jié)構(gòu),不像傳統(tǒng)架構(gòu)的芯片一樣在計(jì)算的時(shí)候必須與DDR進(jìn)行大量的數(shù)據(jù)交互而受存儲帶寬的限制,使整個(gè)芯片的性能受到影響。
這也是“天機(jī)”架構(gòu)芯片算力高的一個(gè)極其重要的原因。因?yàn)椴挥脧耐獠繉?dǎo)入數(shù)據(jù),因此它的功耗比較低,也節(jié)省了成本和空間。
結(jié)語:類腦芯片,AI計(jì)算新藍(lán)海
類腦芯片其實(shí)并不是一個(gè)新話題了。早在2014年,IBM就推出了業(yè)內(nèi)首款類腦芯片TrueNorth。目前國內(nèi)外有許多公司和機(jī)構(gòu)正在類腦芯片研發(fā)上投入大量精力。
據(jù)靈汐科技介紹,與當(dāng)前市面上其他AI芯片架構(gòu)相比,“天機(jī)”類腦芯片的主要優(yōu)勢有:
1、算力高;
2、功耗低;
3、存算一體,不需要外掛DDR,節(jié)省成本功耗和空間;
4、算法的支持度靈活,既能高效支持人工神經(jīng)網(wǎng)絡(luò)算法,又能高效支持SNN算法;
5、擴(kuò)展性好,能得到極大算力的芯片陣列,而且算力效率不會下降;
6、支持多核重組特性,可以實(shí)現(xiàn)多任務(wù)并行處理。
就在今年7月16日,英特爾也發(fā)布了“Pohoiki Beach”芯片系統(tǒng),該系統(tǒng)主要由Loihi神經(jīng)擬態(tài)芯片構(gòu)成,可處理深度學(xué)習(xí)任務(wù),速度比CPU快1000倍,效率高10000倍,耗電量小100倍。
Pohoiki Beach系統(tǒng)由64塊Loihi芯片的800萬個(gè)所謂的神經(jīng)元構(gòu)成。Loihi芯片是英特爾公司2017年首次推出的AI芯片,是一款模仿人類大腦的神經(jīng)擬態(tài)芯片。
相比于傳統(tǒng)芯片,類腦芯片的確在功耗上具有絕對優(yōu)勢,完成同一個(gè)任務(wù)所消耗的能源有時(shí)甚至比傳統(tǒng)芯片節(jié)省高達(dá)1000倍。
同時(shí)類腦芯片的集成度也非常高,拿浙大推出的“達(dá)爾文”芯片來說,其面積為25平方毫米,也就是說邊長只有0.5厘米,但內(nèi)部卻能包含500萬個(gè)晶體管。
隨著行業(yè)對計(jì)算力要求越來越高,馮氏瓶頸將越來越明顯,顛覆傳統(tǒng)架構(gòu)的類腦芯片已為芯片行業(yè)開啟了一扇新的大門。
本文來自智東西微信號,本文作為轉(zhuǎn)載分享。
評論
查看更多