日前, Elsevier(愛思唯爾)云論壇暨絡(luò)繹學(xué)術(shù) Online 第九期線上學(xué)術(shù)會議成功舉辦,我們與 Elsevier 一同為大家呈現(xiàn)了信息技術(shù)芯片的發(fā)展與創(chuàng)新。
本次論壇由上海交通大學(xué)集成量子信息技術(shù)研究中心主任金賢敏教授主持,特邀上海交通大學(xué)人工智能研究院首席科學(xué)家徐雷教授、浙江大學(xué)光電科學(xué)與工程學(xué)院副院長戴道鋅教授、北京大學(xué)人工智能研究院類腦智能芯片研究中心主任楊玉超教授、上海交通大學(xué)物理與天文學(xué)院副研究員唐豪、以及愛思唯爾核心內(nèi)容客戶顧問許靖博士,圍繞信息技術(shù)芯片的基本技術(shù)原理、產(chǎn)品應(yīng)用及未來發(fā)展展開主題分享。
本文將結(jié)合論壇的重點內(nèi)容和當(dāng)前信息處理芯片的現(xiàn)狀,對三種未來備受關(guān)注的信息技術(shù)芯片進(jìn)行概念解讀及產(chǎn)業(yè)分析。
信息技術(shù)芯片的演進(jìn),背后透射出算力的螺旋式上升
在算力需求大幅提升的背景下,信息技術(shù)芯片所承載的計算處理能力不足,來源于架構(gòu)側(cè)、智能化水平、功耗、軟件能力等多方面的挑戰(zhàn)。
最早以 CPU 為代表的計算芯片采用的依然是傳統(tǒng)的馮·諾依曼架構(gòu),存算分離是最大的特點,也是馮諾依曼架構(gòu)的瓶頸所在。在計算之前需要從存儲器當(dāng)中讀取數(shù)據(jù),之后再進(jìn)行計算。這個過程中,功耗和延時花費(fèi)在搬運(yùn)數(shù)據(jù)的環(huán)節(jié)上。從單次操作來講,大多數(shù)情況下,搬運(yùn)數(shù)據(jù)需要的功耗占據(jù)了整個功耗的約 70% 。解決這個問題最直接的思路,即是實現(xiàn)存算一體。
同時,存儲器性能的提升遠(yuǎn)遠(yuǎn)落后于計算器性能的提升。由于馮·諾依曼瓶頸和存儲墻的存在,導(dǎo)致存算分離架構(gòu)下,算力的提升面臨天花板。為了解決這種困境,更多類型的非馮·諾依曼架構(gòu)芯片出現(xiàn),例如類腦芯片、光子芯片等。
除了架構(gòu)側(cè)的限制,智能化水平的提升也趨勢計算芯片向更智能的階段邁進(jìn)。2011 年,風(fēng)險投資公司 Andreessen Horowitz 的普通合伙人 Marc Andreessen 在《華爾街日報》上發(fā)表了一篇非常有影響力的文章,名為“ Why Software Is Eating the World-軟件為何在吞噬世界”。十年后的今天,我們正站在“ Deep Learning is Eating the World-深度學(xué)習(xí)正在吞噬整個世界”的節(jié)點。
基于人工智能的自然語言處理、圖像識別和自動駕駛的技術(shù)進(jìn)步,是以消耗計算資源和能源為代價的。工程師和計算機(jī)科學(xué)家正在付出巨大的努力,以找出更有效地訓(xùn)練和運(yùn)行深度神經(jīng)網(wǎng)絡(luò)的方法。這也是未來計算芯片升級和演化的主要目的,為了讓其更好地執(zhí)行 AI 計算。
第三代神經(jīng)網(wǎng)絡(luò)技術(shù)預(yù)計向類腦脈沖神經(jīng)網(wǎng)絡(luò)技術(shù)演進(jìn),對更高智能水平的人工智能技術(shù)的需求,也驅(qū)使計算平臺的架構(gòu)升級和智能化升級。
不難發(fā)現(xiàn),人腦是自然界中存在的典型高智能、低功耗的單體計算平臺。類腦芯片則是典型的存算一體、高度智能化的計算架構(gòu)。全球范圍內(nèi)對類腦智能和類腦芯片的研究,已經(jīng)是非常重要的前沿課題。
圖 1丨本文關(guān)注的三類信息技術(shù)芯片
面對算力需求的提升和人工智能水平的發(fā)展,對于信息技術(shù)芯片的代際演化來說,近期以面向數(shù)字神經(jīng)網(wǎng)絡(luò)的加速器(GPU / FPGA / ASIC 芯片)為主流解決方案;中遠(yuǎn)期,類腦芯片是解決方案之一。除了集成電路芯片的算法、器件、工藝等突破是解決算力問題的方法之外,集成光子芯片的研發(fā)也是解決算力瓶頸的有效路徑。
未來計算芯片的三個方向,均為更好地執(zhí)行 AI 計算
方向一:神經(jīng)網(wǎng)絡(luò)計算加速器—— GPU / FPGA / ASIC
在 CPU / GPU 設(shè)計領(lǐng)域,中國起步較晚,在技術(shù)水平和產(chǎn)業(yè)規(guī)?;矫孢h(yuǎn)落后于國際先進(jìn)水平。但受益于云計算、邊緣計算、數(shù)據(jù)中心等計算需求增加,物聯(lián)網(wǎng)等多場景對高性能高算力芯片提出更高要求,國產(chǎn)替代等因素,中國在 CPU / GPU / FPGA / ASIC 技術(shù)提升和國產(chǎn)化速度方面加速前進(jìn)。
CPU & GPU
全球 CPU 市場整體被 Intel 和 AMD 占領(lǐng)。無論從營收規(guī)模,臺式機(jī)、筆記本、服務(wù)器細(xì)分市場占有率來講,Intel 遠(yuǎn)超 AMD(如圖 2 所示)。
經(jīng)過數(shù)十年探索,國產(chǎn) CPU 產(chǎn)業(yè)已初具規(guī)模,中國六大國產(chǎn) CPU 芯片廠商為——以 ×86 架構(gòu)為主的復(fù)雜指令集(CISC)下,有海光(×86)、上海兆芯(×86);涉及 ARM 架構(gòu)、MIPS 架構(gòu)、Alpha 架構(gòu)的精簡指令集(RISC)下,有華為鯤鵬(ARM)、天津飛騰(ARM)、龍芯(MIPS)、申威(Alpha)。
圖 2丨Intel、NVIDIA 及 AMD 的部分財務(wù)數(shù)據(jù)
現(xiàn)階段適合神經(jīng)網(wǎng)絡(luò)計算的加速器最常見的解決方案是 GPU,GPU 本質(zhì)上來說依然是先進(jìn)的馮 · 諾依曼架構(gòu)。
同 CPU 一樣,全球 GPU 市場集中度非常高,Intel、NVIDIA 和 AMD 三雄爭霸。
根據(jù) Jon Peddie Research 數(shù)據(jù),在集成 GPU 領(lǐng)域,截至 2019 年第四季度,Intel 以 63% 的市場份額位居榜首,AMD 和 NVIDIA 分別以 19% 和 18% 的市場份額名列第二和第三;在獨立 GPU 領(lǐng)域中,NVIDIA 以 68.92% 的市場份額占據(jù)絕對優(yōu)勢,AMD 以 31.08% 的市場份額排名第二。
三駕馬車奠定 NVIDIA 在 GPU 市場的霸主地位。長期以來,游戲顯卡業(yè)務(wù)功不可沒,游戲部門為其創(chuàng)造了確定的業(yè)績增長與健康的現(xiàn)金流,2015 年 NVIDIA 營收首次超越 AMD。之后 NVIDIA GPU 在數(shù)據(jù)中心業(yè)務(wù)中又獲得一輪爆發(fā)式增長。
此外,在阿里云、AWS、Microsoft Azure 及 Google Cloud 廠商中,NVIDIA 的市場份額大幅領(lǐng)先于 AMD 等一眾廠商,NVIDIA 在全球主要云廠商中占據(jù)絕對領(lǐng)先地位。像 Amazon 和Microsoft 這樣的大型云廠商,在計算芯片上投入了大量資金來支持機(jī)器學(xué)習(xí)算法,Google 也在研發(fā)自己的專用機(jī)器學(xué)習(xí)芯片。
圖 3丨NVIDIA 及 AMD 的部分財務(wù)數(shù)據(jù)
除此之外,NVIDIA 市值和業(yè)務(wù)最有想象空間的還是自動駕駛計算平臺(汽車中控計算芯片)。同時整個計算芯片市場的主要增長動力預(yù)計也將從數(shù)據(jù)中心,轉(zhuǎn)移到自動駕駛汽車。
CPU / GPU 計算芯片的代表公司(僅為部分,并未窮盡)
Intel(英特爾):成立于 1968 年的英特爾,崛起于 PC 時代,創(chuàng)辦人之一的 Gordon Moore 提出了半導(dǎo)體產(chǎn)業(yè)經(jīng)典的摩爾定律。面對異構(gòu)計算架構(gòu)時代,英特爾以 “ SVMS 架構(gòu)”應(yīng)對,發(fā)布多款 FPGA 產(chǎn)品。今年 3 月,英特爾宣布重啟晶圓代工服務(wù),重回 7nm 晶圓制程技術(shù)戰(zhàn)場。
NVIDIA(英偉達(dá)):NVIDIA 正在加速從芯片到 CPU 和 GPU 的連接方式,再到整個軟件堆棧,以及最終跨整個數(shù)據(jù)中心的性能提升。2020 年發(fā)布了首款安培架構(gòu) GPU——NVIDIA A100,單片 A100 包含超過 540 億個晶體管,使其成為世界上最大的 7nm 處理器。同時發(fā)布 NVIDIA DGX A100 系統(tǒng),單節(jié)點 AI 算力達(dá)到創(chuàng)紀(jì)錄的 5 PFLOPS,5 個 DGX A100 系統(tǒng)組成的一個機(jī)架,算力可媲美一個 AI 數(shù)據(jù)中心。
AMD:AMD 于 2020 年正式推出銳龍 5000 系列臺式機(jī)處理器,采用全新“ Zen 3 ”核心架構(gòu),這是自 AMD 2017 年推出 “ Zen ” 處理器以來提升最大的一次。得益于 IPC 和頻率的雙重提升,AMD 銳龍 9 5900X 也是首款默認(rèn)設(shè)置下 CineBench R20 單核心分?jǐn)?shù)超過 600 的臺式機(jī)處理器。
中科曙光(Sugon):中國中科曙光依托中科院科研實力與產(chǎn)業(yè)資源,掌握大量高端計算機(jī)、存儲和云計算等領(lǐng)域核心技術(shù),九次摘得中國超算 Top100 份額第一,在 2019 年第 54 屆全球超算 Top500 中以 71 套系統(tǒng)并列第二名,在國內(nèi)高性能計算市場絕對領(lǐng)先份額。
兆芯(Zhaoxin):中國上海兆芯同時擁有 CPU、GPU、芯片組三種 IP 及芯片自主研發(fā)能力,開先 KX-6000 和開勝 KH-30000 系列處理器基于 16nm 工藝,是國內(nèi)首款主頻達(dá)到 3.0GHz 的國產(chǎn)通用處理器。
景嘉微(JINGJIA MICRO):中國長沙景嘉微是國產(chǎn) GPU 代表力量,2020 年預(yù)計實現(xiàn)營業(yè)總收入 6.54 億元。在圖形顯控領(lǐng)域,以 JM5400 研發(fā)成功為起點,研發(fā)國產(chǎn)高性能低功耗圖形處理芯片。第二代 GPU 芯片 JM7200 流片成功,采用 28nm 工藝,已完成與龍芯、飛騰、麒麟軟件、國心泰山、道、天脈等國內(nèi)主要的 CPU 和操作系統(tǒng)廠商的適配工作。
FPGA / ASIC
回顧 2020 年并購交易額超過 10 億美元的 19 筆交易,大多數(shù)并購活動集中在半導(dǎo)體領(lǐng)域。Salesforce 和 NVIDIA 是唯一進(jìn)行多次重大收購的公司(如圖 4 所示)。
第二大并購事件則是 AMD ——Intel 在 CPU 領(lǐng)域的最大對手、NVIDIA 在 GPU 領(lǐng)域的競爭者——以 350 億美元收購 Xilinx(賽靈思)。這不禁讓人想起 2015 年英特爾以 167 億美元收購 Altera 一案。Altera 和 Xilinx 曾是 FPGA 雙雄,而現(xiàn)在 FPGA 獨霸之主 Xilinx 也要被 AMD 收購。
圖 4丨2020 年最大的科技并購事件
除了 CPU 之外,GPU、APU、TPU、FPGA(現(xiàn)場可編程門陣列)、ASIC(專用集成電路)等多種類型的加速器芯片正扮演著愈加重要的角色。在許多情況下,這些加速器與 CPU 等芯片一起工作,用于加速某些對應(yīng)用至關(guān)重要的任務(wù),例如計算機(jī)視覺應(yīng)用中的圖像識別。多種芯片協(xié)同工作的架構(gòu)通常稱為異構(gòu)計算。
FPGA(現(xiàn)場可編程門陣列)是一種靈活的半導(dǎo)體芯片架構(gòu),能夠在產(chǎn)品設(shè)計完成,甚至在投入現(xiàn)場使用之后進(jìn)行更改或更新(由此得名)。FPGA 的設(shè)計初衷是成為 ASIC(專用集成電路)更靈活的替代品。
有些 FPGA 專門用于高性能、數(shù)據(jù)密集的工作場景,如云端數(shù)據(jù)中心,這時它們需要的運(yùn)行功率高達(dá)幾百瓦;有些則用于小型、低功耗的設(shè)計,其功耗可能低至 1 毫瓦(千分之一瓦);還有些介于兩者之間。由于它們本身非常靈活,可應(yīng)用于各類廣泛的環(huán)境。
以云端數(shù)據(jù)中心為例,微軟一直都在使用高功耗的 FPGA 來加速 Bing 搜索引擎的速度。在此應(yīng)用中,F(xiàn)PGA 與 CPU 協(xié)同工作來加速微軟針對必應(yīng)開發(fā)的特定搜索算法。這類高功耗的 FPGA 多由 Xilinx 和 Intel 提供。
而在一些無人機(jī)、安防攝像頭和可穿戴產(chǎn)品等消費(fèi)電子應(yīng)用中,以及預(yù)測性維護(hù)、馬達(dá)控制和機(jī)器視覺等工業(yè)應(yīng)用中,小尺寸、功耗更低的 FPGA 正適配于網(wǎng)絡(luò)邊緣計算設(shè)備上去運(yùn)行基于人工智能的軟件算法。
在未來十年內(nèi),汽車自動駕駛是 FPGA 最重要的一個探索和應(yīng)用場景。不僅因為 FPGA 靈活的內(nèi)部架構(gòu),它還能很好地適用于特定的連接功能,尤其是連接各類不同的信號輸入。除了在車載信息娛樂系統(tǒng)中顯身手外,F(xiàn)PGA 開始扮演一些新角色,作為多路數(shù)據(jù)的聚合器。
但由于 ASIC 一旦設(shè)計并生產(chǎn)出來,它的功能基本不能修改,除非重新設(shè)計和構(gòu)建全新的芯片。且 ASIC 設(shè)計起來比較困難、價格高昂,在實際通用場景下比較少見。隨著時間推移和場景側(cè)的落地,未來專用于自動駕駛側(cè)的 ASIC 芯片有可能成為主流方向。
圖 5丨 Intel 在汽車自動駕駛場景用 FPGA 市場占主流位置
全球主攻 FPGA 市場的企業(yè)中,除了有 Xilinx 和 Altera 雙雄之外,Lattice 也是專做 FPGA 的上市公司。中國主攻 FPGA 的創(chuàng)業(yè)公司有安路科技和高云半導(dǎo)體。
巨頭 Intel 也是 FPGA 的強(qiáng)有力競爭者,英特爾不僅是 CPU 王者,又收購了 Altera,在 FPGA 領(lǐng)域布下一子。綜合來說,Intel 的計算芯片在汽車自動駕駛市場中的采用率,處于主流位置。不僅自動駕駛 FPGA 芯片已經(jīng)量產(chǎn),還收購 Mobileye 這家全球領(lǐng)先的視覺 ADAS 廠商,僅有自主的專有軟件算法,以及 EyeQ 芯片。
圖 6丨全球CPU及神經(jīng)網(wǎng)絡(luò)加速器頭部公司財務(wù)表現(xiàn)
全球 FPGA / ASIC 代表公司
Lattice:低功耗 FPPA 市場的有力競爭者。長期盤踞消費(fèi)電子市場的 Lattice 逐漸將觸手伸入工業(yè)和汽車領(lǐng)域,更加側(cè)重于邊緣端、嵌入式、低功耗、小尺寸的產(chǎn)品設(shè)計開發(fā)上。
安路科技(ANLOGIC):成立于 2011 年,大基金、華大半導(dǎo)體加持的 FPGA 創(chuàng)業(yè)公司,側(cè)重工業(yè)市場。于 2015 年推出其第一代 FPGA AL3-10,當(dāng)前已經(jīng)形成了從幾百個邏輯單元 CPLD 到 400K 邏輯單元 FPGA 全系列布局。
高云半導(dǎo)體(GOWIN Semiconductor):2015 年一季度量產(chǎn)出國內(nèi)第一塊產(chǎn)業(yè)化的 55nm 工藝 400 萬門的中密度 FPGA 芯片,并開放開發(fā)軟件下載。至今五年時間陸續(xù)推出兩大家族,100 多種封裝的 FPGA 芯片,例如集成 PSRAM 的 FPGA,藍(lán)牙 FPGA、GOAI 等創(chuàng)新嘗試。
方向二:類腦芯片
人工智能中神經(jīng)網(wǎng)絡(luò)模型的一個重要特點就是計算量大,而且計算過程中涉及到的數(shù)據(jù)量也很大,因此對高算力和低能耗的要求極高。目前采用馮·諾伊曼架構(gòu)的主流處理器系統(tǒng)能耗過高、認(rèn)知任務(wù)處理能力不足,無法完全滿足這種要求。在這樣的時代背景下,打破馮 · 諾伊曼架構(gòu)的束縛就成為了必然的趨勢。
人腦是非常理想的計算架構(gòu)參考對象。人腦約有 1000 億個神經(jīng)元和 100 萬億個突觸,能夠在極低的能耗下,完成復(fù)雜的關(guān)聯(lián)記憶、自主識別、自主學(xué)習(xí)等認(rèn)知處理。這是基于腦神經(jīng)網(wǎng)絡(luò)的多層次復(fù)雜空間結(jié)構(gòu)和腦神經(jīng)的高度可塑性。
類腦芯片則是典型的非馮 · 諾伊曼架構(gòu)。類腦計算架構(gòu)的核心正是借鑒人腦信息處理方式,將存儲和計算一體化,能夠?qū)崟r處理非結(jié)構(gòu)化信息,具備自主學(xué)習(xí)能力,同時滿足超低功耗的需求。
目前市場上尚未出現(xiàn)量產(chǎn)的可商用的類腦芯片,但已有很多國家和機(jī)構(gòu)在類腦計算研究和產(chǎn)業(yè)化領(lǐng)域探索了多年。海外類腦計算芯片產(chǎn)業(yè)化道路走在最前面的代表有兩家公司:IBM 和 Intel,他們發(fā)布了兩款全數(shù)字類腦計算芯片。
IBM TrueNorth
2014 年,IBM 推出了神經(jīng)網(wǎng)絡(luò)推斷芯片 TrueNorth ,它借鑒神經(jīng)元工作原理及其信息傳遞機(jī)制,實現(xiàn)了存儲與計算的融合。該芯片包含 4096 個神經(jīng)突觸核心,每個核心包含了 256 個神經(jīng)元和 6.4 萬個突觸,合計約 100 萬個神經(jīng)元和 2.56 億個突觸。
TrueNorth 芯片的功耗低至僅 70 毫瓦,比傳統(tǒng)處理器低了 4 個數(shù)量級。更形象的來說,這相當(dāng)于一款郵票大小的神經(jīng)突觸原理超級計算機(jī),并且僅用一塊智能手機(jī)的電池就可以維持工作近一周時間。TrueNorth 芯片的功率密度也做到了 20 毫瓦/平方厘米,接近腦皮層的水平,同樣相比于 CPU 低了 3-4 個數(shù)量級。
TrueNorth 芯片同時具有很好的擴(kuò)展性,能通過外部連接組成更加復(fù)雜的硅基神經(jīng)網(wǎng)絡(luò)系統(tǒng)。2018 年,NS16e-4 系統(tǒng)問世,它集成了 64 個 TrueNorth 芯片,神經(jīng)元數(shù)量達(dá)到了 6400 萬個。根據(jù) IBM 官網(wǎng)介紹,依托 TrueNorth 可以擴(kuò)展出擁有 10 億神經(jīng)元、2560 億神經(jīng)突觸的超級計算系統(tǒng),然而功耗僅相當(dāng)于一臺桌面計算機(jī)。
圖 7 | 基于 64 個 TrueNorth 芯片的 NS16e-4 系統(tǒng),集成了 6400 萬個神經(jīng)元(來源:https://modha.org)
IBM 也正在探索 TrueNorth 芯片在多個領(lǐng)域的應(yīng)用潛力,包括:運(yùn)動歸類、音頻處理、立體視覺、強(qiáng)化學(xué)習(xí)、機(jī)器人、分類等。
圖 8|TrueNorth 芯片應(yīng)用探索
Intel Loihi
2017 年,Intel 推出了支持片上學(xué)習(xí)的 Loihi 脈沖神經(jīng)網(wǎng)絡(luò)芯片,每個芯片包含 128 個神經(jīng)形態(tài)核心和 3 個× 86 處理器核心,總計 13.1 萬個神經(jīng)元。與 TrueNorth 芯片類似的是,Loihi 芯片同樣表現(xiàn)出了非常好的可擴(kuò)展性。
2019 年,Intel 推出了 64 顆 Loihi 芯片集成的 Pohoiki Beach 系統(tǒng)。2020 年,Intel 又推出了 Pohoiki Springs 系統(tǒng),包含了 768 顆 Loihi 芯片,共擁有 1 億個神經(jīng)元,已經(jīng)相當(dāng)于一個小型哺乳動物的大腦容量。
根據(jù) Intel 官方披露,英特爾的 Pohoiki Springs 等神經(jīng)擬態(tài)系統(tǒng)仍處于研究階段,其設(shè)計目的并非取代傳統(tǒng)的計算系統(tǒng),而是為研究人員提供一個工具來開發(fā)和表征新的神經(jīng)啟發(fā)算法,用于實時處理、問題解決、適應(yīng)和學(xué)習(xí)。
目前,Loihi 芯片的應(yīng)用在以下幾個領(lǐng)域表現(xiàn)出了更快的運(yùn)算速度和更低的能耗:語音命令識別、手勢識別、圖像檢索、優(yōu)化和檢索、機(jī)器人。
中國的類腦計算研發(fā)也產(chǎn)生了顯著的成果,這其中包括清華大學(xué)的“天機(jī)芯”、浙江大學(xué)的“達(dá)爾文芯片”以及創(chuàng)業(yè)公司 SynSense時識科技。
清華大學(xué)“天機(jī)芯”
2019 年 8 月,清華大學(xué)施路平教授團(tuán)隊在《自然》期刊以封面文章發(fā)表首款異構(gòu)融合類腦計算芯片——“天機(jī)芯(Tianjic)”。“天機(jī)芯”采用多核架構(gòu),由 156 個單功能核(FCore)組成,包含大約 4 萬個神經(jīng)元和 1000 萬個神經(jīng)突觸。
而所謂異構(gòu)融合,指天機(jī)芯的架構(gòu)打破了基于計算機(jī)科學(xué)的人工智能和基于神經(jīng)科學(xué)的人工智能的壁壘,成為一個通用的平臺,在算法層面上即支持目前主流的人工神經(jīng)網(wǎng)絡(luò)模型(Artificial Neural Network,ANN)也支持脈沖神經(jīng)網(wǎng)絡(luò)模型(Spiking Neural Network,SNN)。
基于天機(jī)芯的無人自行車展示了可以實現(xiàn)語音識別、自平衡控制、探索跟蹤、自動避障等功能。之所以選用無人自行車作為展示工具,是因為它是一個類似大腦的多模態(tài)系統(tǒng),能夠覆蓋感知決策和執(zhí)行的完整的鏈路,為異構(gòu)融合的多種模型提供支撐;同時不同于在實驗室或者電腦中做仿真,無人自行車也體現(xiàn)了與真實環(huán)境的交互。這一項研究成果也被評選為“ 2019 年中國十大科技進(jìn)展 ”。
圖 9|清華大學(xué)“天機(jī)芯”研究成果登上《自然》期刊封面
從清華大學(xué)類腦計算中心科技成果轉(zhuǎn)化而來的靈汐科技,目前也已經(jīng)獲得了來自中電??怠V發(fā)信德、優(yōu)選資本、華控基石等機(jī)構(gòu)的多輪融資。施路平教授擔(dān)任靈汐科技的聯(lián)合創(chuàng)始人。
浙江大學(xué)“達(dá)爾文芯片”
2015 年,浙江大學(xué)牽頭研發(fā)了達(dá)爾文一代芯片,這是國內(nèi)的首款類腦芯片,擁有 2048 個神經(jīng)元,4 百萬個神經(jīng)突觸。2019 年 8 月,達(dá)爾文二代芯片問世,這是一款主要面向智慧物聯(lián)網(wǎng)應(yīng)用的芯片,單芯片由 576 個內(nèi)核組成,擁有 15 萬神經(jīng)元、1000 萬個神經(jīng)突觸,在神經(jīng)元數(shù)目上已經(jīng)與果蠅相當(dāng),典型應(yīng)用功耗約 100 毫瓦。
2020 年,浙江大學(xué)宣布了包含 792 顆達(dá)爾文二代芯片的類腦計算機(jī) Darwin Mouse 研制成功,這一款類腦計算機(jī)支持 1.2 億脈沖神經(jīng)元、720 億神經(jīng)突觸,與小鼠的大腦神經(jīng)元數(shù)量規(guī)模相當(dāng),典型運(yùn)行功耗只需要 350-500 瓦。
SynSense 時識科技
SynSense 時識科技是一家類腦芯片、智能傳感器設(shè)計與開發(fā)公司,于 2017 年 2 月在瑞士創(chuàng)立(原名 ai-CTX),現(xiàn)已在國內(nèi)落地。公司技術(shù)起源于由蘇黎世大學(xué)和蘇黎世聯(lián)邦理工學(xué)院聯(lián)合發(fā)起的蘇黎世神經(jīng)信息研究所,核心技術(shù) DYNAP (Dynamic Neuromorphic Asynchronous Processor)幫助可配置、通用、實時響應(yīng)的神經(jīng)網(wǎng)絡(luò)在脈沖神經(jīng)元中的實現(xiàn)。
DYNAP-CNN是全球首款動態(tài)視覺專用處理器芯片,于2019年成功流片。該芯片由異步電路設(shè)計,擁有100萬脈沖神經(jīng)元,200萬突觸,可以直聯(lián)動態(tài)相機(jī)(DVS)完成多種實時視覺識別及交互類任務(wù),典型任務(wù)場景下功耗可低至1mW。
創(chuàng)始人喬寧博士畢業(yè)于中國科學(xué)院半導(dǎo)體研究所,曾在蘇黎世大學(xué)從事博士后研究工作,現(xiàn)任蘇黎世大學(xué)助理教授。目前,時識科技已經(jīng)獲得了百度風(fēng)投、默克、和利資本等投資機(jī)構(gòu)的多輪融資。
圖 10|已成功流片類腦計算芯片參數(shù)
除了以上基于硅技術(shù)的類腦計算芯片,還有一部分類腦計算芯片的研究方向是基于新型納米器件和技術(shù),以憶阻器陣列為代表。這種芯片直接利用定制的器件結(jié)構(gòu),來模擬生物神經(jīng)元的電特性,集成度更高,是非常有潛力的類腦計算芯片方案。但是,讓憶阻器陣列完整實現(xiàn)芯片的功能,尚需要解決工藝、系統(tǒng)、算法等一系列的未知難題。
在這一方面,中國學(xué)者的研究成果也走在了世界的前沿。2020 年,清華大學(xué)錢鶴、吳華強(qiáng)教授團(tuán)隊等合作研發(fā)的基于多個憶阻器陣列的存算一體系統(tǒng)發(fā)表在《自然》期刊上,他們在該系統(tǒng)上高效運(yùn)行了卷積神經(jīng)網(wǎng)絡(luò)算法,成功驗證了圖像識別功能,能耗高出 GPU 兩個數(shù)量級,實現(xiàn)了以更低的功耗和硬件成本完成復(fù)雜的計算。這項研究成果證明了利用憶阻器實現(xiàn)存算一體的可行性。
類腦芯片的發(fā)展,經(jīng)歷了從純數(shù)字到數(shù)?;旌稀膯涡酒募傻较到y(tǒng)級的集成、從片外學(xué)習(xí)到片上學(xué)習(xí)的轉(zhuǎn)變趨勢。
類腦計算的發(fā)展未走出前期的實驗室研究階段,離工業(yè)界的實際應(yīng)用仍有一定的距離。根據(jù) Yole 報告,類腦計算最快可能將于 2024 年前后成熟,我們相信到那時類腦計算芯片表現(xiàn)出的相比于馮·諾伊曼架構(gòu)的 AI 芯片的優(yōu)勢將會帶來巨量的產(chǎn)業(yè)發(fā)展機(jī)會。
圖 11丨類腦計算市場規(guī)模預(yù)測
方向三:(硅)光子計算芯片
與電子計算時代的集成電路芯片的物理結(jié)構(gòu)演化路徑一樣,在光子計算語境下,光子芯片就是將大量分立光路元件集成在光子芯片上,以實現(xiàn)更高的穩(wěn)健性和可擴(kuò)展性。
光子芯片的核心是在硅基上實現(xiàn)光子集成芯片,是在傳統(tǒng) CMOS 芯片上蝕刻微米級別的光學(xué)元器件。而光子計算,其實是一個古老的技術(shù)領(lǐng)域。作為一種完全不同于電子計算的技術(shù),光子計算以光子為信息處理載體,依賴光硬件而非電子硬件,以光運(yùn)算代替電運(yùn)算,擅長快速并行處理高度復(fù)雜的計算任務(wù)。
硅光技術(shù)的理念是“以光代電”,但受限于傳統(tǒng)分離式光子器件,具有光場調(diào)控手段單一、光子設(shè)計體積龐大的缺點。光子計算一直沒有明確的應(yīng)用場景,多數(shù)都停留在實驗室階段。Lightelligence(曦智科技)聯(lián)合創(chuàng)始人兼 CEO 沈亦晨曾表示,光計算和光子芯片是最適合下一代計算芯片基建技術(shù)的選擇。
根據(jù) Yole 數(shù)據(jù),按照產(chǎn)品應(yīng)用場景分類,2025 年硅光子市場規(guī)模將由 2019 年的 4.8 億美元增長至 39 億美元。光通信仍然是硅光子最重要的應(yīng)用,數(shù)據(jù)中心通信是硅光子的最大市場。
圖 12丨硅光市場規(guī)模
通信、互連場景下,硅光收發(fā)器市場的競爭長期存在,其中的巨頭先行者是 IBM 和 Intel,主要是為了改善數(shù)據(jù)中心數(shù)據(jù)交換時的速率問題。此外,Luxtera(被思科收購)、Acacia、Fujitsu、Inphi、Rockley Photonics 及 NeoPhotonics 等公司都是硅光芯片領(lǐng)域的有力競爭者。
圖 13丨硅光收發(fā)器競爭格局
硅光芯片除了在數(shù)據(jù)中心、通信、傳感和醫(yī)療領(lǐng)域的應(yīng)用,還有一個非常值得期待的應(yīng)用是光計算。AI 所掀起的計算需求不斷膨脹,帶動了市場針對特定計算推出更適合的新架構(gòu),比如上述的類腦芯片。而在能夠延續(xù)現(xiàn)有成熟半導(dǎo)體工藝技術(shù)上,光子芯片的優(yōu)勢又更為明顯。
需要明確的一點是——光子計算≠光量子計算。光子計算基于波動光學(xué)進(jìn)行精準(zhǔn)調(diào)制;后者則是用光子編碼實現(xiàn)兩種狀態(tài)疊加的量子比特,無法用經(jīng)典波動光學(xué)描述的量子光學(xué)。
全球范圍內(nèi),光計算芯片處于非常早期的階段。從當(dāng)前時間節(jié)點來看,以美國和中國為代表的光子計算公司仍在進(jìn)行技術(shù)和產(chǎn)品上的探索,且商業(yè)化并不成熟。雖然離實際應(yīng)用還需要一定時間驗證,但總體來說中國是非常有機(jī)會走在世界前列的。
在利用光進(jìn)行神經(jīng)網(wǎng)絡(luò)計算的領(lǐng)域中,有一些正在探索的公司,如 Lightmatter,F(xiàn)athom Computing,Lightelligence(曦智科技),LightOn,Luminous 和 Optalysis。將光計算應(yīng)用于脈沖神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)利用大腦神經(jīng)元處理信息的方式,也許可以解釋為什么人腦僅用十幾個神經(jīng)元就能出色地完成工作。
圖 14丨 Lightmatter發(fā)布用于傳統(tǒng)電腦主板的光子計算芯片 Envise
全球光子計算芯片的代表公司(僅為部分,并未窮盡)
Lightmatter:誕生于 MIT,成立于 2017年,已從 Google Ventures(Alphabet 的風(fēng)險部門),Spark Capital 和 Matrix Partners 等投資者那里籌集了總計 3300 萬美元的資金。Lightmatter 計劃在 2021 年底開始發(fā)售其首款基于光的 AI 芯片,稱為 Envise,以適合常規(guī)數(shù)據(jù)中心。Lightmatter 的 CEO Nick Harris 表示,要么發(fā)明新的計算芯片以繼續(xù)使用,要么 AI 速度就會變慢。
Lightelligence(曦智科技):誕生于 MIT,成立于 2017年,2019 年 4 月正式發(fā)布了全球首款光子芯片原型板卡,2021 年全球首款商用光子芯片即將問世。用光子芯片運(yùn)行了 Google TensorFlow 自帶的卷積神經(jīng)網(wǎng)絡(luò)模型來處理 MNIST 數(shù)據(jù)集,整個模型超過 95% 的運(yùn)算是在光子芯片上完成。光子芯片處理的準(zhǔn)確率已經(jīng)接近電子芯片(97% 以上),另外光子芯片完成矩陣乘法所用的時間是最先進(jìn)的電子芯片的 1% 以內(nèi)。
整體來看,計算芯片的代際演進(jìn),服務(wù)于 AI 算法和智能水平的提升。當(dāng)前,全球支柱性、智能化產(chǎn)業(yè)的信息處理環(huán)節(jié)進(jìn)入算力競爭時代。更多類型的非馮 · 諾依曼架構(gòu)芯片將會涌現(xiàn)并逐漸產(chǎn)業(yè)化。絡(luò)繹知圖也將持續(xù)關(guān)注計算芯片產(chǎn)業(yè)及前沿技術(shù)變革,為芯片產(chǎn)業(yè)與技術(shù)研究、投融資顧問、政策對接等專業(yè)服務(wù)貢獻(xiàn)力量。
編輯:lyn
-
芯片
+關(guān)注
關(guān)注
456文章
51088瀏覽量
425914 -
cpu
+關(guān)注
關(guān)注
68文章
10898瀏覽量
212554 -
信息技術(shù)
+關(guān)注
關(guān)注
0文章
605瀏覽量
29707 -
人工智能
+關(guān)注
關(guān)注
1793文章
47588瀏覽量
239465
原文標(biāo)題:變革性信息技術(shù)芯片時代來臨,更多類型的非馮·諾依曼架構(gòu)芯片涌現(xiàn)丨絡(luò)繹知圖深度分析
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論