在本次的CES 2018上,地平線攜帶了2款人工智能專用芯片驚艷亮相,推出基于Intel FPGA的自動(dòng)駕駛系統(tǒng)原型。記者對(duì)地平線創(chuàng)始人兼CEO余凱進(jìn)行了采訪,了解一下地平線研發(fā)芯片的經(jīng)驗(yàn)和未來(lái)的發(fā)展。
CES 2018是這家成立兩年半的公司第二次參加CES。上屆CES,地平線與Intel合作推出基于Arria FPGA的ADAS原型。因?yàn)樵退宫F(xiàn)出的高性能、低功耗以及團(tuán)隊(duì)敏捷的開(kāi)發(fā)效率,這年地平線獲得了Intel Capital領(lǐng)投的上億美金的A+輪融資。
而后今年的拉斯維加斯,地平線在第二代BPU架構(gòu)的基礎(chǔ)上再次推出基于Intel FPGA的自動(dòng)駕駛系統(tǒng)原型。更重要的是,他們還帶來(lái)了數(shù)月前流片成功的2款人工智能專用芯片。
征程1.0處理器
本屆CES開(kāi)始前,記者再次采訪了地平線創(chuàng)始人兼CEO余凱,請(qǐng)他聊一聊過(guò)去2年地平線研發(fā)芯片的經(jīng)驗(yàn),以及芯片發(fā)布之后應(yīng)用和落地的思考。
打造嵌入式人工智能專用處理器
在剛剛過(guò)去的12月,地平線于北京召開(kāi)盛大的發(fā)布會(huì),對(duì)外展示的正是2款嵌入式人工智能專用處理器:面向智能駕駛應(yīng)用的征程1.0和面向攝像頭應(yīng)用的旭日1.0。兩款處理器均是基于地平線的第一代BPU架構(gòu)——高斯架構(gòu)。關(guān)鍵性能指標(biāo)分別是:可實(shí)時(shí)處理1080P@30的視頻,每幀中可同時(shí)對(duì)200個(gè)目標(biāo)進(jìn)行檢測(cè)、跟蹤、識(shí)別,典型功耗1.5W,每幀延時(shí)小于30ms。
對(duì)外,地平線早在一年多前就公布了3代BPU架構(gòu)設(shè)計(jì)的路線圖:高斯架構(gòu) - 伯努利架構(gòu) - 貝葉斯架構(gòu)。三代架構(gòu),性能與功耗比依次提升,工藝也從40nm演進(jìn)到16nm。在內(nèi)部,自2015年10月招募第一位芯片工程師開(kāi)始,地平線今天組建了一支60人左右的專業(yè)芯片團(tuán)隊(duì)。
針對(duì)地平線芯片的發(fā)布,國(guó)內(nèi)人工智能領(lǐng)域泰斗張鈸院士的評(píng)價(jià)是,用算法和軟件來(lái)定義硬件,專門(mén)面向深度學(xué)習(xí)算法的硬件極大地提高了計(jì)算效率,這為硬件的發(fā)展提供了新思路。而對(duì)地平線來(lái)說(shuō),這也恰恰是2款芯片研發(fā)的難點(diǎn),需要團(tuán)隊(duì)同時(shí)具備軟件算法和硬件兩個(gè)領(lǐng)域的經(jīng)驗(yàn)思考。
按照原定的研發(fā)規(guī)劃,地平線會(huì)在去年的5月份進(jìn)行芯片的流片。余凱當(dāng)時(shí)正在底特律出差,5月的深夜他與芯片團(tuán)隊(duì)溝通,決定推遲流片排期。
余凱向我們解釋:一般來(lái)講,在對(duì)芯片硬件開(kāi)始設(shè)計(jì)前,芯片的整個(gè)軟件架構(gòu)需要完全確定。但實(shí)際上,針對(duì)深度學(xué)習(xí)優(yōu)化的人工智能專用芯片很少有人做過(guò),在研發(fā)的過(guò)程中算法和軟件團(tuán)隊(duì)會(huì)修改甚至推翻一些小的決策點(diǎn),于是這對(duì)于硬件團(tuán)隊(duì)來(lái)說(shuō)造成了非常大的挑戰(zhàn),導(dǎo)致在原定的芯片排期內(nèi)仿真做得不夠。好在推遲排期后,他們又與臺(tái)積電積極協(xié)調(diào),爭(zhēng)取一個(gè)月內(nèi)重新安排了流片。
地平線給自己設(shè)計(jì)的定位是具有自主芯片IP,提供完整開(kāi)放嵌入式人工智能解決方案的供應(yīng)商,而這兩年,地平線主要的業(yè)務(wù)領(lǐng)域是自動(dòng)駕駛和IoT。如何面向自動(dòng)駕駛和廣泛的IoT領(lǐng)域提供一個(gè)通用的優(yōu)化過(guò)的計(jì)算架構(gòu),使得芯片開(kāi)發(fā)有很高的效率,同時(shí)針對(duì)垂直應(yīng)用場(chǎng)景又有很好的效果,這可能是芯片研發(fā)的第二個(gè)難點(diǎn)。
這也是為什么這次發(fā)布的2款處理器都是視覺(jué)處理器。2款處理器都是基于高斯架構(gòu),但針對(duì)不同的應(yīng)用場(chǎng)景做了不同的封裝。同樣團(tuán)隊(duì)配置上,地平線在60來(lái)人的芯片團(tuán)隊(duì)之外,建立了一個(gè)100 - 200人之間的應(yīng)用開(kāi)發(fā)團(tuán)隊(duì),負(fù)責(zé)自動(dòng)駕駛和IoT兩個(gè)方向。
自動(dòng)駕駛的落地與產(chǎn)品化
2016年,地平線向博世授權(quán)了一份與ADAS相關(guān)的軟件,這也是公司當(dāng)年一項(xiàng)重要的業(yè)務(wù)。而隨著高斯架構(gòu)的確立,地平線先后在GPU、ARM、FPGA等多個(gè)平臺(tái)上實(shí)現(xiàn)了基于自主IP架構(gòu)的解決方案。比如CES 2017上,地平線采用Intel FPGA搭建基于高斯架構(gòu)的ADAS系統(tǒng),并就這個(gè)系統(tǒng)在與一部分的車企和供應(yīng)商開(kāi)展合作,正在功能驗(yàn)證的階段。
眼下,征程1.0是一顆工業(yè)級(jí)的芯片,余凱說(shuō)團(tuán)隊(duì)希望在未來(lái)1年之內(nèi)推出車規(guī)級(jí)的芯片。同時(shí),面向車輛前裝的周期是漫長(zhǎng)的。地平線目前可以向行業(yè)客戶提供基于征程1.0的Level 2級(jí)別的ADAS解決方案?;谄湓诒緦肅ES上展示的第二代BPU架構(gòu)原型系統(tǒng),之后也陸續(xù)會(huì)推出Level 3和限定場(chǎng)景下L4的解決方案。
余凱說(shuō),今年內(nèi),基于第二代BPU架構(gòu)的征程2.0將會(huì)推出,相比于征程1.0會(huì)有長(zhǎng)足的提升。征程2.0會(huì)面向自動(dòng)駕駛做更多的優(yōu)化,并且會(huì)實(shí)現(xiàn)基于像素級(jí)別的識(shí)別框架,計(jì)算復(fù)雜性也會(huì)更高。
發(fā)布會(huì)上,地平線還對(duì)外公布了與2家車企的合作,一家是奧迪,一家是長(zhǎng)安。今年,地平線將與兩家在自主BPU架構(gòu)的基礎(chǔ)上,各自進(jìn)行自動(dòng)駕駛的聯(lián)合開(kāi)發(fā)和驗(yàn)證。
附上:記者在CES前采訪的對(duì)話節(jié)選,小編做了不改變?cè)獾膭h減。
記者:地平線剛剛發(fā)布了旭日1.0和征程1.0,兩款芯片在硬件上有多大的差異?
余凱:這兩款芯片在硬件上,其實(shí)主要是封裝得不太一樣,里面的主要器件單元是一樣的。因?yàn)樗诓煌膱?chǎng)景下使用,它的模型復(fù)雜度不太一樣。
我們是使用同一代架構(gòu),高斯架構(gòu),采用不同的封裝。業(yè)界比如像NVIDIA是每三年一代架構(gòu),上一代架構(gòu)Pascal,這一代架構(gòu)Volta,然后基于Volta架構(gòu)的話,他們也會(huì)推出不同場(chǎng)景下不同的處理器,主要是一些接口都不一樣,比如說(shuō)在車載的情況下,它對(duì)實(shí)時(shí)性的要求更高。
記者:我們是什么時(shí)候決定說(shuō)把它分裝成兩個(gè)不同的芯片?
余凱:應(yīng)該說(shuō),我們應(yīng)該從一開(kāi)始就瞄準(zhǔn)這兩個(gè)不同的市場(chǎng)。我們會(huì)根據(jù)這一代的架構(gòu),也會(huì)演化成不同的產(chǎn)品。我們也在考慮可能會(huì)基于這一代的架構(gòu),推出支持語(yǔ)音識(shí)別的芯片。
一般來(lái)講的話,架構(gòu)迭代的時(shí)間都是比較長(zhǎng)的,一代架構(gòu)會(huì)根據(jù)不同的應(yīng)用封裝成不同的芯片,有不同的接口,這在業(yè)界都是常見(jiàn)的形式。
記者:像這一代芯片為什么選用的是40納米的工藝?
余凱:因?yàn)槲覀儽容^強(qiáng)調(diào)軟件跟算法的結(jié)合,我們不會(huì)追求純粹的半導(dǎo)體制程上的先進(jìn)性。我們會(huì)強(qiáng)調(diào)因?yàn)槲覀冇懈鼜?qiáng)大的軟件,即使用比別人更低的工藝,但是我們的整個(gè)系統(tǒng)性能也可以做到足夠好,甚至比別人更好。就像Mobileye其實(shí)很長(zhǎng)一段時(shí)間也是用50納米的工藝。所以,這個(gè)就是軟硬結(jié)合的做法跟純粹做硬件思路不太一樣的地方。
Mobileye的EyeQ4是28納米的,其實(shí)跟我們下一代的,今年年底要推出來(lái)的新的一代芯片是差不多的。因?yàn)镋yeQ4是面向L3級(jí)和L4級(jí)自動(dòng)駕駛,我們這一代芯片主要是面向L2級(jí)的ADAS,所以跟EyeQ3是對(duì)標(biāo)的。
記者:40納米跟28納米相比,在成本或者排期上會(huì)有多大的優(yōu)勢(shì)?
余凱:光流片費(fèi)就會(huì)節(jié)省幾百萬(wàn)美金。
記者:地平線的芯片團(tuán)隊(duì)現(xiàn)在大概有多大?
余凱:我們整個(gè)的芯片架構(gòu)、芯片設(shè)計(jì)、芯片驗(yàn)證,然后再加上系統(tǒng)軟件固件團(tuán)隊(duì)的話,現(xiàn)在有五六十人。
記者:根據(jù)地平線12月公布的幾個(gè)解決方案,一個(gè)方向是自動(dòng)駕駛,一個(gè)是零售,還有一個(gè)是安防三個(gè)應(yīng)用領(lǐng)域。那么芯片和算法的底層開(kāi)發(fā),與幾個(gè)方向的應(yīng)用開(kāi)發(fā)怎樣協(xié)調(diào)?
余凱:圍繞應(yīng)用,我們現(xiàn)在內(nèi)部定義的其實(shí)是兩個(gè)方向,一個(gè)是智能IOT,一個(gè)就是自動(dòng)駕駛。兩個(gè)方向的應(yīng)用開(kāi)發(fā)會(huì)由兩個(gè)團(tuán)隊(duì)負(fù)責(zé),芯片算法是一個(gè)公共的底層平臺(tái)團(tuán)隊(duì)。應(yīng)用開(kāi)發(fā)的團(tuán)隊(duì)現(xiàn)在加起來(lái)有100到200號(hào)人之間,自動(dòng)駕駛這塊會(huì)多一些。
記者:你們的芯片,之后是一年會(huì)進(jìn)行一次迭代?
余凱:對(duì),一開(kāi)始是這樣,一年迭代一次架構(gòu)。我們可能往第二代架構(gòu)去迭代的速度會(huì)更快一點(diǎn),第二代會(huì)比第一代更加強(qiáng)大。
記者:基于高斯架構(gòu),會(huì)有多個(gè)面向應(yīng)用的芯片。隨著架構(gòu)的迭代,芯片越來(lái)越專用化,會(huì)不會(huì)變成不同的架構(gòu)?
余凱:我們盡量不希望這樣,這樣做的話會(huì)讓我們的底層資源變得太分散,我們會(huì)盡量通過(guò)軟件來(lái)面對(duì)不同的應(yīng)用場(chǎng)景。
記者:之前講到你們的芯片特點(diǎn)是高性能、低功耗、低成本,相比之下,低成本大概是多低呢?
余凱:跟端上面處理的GPU比的話,我們希把成本至少做低一個(gè)數(shù)量級(jí)。
記者:怎樣跟基于EyeQ3的ADAS比較?
余凱:目前征程1.0的話,其實(shí)是一個(gè)工業(yè)級(jí)的處理器,不是車規(guī)級(jí)的。所以我們一開(kāi)始會(huì)去做ADAS的后裝市場(chǎng)。我們也有計(jì)劃,把我們的處理器推向車規(guī)級(jí)。
記者:發(fā)布會(huì)上,地平線也公布了與奧迪、長(zhǎng)安的合作,具體是怎樣的?
余凱:我們跟奧迪在聯(lián)合研發(fā)自動(dòng)駕駛技術(shù),明年的話,我們會(huì)有聯(lián)合研發(fā)的樣車出來(lái);長(zhǎng)安的話,我們是成立一個(gè)聯(lián)合實(shí)驗(yàn)室,也是面向自動(dòng)駕駛,雙方共同去聯(lián)合研發(fā)。
記者:比如會(huì)基于征程有一些合作嗎?
余凱:其實(shí)會(huì)遠(yuǎn)超征程的范圍,也可以理解為是基于征程的二代處理器,他們提出應(yīng)用場(chǎng)景,我們提供軟件跟處理器。
記者:目前征程1.0是一個(gè)工業(yè)級(jí)的芯片,比如現(xiàn)在有一家汽車廠商希望合作,一般是怎樣去開(kāi)展?
余凱:其實(shí)一般都是這樣的。Mobileye跟它的合作伙伴,一開(kāi)始的芯片也都是工業(yè)級(jí)的,然后會(huì)跟客戶先完成功能測(cè)試,功能測(cè)試通常都要三年的時(shí)間,然后在這個(gè)三年時(shí)間里,不斷地去完成車規(guī)級(jí)和系統(tǒng)級(jí)的功能安全驗(yàn)證。
記者:像這樣提前兩年去定義一款芯片,難點(diǎn)會(huì)在哪里?
余凱:兩年前這個(gè)定義芯片的話,那個(gè)時(shí)候你好多決定,其實(shí)都是需要在不是很確定的情況下去做的。打個(gè)比方,你的輪子還沒(méi)有在裝的過(guò)程中,你車就開(kāi)始跑了,所以這個(gè)風(fēng)險(xiǎn)很大。好在我們一次性流便成功了,這是我們覺(jué)得很興奮的一件事情。
不是很確定的情況,比如說(shuō),你不知道芯片所支持的算法架構(gòu),是不是能夠去滿足未來(lái)應(yīng)用的需求。比如說(shuō)15年的時(shí)候幾乎沒(méi)有人做深度神經(jīng)網(wǎng)絡(luò)的定制化優(yōu)化,我們自己做了,然后還做得比較激進(jìn),那么現(xiàn)在看起來(lái)的話,這個(gè)策略是非常對(duì)的。
記者:像你們的芯片流程,跟傳統(tǒng)的芯片設(shè)計(jì)流程會(huì)有什么不一樣?
余凱:很多不一樣。一般來(lái)講,一個(gè)典型的芯片,在開(kāi)始設(shè)計(jì)之前,整個(gè)軟件框架一定要定下來(lái),一旦開(kāi)始的話就不能再改了。
我們是在2015年那么早的情況下做這個(gè)事情,然后我們有一些小的一些決策點(diǎn),可能會(huì)不斷地推翻。所以當(dāng)時(shí)的話硬件的同學(xué)已經(jīng)開(kāi)始著手了,結(jié)果這邊軟件還時(shí)不時(shí)修改,所以其實(shí)是搞的硬件的設(shè)計(jì)人員挺抓狂的。
做算法研發(fā)的同學(xué)的思維是,軟件我可以隨時(shí)改,有一個(gè)新的idea的話就可以改,但硬件,你就什么東西都得固定下來(lái),一行代碼不能改。因?yàn)橛布稽c(diǎn)點(diǎn)的改動(dòng),其實(shí)就意味著整個(gè)的巨大的工作量,會(huì)導(dǎo)致時(shí)間排期的不確定性。
我們做第二代的時(shí)候,會(huì)在軟件上做一些調(diào)整。因?yàn)橛布母膭?dòng),而導(dǎo)致驗(yàn)證不充分的話,最后芯片研發(fā)會(huì)有很大的風(fēng)險(xiǎn)。從我們這種做軟件背景的人來(lái)講,其實(shí)就是真正地對(duì)硬件研發(fā)有敬畏之心。
評(píng)論
查看更多