近日,百度APOLLO DAY技術開放日活動以線上直播形式成功舉辦。作為國內唯一實現全無人自動駕駛商業(yè)化運營的公司,百度通過該活動全景化展示了Apollo全無人自動駕駛技術實力。
活動期間,昆侖芯科技CEO歐陽劍結合公司兩代芯片產品、技術與市場落地情況,分享昆侖芯2代AI芯片適配RoboTaxi高階自動駕駛系統(tǒng),以澎湃算力賦能智能汽車算力中心的應用實踐。
本篇以下內容整理于昆侖芯科技CEO歐陽劍題為“自研AI芯片創(chuàng)新賦能高階自動駕駛——從AI到端到端算力”的主題演講。
過去幾年,智能汽車領域發(fā)展非??欤瑥膫鹘y(tǒng)的L2級別的輔助駕駛,向今天的RoboTaxi和更高階的自動駕駛發(fā)展,同時自研芯片也發(fā)展得非???,所以大家都非常好奇,自研的AI芯片現在在高階自動駕駛領域表現如何。我今天就給大家?guī)磉@樣一個分享——自研AI芯片創(chuàng)新賦能高階自動駕駛。
在進行分享之前,我想給大家介紹一下昆侖芯科技這個公司,用一句話來總結:“十年磨一劍,一朝試鋒芒”。我們之前是百度的一個部門,2011年開始,從AI進入產業(yè)界第一天,我們就開始從事AI計算相關的工作。我們最早是用FPGA對AI進行計算加速。
從2011年開始這個工作以來到2015年,我們就已經部署了超過5000片的FPGA在百度數據中心。到了2017年,我們總共累計部署超過12000片FPGA。同時,我們在Hot Chips累計發(fā)表了三篇論文,也在一些頂級會議上發(fā)表過我們的論文,在Hot Chips上第一次發(fā)表了XPU架構。到了2018年,我們覺得AI計算架構會有一些非常大的變革,所以我們決定自己研發(fā)AI芯片,正式啟動昆侖芯系列產品的研發(fā)和設計。
到了2020年,昆侖芯1代開始了大規(guī)模部署。2021年,昆侖芯科技正式獨立。到了2022年,我們昆侖芯2代已經在數據中心、工業(yè)領域、自動駕駛領域大規(guī)模部署及落地。這是我們公司過去十多年來的發(fā)展歷程。
大家都知道,大算力的AI芯片起步相對比較晚,在這種情況下我們必須加快產品的迭代,我們迭代的速度和強度,不能低于先進的產品。昆侖芯在這么一個高強度的迭代之下已經量產了兩代,同時我們第三代芯片和第四代芯片都在研發(fā)的過程中。
大家可以看到這個圖上,最左邊是我們第一代的14納米的人工智能芯片,這個芯片采用了非常先進的HBM內存,并采用了2.5D的封裝。這款芯片剛量產就已經在百度數據中心部署了超過2萬片。接著在一年多之后,就量產了第二代AI芯片,7納米的工藝,非常先進。昆侖芯2代AI芯片也采用了非常先進的技術,搭載了第二代XPU架構,是業(yè)界第一顆采用GDDR6內存技術的AI芯片。同時,更先進的第三代AI芯片正在研發(fā),我們的產品迭代的速度是非??斓摹?/p>
基于我們的AI芯片也發(fā)布了一系列的AI加速板卡以及AI服務器,包括做訓練的高性能的AI服務器。
這里給大家介紹一下我們量產的第二代云端通用人工智能計算處理器。特別要突出的是它的通用性。AI發(fā)展到今天,迭代非???,模型非常多,如果不通用,就無法滿足今天AI發(fā)展的需求。
做通用AI芯片,背后的技術挑戰(zhàn)是非常高的。我們第二代芯片采用了最新一代的XPU-R的架構,這個架構經歷了過去十多年的迭代,通用性、易用性有非常顯著的提高。
這個芯片的算力非常強大,有128T 16比特的算力和256T 8比特的算力。昆侖芯2代采用了非常先進的7納米工藝,也是業(yè)界第一顆采用GDDR6高速顯存的人工智能芯片。這個芯片的功能非常完備,除了強大算力之外,也具備支持虛擬化,支持芯片之間的互聯,支持視頻編解碼一系列非常全面的功能。這個芯片的顯存有32GB,非常大,它的顯存帶寬也非常高,達到512GB/秒的顯存帶寬。
現在的市場上,大家能看到很多自主研發(fā)的AI芯片,大家會非常好奇:昆侖芯在這些芯片中有哪些優(yōu)勢?在我看來,昆侖芯的產品有如下三個非常獨一無二的優(yōu)勢。
第一,我認為實際上昆侖芯是為數不多,能夠在真實系統(tǒng)上大規(guī)模部署和應用的AI芯片。我們在互聯網的算力中心、工業(yè)、交通、金融、醫(yī)療、教育等不同方向,都有數萬片規(guī)模部署。
第二,我們的生態(tài)完備性應該是國內做的最好的,我們跟多款通用處理器、操作系統(tǒng)、服務器都做了非常完美的適配,而且這些適配都已經在工業(yè)系統(tǒng)上得到非常好的應用。
最后,這也是昆侖芯獨一無二的一個優(yōu)勢——它非常靈活易用。大家都知道人工智能的算法迭代非??欤碌哪P蛯映霾桓F,所以昆侖芯提供了一個非常好用的SDK,使開發(fā)者可以像用GPU一樣來使用昆侖芯,學習門檻非常低,迭代的效率也非常快。
這么多AI芯片,我認為昆侖芯芯片是為數不多可以在非常多的場景大規(guī)模落地的產品。我們在車路協(xié)同、物流系統(tǒng)、智慧交通這些跟交通相關的領域都有很好的落地。我們在智慧醫(yī)療、智慧園區(qū)、智慧金融、互聯網的大規(guī)模算力中心、教育等等,都有非常全面的大規(guī)模落地,有很好的應用案例。這足以證明昆侖芯的產品和技術非常成熟,而且得到了客戶高度認可。
以上是對昆侖芯的產品、技術和市場落地的情況的介紹。接下來回到今天的主題:昆侖芯在高階自動駕駛方面的工作。大家都知道今天的RoboTaxi系統(tǒng)或者說高階自動駕駛系統(tǒng),它的業(yè)務復雜度、模型算法的復雜度不亞于數據中心。所以昆侖芯在數據中心里面積累的所有優(yōu)勢,包括它的高性能、通用性和易用性都能很好地賦能今天的高階自動駕駛系統(tǒng)。我們的昆侖芯2代AI芯片已經在百度的RoboTaxi系統(tǒng)上做了完整適配。我今天就給大家分享一下這部分的工作。
一個高階自動駕駛系統(tǒng),它的計算系統(tǒng)非常復雜。這里面一般是要用到感知模型、定位模型,用到一些控制規(guī)劃的算法,還包括整個端到端的計算,其中模型的數量可能會有幾十個,而且業(yè)界最新的模型也會非常快地應用到自動駕駛系統(tǒng)中。因為這些都是最新的模型,所以它對算法的迭代速度、對算力的要求都非常高,而且在道路上對延時的要求也非常高。
我們很好地支持了整個RoboTaxi,這里面包括AI部分。我們用昆侖芯2代AI芯片跟業(yè)界最主流的顯卡做了一個性能對比,我們的性能優(yōu)于這個顯卡,功耗只有不到這個顯卡的一半。我們也跟主流的AI加速卡做了一個性能對比,我們的性能是它的兩倍以上。同時,我們也做了一個端到端的測試,我們在不到高端顯卡一半的功耗的情況下,取得了比較領先的性能。
除了AI模型,在一些控制規(guī)劃這種非AI的模型(可能是一些并行計算,也可能是一些邏輯計算),我們也都取得了相對于一些顯卡更好的性能效果。這足以證明昆侖芯的產品能力可以非常完美地支持高階自動駕駛,這是我們的一些適配成果。
第二代昆侖芯在RoboTaxi的駕駛系統(tǒng)上做了完整適配,也在一些仿真系統(tǒng)和路測系統(tǒng)上做了一個完整的測試,測試結果完全達到客戶的要求,這里不做過多的介紹。
這是我們在整體系統(tǒng)上所做的一些工作,可以看到在昆侖芯2代AI芯片的高階自動駕駛系統(tǒng)里面,整個系統(tǒng)運行非常正常、非常平滑,它的性能、穩(wěn)定性也完全符合客戶的需求。
總結來看,今天的高階自動駕駛計算系統(tǒng),和數據中心系統(tǒng)有非常相似之處:它的算法非常多元,算法迭代的速度非常快,算法復雜度也越來越高。那就意味著我們的計算系統(tǒng)一定要滿足這些要求,且非常高性能,否則就沒法支持那么多復雜的算法。在車上這么一個對性能要求苛刻的地方,能夠實現正常運轉,就一定會要求非常好編程、非常好移植,否則那些先進的算法就沒法很快迭代到車上使用,系統(tǒng)也沒法保證其領先性。
此外,它的穩(wěn)定性要非常好。因為車的系統(tǒng)比云端的系統(tǒng)對穩(wěn)定性上要求更加苛刻,這個穩(wěn)定性不僅包括硬件,還包括整個軟件,它要求具備整個系統(tǒng)的穩(wěn)定性。
最后說一下我的心得和體會。我本人參與自動駕駛系統(tǒng)方面的工作已經很多年,過去一直有一個觀點,在車載計算系統(tǒng)是一個相對封閉的系統(tǒng),要求做非常深度的軟件和硬件的定制。五六年前,對于云端的AI芯片也一樣有人持這個觀點,而且這個觀點還非常主流。但今天回頭來看,過去五六年,提出這個觀點的AI芯片公司已經全部不在市場里了。所以,未來的車載計算系統(tǒng)一定是相對開放,能夠為用戶提供高算力、高通用性,可以滿足客戶個性化需求的計算系統(tǒng)。
昆侖芯經過十幾年的迭代,未來也會考慮面向高階自動駕駛系統(tǒng),定制我們的車規(guī)高性能的SoC,把過去10余年所有的積累、所有的創(chuàng)新都用在車上。
謝謝大家,今天的演講就到這里。
審核編輯:湯梓紅
-
AI
+關注
關注
87文章
30998瀏覽量
269310 -
自動駕駛
+關注
關注
784文章
13838瀏覽量
166538 -
算力
+關注
關注
1文章
985瀏覽量
14841 -
昆侖芯科技
+關注
關注
0文章
27瀏覽量
623
原文標題:昆侖芯科技CEO歐陽劍:自研AI芯片創(chuàng)新賦能高階自動駕駛——從AI到端到端算力
文章出處:【微信號:昆侖芯科技,微信公眾號:昆侖芯科技】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論