征程6介紹
與以往征程系列前幾代產(chǎn)品不同的是,征程6(我們業(yè)內(nèi)稱為J6,“鉤6”)并不是一款芯片,而是根據(jù)算力大小,分成了J6B/J6L/J6E/J6M/J6H/J6P 6款!
1 J6P芯片參數(shù)
- CPU:18核心的ARM Cortex-A78AE,算力是410K DMIPS
- BPU:如上文介紹,采用了納什架構(gòu)第四代BPU,560TOPS算力(注意上圖左下角的一行小字:560TOPS算力是等效1/2稀疏網(wǎng)絡(luò)下的算力,必須嚴謹?。?/li>
- 算法支持:對Transformer算法的支持效率在業(yè)內(nèi)領(lǐng)先,同時支持大規(guī)模交互式博弈等前沿算法,表明其在處理復(fù)雜AI任務(wù)上的優(yōu)越性能。
- 功能安全:通過ISO 26262 ASIL-D功能安全流程認證,主動安全AEB ASIL-B產(chǎn)品級功能安全認證。
2 四芯合一的芯片架構(gòu)
J6芯片所實現(xiàn)的“四芯合一”是指將以下四種關(guān)鍵處理單元集成在同一顆系統(tǒng)級芯片SoC上:
- CPU(Central Processing Unit):負責(zé)通用計算任務(wù),處理非特定的計算工作負載,是芯片的控制中心,執(zhí)行操作系統(tǒng)的指令和應(yīng)用程序的邏輯控制。
- BPU(Brain Processing Unit):地平線自主研發(fā)的神經(jīng)網(wǎng)絡(luò)處理單元,專門針對人工智能算法和深度學(xué)習(xí)任務(wù)進行了優(yōu)化,如圖像識別、自然語言處理等,是實現(xiàn)智能駕駛核心算法的關(guān)鍵。
- GPU(Graphics Processing Unit):圖形處理器,除了傳統(tǒng)意義上的圖形渲染,現(xiàn)代GPU也廣泛用于并行計算,特別是在機器視覺、環(huán)境感知等需要大量并行處理的場景中。
- MCU(Microcontroller Unit):微控制器單元,常用于實現(xiàn)嵌入式控制功能,具有功能全、體積小、集成度高等特點。在J6中,MCU被集成用以處理功能安全相關(guān)的任務(wù),確保系統(tǒng)的可靠性。
這種高集成度的設(shè)計不僅提升了系統(tǒng)性能,還顯著提高了性價比,降低了部署難度,使得單顆征程6芯片就能夠支持包括感知、規(guī)劃決策、控制、座艙感知等在內(nèi)的全棧計算任務(wù),適用于多種智能駕駛應(yīng)用場景。
這種多合一實際上就是SIP(System in Package),SIP技術(shù)是一種先進的半導(dǎo)體封裝技術(shù),它允許將多種功能芯片、元器件(如處理器、存儲器、傳感器、RF組件等)以及被動元件(如電阻、電容)集成在一個封裝內(nèi)部,形成一個具有完整或部分系統(tǒng)功能的封裝模塊。與傳統(tǒng)的單一封裝只包含一個主要芯片(如SoC)不同,SIP技術(shù)通過并排排列、堆疊或采用3D封裝等方法,將多個獨立的芯片和組件緊密集成,從而實現(xiàn)了更高的集成度和更小的封裝尺寸。
征程6系列不是人們之前猜測的3款芯片,而是6款,足以覆蓋智能駕駛的各個場景和價位。發(fā)布會上重點介紹了征程6B、6E、6M和6P,筆者認為B應(yīng)該是Base,L是Light,E是Efficiency,M是Medium,H是High,P是Performance或Premium。地平線沒有公開征程6L和6H的參數(shù),預(yù)估6H的AI算力是256-300 TOPS,CPU算力是250-300K DMIPS。6L的AI算力是30-40TOPS,CPU算力是40-50K DMIPS。
征程6系列與5系列相比,升級最明顯的是CPU算力。征程5的CPU是8核心Cortex-A55,算力大致是25-30K DMIPS,這次除了最低的征程6B,其余CPU算力都大幅度提高。
征程6系列的另一個升級是BPU架構(gòu),所謂BPU就是地平線對AI加速器的另一種稱呼,B代表Brain,可以稱為類腦處理器,第一代BPU,地平線致敬數(shù)學(xué)家伯努利,伯努利分布是最簡單的離散型概率分布模型。第二代BPU,地平線致敬英國數(shù)學(xué)家貝葉斯,他推導(dǎo)出貝葉斯定理,貝葉斯定理是一個由結(jié)果倒推原因的概率算法,當年默默無聞,在人工智能的今天大放異彩。
征程6的第三代BPU架構(gòu)則致敬博弈論創(chuàng)始人納什,稱之為納什架構(gòu)。約翰·納什,生于1928年6月13日,著名經(jīng)濟學(xué)家、博弈論創(chuàng)始人、《美麗心靈》男主角原型,并且還是前麻省理工學(xué)院助教,后任普林斯頓大學(xué)數(shù)學(xué)系教授,主要研究博弈論、微分幾何學(xué)和偏微分方程。由于他與另外兩位數(shù)學(xué)家(經(jīng)濟學(xué)家,約翰·C·海薩尼和萊因哈德·澤爾騰)在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻,對博弈論和經(jīng)濟學(xué)產(chǎn)生了重大影響,而獲得1994年諾貝爾經(jīng)濟學(xué)獎。
博弈論主要針對智能車與智能車,智能車與非智能車之間決策交互產(chǎn)生的影響,目前大部分智能駕駛都是基于單車的,未考慮其他車輛對智能車決策的影響,這使得智能車有時候看起來不十分靈活,比如對向車主動讓道讓智能車先走,但智能車無法理解對向車的意圖,還是傻傻地等對向車先走。也就是智能駕駛的策略,大多都有強化學(xué)習(xí)的影子,強化學(xué)習(xí)(Reinforcement Learning,RL)旨在通過與環(huán)境(可以是虛擬的也可以是真實的)的交互來使智能體(我們的「模型」)學(xué)習(xí)。RL 一開始是根據(jù) Markov 過程提出的,我們讓智能體處于不確定的固定環(huán)境中,并試圖通過獎勵/懲罰機制來學(xué)習(xí)到一個最優(yōu)策略。在單智能體的情況下,這種方法被證明是收斂的。但是,如果是將多個智能體放置在同一環(huán)境中(多智能體強化學(xué)習(xí),MARL),情況就復(fù)雜多了。
假設(shè)我們正在試著用智能車來改善城市的交通情況,這時每輛車的決策都會影響其他車的決策與表現(xiàn),比如智能車與智能車之間很可能會發(fā)生沖突,因為可能對于兩輛智能車而言,沿著某條路線行駛都是最方便的(獲得最多的獎勵)。博弈論有個RL算法,它使用深度神經(jīng)網(wǎng)絡(luò)進行函數(shù)逼近,迭代計算子游戲的收益矩陣(Gt)。這個子游戲就是上文提到的 stage games。在每個時間 t 處(每個 stage game),都會計算出符合 NE 的回應(yīng)(σ),并得到最優(yōu)策略(π),然后添加新的策略來擴展 Gt 為 Gt + 1,繼續(xù)重復(fù)上述過程。這是最高明的智能駕駛決策算法。
征程6全系列的AI加速都是納什架構(gòu)
征程6B主打極致性價比,CPU可能是6核心的Cortex-A55,制造工藝可能是14或28納米,征程6B的國際意向客戶是博世和電裝,國內(nèi)意向客戶是四維圖新、福瑞泰克和Minieye。主要對手可能是Mobileye的EyeQ5M/H和EyeQ6L。
征程6系列主打產(chǎn)品是E/M。
征程6系列將于2024年內(nèi)開啟首個前裝量產(chǎn)車型交付,并預(yù)計于2025年實現(xiàn)超10款車型量產(chǎn)交付。面向中階智駕市場,地平線推出普惠城區(qū)性價比方案最優(yōu)解——征程6M,以及極致體驗高速NOA最優(yōu)解——征程6E,并提供符合AEC-Q104車規(guī)標準的SiP模組和Matrix 6域控參考設(shè)計,以超高集成度實現(xiàn)更低的功耗和更優(yōu)的系統(tǒng)成本。發(fā)布會上,地平線官宣與多家Tier1、軟硬件合作伙伴達成征程6E/M的合作,并公布到2024年第二季度將有超過50家生態(tài)伙伴推出基于征程6E/M的準量產(chǎn)級產(chǎn)品。
大家最關(guān)注的還是征程6系列的旗艦征程6P。
征程6P的AI算力是560TOPS,地平線謹慎地做了標注,560TOPS是在1/2稀疏網(wǎng)絡(luò)下的等效算力,地平線未提及精度,應(yīng)該還是INT8位。這個算力實際遠超4片Orin合并的算力,再強調(diào)一次,以目前車載領(lǐng)域用的最頂級車載以太網(wǎng)交換機帶寬不超過1.25GB/s,典型的PCIe 4.0交換機,帶寬不超過32GB/s,即便是價格遠超Orin 的PCIe 6.0交換機,帶寬也不超過120GB/s。想要像服務(wù)器行業(yè)那樣是用4個H100就讓算力增加4倍,帶寬至少要做到900GB/s,而這根本做不到,用最頂級的車載以太網(wǎng)交換機連接4個Orin,算力頂多是1.2倍單個Orin算力,也就是300TOPS。這也是英偉達要花十幾億美元開發(fā)NVLINK的原因,也是NVLINK被美國管制嚴禁出口的原因。
CPU是18核心的ARM Cortex-A78AE,算力是410K DMIPS,英偉達Orin-X是12核心,內(nèi)核也是ARM Cortex-A78AE,算力是227K DMIPS,因為Orin的GPU發(fā)熱量比較大,所以其CPU的頻率較低,而地平線的GPU算力只有200GFLOPS,發(fā)熱量很低,所以CPU頻率可以高點,算力幾乎是英偉達的兩倍,華為的昇騰610的CPU則是16核心,算力是200K DMIPS
征程6P里面添加了一個微型GPU,算力很低,只有200GFLOPS,主要是為了將智能駕駛領(lǐng)域的圖像輸出到儀表或中控屏上。
為了降低成本,更好管理供應(yīng)鏈,也為了減少軟件復(fù)雜度, 征程6P內(nèi)部添加了一個達到ASIL-D級的MCU島,算力是10K DMIPS ,目前 大家都是使用單獨的安全MCU來控制車輛底盤,通常是英飛凌的TC397,TC397價格比較高,且價格波動大,供應(yīng)狀況不穩(wěn)定,最高算力是4K DMIPS,典型算力是2.7K DMIPS 。地平線沒有公布詳細信息,應(yīng)該是 和高通SA8650/SA8255/SA8775那樣的4核心ARM Cortex-R52內(nèi)核,運行頻率估計是800-1000MHz 。
存儲帶寬方面,升級到了LPDDR5,帶寬達205GB/s,與英偉達Orin相同。前視感知支持1800萬像素,圖像帶寬5.3Gpixel/s。
- 內(nèi)部采用TB/s級高性能總線,訪存延時低至130納秒。
- 為應(yīng)對新一代大模型Transformer較多的矢量運算,特別添加了VPU,即矢量浮點運算加速單元。
- 地平線征程P6的晶體管數(shù)量高達370億,英偉達Orin只有170億,Xavier只有90億。
與征程6系列一同發(fā)布的還有 全場景智能駕駛解決方案SuperDrive ,它聚焦擬人化體驗突破,打造好用的智駕系統(tǒng)2.0。憑借動態(tài)、靜態(tài)、OCC(Occupancy占用網(wǎng)絡(luò))三網(wǎng)合一的端到端感知架構(gòu),數(shù)據(jù)驅(qū)動的交互式博弈算法,SuperDrive在任何道路環(huán)境下都能兼顧場景通過率、通行效率和行為擬人,在擁堵匯流、路口交互-動態(tài)Driveline、禮讓騎行人、擁堵?lián)Q道、城市環(huán)島通行等城區(qū)復(fù)雜場景下,均能夠為用戶帶來優(yōu)雅不慫、從容篤定的智能駕駛體驗。
SuperDrive復(fù)雜場景體驗突破
動態(tài)、靜態(tài)、Occupancy三網(wǎng)合一的感知端到端架構(gòu)是精準還原客觀物理世界的有效手段。在此架構(gòu)下遮擋準召率提升70%,動態(tài)代碼行數(shù)降低90%,網(wǎng)絡(luò)負載降低50%,有效解決當前行業(yè)感知架構(gòu)時延高、規(guī)則多、負載重的問題。數(shù)據(jù)驅(qū)動的交互博弈可帶來更擬人的最優(yōu)解,使得SuperDrive像老司機一樣靈活處理復(fù)雜交通流,在擁堵場景下變道成功率提升50%,路口通過率提升67%。
審核編輯 黃宇
-
芯片
+關(guān)注
關(guān)注
455文章
50812瀏覽量
423574
發(fā)布評論請先 登錄
相關(guān)推薦
評論