0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英飛凌AURIX TC4x微控制器系列中的并行處理單元(PPU)簡(jiǎn)介

駿龍電子 ? 來(lái)源:英飛凌汽車電子生態(tài)圈 ? 2024-05-17 10:52 ? 次閱讀

并行處理單元(PPU)是集成在英飛凌AURIX TC4x微控制器系列中的協(xié)處理器。PPU旨在卸載主CPU信號(hào)處理、濾波和其他數(shù)學(xué)運(yùn)算,從而為要求嚴(yán)格的應(yīng)用程序(例如實(shí)時(shí)控制、傳感器信號(hào)處理和軌跡規(guī)劃等)提供高計(jì)算能力和縮短執(zhí)行時(shí)間,并且能支持實(shí)現(xiàn)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)算法。

本文將簡(jiǎn)要介紹PPU的內(nèi)部結(jié)構(gòu)、功能和應(yīng)用領(lǐng)域。

1. PPU內(nèi)部結(jié)構(gòu)

12072d68-13f2-11ef-b74b-92fbcf53809c.png

圖1. TC4x微控制器示意框圖

圖1是TC4x 微控制器示意框圖,圖中右上角是PPU的簡(jiǎn)化結(jié)構(gòu),由標(biāo)量核(scalar core),向量核(vector core/SIMD core),一級(jí)緩存,及其它系統(tǒng)資源組成。

01

標(biāo)量核(Scalar Core):標(biāo)量核用于執(zhí)行大量的標(biāo)量運(yùn)算,以及任務(wù)調(diào)度。標(biāo)量核支持多種算術(shù)運(yùn)算和邏輯運(yùn)算,還支持硬件浮點(diǎn)運(yùn)算,從而實(shí)現(xiàn)更高的計(jì)算效率。另外,標(biāo)量核提供豐富的硬件功能安全機(jī)制,可以輔助實(shí)現(xiàn)高功能安全等級(jí)的任務(wù)。

02

向量核(Vector core/SIMD Core):向量核是 PPU 的另一個(gè)重要功能模塊,專門用于執(zhí)行向量運(yùn)算。向量核支持多種向量算術(shù)運(yùn)算、邏輯運(yùn)算和專用信號(hào)處理,支持整型數(shù)和浮點(diǎn)運(yùn)算,從而實(shí)現(xiàn)更高的計(jì)算效率。向量核還支持多級(jí)流水線和 SIMD(single instruction multiple data,單指令多數(shù)據(jù))指令,對(duì)不同數(shù)據(jù)同時(shí)執(zhí)行同樣的操作,通過(guò)并行執(zhí)行多個(gè)向量運(yùn)算來(lái)提高效率。

03

一級(jí)緩存:一級(jí)緩存是PPU用于保存計(jì)算輸入和輸出數(shù)據(jù)的存儲(chǔ)空間。由于結(jié)構(gòu)上和運(yùn)算核緊密耦合,該緩存可以在PPU 的執(zhí)行過(guò)程中對(duì)狀態(tài)進(jìn)行快速讀寫,并且有EDC/ECC保護(hù),從而實(shí)現(xiàn)更高的執(zhí)行效率和更高的可靠性。

04

其它系統(tǒng)資源:包括用于快速數(shù)據(jù)搬運(yùn)的DMA,共享內(nèi)存區(qū)等等。

2. SIMD 和VLIW指令

2.1SIMD(Single Instruction Multiple Data)指令

SIMD(Single Instruction Multiple Data)指令是一種并行指令,可以同時(shí)對(duì)多個(gè)不同數(shù)據(jù)進(jìn)行相同的操作。這種指令可以大幅提高計(jì)算效率,特別是在執(zhí)行向量運(yùn)算時(shí)效果更為明顯。

PPU 的 SIMD 指令集包括多種運(yùn)算指令,如數(shù)學(xué)運(yùn)算、邏輯運(yùn)算等。這些指令都是并行指令,可以同時(shí)對(duì)多個(gè)數(shù)據(jù)進(jìn)行操作,從而大幅提高計(jì)算效率。例如,PPU 的 SIMD 加法指令可以一次性對(duì)多個(gè)數(shù)據(jù)進(jìn)行加法運(yùn)算,從而實(shí)現(xiàn)更高的計(jì)算速度。

下面是一個(gè)示例,假設(shè)有兩個(gè)向量 A 和 B,每個(gè)向量包含 16 個(gè) 16 位整數(shù) ,要計(jì)算 A 和 B 的和。如果使用不支持SIMD指令的標(biāo)量核,代碼示例如下,需要進(jìn)行16次循環(huán)運(yùn)算,將不同的A[i]、B[i] 數(shù)據(jù)依次順序進(jìn)行加法操作,相當(dāng)費(fèi)時(shí)。

123b980a-13f2-11ef-b74b-92fbcf53809c.png

而如果使用支持SIMD指令的 PPU進(jìn)行運(yùn)算,則可以一次完成,假設(shè)PPU位寬是256bit(=16*16bit):

124e682c-13f2-11ef-b74b-92fbcf53809c.png

由此可見(jiàn),支持SIMD指令的PPU在進(jìn)行向量運(yùn)算時(shí),通過(guò)降低同樣運(yùn)算的處理次數(shù),從而有效節(jié)省運(yùn)算時(shí)間,提高處理效率。

2.2VLIW(Very Long Instruction Word)指令

VLIW(Very Long Instruction Word)是一種處理器的并行架構(gòu),允許在單個(gè)時(shí)鐘周期內(nèi),由處理器的不同部件同時(shí)執(zhí)行多個(gè)操作。

例如,如果要執(zhí)行兩個(gè)復(fù)向量A和B的乘法 ,結(jié)果存儲(chǔ)在向量C中。

126f574e-13f2-11ef-b74b-92fbcf53809c.png

C語(yǔ)言實(shí)現(xiàn)如下:

128561f6-13f2-11ef-b74b-92fbcf53809c.png

如果在標(biāo)量核上運(yùn)算,會(huì)順序執(zhí)行下列代碼,并循環(huán)多次:

129a9bac-13f2-11ef-b74b-92fbcf53809c.png

PPU內(nèi)的向量核有三個(gè)處理單元,包括兩個(gè)浮點(diǎn)運(yùn)算器,和一個(gè)讀取/存儲(chǔ)部件用于將RAM中的數(shù)據(jù)搬運(yùn)到核內(nèi)寄存器。這三個(gè)部件可以同時(shí)運(yùn)行,形成指令層面的并行機(jī)制,從而實(shí)現(xiàn)VLIW指令。

上列代碼由PPU處理,可以將第4和第5行的乘法運(yùn)算分別分配給兩個(gè)浮點(diǎn)運(yùn)算器同時(shí)處理,如下紅框所示。而在下個(gè)指令周期內(nèi),第7,8,9行的指令可以分配給三個(gè)部件同時(shí)處理,如下藍(lán)框所示。從而將原先需要12條指令周期運(yùn)行的代碼縮短到9條(12-1-2=9)指令周期,提高執(zhí)行效率。

12aefe94-13f2-11ef-b74b-92fbcf53809c.png

3. 應(yīng)用場(chǎng)景

PPU適用于不同應(yīng)用場(chǎng)景,圖2 列出了三種較常見(jiàn)的算法。第一種是將時(shí)域信號(hào)轉(zhuǎn)變?yōu)轭l域信號(hào),以提取頻率信息的快速傅里葉變換(FFT)。FFT 在數(shù)字信號(hào)處理中得到了廣泛的應(yīng)用,如音頻信號(hào)處理、毫米波雷達(dá)信號(hào)處理等。

12cc6470-13f2-11ef-b74b-92fbcf53809c.png

圖2. PPU實(shí)現(xiàn)的算法

第二種是多層感知算法,它是一種基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法,可以用于分類、回歸和模式識(shí)別等應(yīng)用。MLP 由多個(gè)神經(jīng)元組成,每個(gè)神經(jīng)元都包含多個(gè)輸入和一個(gè)輸出。MLP 通過(guò)學(xué)習(xí)輸入和輸出之間的映射關(guān)系,從而實(shí)現(xiàn)對(duì)新數(shù)據(jù)的預(yù)測(cè)和分類。MLP 在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘中得到了廣泛的應(yīng)用。除此之外,MLP 還可以用于控制和優(yōu)化問(wèn)題。例如,MLP 可以用于控制系統(tǒng)和過(guò)程控制,如傳感器信號(hào)處理分類、輔助駕駛、自動(dòng)駕駛等。

第三種是卡爾曼濾波,該算法是一種基于狀態(tài)空間模型的濾波器,可以用于估計(jì)未知變量的狀態(tài)和參數(shù)??柭鼮V波通過(guò)利用系統(tǒng)的動(dòng)態(tài)模型和傳感器的觀測(cè)值,遞歸地對(duì)狀態(tài)進(jìn)行估計(jì)和預(yù)測(cè),從而實(shí)現(xiàn)對(duì)系統(tǒng)的狀態(tài)進(jìn)行優(yōu)化和控制。卡爾曼濾波在自動(dòng)控制和信號(hào)處理中得到了廣泛的應(yīng)用,例如,卡爾曼濾波可以用于目標(biāo)跟蹤、路徑規(guī)劃算法等。

4. 開發(fā)工具

新思科技(Synopsys)為PPU提供了豐富的開發(fā)工具資源【1】,包括Metaware編譯器及軟件組件,下列表格列出了相關(guān)工具組件:

軟件組件 描述
MetaWare開發(fā)工具包 該工具包包含支持內(nèi)核和應(yīng)用程序開發(fā)編程的C/C++和OpenCL C編譯器。它還包括一個(gè)調(diào)試器和nSIM PPU模擬器,用于調(diào)試、分析和優(yōu)化內(nèi)核和應(yīng)用程序。
Simulink基于模型設(shè)計(jì)的支持 MATLAB模型自動(dòng)生成優(yōu)化代碼,以便在PPU上執(zhí)行。
DSP和數(shù)學(xué)庫(kù) 這些是為在PPU上執(zhí)行而優(yōu)化的庫(kù),包括矢量DSP和矢量線性代數(shù)庫(kù)。
MetaWare神經(jīng)網(wǎng)絡(luò)SDK 該SDK包括一個(gè)神經(jīng)網(wǎng)絡(luò)編譯器,用于編譯和運(yùn)行為PPU優(yōu)化的人工智能模型。
AUTOSAR復(fù)雜設(shè)備驅(qū)動(dòng)程序(CDD)和底層軟件驅(qū)動(dòng)(LLD) CDD為AUTOSAR應(yīng)用程序的軟件組件(SWC)提供PPU服務(wù)。
LLD是一個(gè)底層軟件驅(qū)動(dòng),用于處理TriCore和PPU之間的通信。
PPU分配器 這是用于在TriCore處理器核心之間進(jìn)行通信的PPU的靜態(tài)庫(kù)。

表1. 新思科技提供的PPU工具組件

上述PPU開發(fā)工具鏈,除了新思科技可提供外,Hightec 在提供TC4x TriCore CPU編譯器的同時(shí),也集成了Metaware編譯工具,及相關(guān)軟件組件【2】,形成完整的TC4x開發(fā)環(huán)境工具鏈。該工具鏈符合ISO26262 ASIL D,能幫助客戶實(shí)現(xiàn)快速、可靠、高功能安全等級(jí)的基于TC4x微處理器的汽車軟件開發(fā)。

此外,Tasking也開發(fā)了PPU的編譯器,并集成在新的SmartCode開發(fā)環(huán)境中。

5. 總結(jié)

總的來(lái)說(shuō),PPU是一個(gè)性能強(qiáng)大的處理器,內(nèi)部包含標(biāo)量核、向量核、一級(jí)緩存和其它系統(tǒng)資源 等,可以實(shí)現(xiàn)高速數(shù)字濾波、向量矩陣運(yùn)算、浮點(diǎn)運(yùn)算、簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)等,為要求嚴(yán)格的實(shí)時(shí)計(jì)算應(yīng)用提供了顯著的性能優(yōu)勢(shì)。PPU為Tricore 主核卸載了復(fù)雜的信號(hào)處理和數(shù)學(xué)運(yùn)算,使得執(zhí)行時(shí)間更快,而其高可配置性和專用硬件資源使其非常適用于各種應(yīng)用程序。使用戶有更多選擇余地,使用不同核構(gòu)架實(shí)施不同性質(zhì)的運(yùn)算。

審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微控制器
    +關(guān)注

    關(guān)注

    48

    文章

    7552

    瀏覽量

    151422
  • 傳感器
    +關(guān)注

    關(guān)注

    2551

    文章

    51099

    瀏覽量

    753568
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4771

    瀏覽量

    100766
  • 協(xié)處理器
    +關(guān)注

    關(guān)注

    0

    文章

    75

    瀏覽量

    18176
  • 傅里葉變換
    +關(guān)注

    關(guān)注

    6

    文章

    441

    瀏覽量

    42600

原文標(biāo)題:AURIX? TC4x 微控制器的并行處理單元(PPU)簡(jiǎn)介

文章出處:【微信號(hào):駿龍電子,微信公眾號(hào):駿龍電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英飛凌MCU AURIX? TC4x特性概覽 2024年下半年逐步量產(chǎn)

    為擴(kuò)展其領(lǐng)先的 AURIX? 微控制器系列,英飛凌推出了用于電動(dòng)交通、ADAS 、汽車 E/E 架構(gòu)和經(jīng)濟(jì)型人工智能 (AI) 應(yīng)用的新一代AURI
    的頭像 發(fā)表于 02-28 13:45 ?2448次閱讀
    <b class='flag-5'>英飛凌</b>MCU <b class='flag-5'>AURIX</b>? <b class='flag-5'>TC4x</b>特性概覽 2024年下半年逐步量產(chǎn)

    英飛凌AURIX TC297微控制器簡(jiǎn)介

    AURIX?是英飛凌全新的微控制器系列。其創(chuàng)新的多核架構(gòu)基于多達(dá)三個(gè)獨(dú)立的32位TriCore CPU,旨在滿足最高安全標(biāo)準(zhǔn),同時(shí)顯著提高性能。TC
    發(fā)表于 09-19 10:03 ?1423次閱讀
    <b class='flag-5'>英飛凌</b><b class='flag-5'>AURIX</b> <b class='flag-5'>TC</b>297<b class='flag-5'>微控制器</b><b class='flag-5'>簡(jiǎn)介</b>

    英飛凌TC3xx系列安全管理單元的使用

    本篇文檔主要用來(lái)介紹英飛凌基于AURIX-2G TriCore 1.6.2架構(gòu)的 TC3xx系列安全管理單元的使用。
    的頭像 發(fā)表于 12-07 09:29 ?2132次閱讀
    <b class='flag-5'>英飛凌</b><b class='flag-5'>TC</b>3xx<b class='flag-5'>系列</b>安全管理<b class='flag-5'>單元</b>的使用

    英飛凌推出新一代AURIX?微控制器,加速汽車的電氣化和數(shù)字化進(jìn)程

    新產(chǎn)品系列英飛凌領(lǐng)先的AURIX? TC3x 系列微控制器的基礎(chǔ)上進(jìn)行了升級(jí),采用了新一代Tr
    發(fā)表于 01-17 16:09 ?1796次閱讀
    <b class='flag-5'>英飛凌</b>推出新一代<b class='flag-5'>AURIX</b>?<b class='flag-5'>微控制器</b>,加速汽車的電氣化和數(shù)字化進(jìn)程

    英飛凌推出新型高性能微控制器AURIX? TC4Dx

    ? TC4x系列的首款產(chǎn)品AURIX? TC4Dx微控制器(MCU)。AURIX?
    發(fā)表于 11-13 17:23 ?580次閱讀
    <b class='flag-5'>英飛凌</b>推出新型高性能<b class='flag-5'>微控制器</b><b class='flag-5'>AURIX</b>? <b class='flag-5'>TC4</b>Dx

    如何在aurix TC333微控制器配置內(nèi)存分區(qū)?

    誰(shuí)能建議如何在 aurix TC333 微控制器配置內(nèi)存分區(qū)。
    發(fā)表于 01-30 07:10

    如何在TC36x微控制器實(shí)現(xiàn)冗余閃存?

    我需要在英飛凌 TC36x 微控制器實(shí)現(xiàn)冗余閃存。 實(shí)施過(guò)程我需要做哪些事情?
    發(fā)表于 05-30 07:36

    英飛凌aurix tc27x系列介紹

      全新AURIXTC27x系列英飛凌下一代MCU系列產(chǎn)品的平臺(tái),可滿足最新的汽車動(dòng)力總成和安全應(yīng)用要求。最多可由三個(gè)TriCore構(gòu)成,以AMP、SMP或鎖步模式
    發(fā)表于 09-12 18:55 ?109次下載

    英飛凌AURIX? TC4x微控制器賦能TERAKI雷達(dá)檢測(cè)軟件,提高自動(dòng)駕駛的安全性

    和算法來(lái)增強(qiáng)車輛對(duì)周圍環(huán)境的感知能力,并將駕駛安全提升到一個(gè)新水平。邊緣傳感處理領(lǐng)域的市場(chǎng)領(lǐng)導(dǎo)者TERAKI近日發(fā)布了最新雷達(dá)檢測(cè)軟件,該軟件集成在英飛凌科技股份公司(FSE代碼:IFX / OTCQX代碼:IFNNY)符合A
    發(fā)表于 10-19 13:49 ?528次閱讀
    <b class='flag-5'>英飛凌</b><b class='flag-5'>AURIX</b>? <b class='flag-5'>TC4x</b><b class='flag-5'>微控制器</b>賦能TERAKI雷達(dá)檢測(cè)軟件,提高自動(dòng)駕駛的安全性

    英飛凌科技和Eatron合作推進(jìn)汽車電池管理系統(tǒng)(BMS)

    英飛凌科技公司和Eatron Technologies合作,將復(fù)雜的機(jī)器學(xué)習(xí)算法和解決方案集成到AURIX TC4x微控制器(MCU)。該
    的頭像 發(fā)表于 11-02 16:48 ?1226次閱讀

    英飛凌和Eatron合作

    ? TC4x微控制器(MCU)。此次合作旨在推進(jìn)汽車電池管理系統(tǒng)(BMS)。憑借具有集成并行處理單元P
    的頭像 發(fā)表于 11-07 16:07 ?358次閱讀
    <b class='flag-5'>英飛凌</b>和Eatron合作

    英飛凌與Eatron合作推進(jìn)電池管理管理解決方案

    Eatron先進(jìn)的機(jī)器學(xué)習(xí)解決方案和算法集成至英飛凌AURIX? TC4x微控制器(MCU)。此次合作旨在推進(jìn)汽車電池管理系統(tǒng)(BMS)
    發(fā)表于 11-10 14:00 ?486次閱讀
      <b class='flag-5'>英飛凌</b>與Eatron合作推進(jìn)電池管理管理解決方案

    英飛凌最新的帶神經(jīng)加速的汽車MCU系列 AURIX TC4x微控制器

    問(wèn)題,允許工程師將人工智能模型納入安全關(guān)鍵應(yīng)用,如汽車用例。 這篇文章進(jìn)一步研究了AURIX TC4x系列汽車MCU與前幾代相比。我們還將回顧MCU家族的人工智能安全性和合規(guī)性,旨在
    的頭像 發(fā)表于 04-24 11:53 ?931次閱讀
    <b class='flag-5'>英飛凌</b>最新的帶神經(jīng)加速的汽車MCU<b class='flag-5'>系列</b> <b class='flag-5'>AURIX</b> <b class='flag-5'>TC4x</b><b class='flag-5'>微控制器</b>

    AURIX? TC4x免費(fèi)開發(fā)環(huán)境介紹

    TC4x的開發(fā)工具主要指集成開發(fā)環(huán)境/編譯和調(diào)試,分為商用版和免費(fèi)評(píng)估版兩種。
    的頭像 發(fā)表于 08-22 16:24 ?708次閱讀
    <b class='flag-5'>AURIX</b>? <b class='flag-5'>TC4x</b>免費(fèi)開發(fā)環(huán)境介紹

    英飛凌AURIX? TC3x MCU系列新增FreeRTOS支持

    全球功率系統(tǒng)和物聯(lián)網(wǎng)領(lǐng)域的半導(dǎo)體領(lǐng)軍企業(yè)英飛凌科技股份公司,近日宣布其AURIX? TC3x微控制器(MCU)系列新增了對(duì)FreeRTOS的
    的頭像 發(fā)表于 12-11 14:06 ?183次閱讀