自主研發(fā)的多核智能計(jì)算架構(gòu)研究解析

1 引言

人工智能算法需要強(qiáng)大的計(jì)算能力支撐，對(duì)算力的需求更是以超摩爾（Moore）定律增長(zhǎng) ，特別是深度學(xué)習(xí)算法大規(guī)模使用，對(duì)計(jì)算能力提出更高要求。智能算法并行性高、數(shù)據(jù)重用性強(qiáng)，而且不斷演進(jìn)、新算法層出不窮、計(jì)算模型不斷變化，為處理器體系結(jié)構(gòu)設(shè)計(jì)帶來巨大的設(shè)計(jì)空間。人工智能處理器體系結(jié)構(gòu)設(shè)計(jì)目前存在著兩種類型設(shè)計(jì)：以TPU 為代表的專用架構(gòu)和以GPU 為代表的通用架構(gòu)。前者性能功耗比高、使用簡(jiǎn)單，但缺乏一定的靈活性和通用性; 后者具有較好的靈活性和通用性，但是增加了功耗，編程和算法設(shè)計(jì)更加復(fù)雜。

國(guó)產(chǎn)眾核處理器具有融合異構(gòu)體系結(jié)構(gòu)、多維并行數(shù)據(jù)通信、柔性優(yōu)化的存儲(chǔ)，以及高效平衡的運(yùn)算核心等特性，為人工智能應(yīng)用提供了有效支撐。深度融合異構(gòu)核心架構(gòu)集成通用處理核心和領(lǐng)域通用計(jì)算核心，滿足通用計(jì)算和智能計(jì)算領(lǐng)域通用的智能計(jì)算能力。多維并行數(shù)據(jù)通信體系采用基于輕量級(jí)寄存器通信和運(yùn)算核心快速同步技術(shù)，實(shí)現(xiàn)運(yùn)算核心間的低延遲高帶寬的數(shù)據(jù)交換和靈活高效同步，提升人工智能應(yīng)用的核心運(yùn)算效率。柔性優(yōu)化存儲(chǔ)體系采用軟硬件結(jié)合的方法，使片上存儲(chǔ)管理柔性靈活，解決智能計(jì)算存儲(chǔ)帶寬受限和延遲增加的難題。高效平衡的運(yùn)算核心在保證智能計(jì)算類應(yīng)用處理效率的同時(shí)，通過集成更多的核心獲得更高的并行處理性能，可同時(shí)滿足人工智能計(jì)算需求。

2 眾核處理器的發(fā)展

眾核處理器是當(dāng)前支持人工智能計(jì)算的關(guān)鍵核心器件，發(fā)展過程中涌現(xiàn)眾多類型的技術(shù)和架構(gòu)，大量研究者和公司為推動(dòng)其發(fā)展貢獻(xiàn)了智慧和力量。

粗粒度可重構(gòu)體系結(jié)構(gòu)是眾核處理器形成的先導(dǎo)技術(shù)。在2000年前后出現(xiàn)了一大批基于交叉開關(guān)、線性陣列、MESH等3大類體系結(jié)構(gòu)的粗粒度可重構(gòu)處理器。基于全交叉開關(guān)的體系結(jié)構(gòu)具有很強(qiáng)的通信能力，通常采用簡(jiǎn)化的交叉開關(guān)來應(yīng)對(duì)由于處理單元數(shù)量的增加而導(dǎo)致實(shí)現(xiàn)代價(jià)的指數(shù)增長(zhǎng)，如用于DSP數(shù)據(jù)通道的快速原型PADDI ，PADDI-2 ; 基于一個(gè)或者多個(gè)線性陣列的體系結(jié)構(gòu)，可提供可重構(gòu)的流水線Stage，實(shí)現(xiàn)部分快速動(dòng)態(tài)流水線重構(gòu)和運(yùn)行時(shí)對(duì)配置流和數(shù)據(jù)流的調(diào)度，如PIPERENCH ; 基于Mesh的體系結(jié)構(gòu)，將PE按照二維陣列進(jìn)行排列，相鄰PE可以通信，一般也支持行或者列內(nèi)PE之間直接通信，可支持編譯時(shí)確定的靜態(tài)網(wǎng)絡(luò)和運(yùn)行時(shí)確定的動(dòng)態(tài)網(wǎng)絡(luò)，如RAW 。粗粒度可重構(gòu)體系結(jié)構(gòu)的研究成果除部分轉(zhuǎn)化為工業(yè)產(chǎn)品（如TILE系列 2））外，其更多是集中于學(xué)術(shù)領(lǐng)域。

工業(yè)界眾核處理器開始于GPU. 2002年GPGPU （通用圖形計(jì)算）的概念逐漸明確，實(shí)現(xiàn)浮點(diǎn)矩陣乘矩陣算法 3）并開始應(yīng)用于傳統(tǒng)的科學(xué)工程計(jì)算領(lǐng)域; 2005年， GPU實(shí)現(xiàn)了浮點(diǎn)矩陣的LU分解計(jì)算。這一階段， GPU面臨的最主要的問題是編程困難，必須把科學(xué)工程算法映射成傳統(tǒng)的圖像處理流程。同一時(shí)期的2002年， IBM開展了面向P級(jí)超級(jí)計(jì)算機(jī)的C64研發(fā)，其核心是Cyclops-64眾核處理器。 Cyclops-64包含80顆核心，通過交叉開關(guān)互連，峰值性能達(dá)80 GFlops. 2005年， IBM發(fā)布CELL處理器，集成了不同功能的兩類核心：主控制核心（PPE）和協(xié)處理器核心（SPE），核心之間通過總線互連，峰值性能可達(dá)102 GFlops. 2008年， IBM基于CELL構(gòu)建了Roadrunner超級(jí)計(jì)算機(jī)， Linpack持續(xù)性能首次超過1 PFlops，并在TOP500排行榜中名列第一，對(duì)業(yè)界產(chǎn)生了巨大的影響。

隨著眾核處理器體系結(jié)構(gòu)的持續(xù)改進(jìn)，其適應(yīng)性和好用性得到不斷提高。高性能GPU逐漸增加雙精度浮點(diǎn)運(yùn)算單元、內(nèi)存控制器增加ECC校驗(yàn)，計(jì)算方式更加通用。特別是2007年CUDA軟件開發(fā)套件的發(fā)布，為GPU的廣泛應(yīng)用鋪平道路。 2010年6月，曙光公司的銀河超級(jí)計(jì)算機(jī)使用NVIDIA的Tesla，測(cè)試峰值性能1.27 PFlops; 2010年11月，天河– 1A使用Tesla測(cè)試性能達(dá)到2.56 PFlops; GPU在高性能計(jì)算領(lǐng)域得到了越來越廣泛的使用，成為了眾核處理器的事實(shí)標(biāo)準(zhǔn)。 Intel作為HPC領(lǐng)域的重要廠商，在眾核處理器領(lǐng)域不斷加大投入， 2006年開始研究Larrabee體系結(jié)構(gòu)， 2010年發(fā)布了MIC體系結(jié)構(gòu)，推出Xeon PHI高性能眾核處理器，包含57～～ 72顆X86核心。 2013年，國(guó)防科技大學(xué)研制了基于PHI的“天河二號(hào)”超級(jí)計(jì)算機(jī)，性能居當(dāng)時(shí)世界第一。

根據(jù)計(jì)算核心的結(jié)構(gòu)復(fù)雜度和組織方式，可以將眾核處理器分為基于通用處理核心和基于計(jì)算簇的眾核處理器兩大類。

基于通用處理核心眾核處理器可以看作是多核結(jié)構(gòu)處理器的進(jìn)一步延伸，通過片上互連網(wǎng)絡(luò)（NoC）集成眾多的通用處理器核心。計(jì)算核心一般由通用核心簡(jiǎn)化而來，所有核心功能齊全、計(jì)算能力強(qiáng)。但通常會(huì)簡(jiǎn)化指令調(diào)度、推測(cè)執(zhí)行等結(jié)構(gòu)，計(jì)算核心內(nèi)的運(yùn)算部件一般支持SIMD，單核心內(nèi)通常會(huì)保留通用處理器中傳統(tǒng)的多級(jí)Cache存儲(chǔ)結(jié)構(gòu)，典型代表包括Intel的Larrabee/MIC架構(gòu)處理器、SCC架構(gòu)處理器， Tilera的TILE-GX系列處理器。

基于計(jì)算簇的眾核處理器片上集成了大量簡(jiǎn)單的計(jì)算核心，旨在通過簡(jiǎn)單運(yùn)算部件的聚合提供超高計(jì)算性能。這類眾核處理器計(jì)算核心為簡(jiǎn)單計(jì)算部件，多個(gè)核心以組或簇的形式進(jìn)行組織，可通過單指令多線程流（SIMT）等數(shù)據(jù)流并行的方式提供強(qiáng)大的并行計(jì)算能力。片上通常還集成有面向領(lǐng)域的專用加速處理部件，計(jì)算簇內(nèi)所有計(jì)算核心共用指令發(fā)射單元，并共享寄存器文件、一級(jí)Cache等存儲(chǔ)資源。計(jì)算簇間則共享二級(jí)Cache和主存等。典型代表主要包括NVIDIA的GPGPU系列處理器，如Fermi， Kepler ; AMD/ATI的GPU系列，如RV架構(gòu)處理器、GCN架構(gòu)處理器 5）等。

國(guó)際上眾核處理器發(fā)展的同時(shí)，國(guó)內(nèi)研究也在同步開展，包括Godson-T眾核處理器、YHFT64-2流處理器，以及申威眾核處理器等。 Godson-T采用了2D MESH結(jié)構(gòu)， 8××8陣列結(jié)構(gòu)共64個(gè)處理器核，兼容MIPS指令集。 YHFT64-2處理器采用異構(gòu)多核架構(gòu)，包含64核心處理器，具有傳統(tǒng)通用體系結(jié)構(gòu)的靈活性，又擁有大量的計(jì)算資源，峰值計(jì)算能力強(qiáng)大。申威眾核處理器應(yīng)用于“神威? ? 太湖之光”超級(jí)計(jì)算機(jī)系統(tǒng)中，采用片上融合異構(gòu)的體系結(jié)構(gòu)，并采用統(tǒng)一的指令集系統(tǒng)，兼顧應(yīng)用的好用性和性能，實(shí)現(xiàn)較優(yōu)的性能功耗比和計(jì)算密度。

以深度學(xué)習(xí)為代表的人工智能領(lǐng)域已開啟體系結(jié)構(gòu)的新時(shí)代。當(dāng)前人工智能應(yīng)用對(duì)算力的需求更是以超摩爾定律的速度增長(zhǎng)，從2012年到2017年計(jì)算需求增加30萬倍，即每3.5個(gè)月翻一倍。人工智能算法的核心計(jì)算為低精度線性代數(shù)，一方面具有足夠的適應(yīng)性，可以推廣到眾多領(lǐng)域; 另一方面具有足夠的特殊性，可以受益于領(lǐng)域?qū)Ｓ皿w系結(jié)構(gòu)設(shè)計(jì)。

眾核處理器體系結(jié)構(gòu)不僅對(duì)科學(xué)工程計(jì)算具有較高的效能和較好的適應(yīng)性，其對(duì)雙精度、單精度矩陣計(jì)算的支持同樣能夠在一定程度上滿足人工智能關(guān)鍵計(jì)算需求。因此，眾核處理器體系結(jié)構(gòu)對(duì)人工智能計(jì)算具有天然的優(yōu)勢(shì)。同時(shí)，眾核處理器又根據(jù)人工智能計(jì)算特殊的需求，不斷進(jìn)行改進(jìn)完善，例如增加其他計(jì)算核心加速的支持、增加混合精度計(jì)算的支持等。 NVIDIA在V100， Turing眾核處理器中增加顯著提升性能的TensorCore，使其人工智能計(jì)算峰值性能是雙精度浮點(diǎn)的約17倍。 AMD的VEGA架構(gòu)同樣顯著提升人工智能計(jì)算性能。 Intel推出的Knights Mill眾核處理器，增加了支持人工智能計(jì)算的特殊指令。

3 面向智能計(jì)算的國(guó)產(chǎn)眾核架構(gòu)關(guān)鍵技術(shù)

卷積和矩陣乘是智能計(jì)算最核心的操作，具有高度的并行性和數(shù)據(jù)重用性等特點(diǎn)，當(dāng)前人工智能領(lǐng)域的處理器都圍繞如何對(duì)加速這兩種操作進(jìn)行體系結(jié)構(gòu)設(shè)計(jì)。國(guó)產(chǎn)眾核處理器要良好地適應(yīng)智能計(jì)算需求，就必須有效支持大規(guī)模的卷積和矩陣乘計(jì)算。國(guó)產(chǎn)眾核處理器的運(yùn)算核心需要具備靈活的控制能力，可實(shí)現(xiàn)卷積和矩陣乘計(jì)算復(fù)雜循環(huán)過程的高效控制和數(shù)據(jù)調(diào)度; 通過高效的片上通信支持卷積權(quán)重用和輸入特征值的全局共享; 通過指令重排精確控制權(quán)重和輸入特征值，從局部片上存儲(chǔ)到計(jì)算流水線的讀取與計(jì)算重疊，進(jìn)一步提升計(jì)算性能; 通過靈活的數(shù)據(jù)移動(dòng)和片上布局實(shí)現(xiàn)卷積和輸入特征值的靈活轉(zhuǎn)換，減少數(shù)據(jù)重整開銷; 片上多層次并行機(jī)制，支持高效的片上數(shù)據(jù)并行策略，提升數(shù)據(jù)交換性能和權(quán)值更新性能。

從總整體上看，國(guó)產(chǎn)眾核處理器架構(gòu)需要具有多項(xiàng)創(chuàng)新的關(guān)鍵技術(shù)以有效支持人工智能計(jì)算，包括：融合異構(gòu)的體系結(jié)構(gòu)、輕量級(jí)片上通信機(jī)制、柔性優(yōu)化的存儲(chǔ)體系、高效平衡的運(yùn)算核心架構(gòu)等。

3.1 融合異構(gòu)的體系結(jié)構(gòu)

眾核處理器在同一芯片內(nèi)同時(shí)集成充分挖掘TLP的“重”核心和結(jié)構(gòu)簡(jiǎn)單用于ILP的“輕”核心，可高效支持復(fù)雜的人工智能應(yīng)用和算法實(shí)現(xiàn)，兼顧好用性和性能，實(shí)現(xiàn)較優(yōu)的性能功耗比和高的計(jì)算密度。

運(yùn)算核心（“輕”核心）與控制核心（“重”核心）協(xié)同支持人工智能應(yīng)用中不同類型任務(wù)。運(yùn)算核心支持多種寬度SIMD，為人工智能應(yīng)用提供其所需的主要計(jì)算能力; 運(yùn)算核心支持軟件管理片上局部存儲(chǔ)，并通過高效片上網(wǎng)絡(luò)結(jié)構(gòu)，實(shí)現(xiàn)數(shù)據(jù)級(jí)和線程級(jí)并行，支持更加靈活、豐富的人工智能算法實(shí)現(xiàn)機(jī)制，例如算法層次化、數(shù)據(jù)片上共享、MPMD模式等。控制核心負(fù)責(zé)人工智能任務(wù)中難以并行化部分的計(jì)算，實(shí)現(xiàn)指令級(jí)并行，通過多級(jí)Cache重用應(yīng)用的空間和時(shí)間局部性，支持復(fù)雜的超參數(shù)調(diào)優(yōu)、訓(xùn)練迭代、數(shù)據(jù)拆分等。

為有效解決人工智能異構(gòu)任務(wù)管理困難、片上數(shù)據(jù)共享復(fù)雜、數(shù)據(jù)一致性難以處理、執(zhí)行模型兼容難等挑戰(zhàn)，眾核架構(gòu)的不同核心之間需要采用統(tǒng)一指令系統(tǒng)、統(tǒng)一執(zhí)行模型，支持多種存儲(chǔ)空間管理模式等技術(shù)，實(shí)現(xiàn)片上異構(gòu)核心的深度融合。

3.2 輕量級(jí)片上通信機(jī)制

眾核處理器核心數(shù)多，每個(gè)核心的局部存儲(chǔ)空間受限，每個(gè)核心能夠獨(dú)立處理的工作集較小，對(duì)主存訪問帶寬和延遲需求大，而人工智能應(yīng)用多為“存算密集型應(yīng)用”。眾核處理器必須具有高效的核心間片上數(shù)據(jù)重用機(jī)制擴(kuò)大工作集，減少應(yīng)用的訪存需求，最大限度保證處理器計(jì)算能力發(fā)揮。采用輕量級(jí)片上通信機(jī)制，實(shí)現(xiàn)運(yùn)算核心間的低延遲高帶寬的數(shù)據(jù)交換，提升運(yùn)算核心密切協(xié)同的執(zhí)行效率，顯著提高片上數(shù)據(jù)的重用效率，有效緩解眾核處理器面臨的“存儲(chǔ)墻”問題。

輕量級(jí)片上通信機(jī)制使用雙邊協(xié)議，實(shí)現(xiàn)輕量級(jí)的阻塞和非阻塞通信。源核心將數(shù)據(jù)送入發(fā)送部件，發(fā)送指令即執(zhí)行完成，流水線可繼續(xù)執(zhí)行; 目標(biāo)核心使用接收指令，從接收緩沖中獲取有效數(shù)據(jù)。為實(shí)現(xiàn)通信的高效和物理實(shí)現(xiàn)的精簡(jiǎn)，通信協(xié)議需要避免為了建立通信進(jìn)行復(fù)雜的握手或同步協(xié)議，并簡(jiǎn)化簇通信網(wǎng)絡(luò)的設(shè)計(jì)復(fù)雜度和開銷。與傳統(tǒng)的片上網(wǎng)絡(luò)通信機(jī)制相比，輕量級(jí)通信機(jī)制實(shí)現(xiàn)運(yùn)算核心需要盡量避免經(jīng)過多層次片上存儲(chǔ)層的搬移。

運(yùn)算核心間輕量級(jí)通信機(jī)制從提高片上數(shù)據(jù)重用率的角度，需要實(shí)現(xiàn)核心間數(shù)據(jù)細(xì)粒度、低延遲交換/移動(dòng)，并支持多播等集合通信功能。例如，對(duì)人工智能應(yīng)用的核心運(yùn)算（矩陣乘矩陣運(yùn)算），輕量級(jí)通信可提升超過10個(gè)百分點(diǎn)的效率。

3.3 柔性優(yōu)化的存儲(chǔ)體系

針對(duì)智能計(jì)算過程中計(jì)算密度大這一特性，眾核處理器需要實(shí)現(xiàn)靈活的數(shù)據(jù)移動(dòng)和片上布局、可重構(gòu)局部數(shù)據(jù)存儲(chǔ)器技術(shù)的片上存儲(chǔ)體系。采用軟硬件結(jié)合的方法，使片上存儲(chǔ)管理柔性靈活，數(shù)據(jù)傳輸性能優(yōu)化，有效解決了智能計(jì)算存儲(chǔ)帶寬受限和延遲增加的難題，提高了眾核架構(gòu)的效率和適應(yīng)面。

（1）靈活的數(shù)據(jù)移動(dòng)和片上布局。運(yùn)算核心在能夠直接訪問主存空間時(shí)，為支持片上存儲(chǔ)的高效使用和數(shù)據(jù)在運(yùn)算核心中的靈活分配，需要支持靈活的數(shù)據(jù)移動(dòng)和片上布局，支持?jǐn)?shù)據(jù)在核心存儲(chǔ)和主存間的高效異步數(shù)據(jù)傳輸，實(shí)現(xiàn)計(jì)算與訪存的并行。根據(jù)人工智能算法的訪存特征，存儲(chǔ)接口實(shí)現(xiàn)了基于滑動(dòng)窗口平行的調(diào)度策略和多種映射性能優(yōu)化算法，有效提高了存儲(chǔ)帶寬的使用效率。

眾核架構(gòu)支持多種數(shù)據(jù)布局。支持單運(yùn)算核心模式、多播模式、行模式、廣播行模式和矩陣模式。多播模式將主存中每個(gè)核心都需要的數(shù)據(jù)提供給多個(gè)運(yùn)算核心; 行模式和廣播行模式實(shí)現(xiàn)行維度循環(huán)分布數(shù)據(jù)塊的傳輸; 矩陣模式實(shí)現(xiàn)整個(gè)運(yùn)算核心簇內(nèi)二維格柵上循環(huán)分布數(shù)據(jù)塊的傳輸。單核心模式、行模式和矩陣模式同時(shí)支持主存到局部數(shù)據(jù)存儲(chǔ)器和局部數(shù)據(jù)存儲(chǔ)器到主存的傳輸，其他模式只支持主存到局部數(shù)據(jù)存儲(chǔ)器方向的傳輸。

眾核處理器的多模式數(shù)據(jù)流傳輸技術(shù)，可以有效提高智能計(jì)算數(shù)據(jù)重用率，進(jìn)而提升人工智能算法性能。

（2）可重構(gòu)數(shù)據(jù)存儲(chǔ)技術(shù)。面向智能計(jì)算的運(yùn)算核心設(shè)計(jì)力求簡(jiǎn)潔高效，采用可重構(gòu)局部數(shù)據(jù)存儲(chǔ)器技術(shù)。運(yùn)算核心的數(shù)據(jù)存儲(chǔ)可由軟件配置成軟硬協(xié)同Cache或片上存儲(chǔ)器，以完成不同特征數(shù)據(jù)的緩存管理。這兩種數(shù)據(jù)存儲(chǔ)管理方式可同時(shí)存在并支持容量動(dòng)態(tài)劃分，充分結(jié)合了硬件的高效性和軟件的靈活性，降低設(shè)計(jì)開銷并滿足人工智能應(yīng)用對(duì)存儲(chǔ)的需要。

軟硬件協(xié)同Cache中Cache行的數(shù)據(jù)和Cache行tag信息均保存在局部數(shù)據(jù)存儲(chǔ)器中，設(shè)置一個(gè)固定寄存器保存整個(gè)Cache的信息。軟件管理Cache的裝入與淘汰，硬件提供指令加速命中查詢和地址轉(zhuǎn)換的性能，軟硬件協(xié)同完成數(shù)據(jù)的緩存管理，充分結(jié)合硬件的高效性和軟件的靈活性，以較小的硬件開銷實(shí)現(xiàn)高效的訪存優(yōu)化。在軟硬件協(xié)同Cache中，硬件負(fù)責(zé)命中查詢及不命中時(shí)的自動(dòng)跳轉(zhuǎn)，降低軟件實(shí)現(xiàn)的開銷（例如代碼膨脹、條件分支判斷等）。軟件負(fù)責(zé)管理Cache的裝入與淘汰。程序在運(yùn)行時(shí)可對(duì)應(yīng)多個(gè)Cache，軟件負(fù)責(zé)不同Cache的數(shù)據(jù)訪問在局部數(shù)據(jù)存儲(chǔ)器中的有效隔離，避免互相沖突。

3.4 高效平衡的運(yùn)算核心架構(gòu)

根據(jù)人工智能應(yīng)用的分析，眾核架構(gòu)可采用弱亂序流水線結(jié)構(gòu)，其主要特點(diǎn)是確定性執(zhí)行基礎(chǔ)上的有限程度亂序。確定性執(zhí)行的主要目的是減少推測(cè)執(zhí)行帶來的額外功率開銷，同時(shí)可減少為緩存未退出的推測(cè)執(zhí)行指令而設(shè)置的重定序緩沖等部件的面積開銷; 有限程度的亂序是指基于指令塊的指令調(diào)度發(fā)射策略，可以有效隱藏一些長(zhǎng)延遲事件（比如離散訪問主存）帶來的性能損失。弱亂序流水線結(jié)構(gòu)在改善順序流水線性能的同時(shí)有效控制結(jié)構(gòu)復(fù)雜度。

采用弱亂序流水線結(jié)構(gòu)的運(yùn)算核心雖然降低了硬件復(fù)雜度，仍可高效處理智能計(jì)算類應(yīng)用，主要表現(xiàn)在：運(yùn)算核心采用的面向精簡(jiǎn)運(yùn)算核心的高效轉(zhuǎn)移預(yù)測(cè)機(jī)制，通過編譯指導(dǎo)的靜態(tài)轉(zhuǎn)移預(yù)測(cè)、轉(zhuǎn)移提示和分支回跳預(yù)取等策略，以較小的代價(jià)實(shí)現(xiàn)了較高的IPC. 對(duì)于運(yùn)算規(guī)整的智能計(jì)算應(yīng)用，在保證指令流水性能的同時(shí)，省去了傳統(tǒng)轉(zhuǎn)移預(yù)測(cè)機(jī)制依賴的大容量轉(zhuǎn)移歷史表，減少面積開銷; 智能計(jì)算類應(yīng)用是數(shù)據(jù)密集型應(yīng)用，具有批量數(shù)據(jù)處理需求，運(yùn)算核心實(shí)現(xiàn)的單指令多數(shù)據(jù)流技術(shù)可以高效地處理批量數(shù)據(jù)，降低流水線指令控制開銷，節(jié)省功耗; 運(yùn)算核心采用的局部數(shù)據(jù)存儲(chǔ)器結(jié)構(gòu)結(jié)合批量數(shù)據(jù)傳輸技術(shù)，對(duì)數(shù)據(jù)訪問規(guī)律和確定的智能計(jì)算可以有效地隱藏?cái)?shù)據(jù)訪問延遲，并極大地提高數(shù)據(jù)局部性訪問效率，降低了傳統(tǒng)數(shù)據(jù)Cache存在的容量失效導(dǎo)致數(shù)據(jù)訪問延遲不能隱藏的風(fēng)險(xiǎn)。

高效平衡的運(yùn)算核心結(jié)構(gòu)使得單芯片可以集成更多的運(yùn)算核心，在保證智能計(jì)算類應(yīng)用處理效率的同時(shí)，通過集成更多的核心獲得更高的并行處理性能。

4 基于國(guó)產(chǎn)眾核處理器的智能計(jì)算應(yīng)用性能分析

當(dāng)前國(guó)產(chǎn)眾核處理器已經(jīng)支持相對(duì)完整的軟件生態(tài)（例如線性代數(shù)基礎(chǔ)庫swBLAS、深度學(xué)習(xí)庫swDNN、支持深度學(xué)習(xí)框架swCaffe等），支持許多典型的人工智能應(yīng)用（例如醫(yī)學(xué)影像、圍棋、語音識(shí)別等），取得較好的測(cè)試性能。

卷積計(jì)算是深度學(xué)習(xí)的典型算法， swDNN 重點(diǎn)對(duì)其進(jìn)行優(yōu)化加速：利用雙緩沖機(jī)制，為卷積計(jì)算的每一部分?jǐn)?shù)據(jù)分配雙倍的LDM空間，保證計(jì)算和訪存相對(duì)獨(dú)立，實(shí)現(xiàn)計(jì)算訪存重疊; 利用靈活的片上網(wǎng)絡(luò)和多種DMA機(jī)制，保證不同卷積計(jì)算到運(yùn)算核心陣列的高效映射; 利用運(yùn)算核心雙流水線特征，通過最大化訪存指令和計(jì)算指令重疊，減少計(jì)算單元的等待時(shí)間，提升卷積性能。眾核處理器利用swDNN執(zhí)行卷積計(jì)算，與同一時(shí)期的商用眾核處理器NVIDIA的K40m （使用cuDNN庫）相比，性能提升2～～ 9倍。

swCaffe 是Caffe深度學(xué)習(xí)框架在眾核處理器上的移植，集成swDNN和swBLAS，實(shí)現(xiàn)功能和性能上的定制和優(yōu)化，同時(shí)采用參數(shù)服務(wù)器進(jìn)行全局參數(shù)更新，支持計(jì)算通信重疊的同步更新策略。基于swCaffe的卷積計(jì)算在單個(gè)運(yùn)算核心陣列上的性能是單顆Intel Xeon處理器的3.5倍; 在單顆眾核處理器上的性能是K40m的1.5倍; 并行訓(xùn)練可獲得較好的強(qiáng)可擴(kuò)展性和弱可擴(kuò)展性。

利用256個(gè)眾核處理器運(yùn)行圍棋訓(xùn)練程序，其深度學(xué)習(xí)模型包括39層CNN網(wǎng)絡(luò)，使用了2.4億個(gè)訓(xùn)練樣本。利用128個(gè)眾核處理器，訓(xùn)練醫(yī)療圖像處理器模型，模型基于AlexNet， VGG等多種網(wǎng)絡(luò)，訓(xùn)練數(shù)據(jù)達(dá)1 TB 。利用眾核處理器完成了超過10 TB數(shù)據(jù)的遙感圖像分類模型訓(xùn)練。

5 總結(jié)

在人工智能（特別是深度學(xué)習(xí)）的推動(dòng)下，眾核處理器體系結(jié)構(gòu)已經(jīng)向著智能計(jì)算的方向發(fā)展。人工智能計(jì)算的復(fù)雜性、靈活性和領(lǐng)域?qū)Ｓ眯酝苿?dòng)國(guó)產(chǎn)眾核處理器體系結(jié)構(gòu)未來的發(fā)展。隨著智能算法不斷演進(jìn)，新算法層出不窮，算法模型也在不斷變化，需要構(gòu)建一種動(dòng)態(tài)可變的眾核處理器架構(gòu)并保證可編程性，以應(yīng)對(duì)算法的變換和迭代; 設(shè)計(jì)新的多層次多粒度片上訪存和通信管理機(jī)制，充分適應(yīng)人工智能應(yīng)用片上數(shù)據(jù)共享和移動(dòng)特征，提升計(jì)算能力的同時(shí)，有效降低訪存需求; 面向人工智能核心算法，構(gòu)建可定制的加速核心，快速應(yīng)對(duì)算法的變化，采用高能效結(jié)構(gòu)和設(shè)計(jì)方法，實(shí)現(xiàn)綠色節(jié)能目標(biāo).

閱讀全文

計(jì)算機(jī)(83935) 計(jì)算機(jī)(83935)
智能(116904) 智能(116904)

評(píng)論

相關(guān)推薦

中國(guó)自主研發(fā)ARM計(jì)算機(jī)芯片完成

近日，中國(guó)電子旗下中國(guó)軟件與技術(shù)服務(wù)股份有限公司高級(jí)副總裁王定健介紹，完全由中國(guó)自主研發(fā)的安全可靠的計(jì)算機(jī)芯片及系統(tǒng)已經(jīng)研制完成，今年9月將參加中國(guó)黨政機(jī)關(guān)計(jì)算機(jī)系統(tǒng)的工程招標(biāo)。

2015-08-07 07:50:36

1434

華為ARM架構(gòu)“泰山”服務(wù)器真是自主芯片嗎？

那么，為何一款購買ARM公版架構(gòu)的產(chǎn)品能夠成為“自主研發(fā)”，能夠成為“除存儲(chǔ)單元外均有完整知識(shí)產(chǎn)權(quán)”，甚至成為核高基1號(hào)專項(xiàng)項(xiàng)目？這就要從國(guó)內(nèi)就自主研發(fā)的標(biāo)準(zhǔn)和話語權(quán)之爭(zhēng)說起了。

2016-06-14 01:14:00

16050

研發(fā)自主架構(gòu)的CPU，展訊將成為全球第三家！

展訊自主架構(gòu)的CPU 實(shí)現(xiàn) ARM 架構(gòu)和軟件的全兼容，完全 pin to pin 的替換。真正掌握了自主架構(gòu)，未來展訊可以在優(yōu)化功耗、提升產(chǎn)品性能方面有更多的發(fā)揮空間。

2017-08-16 08:23:09

5892

AUTOSAR架構(gòu)下的多核通信介紹

隨著汽車ECU迅速的往域控制器方向發(fā)展，ECU要處理的任務(wù)越來越多，單核CPU的負(fù)載越來越大，多核ECU勢(shì)在必行。AUTOSAR架構(gòu)下OS支持多核處理，本系列文章將詳細(xì)介紹AUTOSAR架構(gòu)下的多核機(jī)制。本文介紹AUTOSAR架構(gòu)下的多核通信。

2023-11-13 09:24:11

654

光電智能計(jì)算架構(gòu)和芯片研究

無處不在的持續(xù)增長(zhǎng)的需求。這些硅計(jì)算硬件平臺(tái)的進(jìn)步催生了更大規(guī)模的訓(xùn)練和更復(fù)雜的模型，極大地促進(jìn)了人工智能(AI)的復(fù)興。我們見證了各種神經(jīng)計(jì)算架構(gòu)，例如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)、脈沖神經(jīng)網(wǎng)絡(luò)(SNN)等，在諸多領(lǐng)域的廣泛應(yīng)用。

2024-01-08 09:13:29

349

自主指令架構(gòu)取代Arm和x86，LoongArch的未來“野心”

在4月19日結(jié)束的第四屆關(guān)鍵信息基礎(chǔ)設(shè)施自主安全創(chuàng)新論壇上，龍芯中科董事長(zhǎng)胡偉武對(duì)對(duì)龍芯的蜘蛛指令系統(tǒng)架構(gòu)LoongArch進(jìn)行了深度解析，介紹了LoongArch的發(fā)展過程、自主與兼容性以及未來

2021-04-21 09:00:00

6399

安謀科技重磅發(fā)布！以超域架構(gòu)定義全新XPU，為智能計(jì)算提供“核芯動(dòng)力”

安謀科技重磅發(fā)布“雙輪驅(qū)動(dòng)”戰(zhàn)略以及新業(yè)務(wù)品牌“核芯動(dòng)力”。將依托“核芯動(dòng)力”向市場(chǎng)提供高性能、可定制化的自主架構(gòu)XPU IP產(chǎn)品和服務(wù)，用CPU+XPU引領(lǐng)雙輪驅(qū)動(dòng)。安謀科技推動(dòng)計(jì)算架構(gòu)升級(jí)，貼合智能計(jì)算產(chǎn)業(yè)發(fā)展趨勢(shì)，積極打造合作共贏的產(chǎn)業(yè)生態(tài)，為產(chǎn)業(yè)發(fā)展賦能。

2021-08-28 08:00:00

3708

3A開關(guān)型充電管理ZCC6688（自主研發(fā)）

本帖最后由四維電子科技于 2019-7-30 16:12 編輯 3A開關(guān)型充電管理ZCC6688（自主研發(fā)）

2019-07-30 14:59:06

多核智能移動(dòng)平臺(tái)電源架構(gòu)詳解

縮小，對(duì)于對(duì)空間要求極為苛刻的移動(dòng)設(shè)備，節(jié)省下來的空間可以讓給電池這類的重要部件，無疑為廠商的設(shè)計(jì)提供了便利?！　?b class="flag-6" style="color: red">多核系統(tǒng)電源架構(gòu)　　正是因?yàn)?b class="flag-6" style="color: red">智能手機(jī)和平板電腦能夠滿足消費(fèi)者越來越高的要求，比如更大

2018-09-25 10:33:38

多核處理器的優(yōu)點(diǎn)

的功耗更低、計(jì)算功耗產(chǎn)生的熱量更少。多核架構(gòu)能夠使目前的軟件更出色地運(yùn)行，并創(chuàng)建一個(gè)促進(jìn)未來的軟件編寫更趨完善的架構(gòu)。盡管認(rèn)真的軟件廠商還在探索全新的軟件并發(fā)處理模式，隨著向多核處理器的移植，現(xiàn)有軟件

2019-06-20 06:47:01

多核嵌入式系統(tǒng)存在的局限性？怎么解決這些問題？

本文列舉了多核嵌入式系統(tǒng)存在的一些主要局限，并對(duì)解決這些局限的可行方案進(jìn)行了探討。將以一些嵌入式系統(tǒng)為例，指出利用現(xiàn)有架構(gòu)改進(jìn)系統(tǒng)節(jié)能效果的機(jī)遇。多核處理器與新興的嵌入式平臺(tái)的結(jié)合能夠滿足現(xiàn)代嵌入式

2021-03-09 06:36:52

多核片上系統(tǒng)架構(gòu)的嵌入式DSP軟件設(shè)計(jì)資料分享

多核片上系統(tǒng)（SoC）架構(gòu)的嵌入式DSP軟件設(shè)計(jì)Multicore a System-on-a-Chip (SoC) ArchitectureSoCs的軟件開發(fā)涉及到基于最強(qiáng)大的計(jì)算模型在各種處理

2021-12-14 08:18:07

多核系統(tǒng)設(shè)計(jì)平臺(tái)

;Execute — 使用模塊化的框架工具進(jìn)行編譯執(zhí)行，為緊耦合分布式計(jì)算系統(tǒng)（單片多核或單板多處理器架構(gòu)）提供標(biāo)準(zhǔn)化的通訊方式。MCAPI和Polycore軟件聯(lián)合應(yīng)用，提供經(jīng)驗(yàn)證的消息傳遞編程模板

2016-10-11 10:35:03

多核設(shè)備中的Linux實(shí)時(shí)性能怎么提高？

上個(gè)世紀(jì)，研發(fā)人員投入了大量精力提高 Linux 實(shí)時(shí)性能和行為，最著名的是 PREEMPT_RT Linux 實(shí)時(shí)擴(kuò)展。最近，研發(fā)人員致力于研究適用于多核設(shè)備的 Linux 用戶空間解決方案，該

2020-04-06 08:17:17

智能產(chǎn)品研發(fā)總監(jiān)招聘

，加我好友聊，或者直接電話02089000666。招聘要求：職位名稱：智能產(chǎn)品研發(fā)總監(jiān)年薪20萬以上，可享受期權(quán)激勵(lì)1、本科以上學(xué)歷，電子技術(shù)、信息類專業(yè)、自動(dòng)化控制、通信電子計(jì)算機(jī)及其相關(guān)專業(yè)；2、有

2015-02-06 15:22:07

智能電網(wǎng)中的三個(gè)互操作架構(gòu)遠(yuǎn)景是什么？

智能電網(wǎng)中的三個(gè)互操作架構(gòu)遠(yuǎn)景是什么？

2021-05-21 06:10:25

智能電網(wǎng)的網(wǎng)絡(luò)通信架構(gòu)及關(guān)鍵技術(shù)解析

的網(wǎng)絡(luò)通信架構(gòu)進(jìn)行研究，明確不同應(yīng)用領(lǐng)域的關(guān)鍵網(wǎng)絡(luò)技術(shù)。2 智能電網(wǎng)的框架與概念參考模型中國(guó)的智能電網(wǎng)建設(shè)提出了以特高壓電網(wǎng)為骨干網(wǎng)架，以堅(jiān)強(qiáng)智能電網(wǎng)為基礎(chǔ)，以通信信息平臺(tái) 為支撐，以智能控制為手段，包含

2013-10-09 11:42:53

智能車主動(dòng)安全技術(shù)-智能汽車自主循跡控制研究

智能汽車自主循跡橫向控制是通過調(diào)整汽車的轉(zhuǎn)向盤轉(zhuǎn)角使汽車與期望軌跡之間的橫向循跡誤差最小，同時(shí)使汽車運(yùn)動(dòng)方向與期望軌跡切線方向之間的角度誤差最小，在保證控制精度的前提下又要兼顧汽車的平順性和舒適性。

2016-05-09 16:45:03

智能輪椅導(dǎo)航定位的研究現(xiàn)狀及趨勢(shì)

電動(dòng)輪椅,融合多種領(lǐng)域的研究,包括機(jī)器視覺,機(jī)器人導(dǎo)航和定位.模式識(shí)別,多傳感器融合及用戶接口等。目前美國(guó)、德國(guó).日本、及中國(guó)等多個(gè)國(guó)家都在進(jìn)行這方面的研究。輪椅的安全導(dǎo)航,是智能輪椅要解決的中心

2023-09-25 07:13:35

自主導(dǎo)航小車AGV定位方法的研究[1]

2016-08-29 11:07:35

ACAP的主要架構(gòu)創(chuàng)新解析

2019年“FPGA國(guó)際研討會(huì)”上，賽靈思發(fā)表了兩篇長(zhǎng)論文，詳細(xì)介紹了賽靈思“自適應(yīng)計(jì)算加速平臺(tái)”ACAP的系統(tǒng)架構(gòu)和技術(shù)細(xì)節(jié)。本文將對(duì)ACAP的主要架構(gòu)創(chuàng)新進(jìn)行深入解讀，讓各位先睹為快。

2020-11-27 07:30:17

AUTOSAR架構(gòu)深度解析精選資料分享

AUTOSAR架構(gòu)深度解析本文轉(zhuǎn)載于：AUTOSAR架構(gòu)深度解析AUTOSAR的分層式設(shè)計(jì)，用于支持完整的軟件和硬件模塊的獨(dú)立性(Independence)，中間RTE(Runtime Environment)作為虛擬功能...

2021-07-28 07:02:13

AUTOSAR架構(gòu)深度解析精選資料推薦

AUTOSAR架構(gòu)深度解析本文轉(zhuǎn)載于：AUTOSAR架構(gòu)深度解析目錄AUTOSAR架構(gòu)深度解析AUTOSAR分層結(jié)構(gòu)及應(yīng)用軟件層功能應(yīng)用軟件層虛擬功能總線VFB及運(yùn)行環(huán)境RTE基礎(chǔ)軟件層(BSW)層

2021-07-28 07:40:15

FPGA研發(fā)之道(2)FPGA和他那些小伙伴們(一)系統(tǒng)架構(gòu)組

基礎(chǔ)設(shè)施的迅速研發(fā)和部署。　　沒有完美的架構(gòu)，只有合適的組合，各種芯片和架構(gòu)都是為應(yīng)用服務(wù)，互相的滲透是趨勢(shì)，也是必然。FPGA相對(duì)處理器的可編程領(lǐng)域，仍然屬于小眾(雖然人數(shù)也不少)。但是正像一則笑話

2018-08-06 11:45:27

RISC-V架構(gòu)能否讓國(guó)產(chǎn)IC真正自主研發(fā)？

RISC-V架構(gòu)能否讓國(guó)產(chǎn)IC真正“自主研發(fā)”？

2020-06-09 16:31:04

XIMEA公司研發(fā)智能相機(jī)助力自主式機(jī)器人

CURRERA-R系列相機(jī)是德國(guó)XIMEA公司推出的一款智能相機(jī)，其體型巧，擁有完整的視覺系統(tǒng)。用戶可以連接所有PC標(biāo)準(zhǔn)外圍：如顯示器、鍵盤和鼠標(biāo)、外部存儲(chǔ)器等，可在單機(jī)模式下使用，也可通過網(wǎng)絡(luò)遠(yuǎn)程

2014-04-10 15:37:48

[活動(dòng)] 智能設(shè)計(jì)（智能家居的研發(fā)實(shí)戰(zhàn)實(shí)操）專項(xiàng)技能培訓(xùn)通知

需求分析等業(yè)務(wù)知識(shí)如何影響實(shí)際需求開發(fā)和產(chǎn)品規(guī)劃？7月26日~7月30日，機(jī)智云人工智能實(shí)驗(yàn)室負(fù)責(zé)人黃明（原Intel WPRD MC1系統(tǒng)高級(jí)工程師，主導(dǎo)完成Intel基帶芯片算法的研發(fā)）、泰迪高級(jí)

2017-06-19 14:55:28

“網(wǎng)絡(luò)物理系統(tǒng)（CPS） - 面向安全關(guān)鍵應(yīng)用的未來異構(gòu)多核E / E架構(gòu)”

嵌入式電子系統(tǒng)領(lǐng)域，現(xiàn)在也被稱為網(wǎng)絡(luò)物理系統(tǒng)，正在成為新興技術(shù)的挑戰(zhàn)。網(wǎng)絡(luò)物理系統(tǒng)（CPS）是一種緊密組合和增加協(xié)作計(jì)算和物理元素的單片集成xit。如今，智能按需自動(dòng)化環(huán)境中可以找到前期生成的網(wǎng)絡(luò)

2018-09-26 01:27:47

【AD新聞】蘋果秘密自主研發(fā)顯示屏：要和三星分手了？

，實(shí)現(xiàn)共贏，雙方度過了一段不短的蜜月期，但近期，雙方卻傳出了要“分手”的征兆...... 蘋果秘密研發(fā)顯示屏：要和三星分手了？作為iPhone系列的旗艦手機(jī)，iPhoneX使用的是三星自主研發(fā)

2018-03-23 15:31:33

【STM32MP157A-DK1開發(fā)板試用連載】基于stm32mp1的異構(gòu)多核研究

項(xiàng)目名稱：基于stm32mp1的異構(gòu)多核研究試用計(jì)劃：申請(qǐng)理由：本人從事嵌入式研究多年，一直在工控領(lǐng)域開發(fā)工業(yè)產(chǎn)品。目前單位準(zhǔn)備采用STM32MP1完成新產(chǎn)品的開發(fā)，剛好論壇的活動(dòng)，因此積極參與本次

2020-03-25 16:50:11

一種對(duì)多核處理器架構(gòu)上程序時(shí)間測(cè)量的全新技術(shù)介紹

概述盡管多核處理器比單核處理器提供更強(qiáng)大的處理能力，當(dāng)時(shí)多核處理器存在難以檢測(cè)和并發(fā)相關(guān)的錯(cuò)誤。本文介紹了一種對(duì)多核處理器架構(gòu)上程序時(shí)間測(cè)量的全新技術(shù)，這種技術(shù)通過在目標(biāo)系統(tǒng)上運(yùn)行，實(shí)現(xiàn)覆蓋率的實(shí)時(shí)

2021-12-14 07:07:22

中國(guó)自主研發(fā)兩款無線傳感網(wǎng)SoC芯片

自主知識(shí)產(chǎn)權(quán)的無線傳感網(wǎng)SoC芯片?！　o錫物聯(lián)網(wǎng)產(chǎn)業(yè)研究院邢博士介紹，兩款芯片中，VW628為國(guó)內(nèi)首款符合IEEE802.15.4c和CWPAN(中國(guó)無線個(gè)域網(wǎng)標(biāo)準(zhǔn)項(xiàng)目組)標(biāo)準(zhǔn)的無線傳感網(wǎng)收發(fā)SoC芯片，該

2018-11-01 15:00:03

中國(guó)航天晨信公司招聘 DSP相關(guān)人才

研發(fā)并具有一定的自主權(quán)；2)負(fù)責(zé)DSP架構(gòu)選型、硬件電路設(shè)計(jì)、相關(guān)驅(qū)動(dòng)軟件開發(fā)及維護(hù)；3)負(fù)責(zé)相關(guān)文檔的編寫和維護(hù)；4)負(fù)責(zé)系統(tǒng)聯(lián)調(diào)、測(cè)試排故及試驗(yàn)驗(yàn)證。職位要求：1)電子、計(jì)算機(jī)等相關(guān)專業(yè)，本科

2014-05-08 14:10:42

以全新的多核SoC架構(gòu)進(jìn)行LTE開發(fā)

對(duì)于MIMO計(jì)算一般，TI全新架構(gòu)中不可或缺的浮點(diǎn)支持可大幅簡(jiǎn)化及加速必要的處理，因?yàn)樵↑c(diǎn)支持十分有助于矩陣求逆。多核共享內(nèi)存控制器另一項(xiàng)重要多核功能改進(jìn)之處是TI全新的多核共享內(nèi)存控制器。由于多核需要

2011-07-14 14:40:08

典型的支持多核處理器的RTOS功能解析

1、基于同步原語擴(kuò)展的實(shí)時(shí)操作系統(tǒng) 在多核處理器的每一個(gè)處理器核上都運(yùn)行一個(gè)完全相同的RTOS，然后提供擴(kuò)展的組件庫，這種組件庫提供相應(yīng)的同步原語以支持處理器核間的通信。Eg：VxWorks

2019-06-29 08:30:00

功能安全---AUTOSAR架構(gòu)深度解析精選資料分享

AUTOSAR架構(gòu)深度解析本文轉(zhuǎn)載于：AUTOSAR架構(gòu)深度解析AUTOSAR的分層式設(shè)計(jì)，用于支持完整的軟件和硬件模塊的獨(dú)立性(Independence)，中間RTE(Runtime

2021-07-23 08:34:18

北極雄芯開發(fā)的首款基于Chiplet異構(gòu)集成的智能處理芯片“啟明930”

近日，北極雄芯分別在西安秦創(chuàng)原人工智能前沿科技成果發(fā)布會(huì)及北京韋豪創(chuàng)芯孵化器啟用儀式上同步發(fā)布了首個(gè)基于Chiplet架構(gòu)的“啟明930”AI芯片。據(jù)介紹，該芯片中央控制芯粒采用RISC-V CPU

2023-02-21 13:58:08

如何計(jì)算放大器架構(gòu)的噪聲系數(shù)？

本文簡(jiǎn)要介紹了兩種放大器架構(gòu)的噪聲系數(shù)計(jì)算，包括inverting，non-inverting架構(gòu)的噪聲系數(shù)計(jì)算，并提供計(jì)算小工具。

2021-04-07 06:38:47

如何利用射頻前端電路研究和設(shè)計(jì)智能天線？

隨著移動(dòng)通信事業(yè)在全球范圍內(nèi)的迅猛發(fā)展，我國(guó)的移動(dòng)通信總用戶已經(jīng)躍居世界第一。作為通信強(qiáng)國(guó)，國(guó)內(nèi)許多大學(xué)和公司致力于通信事業(yè)的研究和發(fā)展，并與九十年代初，提出了我國(guó)第一個(gè)具有自主知識(shí)產(chǎn)權(quán)的通信

2019-07-31 08:25:51

嵌入式實(shí)時(shí)系統(tǒng)多核負(fù)載均衡調(diào)度架構(gòu)的相關(guān)資料推薦

背景介紹目前嵌入式開發(fā)為了追求穩(wěn)定性、可靠性，多核處理器多使用靜態(tài)任務(wù)調(diào)度架構(gòu)，靜態(tài)分配CPU、進(jìn)程(APP)、線程(Task)、任務(wù)(runnable)的多層調(diào)用關(guān)系樹。系統(tǒng)在低負(fù)載場(chǎng)景十分穩(wěn)定

2021-12-14 07:25:29

怎么實(shí)現(xiàn)Linux和S3C2410的PROFIBUSDP主站平臺(tái)設(shè)計(jì)？

針對(duì)標(biāo)準(zhǔn)PROFIBUSDP主站在國(guó)內(nèi)研究較少，自主研發(fā)產(chǎn)品的功能有限、智能化不足的現(xiàn)狀，進(jìn)行了基于Linux操作系統(tǒng)的PROFIBUSDP主站的設(shè)計(jì)和研究，實(shí)現(xiàn)了PROFIBUSDP 1類主站的主從通信功能。

2021-05-31 06:09:27

招聘高性能計(jì)算硬件設(shè)計(jì)師（基于多核DSP） 1人 (51job網(wǎng)站...

DSP（含ARM+DSP）等架構(gòu)相關(guān)硬件平臺(tái)的分析、規(guī)劃、研發(fā)及系列發(fā)展，具有一定的自主權(quán)；2)負(fù)責(zé)硬件方案設(shè)計(jì)、原理圖設(shè)計(jì)、PCB圖設(shè)計(jì)、生產(chǎn)調(diào)試、測(cè)試試驗(yàn)等工作；3)負(fù)責(zé)硬件平臺(tái)相關(guān)CPLD/FPGA

2014-05-08 14:05:48

招聘高性能計(jì)算驅(qū)動(dòng)軟件設(shè)計(jì)師（多核DSP，含ARM+DSP） 1人 ...

)負(fù)責(zé)基于多核DSP（含ARM+DSP）的系統(tǒng)研發(fā)并具有一定的自主權(quán)；2)負(fù)責(zé)基于多核DSP架構(gòu)的底層驅(qū)動(dòng)軟件開發(fā)、測(cè)試及維護(hù)；3)負(fù)責(zé)相關(guān)文檔的編寫和維護(hù)；4)協(xié)助團(tuán)隊(duì)成員進(jìn)行聯(lián)調(diào)、測(cè)試排故及試驗(yàn)驗(yàn)證

2014-05-08 14:07:29

探討采用C6000系列多核DSP的并行計(jì)算（OpenCL、OpenMP）實(shí)現(xiàn)大規(guī)模電磁系統(tǒng)的暫態(tài)仿真及其控制系統(tǒng)

探討采用C6000系列多核DSP的并行計(jì)算（OpenCL、OpenMP）實(shí)現(xiàn)大規(guī)模電磁系統(tǒng)的暫態(tài)仿真及其控制系統(tǒng)大規(guī)模電磁系統(tǒng)在能源發(fā)電、輸變電、配網(wǎng)用電，以及電力電子電路中大量存在，其復(fù)雜的系統(tǒng)

2016-12-03 20:42:42

數(shù)字信號(hào)處理器重新采納多核架構(gòu)

多核方式。DSP正在開始重新采納多核架構(gòu)，不過主要是針對(duì)那些處理任務(wù)可以得到妥善劃分的特殊應(yīng)用。DSP應(yīng)用通常只包含少量高度復(fù)雜的任務(wù)，系統(tǒng)性能的提升依賴于加快任務(wù)執(zhí)行速度，而不是簡(jiǎn)單地運(yùn)行更多的任務(wù)

2009-04-09 23:14:41

機(jī)器人想要實(shí)現(xiàn)智能移動(dòng)，必須具備超強(qiáng)的自主定位導(dǎo)航能力

圖像信息、視頻數(shù)據(jù)及各傳感器信息回傳至智能安防綜合管理平臺(tái)，經(jīng)過信息融合與智能分析，可為特定區(qū)域提供安全預(yù)警、巡邏等服務(wù)，及時(shí)采取安防措施。愛好者研究利用SLAMWARE自主定位導(dǎo)航方案幫助機(jī)器人自由

2018-01-03 11:41:55

構(gòu)建一種低功耗小基站和適變型邊緣計(jì)算MEC網(wǎng)絡(luò)平臺(tái)

能力，完整的驗(yàn)證和展示了佰才邦基于ARM的5G產(chǎn)品的高效穩(wěn)定的性能。佰才邦自主研發(fā)芯片、基站、核心網(wǎng)軟件、CPE終端和邊緣計(jì)算平臺(tái)等端到端產(chǎn)品，作為5G基站創(chuàng)新開放架構(gòu)領(lǐng)軍企業(yè)，突破4G/5G重大核心技術(shù)。原作者：佰才邦

2022-09-08 14:12:16

深入解析傳感器網(wǎng)絡(luò)中實(shí)時(shí)通信的研究

2021-05-26 06:00:09

電機(jī)功率計(jì)算公式最全解析，如何計(jì)算才最合理？

電機(jī)功率計(jì)算公式最全解析，如何計(jì)算才最合理？

2020-04-11 20:11:28

視頻監(jiān)控系統(tǒng)圖像處理技術(shù)應(yīng)用解析

視頻監(jiān)控系統(tǒng)圖像處理技術(shù)應(yīng)用解析隨著物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展，傳統(tǒng)的IT架構(gòu)逐漸云端化，計(jì)算資源和承載業(yè)務(wù)將進(jìn)一步深度整合，在物聯(lián)網(wǎng)和云計(jì)算匯聚的潮流中，視頻監(jiān)控技術(shù)將發(fā)生徹底的變革：視頻

2013-09-23 15:00:02

記憶/憶聯(lián)研發(fā)體系最新*** 20180108

平臺(tái)代碼研發(fā)、項(xiàng)目導(dǎo)入、配合產(chǎn)品整體調(diào)試參與平臺(tái)架構(gòu)設(shè)計(jì)、概要設(shè)計(jì)、詳細(xì)設(shè)計(jì)和技術(shù)攻關(guān)；精通C，了解基本算法，精通嵌入式和內(nèi)存受限系統(tǒng)設(shè)計(jì)；熟悉多核ARM SOC架構(gòu)，掌握常見的外設(shè)及其設(shè)備驅(qū)動(dòng)：8

2018-01-08 15:24:44

請(qǐng)問多核架構(gòu)在微波鏈路上如何實(shí)現(xiàn)千兆位傳輸？

請(qǐng)問多核架構(gòu)在微波鏈路上如何實(shí)現(xiàn)千兆位傳輸？

2021-04-19 06:57:52

請(qǐng)問自主可控CPU架構(gòu)系列有哪幾種？

2021-10-13 06:31:03

讀書分享會(huì) | 玄鐵RISC-V處理器入門與實(shí)戰(zhàn)電子書免費(fèi)下載！

開發(fā)的一種開放、免費(fèi)且可定制的指令集架構(gòu)，其目標(biāo)是為各種應(yīng)用提供高效、靈活的計(jì)算能力。玄鐵處理器是由平頭哥開發(fā)的一種高性能、低功耗的處理器，其基于RISC-V架構(gòu)，并采用了自主研發(fā)的多核

2023-04-12 11:16:58

談一談RISC-V架構(gòu)的優(yōu)勢(shì)和特點(diǎn)

RISC-V是基于精簡(jiǎn)指令集計(jì)算(RISC)原理建立的開放指令集架構(gòu)，是一種與X86，ARM并列的一種計(jì)算指令集架構(gòu)。RISC是一個(gè)開放的芯片架構(gòu)，可以免費(fèi)授權(quán)?？蛻艨梢蕴砑幼约旱臄U(kuò)展，并為包括

2023-05-14 09:05:11

邊緣計(jì)算主板選型要素，附研發(fā)樣品

場(chǎng)景里，完全依賴云計(jì)算的人工智能越來越不適應(yīng)，業(yè)界提出的解決方案便是邊緣智能。當(dāng)然，邊緣智能和傳統(tǒng)的云端智能絕不是替代關(guān)系，而是更好的補(bǔ)充。通過下方邊緣計(jì)算產(chǎn)業(yè)聯(lián)盟（ECC）發(fā)布的邊緣計(jì)算參考架構(gòu)能夠

2022-12-12 11:46:20

基于多核分離架構(gòu)的千兆QoS模型研究

隨著多核架構(gòu)處理器迅速普及，如何充分利用其強(qiáng)大的并行處理優(yōu)勢(shì)已成為當(dāng)今計(jì)算機(jī)技術(shù)亟待解決的難題。同時(shí)，網(wǎng)絡(luò)帶寬的迅速提升也對(duì)網(wǎng)絡(luò)安全設(shè)備性能提出了更高的要求。

2009-09-17 11:28:06

嵌入式異構(gòu)多核的片上通信架構(gòu)設(shè)計(jì)

為了克服目前嵌入式異構(gòu)多核處理器的片上通信架構(gòu)無法提供高效的異構(gòu)多核協(xié)作架構(gòu)的問題，本文分析了嵌入式異構(gòu)多核體系中片上處理核在核間通信以及存儲(chǔ)層次上的不同需求

2009-12-04 11:30:30

我國(guó)全力打造首顆多核龍芯Godson-3

我國(guó)全力打造首顆多核龍芯Godson-3 中國(guó)的研究人員正在全力打造Godson（龍芯）的第一個(gè)多核版本，它將成為中國(guó)首個(gè)自行研發(fā)的多核微處理器，具有四到八個(gè)核，預(yù)計(jì)在未

2008-09-01 08:38:40

418

NSF資助高校多核研究計(jì)劃

NSF資助高校多核研究計(jì)劃美國(guó)國(guó)家科學(xué)基金會(huì)（NSF）與半導(dǎo)體高校研究聯(lián)盟半導(dǎo)體研究組織(SRC) 近日宣布將連手開展一項(xiàng)關(guān)注多核芯片設(shè)計(jì)和架構(gòu)、為期三年的技術(shù)創(chuàng)新計(jì)

2008-09-05 10:55:53

569

TI推出多核片上系統(tǒng)架構(gòu) 實(shí)現(xiàn)5倍性能提升

TI推出多核片上系統(tǒng)架構(gòu) 實(shí)現(xiàn)5倍性能提升日前，德州儀器 (TI) 宣布推出一款基于 TI 多核數(shù)字信號(hào)處理器 (DSP) 的新型片上系統(tǒng) (SoC) 架構(gòu)，該架構(gòu)在業(yè)界性能最高的 CPU

2010-02-24 09:41:14

863

TI推出最新多核SoC架構(gòu)，實(shí)現(xiàn)5倍性能提升

TI推出最新多核SoC架構(gòu)，實(shí)現(xiàn)5倍性能提升日前，德州儀器(TI)宣布推出一款基于 TI 多核數(shù)字信號(hào)處理器(DSP)的新型片上系統(tǒng)(SoC)架構(gòu)，該架構(gòu)在業(yè)界性能最高的CPU中同時(shí)

2010-02-26 08:38:16

562

聯(lián)芯科技為何推自主研發(fā)TD芯片

聯(lián)芯科技為何推自主研發(fā)TD芯片 4月26日消息，許久未露面的TD芯片核心企業(yè)、聯(lián)芯科技總裁孫玉望首次透露，聯(lián)芯已經(jīng)推出自主研發(fā)的TD系列芯片，從而彌補(bǔ)了以往聯(lián)發(fā)科平

2010-04-26 08:47:28

780

多核處理器架構(gòu)及調(diào)試

　　認(rèn)識(shí)多核基本架構(gòu) 　　多核處理器在同一個(gè)芯片中植入了多個(gè)處理器引擎，這就可以提供更高的CPU性能、功能特性和分區(qū)能力。一般說來，多核有兩種實(shí)現(xiàn)形式。

2010-08-26 18:08:00

1242

多核處理器片上存儲(chǔ)系統(tǒng)研究

針對(duì) 多核處理器 計(jì)算能力和訪存速度間差異不斷增大對(duì)多核系統(tǒng)性能提升的制約問題，分析幾款典型多核處理器存儲(chǔ)系統(tǒng)的設(shè)計(jì)特點(diǎn)，探討多核處理器片上存儲(chǔ)系統(tǒng)發(fā)展的關(guān)鍵技術(shù)，

2011-07-27 15:49:57

英飛凌推出汽車應(yīng)用微控制器多核架構(gòu)

英飛凌科技股份公司（FSE: IFX / OTCQX: IFNNY）近日推出其32位微控制器（MCU）多核架構(gòu)。這種全新架構(gòu)是英飛凌可滿足未來汽車動(dòng)力總成和安全應(yīng)用需求的新一代微控制器的基礎(chǔ)。這種多核

2011-10-26 08:56:42

620

Tilera推用于云計(jì)算的多核處理器Meshed

多核處理器的新貴Tilera在幾年前才開始嶄露頭角,該公司多核架構(gòu)的關(guān)鍵優(yōu)勢(shì)是協(xié)調(diào)具備基本CPU功能的高度可擴(kuò)展的核心數(shù)量，單獨(dú)的緩存，非阻塞的路由用于核心之間的通信，還包括快

2012-02-02 09:33:14

957

芯片解密促進(jìn)自主研發(fā)實(shí)現(xiàn)智能設(shè)備升級(jí)

智能設(shè)備的升級(jí)改進(jìn)離不開芯片的突破，芯片解密是其中的一把好手，不僅能快速推進(jìn)國(guó)產(chǎn)芯片的技術(shù)研發(fā)水平，還能實(shí)現(xiàn)智能設(shè)備的自主升級(jí)與維護(hù)。

2016-05-24 10:37:01

629

深入解析ARM Cortex-A12架構(gòu)

2017-01-14 12:31:49

MANGO:基于FPGA的重可編程高性能計(jì)算架構(gòu)探索

MANGO是一項(xiàng)具備創(chuàng)新性研究型高科技工程，它的資金來源主要是靠歐盟“視野2020” （Horizon 2020）研究與創(chuàng)新項(xiàng)目的資助。目的主要是對(duì)多核處理器架構(gòu)的功耗、性能和可預(yù)測(cè)性展開研究，強(qiáng)調(diào)

2017-02-08 09:00:11

272

ARM新銳Cortex_A7核心架構(gòu)解析

ARM新銳Cortex_A7核心架構(gòu)解析

2017-09-28 10:10:02

基于云計(jì)算的架構(gòu)模型研究

為了構(gòu)建有效、穩(wěn)定的云計(jì)算平臺(tái)環(huán)境并對(duì)其應(yīng)用性能進(jìn)行研究，采用理論分析和實(shí)踐設(shè)計(jì)的方法，研究了云計(jì)算的關(guān)鍵技術(shù)，包括云數(shù)據(jù)中心串聯(lián)、云數(shù)據(jù)存儲(chǔ)管理技術(shù)和云編程模型，提出了- 一個(gè)通用的云計(jì)算架構(gòu)

2017-10-11 16:25:42

計(jì)算高度密集型應(yīng)用在異構(gòu)多核DSP上的運(yùn)行方法研究

計(jì)算高度密集型應(yīng)用在異構(gòu)多核DSP上的運(yùn)行方法研究

2017-10-19 11:00:44

基于TI最新多核DSP SoC架構(gòu)的解析

。 TI多核及媒體基礎(chǔ)架構(gòu)DSP業(yè)務(wù)部全球業(yè)務(wù)經(jīng)理Ramesh Kumar表示，TI的多核SoC產(chǎn)品正是針對(duì)市場(chǎng)對(duì)上述能力的不斷需求而推出的。TI了解市場(chǎng)正在變化，因此推出了這一多核SoC結(jié)構(gòu)，期待能為設(shè)備供應(yīng)商提供更快、更便利的解決方案。 TI 最近為這一系

2017-10-24 11:41:32

模板計(jì)算性能優(yōu)化研究

模板計(jì)算是一類重要的計(jì)算核心，廣泛存在于圖像和視頻處理以及大規(guī)模科學(xué)和工程計(jì)算領(lǐng)域。但是，針對(duì)ARM64高性能處理器的模板計(jì)算性能的優(yōu)化研究還很少。為了實(shí)現(xiàn)典型模板計(jì)算核心在ARM64架構(gòu)多核

2017-11-21 14:50:59

基于FPGA的NoC多核處理器的設(shè)計(jì)

為了能夠靈活地驗(yàn)證和實(shí)現(xiàn)自主設(shè)計(jì)的基于NoC的多核處理器，縮短N(yùn)oC多核處理器的設(shè)計(jì)周期，提出了設(shè)計(jì)集成4片Virtex-6—550T FPGA的NoC多核處理器原型芯片設(shè)計(jì)／驗(yàn)證平臺(tái)。分析和評(píng)估

2017-11-22 09:15:01

4137

基于共享內(nèi)存多核數(shù)據(jù)結(jié)構(gòu)研究

隨著計(jì)算機(jī)硬件技術(shù)的發(fā)展，如今我們已經(jīng)邁入了多核CPU時(shí)代．然而，作為軟件核心的數(shù)據(jù)結(jié)構(gòu)仍然是按照單核CPU和順序型準(zhǔn)則來設(shè)計(jì)的．在基于共享內(nèi)存的多核時(shí)代，大量并發(fā)運(yùn)行的線程會(huì)交替地修改數(shù)據(jù)，產(chǎn)生

2018-01-15 11:34:12

Mentor嵌入式多核架構(gòu)的展示

Mentor嵌入式多核架構(gòu)允許在Zynq UltraScale + MPSoC上的兩個(gè)ARM Cortex-R5內(nèi)核上同步4個(gè)ARM Cortex-A53內(nèi)核上的Linux和Mentor Nucleus RTOS

2018-11-27 06:44:00

2982

華為自主研發(fā)的1300萬億次高性能計(jì)算平臺(tái)落戶沈陽

近日，記者獲悉，由華為公司自主研發(fā)的1300萬億次高性能計(jì)算平臺(tái)在沈陽落地，在航空工業(yè)氣動(dòng)院（以下簡(jiǎn)稱“氣動(dòng)院”）投入使用。此次引入華為公司自主研發(fā)的1300萬億次高性能計(jì)算平臺(tái)，將用于氣動(dòng)院計(jì)算流體力學(xué)研究領(lǐng)域的各項(xiàng)設(shè)計(jì)、研發(fā)和驗(yàn)證，有望大大提升我國(guó)現(xiàn)有航空系統(tǒng)的自主創(chuàng)新能力。

2019-10-12 16:17:56

2675

天翼云借鑒互聯(lián)網(wǎng)分布式架構(gòu)及開源技術(shù)，自主研發(fā)了 PaaS云平臺(tái)

為推進(jìn)全面上云進(jìn)程，天翼云借鑒互聯(lián)網(wǎng)分布式架構(gòu)及開源技術(shù)，結(jié)合中國(guó)電信業(yè)務(wù)及管理需求，自主研發(fā)了 PaaS云平臺(tái)，推進(jìn)中國(guó)電信IT架構(gòu)互聯(lián)網(wǎng)化。該平臺(tái)緊貼企業(yè)關(guān)鍵業(yè)務(wù)場(chǎng)景，聚焦在線交易、密集計(jì)算、大數(shù)據(jù)等關(guān)鍵技術(shù)，支持統(tǒng)一平臺(tái)，集中管理，分布式部署和使用。

2020-08-07 08:49:41

5711

我國(guó)自主研發(fā)6比特超導(dǎo)量子計(jì)算云平臺(tái)上線

我國(guó)企業(yè)自主研發(fā)的6比特超導(dǎo)量子計(jì)算云平臺(tái)日前正式上線，全球用戶可以在線體驗(yàn)來自中國(guó)的量子計(jì)算服務(wù)。

2020-09-16 09:46:45

1330

華為自主研發(fā)編程語言事件分析

據(jù)微博博主@IT工程師稱，華為正在研發(fā)新的自主編程語言倉頡，領(lǐng)頭人是南京大學(xué)的計(jì)算機(jī)科學(xué)與技術(shù)系博士生導(dǎo)師，馮新宇。

2020-09-26 09:31:58

3114

Imagination宣布推出首款多核架構(gòu)GPU

此次發(fā)布的B系列都給出了4核架構(gòu)設(shè)計(jì)。Kristof Beets解釋說這是與用戶溝通后的結(jié)果，能夠在性能和能效之間取得平衡，未來還會(huì)持續(xù)提升單核性能和拓展多核架構(gòu)。

2020-10-20 16:14:32

2326

蔚來正在規(guī)劃自主研發(fā)自動(dòng)駕駛計(jì)算芯片

10月21日，有報(bào)道稱蔚來正在規(guī)劃自主研發(fā)自動(dòng)駕駛計(jì)算芯片，該計(jì)劃尚處于早期，主要由蔚來汽車董事長(zhǎng)兼CEO李斌推動(dòng)。

2020-10-21 16:45:28

1033

蔚來汽車正加強(qiáng)智能駕駛領(lǐng)域的自主研發(fā)

據(jù)了解，自主研發(fā)自動(dòng)駕駛計(jì)算芯片將由李斌親自帶隊(duì)，早在幾個(gè)月前，李斌就開始尋找具有硅谷背景的技術(shù)負(fù)責(zé)人，為自研芯片計(jì)劃做準(zhǔn)備。

2020-10-22 16:55:32

2113

車用EE架構(gòu)對(duì)CAN有何影響?

代表性的是Bosch的說法（引自佐思汽研發(fā)布《2019-2020 智能汽車計(jì)算平臺(tái)與系統(tǒng)架構(gòu)研究報(bào)告》智能汽車E/E架構(gòu)研究：特斯拉遙遙領(lǐng)先，傳統(tǒng)車企發(fā)力猛追）：從現(xiàn)在的分散的以信息Domain的系統(tǒng)過渡到強(qiáng)ECU的中心化域，再到跨Domain的Zone ECU。再下一步是計(jì)算中心與云。

2021-01-01 09:04:00

2310

歐拉(openEuler)Summit 2021:RISC—V64多核異構(gòu)的系統(tǒng)架構(gòu)

openEuler Summit 2021-邊緣&嵌入式分論壇上，介紹了RISC—V64多核異構(gòu)的系統(tǒng)架構(gòu)。

2021-11-10 15:08:29

1671

朗駿智能旋鎖式自主光控器/開關(guān)介紹

朗駿智能基于NEMA標(biāo)準(zhǔn)接口生產(chǎn)研發(fā)得JL-2系列旋鎖式自主光控器、光控開關(guān)，自適應(yīng)智聯(lián)型光控器以及光控器插座。

2022-09-30 09:03:32

866

ASPICE 和26262中的軟件架構(gòu)解析

ASPICE 和26262中ASPICE 和26262中的軟件架構(gòu)解析的軟件架構(gòu)解析

2022-10-25 11:53:34

703

Spresense多核質(zhì)數(shù)計(jì)算器開源

電子發(fā)燒友網(wǎng)站提供《Spresense多核質(zhì)數(shù)計(jì)算器開源.zip》資料免費(fèi)下載

2023-06-13 11:48:25

華為麒麟9000s芯片架構(gòu)解析

華為麒麟9000s芯片架構(gòu)解析華為麒麟9000s芯片是華為公司自主研發(fā)的一款高端移動(dòng)芯片，可以為消費(fèi)者提供出色的性能和良好的節(jié)能效果。是目前市場(chǎng)上最頂尖的處理器之一。麒麟9000s芯片的設(shè)計(jì)架構(gòu)不僅體現(xiàn)了華為公司在技術(shù)研發(fā)上的強(qiáng)大實(shí)力，更體現(xiàn)了華為公司深厚的技術(shù)積淀和自主創(chuàng)新能力。

2023-08-30 17:49:41

16091

升騰910是幾納米？什么架構(gòu)？

升騰910是幾納米？什么架構(gòu)？華為昇騰910是一款專門為人工智能應(yīng)用設(shè)計(jì)的芯片，它采用了華為自主研發(fā)的達(dá)芬奇架構(gòu)。該架構(gòu)采用了全新的并行計(jì)算的方式，可以實(shí)現(xiàn)更高效、更快速的人工智能計(jì)算，進(jìn)而滿足

2023-08-31 17:13:47

6619

基于Tricore架構(gòu)的RTThread多核實(shí)現(xiàn)

在《基于Hightec+TC375TP的RT-Thread移植詳解》一文中，基于Tricore實(shí)現(xiàn)了單核RTThread的移植。最近，花了些時(shí)間完成遺留的任務(wù)：基于Tricore的多核移植。目前

2023-09-12 18:40:02

421

景嘉微與北京大學(xué)長(zhǎng)沙計(jì)算與數(shù)字經(jīng)濟(jì)研究院共建“先進(jìn)計(jì)算”聯(lián)合實(shí)驗(yàn)室

國(guó)產(chǎn)替代浪潮來臨，面對(duì)我國(guó)產(chǎn)業(yè)國(guó)產(chǎn)化、數(shù)字化“兩化”轉(zhuǎn)型的市場(chǎng)需求，此次景嘉微與研究院攜手共建“先進(jìn)計(jì)算”聯(lián)合實(shí)驗(yàn)室，將致力于高性能基礎(chǔ)計(jì)算庫等高效基礎(chǔ)軟件研發(fā)，研究新一代國(guó)產(chǎn)GPU計(jì)算體系架構(gòu)設(shè)計(jì)，促進(jìn)國(guó)產(chǎn)自主可控計(jì)算生態(tài)建設(shè)和發(fā)展創(chuàng)新。

2023-09-28 17:05:12

949

基于Tricore芯片的AUTOSAR架構(gòu)下的多核啟動(dòng)

隨著汽車ECU迅速的往域控制器方向發(fā)展，ECU要出來任務(wù)越來越多，單核CPU的負(fù)載越來越大，多核ECU勢(shì)在必行。AUTOSAR架構(gòu)下OS支持多核處理，本系列文章將詳細(xì)介紹AUTOSAR架構(gòu)下的多核機(jī)制。本文介紹基于Tricore芯片的AUTOSAR架構(gòu)下的多核啟動(dòng)。

2023-10-23 10:15:22

899

已全部加載完成

搜索歷史

自主研發(fā)的多核智能計(jì)算架構(gòu)研究 解析

評(píng)論

自主研發(fā)的多核智能計(jì)算架構(gòu)研究解析