0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡單認(rèn)識高級處理器

Semi Connect ? 來源:Semi Connect ? 2023-12-07 11:31 ? 次閱讀

除了傳統(tǒng)的處理器 (CPU、MPU/MCU、DSPGPU),面向當(dāng)代各種應(yīng)用的高級處理器(Advanced Processors)層出不窮,例如加速處理單元 (AcceleratedProcessing Unit, APU) 、采用異構(gòu)系統(tǒng)架構(gòu) ( Heterogeneous System Architecture,HSA) 特征設(shè)計的集成電路、基于人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN) 深度學(xué)習(xí) (Deep Learning)的高級處理器等。

1. 加速處理單元

AMD 公司于2006 年收購了 ATI 公司,從設(shè)計傳統(tǒng)的串行計算處理器 CPU過渡到并行圖形處理器 GPU;經(jīng)過研發(fā)升級,再將 CPU 和GPU 合為一體成為APU,集成為單個芯片,使得微處理器的性能得到改進(jìn),處理能力得以提高。APU 為隨后被擴(kuò)展為 HSA 走出了一條新路。AMD 公司的三代 APU 架構(gòu)開發(fā)項(xiàng)目見表 2-15。

bbc42e08-94ab-11ee-939d-92fbcf53809c.png

2.采用異構(gòu)系統(tǒng)架構(gòu)特征設(shè)計的集成電路

HSA 最早是由 AMD 公司開發(fā)的 APU 概念擴(kuò)展而來的。HSA 定義了一套計算機(jī)硬件規(guī)范,其核心為 CPU 標(biāo)量處理和 GPU (或者 DSP)并行處理的結(jié)合。與此相應(yīng)的有開源軟件的開發(fā)與應(yīng)用,包括系統(tǒng)級 C/C++高級語言、用于異構(gòu)系統(tǒng)的開放計算語言 (Open Computing Language, OpenCL)結(jié)構(gòu)、針對三維圖形(例如 GPU)的開放圖形庫 (Open Graphics Library, OpenGL)、開放多進(jìn)程(Open Multi-Processing, OpenMP)應(yīng)用程序接口、NVIDIA 公司開發(fā)的平行計算與應(yīng)用接口 ( Compute Unified Device Architecture, CUDA) 的模型、支持多種操作系統(tǒng)Python 等語言。2012年6月由 AMD、ARM、Imagination、聯(lián)發(fā)科(MediaTek)、高通三星成立了非營利組織 HSA 協(xié)會。HSA 協(xié)會著重于開發(fā)和定義各種處理器(包括 CPU、GPU、DSP)以及存儲器的特點(diǎn)和接口;之后,該協(xié)會又添加了 ASIC 設(shè)計公司成員,從而建立起新型的并行計算異構(gòu)系統(tǒng)架構(gòu),如圖2-31 所示。HSA 包括軟件和硬件兩大部分。軟件包括 OpenCL、OpenMP、CUDA 模型等。圖2-31中 CPU 和其專用存儲器 DDR,以及 GPU 和其專用存儲器 GDDR, 使用指針 (Pointer)功能傳遞,在HSA 系統(tǒng)中形成了共享的系統(tǒng)虛擬存儲器 (System Virtual Memory, SVM)。

3.基于人工神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的高級處理量

約翰?麥卡錫(John McCarthy)在1956年最早使用了人工智能 (ArtificialIntelligence, AI)這個詞,他也因此被稱為 “人工智能之父”。AI通過使用機(jī)器學(xué)習(xí) (Machine Learning)而設(shè)計的產(chǎn)品應(yīng)用廣泛,發(fā)展迅速。1986 年 GeffreyHinton 等人發(fā)表了神經(jīng)網(wǎng)絡(luò)中反向傳播算法(Back-Propagation Algorithm)的文章。2006 年Hinton 的這一研究有了新的突破,并提出了深度學(xué)習(xí)(DeepLearning)的概念。近年來,深度神經(jīng)網(wǎng)絡(luò) (Deep Neural Network, DNN)、卷積神經(jīng)網(wǎng)絡(luò) ( Convolutional Neural Network, CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò) (RecurrentNeural Network,RNN,例如時間遞歸神經(jīng)網(wǎng)絡(luò),即 Long Short - Term Memory,LSTM)等深度學(xué)習(xí)方法大大推動了各種芯片的設(shè)計進(jìn)程。

bbe06834-94ab-11ee-939d-92fbcf53809c.png

Intel 公司 2017 年推出了 Nervana 平臺,利用其 APU 產(chǎn)品 LakeCrest, 采用CPU 與FPGA 重組架構(gòu)設(shè)計,用在深度學(xué)習(xí)的分析算法領(lǐng)域中。另外,Intel于2016-2017 年發(fā)布的高級CPU 都可以用在深度學(xué)習(xí)的相關(guān)領(lǐng)域。例如,2016年第一季度發(fā)布了 14nm 工藝制造的 Atom x5-Z8330 處理器,含有4 核4線程,L2緩存(Cache)為 2MB, 最高工作頻率為 1.92GHz。 Intel 于 2016 年第四季度發(fā)布了至強(qiáng)(Xeon Phi)系列處理器 7290,含72核,采用14nm 工藝,集成16GB 緩存,工作頻率為 1.5GHz。Intel 于 2017 年發(fā)布了第七代4核處理器 IntelCore-i7 系列,工作頻率為 3.5~4.5GHz。

IBM 公司承擔(dān)美國 DARPA 的 SyNAPSE 項(xiàng)目,基于 CNN 設(shè)計了認(rèn)知計算機(jī)(Cognitive Computer),從而于 2014 年設(shè)計出備受關(guān)注的具有 4096 個 CPU 眾核的真北(TrueNorth) 神經(jīng)網(wǎng)絡(luò)芯片,它有54 億個晶體管,功耗只有70mW。它模擬2.68 億個神經(jīng)軸突(Synapse),每個 CPU 核可以模仿 256 個可編程的神經(jīng)元 (Neuron),總共等效于 100 萬個神經(jīng)元。??

中國科學(xué)院計算所2016年報道了結(jié)合 GPU 和 CPU 的深度學(xué)習(xí)專用處理器寒武紀(jì)(Cambrian)芯片,計算速度大為提高,為其虛擬現(xiàn)實(shí)研究建立了基礎(chǔ)。寒武紀(jì)1號(DianNao)芯片采用 65nm 工藝.芯片面積為 3.02mm2,主頻為0.98GHz,功耗為 0.485W,峰值性能達(dá)每秘 4520 億次神經(jīng)網(wǎng)絡(luò)基本運(yùn)算。寒武紀(jì)2 號(DaDianNao)芯片包含 16個處理器核,采用28nm 工藝,面積為67.7mm2,主頻為 606MHz,功耗約為 16W。據(jù)稱與主流 GPU 相比,寒武紀(jì)2號單芯片性能超過若干倍,能耗極低,高效能計算系統(tǒng)性能提升數(shù)百倍。寒武紀(jì)3號(PuDianNao)芯片采用 65nm 工藝,面積為 3.51mm2,主頻為 1GHz,功耗為0.596W,峰值性能達(dá)每秒10 560 億次基本操作。PuDianNao 運(yùn)行機(jī)器學(xué)習(xí)算法時的平均性能與主流 GPGPU (通用GPU)相當(dāng),但面積和功耗僅為主流GPGPU 百分之一量級。???

谷歌公司于2013 年9月從惠普實(shí)驗(yàn)室聘請了計算機(jī)體系結(jié)構(gòu)領(lǐng)域?qū)<?NormJouppi,參與開發(fā)被稱作張量處理器 (Tensor Processing Unit, TPU)的集成電路設(shè)計,使用時通過 PCle插口去優(yōu)化 CPU 和 GPU 芯片組的運(yùn)行。該TPU 專為深度學(xué)習(xí)平臺TensorFlow 打造,運(yùn)用高層次機(jī)器深度學(xué)習(xí)與計算,可以將復(fù)雜的數(shù)據(jù)結(jié)構(gòu)傳輸至人工智能神經(jīng)網(wǎng)絡(luò)中進(jìn)行分析和處理,可以用于語音識別或圖像識別等多項(xiàng)機(jī)器深度學(xué)習(xí)。谷歌于 2014 年合并了英國 DeepMind 公司,其具有神經(jīng)智能學(xué)習(xí)功能的阿爾法圍棋(AlphaGo)于2016 年5月打敗了世界頂級圍棋棋手李世石。AlphaGo 2.0于2017 年6月打敗個人圍棋大賽四冠王柯潔。阿爾法圍棋是在 TPU 之上運(yùn)行的,在人機(jī)比賽時最多使用了 1920 個 CPU 和 280個GPU。谷歌公司于2017 年4月5 日公開發(fā)表官方博客,介紹TPU 的架構(gòu),其處理 AI 事務(wù)速度比其他 GPU 與 CPU 結(jié)合模式快 15~30倍,計算能效高 50~80倍。這些進(jìn)展為未來各種新型的高級處理器產(chǎn)品設(shè)計帶來新的激勵。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19286

    瀏覽量

    229837
  • dsp
    dsp
    +關(guān)注

    關(guān)注

    553

    文章

    7998

    瀏覽量

    348922
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5468

    瀏覽量

    134160
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4740

    瀏覽量

    128945
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5503

    瀏覽量

    121162

原文標(biāo)題:高級處理器,高級處理器,Advanced Processors

文章出處:【微信號:Semi Connect,微信公眾號:Semi Connect】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    高級處理器特性能否提高編碼效率?

    高級處理器特性能否提高編碼效率?
    發(fā)表于 04-26 06:41

    別讓處理器編號混淆您的認(rèn)識

    別讓處理器編號混淆您的認(rèn)識 隨著90奈米處理器(Dothan、Prescott)與新芯片組(915/925)的問世,英特爾(Intel)也增加一項(xiàng)新的處理器編號命名方式
    發(fā)表于 01-25 14:34 ?475次閱讀

    用verilog實(shí)現(xiàn)簡單處理器

    本站提供的用verilog實(shí)現(xiàn)簡單處理器資料,希望對你的學(xué)習(xí)有所幫助!
    發(fā)表于 05-30 17:09 ?96次下載
    用verilog實(shí)現(xiàn)<b class='flag-5'>簡單</b>的<b class='flag-5'>處理器</b>

    從Cortex-M到 Cortex-A認(rèn)識ARM處理器

    從Cortex-M到Cortex-A認(rèn)識ARM處理器
    的頭像 發(fā)表于 03-08 11:34 ?3464次閱讀

    了解高級處理器功能可促進(jìn)高效編碼

    了解高級處理器功能可促進(jìn)高效編碼
    發(fā)表于 05-14 18:38 ?10次下載
    了解<b class='flag-5'>高級</b><b class='flag-5'>處理器</b>功能可促進(jìn)高效編碼

    ADSP-BF522低功耗Blackfin處理器高級外圍設(shè)備產(chǎn)品亮點(diǎn)

    ADSP-BF522低功耗Blackfin處理器高級外圍設(shè)備產(chǎn)品亮點(diǎn)
    發(fā)表于 05-16 12:35 ?0次下載
    ADSP-BF522低功耗Blackfin<b class='flag-5'>處理器</b>與<b class='flag-5'>高級</b>外圍設(shè)備產(chǎn)品亮點(diǎn)

    面向高級應(yīng)用處理器的新型PMIC

    面向高級應(yīng)用處理器的新型PMIC
    發(fā)表于 05-23 16:49 ?12次下載
    面向<b class='flag-5'>高級</b>應(yīng)用<b class='flag-5'>處理器</b>的新型PMIC

    視頻處理器讓投影變得更簡單

    隨著科技技術(shù)的不斷發(fā)展,各種高級別會議場所對投影機(jī)畫面效果提出了更高的要求,視頻處理器的研發(fā)與生產(chǎn)滿足了人們的高品質(zhì)追求。其采用先進(jìn)的分布學(xué)設(shè)計思想,經(jīng)過一系列的接收信號、拼接畫面到最后融合處理
    的頭像 發(fā)表于 08-24 16:37 ?822次閱讀
    視頻<b class='flag-5'>處理器</b>讓投影變得更<b class='flag-5'>簡單</b>

    簡單認(rèn)識IA-64架構(gòu)處理器

    IA- 64 架構(gòu)處理器(IA - 64 Processors )最早為安騰架構(gòu) (Itanium Architecture)處理器的縮寫,支持64 位處理技術(shù)。但由于安騰架構(gòu)處理器
    的頭像 發(fā)表于 11-27 09:33 ?1353次閱讀

    簡單認(rèn)識POWER系列架構(gòu)處理器

    POWER 架構(gòu)最新的處理器是 2017 年發(fā)布的 POWER9,采用14nm 工藝制造,性能遠(yuǎn)超 ×86 架構(gòu)處理器。POWER 系列架構(gòu)歷代產(chǎn)品的簡單說明見表 2-10。
    的頭像 發(fā)表于 11-28 09:21 ?2511次閱讀
    <b class='flag-5'>簡單</b><b class='flag-5'>認(rèn)識</b>POWER系列架構(gòu)<b class='flag-5'>處理器</b>

    簡單認(rèn)識MIPS架構(gòu)處理器

    無互鎖流水級微處理器 (Microprocessors without Interlocked Pipeline Stages,MIPS) 是流行的 RISC 架構(gòu)處理器之一。其原理是盡量利用軟件
    的頭像 發(fā)表于 11-29 09:14 ?1953次閱讀
    <b class='flag-5'>簡單</b><b class='flag-5'>認(rèn)識</b>MIPS架構(gòu)<b class='flag-5'>處理器</b>

    簡單認(rèn)識數(shù)字信號處理器

    數(shù)字信號處理器 (Digital Signal Processor, DSP)是一種專用微處理器,它在架構(gòu)上對數(shù)字信號處理 (Digital Signal Processing)做了優(yōu)化。第一款單
    的頭像 發(fā)表于 11-30 09:07 ?1239次閱讀
    <b class='flag-5'>簡單</b><b class='flag-5'>認(rèn)識</b>數(shù)字信號<b class='flag-5'>處理器</b>

    簡單認(rèn)識網(wǎng)絡(luò)處理器

    網(wǎng)絡(luò)處理器(Network Processor, NP)或者網(wǎng)絡(luò)處理器單元 (NP Unit,NPU)可以處理各種網(wǎng)絡(luò)通信任務(wù),包括數(shù)據(jù)包的處理、協(xié)議分析、路由查找、聲音和數(shù)據(jù)的匯聚、
    的頭像 發(fā)表于 12-05 09:34 ?1304次閱讀

    簡單認(rèn)識安全加密處理器

    安全加密處理器 (Secure Cryptoprocessor) 是一種本身不產(chǎn)生加密數(shù)據(jù)或程序指令,但產(chǎn)生密鑰(Key)的處理器,其應(yīng)用產(chǎn)品有智能卡、ATM、電視機(jī)機(jī)頂盒、軍事系統(tǒng)等。而加密型
    的頭像 發(fā)表于 12-06 09:19 ?1253次閱讀

    簡單認(rèn)識變壓器

    簡單認(rèn)識變壓器
    的頭像 發(fā)表于 01-25 10:05 ?1013次閱讀
    <b class='flag-5'>簡單</b><b class='flag-5'>認(rèn)識變壓器</b>