0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里苦心研發(fā)Ali-NPU,AI芯片哪種跟具優(yōu)勢(shì)

mK5P_AItists ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-04-23 17:57 ? 次閱讀

4月19日,有消息稱,阿里巴巴達(dá)摩院正在研發(fā)一款神經(jīng)網(wǎng)絡(luò)芯片——Ali-NPU,主要運(yùn)用于圖像視頻分析、機(jī)器學(xué)習(xí)AI推理計(jì)算。按照設(shè)計(jì),這款芯片性能將是目前市面上主流CPUGPU架構(gòu)AI芯片的10倍,而制造成本和功耗僅為一半,其性價(jià)比超過(guò)40倍。

事實(shí)上,隨著人工智能產(chǎn)業(yè)的發(fā)展,CPU、GPU、TPU、DPU、NPU、BPU……各種PU也開始爆發(fā)式出現(xiàn)。那么,究竟這些PU在性能和使用上有何異同,又有哪些優(yōu)劣呢?

CPU:計(jì)算力占據(jù)部分很小 擅長(zhǎng)邏輯控制

CPU是最為普遍,最為常見的中央處理器。主要包括運(yùn)算器(ALU)和控制單元(CU),除此之外還包括若干寄存器、高速緩存器和它們之間通訊的數(shù)據(jù)、控制及狀態(tài)的總線。依循馮諾依曼架構(gòu),CPU需要大量空間放置存儲(chǔ)單元和控制邏輯,計(jì)算能力只占據(jù)很小的部分,更擅長(zhǎng)邏輯控制。

CPU結(jié)構(gòu)簡(jiǎn)化圖

GPU:計(jì)算單元數(shù)量眾多 但無(wú)法單獨(dú)使用

GPU的誕生可以解決CPU在計(jì)算能力上的天然缺陷。采用數(shù)量眾多的計(jì)算單元和超長(zhǎng)的流水線,善于處理圖像領(lǐng)域的運(yùn)算加速。但GPU的缺陷也很明顯,即無(wú)法單獨(dú)工作,必須由CPU進(jìn)行控制調(diào)用才能工作。

CPU、GPU微架構(gòu)對(duì)比圖

TPU:高性能低功耗 然則開發(fā)周期長(zhǎng)、轉(zhuǎn)換成本高

谷歌專門為 TensorFlow 深度學(xué)習(xí)框架定制的TPU,是一款專用于機(jī)器學(xué)習(xí)的芯片。TPU可以提供高吞吐量的低精度計(jì)算,用于模型的前向運(yùn)算而不是模型訓(xùn)練,且能效更高。但它的缺陷主要是開發(fā)周期長(zhǎng)、可配置性能有限,缺乏靈活性且轉(zhuǎn)換成本高。

DPU:可實(shí)現(xiàn)快速開發(fā)與產(chǎn)品迭代

國(guó)際上,Wave Computing最早提出DPU。在國(guó)內(nèi),DPU最早是由深鑒科技提出,是基于Xilinx可重構(gòu)特性的FPGA芯片,設(shè)計(jì)專用深度學(xué)習(xí)處理單元,且可以抽象出定制化的指令集和編譯器,從而實(shí)現(xiàn)快速的開發(fā)與產(chǎn)品迭代。

深鑒“雨燕”DPU平臺(tái)

NPU:運(yùn)行效率提升 不支持大樣本訓(xùn)練

NPU是神經(jīng)網(wǎng)絡(luò)處理器,在電路層模擬人類神經(jīng)元和突觸,并且用深度學(xué)習(xí)指令集直接處理大規(guī)模的神經(jīng)元和突觸,一條指令完成一組神經(jīng)元的處理。相比于CPU和GPU的馮諾伊曼結(jié)構(gòu),NPU通過(guò)突觸權(quán)重實(shí)現(xiàn)存儲(chǔ)和計(jì)算一體化,從而提高運(yùn)行效率。但NPU也有自身的缺陷,比如不支持對(duì)大量樣本的訓(xùn)練。

BPU:比在CPU上用軟件實(shí)現(xiàn)更為高效 不可再編程

BPU是由地平線主導(dǎo)的嵌入式處理器架構(gòu)。第一代是高斯架構(gòu),第二代是伯努利架構(gòu),第三代是貝葉斯架構(gòu)。BPU主要是用來(lái)支撐深度神經(jīng)網(wǎng)絡(luò),比在CPU上用軟件實(shí)現(xiàn)更為高效。然而,BPU一旦生產(chǎn),不可再編程,且必須在CPU控制下使用。

從CPU、GPU的市場(chǎng)來(lái)看,已經(jīng)基本被英特爾、英偉達(dá)AMD三分天下。而在ASIC框架下的TPU,只有谷歌的體量和實(shí)力才有開發(fā)專用加速的動(dòng)力。

推出DPU的深鑒科技有清華和斯坦福雙重學(xué)術(shù)背景,公司目前的兩條發(fā)展路線是:以芯片技術(shù)為主的純技術(shù)路線,以及基于技術(shù)的產(chǎn)品路線。其處理器做深度學(xué)習(xí)應(yīng)用端,不做訓(xùn)練端。目前,其深度壓縮技術(shù)可以將神經(jīng)網(wǎng)絡(luò)壓縮數(shù)十倍而不影響精度,還可以使用芯片存儲(chǔ)深度學(xué)習(xí)算法模型,減少內(nèi)存讀取次數(shù),降低運(yùn)行功耗。

去年底,地平線在創(chuàng)辦兩年后終于發(fā)布首款芯片——“征程”與“旭日”。目前,這兩款處理器都屬于嵌入式人工智能視覺芯片,分別面向智能駕駛和智能攝像頭。2018年CES上,英特爾和地平線還發(fā)布了基于伯努利架構(gòu)的新一代征程處理器,其發(fā)展路徑圖為:2018年,感知;2019年,建模;2020年,決策。

而因?yàn)榕c英特爾的合作,地平線不禁讓市場(chǎng)聯(lián)想到英特爾早前重金收購(gòu)的Mobileye。在嵌入式人工智能領(lǐng)域,Mobileye是業(yè)界領(lǐng)頭羊。地平線在英特爾的定位版圖是否是中國(guó)版Mobileye?但其創(chuàng)始人余凱的抱負(fù)是,地平線是要做中國(guó)的英特爾。

相較而言,阿里在三家中最為熱衷芯片布局,上述包括寒武紀(jì)、深鑒科技均有阿里參投。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1616

    瀏覽量

    47231
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    286

    瀏覽量

    18632

原文標(biāo)題:“芯痛”之下阿里苦心研發(fā)NPU AI芯片究竟哪款PU更厲害?

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    恒玄科技研發(fā)AI眼鏡專用芯片

    近日,知情人士透露,國(guó)內(nèi)領(lǐng)先的芯片設(shè)計(jì)公司恒玄科技目前正致力于研發(fā)一款專門適配于AI眼鏡的芯片。 據(jù)了解,目前市場(chǎng)上的AI眼鏡產(chǎn)品主要搭載的
    的頭像 發(fā)表于 12-31 14:42 ?261次閱讀

    NPU在邊緣計(jì)算中的優(yōu)勢(shì)

    和GPU相比,NPU在處理神經(jīng)網(wǎng)絡(luò)相關(guān)的計(jì)算任務(wù)時(shí),能夠提供更高的能效比和更快的處理速度。NPU通過(guò)優(yōu)化數(shù)據(jù)流和計(jì)算結(jié)構(gòu),使得神經(jīng)網(wǎng)絡(luò)的前向傳播和反向傳播更加高效。 NPU在邊緣計(jì)算中的優(yōu)勢(shì)
    的頭像 發(fā)表于 11-15 09:13 ?393次閱讀

    NPU技術(shù)如何提升AI性能

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為AI領(lǐng)域的核心驅(qū)動(dòng)力,對(duì)計(jì)算能力的需求日益增長(zhǎng)。NPU技術(shù)應(yīng)運(yùn)而生,為AI性能的提升提供了強(qiáng)大的硬件支持。 NPU技術(shù)概述
    的頭像 發(fā)表于 11-15 09:11 ?473次閱讀

    什么是NPU芯片及其功能

    在人工智能(AI)技術(shù)迅猛發(fā)展的今天,NPU芯片已經(jīng)成為推動(dòng)這一領(lǐng)域進(jìn)步的關(guān)鍵技術(shù)之一。NPU芯片,即神經(jīng)網(wǎng)絡(luò)處理單元,是一種專門為深度學(xué)習(xí)
    的頭像 發(fā)表于 11-14 15:48 ?1400次閱讀

    小鵬汽車2024 AI科技日:圖靈AI芯片進(jìn)展公布,預(yù)計(jì)AI汽車市場(chǎng)將迎來(lái)巨變

    在11月6日下午的2024小鵬AI科技日上,小鵬汽車揭曉了其圖靈AI芯片的最新研發(fā)成果。小鵬汽車強(qiáng)調(diào),這款圖靈芯片是專為
    的頭像 發(fā)表于 11-07 14:56 ?901次閱讀

    什么是NPU?什么場(chǎng)景需要配置NPU?

    處理AI任務(wù)上的效率更高,在現(xiàn)今ARM主板配置中也變得越來(lái)越重要。本文將帶大家了解 NPU 的作用、必要性,以及國(guó)產(chǎn)芯片廠商是如何對(duì)它進(jìn)行布局的。
    的頭像 發(fā)表于 10-11 10:13 ?1679次閱讀
    什么是<b class='flag-5'>NPU</b>?什么場(chǎng)景需要配置<b class='flag-5'>NPU</b>?

    阿里Ali266解碼器助力高通AI PC首播H.266超高清

     9月20日,最新科技動(dòng)態(tài)傳來(lái),國(guó)際廣播電視展(IBC)圓滿落幕,高通技術(shù)公司在展會(huì)中大放異彩,展示了其攜手阿里巴巴自研解碼器Ali266打造的高性能視頻解碼方案。這一創(chuàng)新方案在搭載驍龍X
    的頭像 發(fā)表于 09-20 14:20 ?669次閱讀

    AI芯片的混合精度計(jì)算與靈活可擴(kuò)展

    、NPU、DSP等。 ? 而無(wú)論是哪種架構(gòu),如何判斷其性能優(yōu)劣都至關(guān)重要,而這就涉及到AI芯片的各項(xiàng)性能指標(biāo),如算力、能效、時(shí)延等。其中AI
    的頭像 發(fā)表于 08-23 00:08 ?4862次閱讀

    刷新AI PC NPU算力,AMD銳龍AI 9 HX 375領(lǐng)銜55 TOPS

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)最近AMD官網(wǎng)上線了銳龍AI 300系列中的最新成員銳龍AI 9 HX 375處理器。原本Ryzen AI 9 HX 370的NPU達(dá)到了50 TOPS,
    的頭像 發(fā)表于 08-07 00:28 ?3374次閱讀
    刷新<b class='flag-5'>AI</b> PC <b class='flag-5'>NPU</b>算力,AMD銳龍<b class='flag-5'>AI</b> 9 HX 375領(lǐng)銜55 TOPS

    esp-ali-smartliving SDK功能OTA升級(jí)失敗的原因?

    芯片:esp-8266EX ESP8266_RTOS_SDK:v3.3 github:https://github.com/espressif/esp-ali-smartliving.git 示例
    發(fā)表于 06-28 08:50

    AI PC引發(fā)的NPU大戰(zhàn)?英特爾:僅30%開發(fā)者選擇NPU

    隨著COMPUTEX 2024的日益臨近,關(guān)于人工智能(AI)個(gè)人計(jì)算機(jī)(PC)的話題開始變得愈發(fā)熱門和受關(guān)注。據(jù)微軟公司近期發(fā)布的相關(guān)技術(shù)規(guī)范要求,所有運(yùn)行Windows操作系統(tǒng)的AI PC必須配備本地運(yùn)行Copilot的功能機(jī)制,并安裝容量至少為40 TOPS的神經(jīng)網(wǎng)
    的頭像 發(fā)表于 06-03 17:24 ?877次閱讀

    高通NPU和異構(gòu)計(jì)算提升生成式AI性能?

    異構(gòu)計(jì)算的重要性不可忽視。根據(jù)生成式AI的獨(dú)特需求和計(jì)算負(fù)擔(dān),需要配備不同的處理器,如專注于AI工作負(fù)載的定制設(shè)計(jì)的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?806次閱讀

    采用芯原NPU IP的AI芯片已在全球出貨超過(guò)1億顆

    芯原股份發(fā)布重要消息,其集成了芯原神經(jīng)網(wǎng)絡(luò)處理器(NPU)IP的人工智能(AI)類芯片,已在全球范圍內(nèi)出貨超過(guò)1億顆。這一里程碑式的成就標(biāo)志著芯原在AI領(lǐng)域的持續(xù)領(lǐng)先和創(chuàng)新。
    的頭像 發(fā)表于 03-06 10:54 ?871次閱讀

    采用芯原NPU IP的AI芯片已在全球出貨超過(guò)1億顆

    芯原股份(芯原,股票代碼:688521.SH)今日宣布集成了芯原神經(jīng)網(wǎng)絡(luò)處理器(NPU)IP的人工智能(AI)類芯片已在全球范圍內(nèi)出貨超過(guò)1億顆,主要應(yīng)用于物聯(lián)網(wǎng)、可穿戴設(shè)備、智慧電視、智慧家居、安
    的頭像 發(fā)表于 02-29 10:26 ?469次閱讀

    AI服務(wù)器增長(zhǎng)拉動(dòng)PC DRAM需求,2024年全球AI服務(wù)器數(shù)量將破160萬(wàn)臺(tái)

    TrendForce指出,想要滿足微軟AI PC所要求的40 TOPS算力基礎(chǔ),需同時(shí)具備兩個(gè)條件:微軟憑借Windows操作系統(tǒng)和Office軟件等優(yōu)勢(shì)推進(jìn)Copilot應(yīng)用;以及芯片制造商如英特爾,
    的頭像 發(fā)表于 01-18 09:36 ?783次閱讀