0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為發(fā)布最外那個(gè)算力AI芯片

h1654155282.3538 ? 來源:沈苗 ? 2019-08-23 17:15 ? 次閱讀

華為全場景AI方案構(gòu)建完成!

在今天深圳的發(fā)布會(huì)上,華為副董事長、輪值董事長徐直軍發(fā)布了最新商用AI芯片昇騰910(Ascend 910),以及首款國產(chǎn)的全場景AI計(jì)算框架——MindSpore計(jì)算框架。

至此,從去年發(fā)布“五大AI戰(zhàn)略”,短短一年時(shí)間,在各方壓力下的華為,已經(jīng)迅速完成了全場景AI方案的全部部件構(gòu)建。華為表示,接下來會(huì)專注于各部件的優(yōu)化和升級。

在答記者問的環(huán)節(jié)徐直軍也提到,“516事件”(美國商務(wù)部以國家安全為由,將華為公司及其70家附屬公司列入出口管制「實(shí)體名單」)對華為戰(zhàn)略推薦和全場景產(chǎn)品研發(fā)沒有任何影響,盡管外部環(huán)境發(fā)生了很多變化,但是整個(gè)AI戰(zhàn)略和產(chǎn)品商用依然在穩(wěn)步推進(jìn),也達(dá)到了預(yù)期結(jié)果。

而對于華為在計(jì)算框架生態(tài)的構(gòu)建上,如何與谷歌和Facebook等已經(jīng)長期耕耘的公司競爭的問題,徐直軍表示,華為的優(yōu)勢在于有自己的移動(dòng)終端產(chǎn)品,并且利用算力和計(jì)算框架結(jié)合,可以打造很多其他框架不能實(shí)現(xiàn)的功能。

其實(shí)在8月21日開幕的第31屆Hot Chips大會(huì)上,華為作為主角之一與AMD、Intel、ARM等巨頭同臺(tái)亮相時(shí),就推出了AI芯片所用的“Da Vinci(達(dá)芬奇)”架構(gòu),以及昇騰310、昇騰910芯片和麒麟810芯片。

昇騰310、昇騰910芯片早在去年10月10日的華為全鏈接2018大會(huì)上就已首次亮相。

聚焦低功耗的昇騰310已經(jīng)量產(chǎn)商用,那今天發(fā)布的昇騰910(Ascend 910)AI處理器和MindSpore計(jì)算框架又有什么新的亮點(diǎn)呢?

最新商用AI芯片昇騰910發(fā)布

先看昇騰910,據(jù)華為介紹,這款芯片在算力方面超過了預(yù)期,同等規(guī)格下,昇騰910達(dá)到并超過了C級規(guī)格,能在一個(gè)時(shí)鐘周期下完成4096次計(jì)算。

這個(gè)成績得益于基于達(dá)芬奇架構(gòu)的AI核的計(jì)算核心,除了標(biāo)量和矢量計(jì)算單元,AI核集成了3D立方體計(jì)算引擎,與CPUGPU相比,有兩個(gè)數(shù)量級上的提升。

昇騰910更是集成了32個(gè)立方體計(jì)算引擎,能夠輸出256TFLOPS(每秒256萬億次浮點(diǎn)指令),所以昇騰910不僅是一個(gè)AI芯片,更是一個(gè)高度集成的片上系統(tǒng),集成了CPU、DVBP及任務(wù)管理器。

同時(shí)昇騰910擁有自治能力,使其可以獨(dú)立完成整個(gè)AI訓(xùn)練流程,最小化和Host的交互,從而發(fā)揮其強(qiáng)大的算力。

再看昇騰910的通信機(jī)制,昇騰910集成了HCCS、PCLe和RoCE三種高速接口,其中自研的HCCS可以提供單接口240Gbps的傳輸,從而實(shí)現(xiàn)芯片構(gòu)建訓(xùn)練系統(tǒng)的性能和靈活性的大幅提升。

華為也表示,將繼續(xù)面向未來投資,針對不同場景進(jìn)行研發(fā),提供更強(qiáng)大經(jīng)濟(jì)的算力需求。昇騰310、昇騰910僅僅是一個(gè)開始,未來將推出昇騰920。

在價(jià)格上,華為也表示,這款芯片的售價(jià)還沒有確定,但是絕不會(huì)高于同性能芯片的售價(jià)。

發(fā)布首款國產(chǎn)全場景AI計(jì)算框架——MindSpore

接下來,華為還發(fā)布了一款全場景AI計(jì)算框架——MindSpore。

徐直軍表示,目前國內(nèi)還沒有一款能夠?qū)?biāo)Tensorflow的全場景AI計(jì)算框架,MindSpore希望能夠彌補(bǔ)國內(nèi)的這一空白。

在性能上,MindSpore對開發(fā)者非常友好,能夠有效減少模型開發(fā)時(shí)間,降低開發(fā)門檻。相同場景需求下,減少模型代碼量20%,效率能夠整體提升50%以上。

具體來說,MindSpore自動(dòng)微分采用Source 2 Source方式實(shí)現(xiàn),在性能和可編程性上,明顯優(yōu)于業(yè)界圖和運(yùn)算符重載方式,同時(shí)能夠?qū)崿F(xiàn)任意算子的微分表達(dá)和編譯優(yōu)化,實(shí)現(xiàn)反向算子自動(dòng)生成,從而極大方便模型開發(fā)。

隨著數(shù)據(jù)集和模型規(guī)模越來越大,模型并行成為必然,手工切分的模型并行存在門檻高、效率低、調(diào)優(yōu)難的缺陷,而MindSpore只需要定義單機(jī)模型,即可實(shí)現(xiàn)多機(jī)混合并行運(yùn)行,無需了解AI集群細(xì)節(jié)。

MindSpore同時(shí)支持靜態(tài)圖和動(dòng)態(tài)圖,且可用一條語句實(shí)現(xiàn)無縫切換,從而讓調(diào)試也變得簡單而高效。

不僅有開發(fā)態(tài)的高效,運(yùn)行態(tài)的友好同樣是MindSpore的追求目標(biāo)。MindSpore大大提高了運(yùn)算性能,并且除了支持華為的昇騰910外,也支持其他業(yè)界其他CPU、GPU。

MindSpore還提供了Ascend Native運(yùn)行技術(shù),助力昇騰算力最佳發(fā)揮。主從控制模式中,CPU和GPU交互,引入內(nèi)存和數(shù)據(jù)開銷,在芯片上完成神經(jīng)網(wǎng)絡(luò)模型所需要的所有控制和執(zhí)行。

至于很多人問為什么有了TensorFlow還要開發(fā)MindSpore,徐直軍表示:目前沒有任何一個(gè)國產(chǎn)框架支持全場景。華為目前的業(yè)務(wù)包括云、端、邊,這些都需要全場景支持的AI框架。在不同的運(yùn)行環(huán)境中,架構(gòu)上支持可大可小,適應(yīng)全部場景部署。

在隱私保護(hù)方面,MindSpore不帶有隱私信息的梯度模型,能夠在保證保護(hù)用戶隱私的前提下,跨場景協(xié)同。

總的來說,支持端、邊、云獨(dú)立和協(xié)同的統(tǒng)一訓(xùn)練和推理的MindSpore計(jì)算框架,降低了AI的開發(fā)和使用門檻,釋放AI生產(chǎn)力,最大程度發(fā)揮AI芯片算力潛力,從而鼓勵(lì)開發(fā)人員共同打造AI生態(tài),推動(dòng)AI產(chǎn)業(yè)落地。

華為稱,MindSpore將在明年一季度開源,讓更多開發(fā)者參與將MindSpore打造好。

華為全場景AI構(gòu)建方案完成

最后,讓我們再回顧一下華為去年發(fā)布的AI五大戰(zhàn)略:

投資基礎(chǔ)研究:在計(jì)算視覺、自然語言處理、決策推理等領(lǐng)域構(gòu)筑數(shù)據(jù)高效(更少的數(shù)據(jù)需求)、能耗高效(更低的算力和能耗),安全可信、自動(dòng)自治的機(jī)器學(xué)習(xí)基礎(chǔ)能力

打造全棧方案:打造面向云、邊緣和端等全場景的、獨(dú)立的以及協(xié)同的、全棧解決方案,提供充裕的、經(jīng)濟(jì)的算力資源,簡單易用、高效率、全流程的AI平臺(tái)

投資開放生態(tài)和人才培養(yǎng):面向全球,持續(xù)與學(xué)術(shù)界、產(chǎn)業(yè)界和行業(yè)伙伴廣泛合作,打造人工智能開放生態(tài),培養(yǎng)人工智能人才

解決方案增強(qiáng):把AI思維和技術(shù)引入現(xiàn)有產(chǎn)品和服務(wù),實(shí)現(xiàn)更大價(jià)值、更強(qiáng)競爭力

內(nèi)部效率提升:應(yīng)用AI優(yōu)化內(nèi)部管理,對準(zhǔn)海量作業(yè)場景,大幅度提升內(nèi)部運(yùn)營效率和質(zhì)量

而今年芯片和計(jì)算架構(gòu)的發(fā)布,也是華為對這一戰(zhàn)略的落地實(shí)踐。這也標(biāo)志著華為全場景AI構(gòu)建方案完成。

目前從世界范圍來看,在桌面CPU上,Intel和AMD處于絕對的統(tǒng)治地位;GPU方面,則是英偉達(dá)在領(lǐng)跑;至于手機(jī)處理器,則基本握在了ARM手中。盡管華為有備胎計(jì)劃,但是性能方面預(yù)計(jì)很難超過這些技術(shù)成熟、人才資本雄厚的企業(yè)。

深圳半導(dǎo)體協(xié)會(huì)秘書長常軍鋒曾指出,國外半導(dǎo)體巨頭通過國際標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、專利保護(hù)建立了技術(shù)壁壘。

AI芯片,則成為了國產(chǎn)芯片彎道超車的絕佳機(jī)會(huì)。

AI芯片從發(fā)育到成熟落地,國內(nèi)基本和國外大廠處于同一起跑線上,并且如今華為昇騰系列已經(jīng)商業(yè)化,昇騰910作為是目前單芯片計(jì)算密度最大的芯片,計(jì)算力也超過了谷歌及英偉達(dá)競品。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 華為
    +關(guān)注

    關(guān)注

    216

    文章

    35089

    瀏覽量

    255284
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34588

    瀏覽量

    276153
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1973

    瀏覽量

    35741
收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為AI WAN智IP廣域網(wǎng)助力互聯(lián)網(wǎng)建設(shè)

    近期,NIDA發(fā)布的《工信部首提數(shù)據(jù)通信產(chǎn)業(yè),賦能互聯(lián)網(wǎng)新征程》一文引發(fā)了行業(yè)關(guān)注。文章解讀工信部最新發(fā)布的《
    的頭像 發(fā)表于 06-11 11:21 ?352次閱讀

    芯片的生態(tài)突圍與革命

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 李彎彎)大芯片,即具備強(qiáng)大計(jì)算能力的集成電路芯片,主要應(yīng)用于高性能計(jì)算(HPC)、人工智能(AI)、數(shù)據(jù)中心、
    的頭像 發(fā)表于 04-13 00:02 ?1563次閱讀

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對的需求持續(xù)攀升,直接推動(dòng)了服務(wù)
    發(fā)表于 03-25 12:00

    安霸大AI芯片接入DeepSeek R1

    安霸(Ambarela)在人工智能領(lǐng)域持續(xù)發(fā),已成功在多款 AI 芯片,包括 N 系列大 AI
    的頭像 發(fā)表于 02-17 13:36 ?480次閱讀

    中心的如何衡量?

    (ComputationalPower)是指智中心通過其內(nèi)部的計(jì)算設(shè)備(如CPU、GPU、AI芯片等)對數(shù)據(jù)進(jìn)行處理和計(jì)算的能力。它體現(xiàn)了智中心在單位時(shí)間內(nèi)能夠完成的計(jì)算任務(wù)量,
    的頭像 發(fā)表于 01-16 14:03 ?2049次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    企業(yè)AI租賃模式的好處

    構(gòu)建和維護(hù)一個(gè)高效、可擴(kuò)展的AI基礎(chǔ)設(shè)施,不僅需要巨額的初期投資,還涉及復(fù)雜的運(yùn)維管理和持續(xù)的技術(shù)升級。而AI
    的頭像 發(fā)表于 12-24 10:49 ?1169次閱讀

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?2357次閱讀

    億鑄科技熊大鵬探討AI芯片的挑戰(zhàn)與解決策略

    在SEMiBAY2024《HBM與存儲(chǔ)器技術(shù)與應(yīng)用論壇》上,億鑄科技的創(chuàng)始人、董事長兼CEO熊大鵬博士發(fā)表了題為《超越極限:大芯片的技術(shù)挑戰(zhàn)與解決之道》的演講,深入剖析了AI大模型
    的頭像 發(fā)表于 10-25 11:52 ?855次閱讀

    AI芯片供電電源測試?yán)?費(fèi)思低壓大電流系列電子負(fù)載

    AI芯片作為驅(qū)動(dòng)復(fù)雜計(jì)算任務(wù)的核心引擎,其性能與穩(wěn)定性成為了決定應(yīng)用成敗的關(guān)鍵因素。而在這背后,供電電源的穩(wěn)定性和高效性則是保障AI
    的頭像 發(fā)表于 10-25 11:26 ?1335次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>供電電源測試?yán)?費(fèi)思低壓大電流系列電子負(fù)載

    一體架構(gòu)創(chuàng)新助力國產(chǎn)大AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《存一體架構(gòu)創(chuàng)新助力國產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?797次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    1章 從TOP500和MLPerf看芯片格局 1.1科學(xué)最前沿TOP500 1.2 AI
    發(fā)表于 10-15 22:08

    中國大會(huì)召開,業(yè)界首個(gè)高質(zhì)量評估體系發(fā)布

    首次完整地構(gòu)建了人工智能時(shí)代高質(zhì)量的理論體系,并探索性提出業(yè)界首個(gè) "五位一體"的高質(zhì)量評估體系。 發(fā)布現(xiàn)場 在當(dāng)前由大模型和AIG
    的頭像 發(fā)表于 09-28 16:50 ?448次閱讀
    中國<b class='flag-5'>算</b><b class='flag-5'>力</b>大會(huì)召開,業(yè)界首個(gè)<b class='flag-5'>算</b><b class='flag-5'>力</b>高質(zhì)量評估體系<b class='flag-5'>發(fā)布</b>

    名單公布!【書籍評測活動(dòng)NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    ,在全球范圍內(nèi),對于推動(dòng)科技進(jìn)步、經(jīng)濟(jì)發(fā)展及社會(huì)整體的運(yùn)作具有至關(guān)重要的作用。隨著信息技術(shù)的高速發(fā)展,高性能計(jì)算(HPC)和人工智能(AI)等技術(shù)在多個(gè)領(lǐng)域的應(yīng)用變得日益廣泛,芯片
    發(fā)表于 09-02 10:09

    大模型時(shí)代的需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問題,帶著這個(gè)極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品