看似高深的人工智能(AI)技術(shù),其實(shí)已經(jīng)“潤物細(xì)無聲”地深入大眾生活,僅你手中的一部華為Mate20手機(jī),就可以實(shí)現(xiàn)人臉識(shí)別、物體識(shí)別、物體檢測(cè)、圖像分割、智能翻譯等AI功能。這背后,依仗的是手機(jī)算力的大幅提升。其中小小一枚一分錢硬幣大小的華為麒麟980手機(jī)芯片,就集成了69億個(gè)晶體管,具備每秒鐘完成萬億次級(jí)運(yùn)算的能力。你可能想不到,如今自己手中任何普通智能手機(jī)的算力,甚至比美國航空航天局1969年登月計(jì)劃中最先進(jìn)計(jì)算機(jī)還高出幾百上千萬倍乃至更高。
數(shù)據(jù)、算力和算法,驅(qū)動(dòng)著人工智能的第三次浪潮。其中,算力正是重要的基石。手機(jī)端的芯片算力幾年間已經(jīng)發(fā)展得如此驚人,用于云端的AI芯片需要處理自動(dòng)駕駛等復(fù)雜場景的海量數(shù)據(jù),又需要多強(qiáng)大的算力呢?OpenAI近期發(fā)布的研究顯示,僅2012年以來,人們對(duì)于算力的需求六年就增長超過30萬倍,平均每年增長10倍,遠(yuǎn)遠(yuǎn)超過了摩爾定律的發(fā)展速度,因?yàn)?a href="http://www.wenjunhu.com/v/tag/448/" target="_blank">深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)需要對(duì)張量(可以簡化理解為矩陣)進(jìn)行大規(guī)模并行計(jì)算,顛覆了傳統(tǒng)的浮點(diǎn)計(jì)算,對(duì)算力的需求正在出現(xiàn)指數(shù)級(jí)的爆炸式增長。例如原來1個(gè)時(shí)鐘單元只能計(jì)算1次浮點(diǎn)計(jì)算,現(xiàn)在可以通過新的算子同時(shí)對(duì)N*N的矩陣計(jì)算,如果N=10,那就是同時(shí)計(jì)算了100次,計(jì)算次數(shù)較原來增長了100倍,新算子帶來了對(duì)新芯片的強(qiáng)大算力訴求。
如果說2019年最受輿論關(guān)注的ICT和智能終端廠商是華為,那么其去年10月以來一直“猶抱琵琶半遮面”的業(yè)界算力最高AI處理器——Ascend(昇騰)910芯片,則是人工智能圈本年度最期待的AI芯片。
面對(duì)AI算力需求的爆發(fā)式增長,這幾年華為在做些什么?
率先將專用NPUAI芯片 引入手機(jī)
人工智能發(fā)展中,我國在數(shù)據(jù)方面具備優(yōu)勢(shì),但在算法與算力方面仍待發(fā)展,尤其是芯片與硬件代表的算力方面。算法科學(xué)家、工程師和應(yīng)用廠商面臨著AI算力稀缺和昂貴問題,大大抬高了算法研究和創(chuàng)新門檻,阻礙著AI的全行業(yè)普及和應(yīng)用。
正因如此,盡管AI芯片在金錢、時(shí)間和人力各方面的研發(fā)成本高昂,但在AI商業(yè)賽道上,各廠商都在打造各自的芯片體系,其中多為聚焦于某一應(yīng)用或某一場景的互聯(lián)網(wǎng)和芯片廠商,也不乏ICT大廠。國內(nèi)廠商中,華為在AI芯片的布局堪稱“經(jīng)典”。
在AlphaGo一戰(zhàn)成名之前,絕大多國人就已經(jīng)完成了從功能手機(jī)到第一代智能手機(jī)的換代,不斷增長的手機(jī)系統(tǒng)自帶功能特性和第三方應(yīng)用,刷新著用戶的體驗(yàn)。無論是AI功能還是場景化AI服務(wù),都需要手機(jī)完成復(fù)雜深度學(xué)習(xí)算法模型運(yùn)算,計(jì)算密集復(fù)雜,計(jì)算需求巨大,實(shí)時(shí)性非常挑戰(zhàn);同時(shí)運(yùn)行環(huán)境受限,功耗、內(nèi)存、存儲(chǔ)空間非常挑戰(zhàn),因此強(qiáng)大的算力是必須的。
如何將人工智能引入到手機(jī)終端,是彼時(shí)蘋果、華為在內(nèi)的手機(jī)廠商都在努力攻破的問題。
2017年9月的柏林電子消費(fèi)展上,華為正式發(fā)布全球領(lǐng)先移動(dòng)端AI芯片麒麟970,一個(gè)月后發(fā)布了搭載麒麟970的旗艦手機(jī)Mate 10。麒麟970是全球首款內(nèi)置了獨(dú)立神經(jīng)網(wǎng)絡(luò)處理單元(即NPU)的人工智能芯片。華為第一個(gè)將NPU引入手機(jī)芯片,在此之后,蘋果、三星等廠商紛紛跟進(jìn),到今天,AI手機(jī)已成為眾多手機(jī)廠商的旗艦配置。麒麟970內(nèi)置NPU性能大幅優(yōu)于CPU、GPU和DSP這些通用計(jì)算單元。同時(shí)相比CPU獲得了約50倍能效和25倍性能優(yōu)勢(shì)。這意味著,麒麟970芯片可以用更少的能耗更快地完成AI計(jì)算任務(wù)。
在NPU的加持下,手機(jī)功能也會(huì)變得更加強(qiáng)大。例如使用語音功能時(shí),AI會(huì)對(duì)當(dāng)前語境和內(nèi)容進(jìn)行細(xì)致的分析,從而實(shí)現(xiàn)高準(zhǔn)確率的識(shí)別體驗(yàn),將語音識(shí)別的成功率提升到更高的級(jí)別。這樣一來,以智能助手為主語音功能就得以替代傳統(tǒng)的手工輸入,扮演更重要的角色,或許以后大街上見不到邊玩邊走“低頭族”,而是更多人對(duì)著手機(jī)“自言自語”了。
在用戶十分關(guān)心的拍照方面,AI的出現(xiàn)同樣為喜歡手機(jī)攝影的用戶帶來不少福利。麒麟970搭載雙通道ISP圖像信號(hào)處理器,在動(dòng)態(tài)影像捕捉和低光拍照上有很大的提升。雙攝鏡頭+雙ISP軟硬件優(yōu)化、再配合人工智能的計(jì)算機(jī)視覺分析,便能自動(dòng)分析畫面內(nèi)的物體,并選擇當(dāng)前最佳的拍照模式,甚至可以進(jìn)行物體追蹤對(duì)焦和預(yù)測(cè)用戶拍照時(shí)機(jī),提供前所未有的拍照體驗(yàn)。
麒麟970的推出,成為傳統(tǒng)智能手機(jī)和未來AI手機(jī)的重要分水嶺,AI手機(jī)的發(fā)展也從單純的算法優(yōu)化進(jìn)入了硬件能力的真·人工智能比拼階段。
2018年8月,同樣是在柏林電子消費(fèi)展上,華為又發(fā)布了全球首款7nm人工智能手機(jī)芯片——麒麟980。
1納米等于1毫微米(即十億分之一米),約為10個(gè)原子的長度。一根頭發(fā)絲直徑約為0.1毫米,而7nm相當(dāng)于頭發(fā)絲的萬分之一,在不到1平方厘米的麒麟980內(nèi)部有高達(dá)69億個(gè)晶體管。從芯片工藝上看,7nm相當(dāng)于70個(gè)原子直徑,逼近了硅基半導(dǎo)體工藝的物理極限,麒麟980實(shí)現(xiàn)了在針尖上翩翩起舞。華為消費(fèi)者業(yè)務(wù)CEO余承東表示,麒麟980的7nm工藝是由超過1000多名半導(dǎo)體工程師組成的團(tuán)隊(duì)歷時(shí)3年時(shí)間,經(jīng)歷超過5000多次的工程驗(yàn)證精心打磨而成。
相對(duì)于麒麟970來說,麒麟980全面升級(jí)。以圖像識(shí)別速度為例,麒麟970可達(dá)到約2005張每分鐘,而麒麟980在移動(dòng)端雙NPU強(qiáng)大算力加持下,實(shí)現(xiàn)每分鐘圖像識(shí)別4500張,識(shí)別速度相比上一代提升120%,遠(yuǎn)高于業(yè)界同期水平。隨之而來的,是人臉識(shí)別、語音助手、AI拍照,及各類智能美拍P圖等APP在手機(jī)上的全面升級(jí)。
同時(shí),面對(duì)更海量的用戶,麒麟710讓更多消費(fèi)者享受到人工智能的樂趣。到了2019年,華為推出麒麟810芯片,這是華為第二款7nm工藝的手機(jī)芯片,也是華為首款自研達(dá)芬奇架構(gòu)NPU的手機(jī)芯片,這意味著更多海量用戶享受到專用NPU帶來的旗艦級(jí)的AI體驗(yàn)。
至此,華為完成第一輪在手機(jī)端的AI芯片布局(麒麟970、麒麟980、麒麟710、麒麟810),手機(jī)產(chǎn)業(yè)也正式走入了AI時(shí)代。
“達(dá)芬奇”構(gòu)建端、邊、云算力大爆發(fā)基礎(chǔ)
AI賽道比拼,影響的絕不僅是手機(jī)端,邊緣側(cè)、云側(cè)的硬件算力、數(shù)據(jù)算法等元素?zé)o一不處于白熱化的競賽之中,幾乎每天都有新的論文、新的產(chǎn)品問世。
如果說華為在芯片上的持續(xù)投入屬“居安思?!保@示的是其遠(yuǎn)見與決心。那么,華為在人工智能領(lǐng)域的野心則更為宏大,這一次,華為不僅要覆蓋云、邊、端各種場景,還要形成從應(yīng)用使能到系統(tǒng)到芯片的閉環(huán)。
2018年10月,華為在其全聯(lián)接大會(huì)上首次提出全棧全場景AI解決方案,華為輪值董事長徐直軍表示,“全場景,是指包括公有云、私有云、各種邊緣計(jì)算、物聯(lián)網(wǎng)行業(yè)終端以及消費(fèi)類終端等部署環(huán)境。全棧是技術(shù)功能視角,是指包括芯片、芯片使能、訓(xùn)練和推理框架和應(yīng)用使能在內(nèi)的全堆棧方案?!?/p>
其中,全棧AI的基礎(chǔ),是一系列基于統(tǒng)一的達(dá)芬奇架構(gòu)的AI芯片——從IoT到終端(如麒麟芯片的NPU)、到邊緣側(cè)再到云。在會(huì)上,徐直軍還宣布,“外界一直在傳華為在開發(fā)AI芯片,我要告訴大家,這是事實(shí),我們今天發(fā)布兩顆AI芯片:華為昇騰(Ascend)910和310?!贝搜砸怀?,立刻在國內(nèi)外人工智能圈子驚起波瀾——華為終于祭出了大招。
達(dá)芬奇架構(gòu)針對(duì)AI運(yùn)算特征而設(shè)計(jì),以高性能3D Cube計(jì)算引擎為基礎(chǔ),實(shí)現(xiàn)了算力和能效的大幅提升。從云、邊緣、端獨(dú)立的和協(xié)同的AI實(shí)際需求出發(fā),從極致低功耗,到極致大算力的AI場景,為云、邊、端之間的算法協(xié)同、遷移、部署、升級(jí)和運(yùn)維,提供了統(tǒng)一架構(gòu)底層核心支撐,大大降低了人工智能算法開發(fā)和迭代的門檻,降低了企業(yè)人工智能部署和商用成本。
目前,昇騰(Ascend)芯片家族中的昇騰310已經(jīng)落地商用?;跁N騰310,華為陸續(xù)發(fā)布了Atlas 200、Atlas 300、Atlas500、Atlas 800等產(chǎn)品,已被廣泛應(yīng)用于安防、金融、醫(yī)療、交通、電力、汽車等行業(yè),涉及攝像機(jī)、無人機(jī)、機(jī)器人、智能小站、MDC(Mobile Data Center)等產(chǎn)品形態(tài)。并提供基于昇騰310的AI云服務(wù),比如華為云圖像分析類服務(wù)、OCR服務(wù)、視頻智能分析服務(wù)等超過50款A(yù)PI已經(jīng)基于昇騰310,日均調(diào)用量超過1億次。另有大量企業(yè)客戶正在借助昇騰310芯片自己開發(fā)算法服務(wù)。
隨著昇騰310相關(guān)產(chǎn)品大規(guī)模上市,外界對(duì)昇騰910的期待更盛。畢竟,去年10月,徐直軍在會(huì)上公布,“昇騰910是目前計(jì)算密度最大的單芯片,最大功耗為350W,半精度為(FP 16)256 Tera FLOPS,比英偉達(dá) V100的125 Tera FLOPS還要高出近1倍。若集齊1024個(gè)昇騰910,將會(huì)出現(xiàn)迄今為止全球最大的AI計(jì)算集群,性能也將達(dá)到256個(gè)P,不管多復(fù)雜的模型都能輕松訓(xùn)練?!焙唵蝸碚f就是,昇騰910是業(yè)界算力最高的AI處理器,相同功耗情況下,它的算力是業(yè)界芯片的2倍,最強(qiáng)CPU的50倍。
全棧全場景AI逐步落地
除了昇騰系列芯片外,華為提出的全棧AI,還包括支持端、邊、云獨(dú)立的和協(xié)同的統(tǒng)一訓(xùn)練和推理框架MindSpore,芯片算子庫和高度自動(dòng)化算子開發(fā)工具——CANN,提供全流程服務(wù)(ModelArts)、分層API和預(yù)集成方案的應(yīng)用使能。
其中,在2019年已經(jīng)落地實(shí)現(xiàn)商用的,除了昇騰310,還有其面向用戶和開發(fā)者的門戶——華為云ModelArts。作為一站式AI開發(fā)平臺(tái),ModelArts可以提供海量數(shù)據(jù)預(yù)處理及半自動(dòng)化標(biāo)注、大規(guī)模分布式訓(xùn)練、自動(dòng)化模型生成,及端-邊-云模型按需部署能力,幫助用戶快速創(chuàng)建和部署模型,管理全周期AI工作流。2019年5月,在斯坦福大學(xué)DAWNBench榜單,華為云ModelArts獲得圖像識(shí)別訓(xùn)練第一,ImageNet- 1k數(shù)據(jù)集上用128塊V100GPU訓(xùn)練ResNet-50模型僅需要2分43秒,而在2017年10月,斯坦福DAWN的訓(xùn)練時(shí)間是13天10小時(shí)41分鐘。ModelArts如果由強(qiáng)大的昇騰910加持,是否能進(jìn)一步刷新世界紀(jì)錄?若再采用1024個(gè)昇騰910的全球最大AI計(jì)算集群,又將出現(xiàn)什么樣的成績?
從端側(cè)到邊緣側(cè)再到云側(cè),從底層硬件到深度學(xué)習(xí)框架再到上層應(yīng)用使能,華為的全棧全場景AI戰(zhàn)略正在逐步落地。在一年前關(guān)于AI的豪言中,哪些是華為下一步將要向市場兌現(xiàn)的呢?我們拭目以待。
-
華為
+關(guān)注
關(guān)注
216文章
34477瀏覽量
252122 -
AI
+關(guān)注
關(guān)注
87文章
31124瀏覽量
269447
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論