人工智能(AI)的發(fā)展已達(dá)60余年,涉及范圍非常廣泛,擁有比一般科技領(lǐng)域更復(fù)雜、更豐富的內(nèi)涵?,F(xiàn)階段人工智能技術(shù)研究將圍繞算法、框架軟件、芯片三個(gè)方面。未來十年是人工智能產(chǎn)業(yè)發(fā)展的重要時(shí)期,也是人工智能芯片技術(shù)突破的關(guān)鍵時(shí)期,遠(yuǎn)期人工智能技術(shù)的發(fā)展路徑將會沿著算法、算力兩條主線向前發(fā)展,并逐步帶領(lǐng)人類進(jìn)入到人機(jī)協(xié)同時(shí)代。發(fā)展人工智能的最終目標(biāo)并不是要替代人類智能,而是要與人類智能形成互補(bǔ),使得人類從繁重的重復(fù)性工作中解放出來,從而專注于推動人類自身文明的進(jìn)步。
一、我國發(fā)展人工智能面臨三方面挑戰(zhàn)
我國發(fā)展人工智能當(dāng)前面臨的挑戰(zhàn)主要在AI算法、AI框架軟件及AI芯片三個(gè)方面,詳細(xì)論述如下。
(一)AI算法
人工智能技術(shù)常見的算法技術(shù)有決策樹、隨機(jī)森林、邏輯回歸、支持向量機(jī)、樸素貝葉斯算法等,國內(nèi)各大高校團(tuán)隊(duì)一直有深入研究,但是在科研成果轉(zhuǎn)化領(lǐng)域一直發(fā)展緩慢,難點(diǎn)在于如何將算法和實(shí)際工程應(yīng)用結(jié)合,實(shí)現(xiàn)技術(shù)向生產(chǎn)力的轉(zhuǎn)化。目前以華為、阿里、騰訊等公司主導(dǎo)的技術(shù)研發(fā)團(tuán)隊(duì),將自身應(yīng)用和算法技術(shù)結(jié)合,從產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)算法的技術(shù)成果轉(zhuǎn)化。
底層數(shù)學(xué)庫的研究一直屬于冷門行業(yè),一方面因?yàn)榧夹g(shù)成果轉(zhuǎn)化不易,另一方面因?yàn)檠芯款I(lǐng)域狹窄,國內(nèi)僅有少數(shù)科研團(tuán)隊(duì)專注于此。企業(yè)領(lǐng)域,主要是嘗試從底層硬件開發(fā)角度,通過優(yōu)化數(shù)學(xué)庫實(shí)現(xiàn)硬件效率最優(yōu)化的方式進(jìn)行研究,如美國NVIDIA公司開發(fā)了cuDNN的深度學(xué)習(xí)庫,是專門針對其CUDA GPU的優(yōu)化,但是并沒有對大規(guī)模機(jī)器學(xué)習(xí)場景中分布式并行的支持。美國IBM (PML)和Intel (DistML)在前些年均開發(fā)了機(jī)器學(xué)習(xí)/深度學(xué)習(xí)相關(guān)框架、庫和工具集,但均限內(nèi)部使用或者是簡單版本的開源。Databricks公司以Spark為核心開發(fā)支持機(jī)群學(xué)習(xí)相關(guān)的庫?;陂_源軟件Caffe擴(kuò)展了基于MPI的分布式并行實(shí)現(xiàn)。從面向市場的產(chǎn)品角度看,這些目前還處于研制階段,性能和穩(wěn)定性改善空間潛力巨大。
算法領(lǐng)域的技術(shù)突破,我國科研機(jī)構(gòu)和企業(yè)的關(guān)注點(diǎn)是不一樣的??蒲蓄I(lǐng)域針對目前的已有算法進(jìn)行深度優(yōu)化,實(shí)現(xiàn)更好的處理效果,或者另辟蹊徑,對原有算法進(jìn)行脫胎換骨。而企業(yè)則更多立足于產(chǎn)業(yè)發(fā)展需要,將成熟的算法應(yīng)用到實(shí)際的工程項(xiàng)目中,實(shí)現(xiàn)人工智能產(chǎn)業(yè)化。
(二)AI框架軟件
國內(nèi)的AI框架軟件逐漸起步,也開始擁抱開源,并正在培育自己的生態(tài)環(huán)境??蚣苘浖侨斯ぶ悄苌鷳B(tài)中最重要的因素之一,我國需要促進(jìn)國產(chǎn)自研框架軟件的發(fā)展和推廣,擺脫國外的軟件生態(tài)標(biāo)準(zhǔn)制約。國產(chǎn)AI框架軟件需要和國產(chǎn)AI芯片及硬件進(jìn)行相互適配、性能優(yōu)化和應(yīng)用推廣,能夠形成面向行業(yè)應(yīng)用的軟硬件一體化平臺,促進(jìn)這種融合技術(shù)在各行業(yè)的產(chǎn)業(yè)推廣。
1.AI框架軟件
AI框架軟件是相關(guān)算法、庫、工具的集合。AI框架軟件的出現(xiàn)降低了使用門檻,開發(fā)人員借助計(jì)算框架,不需要從復(fù)雜的神經(jīng)網(wǎng)絡(luò)開始編寫代碼,可以依據(jù)需要,使用已有的模型,快速實(shí)現(xiàn)應(yīng)用。框架軟件提供了一系列的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)組件,其中,通用的AI算法已集成實(shí)現(xiàn),若需要使用新的算法可根據(jù)自己的需求去定義,然后調(diào)用深度學(xué)習(xí)框架的函數(shù)接口使用戶自定義的新算法。隨著這些開源框架在全球范圍內(nèi)的廣泛使用,互聯(lián)網(wǎng)巨頭開始逐漸掌控了人工智能的應(yīng)用生態(tài),形成了幾乎所有的AI芯片、系統(tǒng)、平臺都需要與這些主流框架適配的局面。AI算法的生產(chǎn)與程序生產(chǎn)不同,是一個(gè)系統(tǒng)工程,需要能夠協(xié)同優(yōu)化數(shù)據(jù)、算法、算力的平臺級產(chǎn)品。深度學(xué)習(xí)對算力有較高需求,因此相繼出現(xiàn)了一些專門的計(jì)算框架軟件和平臺,如谷歌的TensorFlow、伯克利大學(xué)的Caffe、Facebook的PyTorch(基于Torch推出)、微軟的CNTK、亞馬遜的MXNet、百度的PaddlePaddle等。
2.國內(nèi)AI框架軟件主要研發(fā)廠商
國內(nèi)人工智能產(chǎn)業(yè)也是大面積采用國外研發(fā)的這些框架軟件,自研的AI框架軟件相對比較小眾,主要集中在從事AI算法研究比較早的幾個(gè)公司內(nèi)部使用,但是隨著技術(shù)進(jìn)步,逐漸開始進(jìn)入實(shí)用環(huán)節(jié),并開源發(fā)布。國內(nèi)比較知名的幾個(gè)框架軟件的情況如下。
百度飛槳PaddlePaddle:是國內(nèi)開發(fā)較為完善的AI計(jì)算框架,是集深度學(xué)習(xí)核心框架、基礎(chǔ)模型庫、端到端開發(fā)套件、工具組件和服務(wù)平臺于一體的開源深度學(xué)習(xí)平臺。目前百度有超過30個(gè)主要產(chǎn)品都在使用 PaddlePaddle,從市場接受程度判斷,目前還處于起步階段,使用群體相對較少,還需要加大研發(fā)投入和市場培養(yǎng)。
曠視Brain++:擁有自主研發(fā)深度學(xué)習(xí)框架,自主研發(fā)的AI算法平臺Brain++作為統(tǒng)一的底層架構(gòu),為算法訓(xùn)練及模型改進(jìn)過程提供重要支持。在算法開發(fā)方面,曠視自研開源深度學(xué)習(xí)框架MegEngine(Brain++核心組件之一),Brain++幫助曠視構(gòu)建了一條不斷自我改進(jìn)、不斷更加自動化的算法生產(chǎn)線,并能夠針對不同垂直領(lǐng)域的碎片化需求定制豐富且不斷增長的算法組合。
商湯Parrots:是一個(gè)訓(xùn)練框架,核心是一個(gè)動態(tài)的編譯與調(diào)度引擎,商湯Parrots采用動態(tài)實(shí)時(shí)編譯技術(shù),所有代碼都是在運(yùn)行過程當(dāng)中即時(shí)編譯,并且放到計(jì)算芯片或引擎上大規(guī)模地并行執(zhí)行。具備了傳統(tǒng)靜態(tài)深度網(wǎng)絡(luò)的伸縮性,以及當(dāng)代動態(tài)編程模型的靈活性,達(dá)到了這兩者的最佳結(jié)合。
華為MindSpore:計(jì)算框架已經(jīng)正式開源。MindSpore原生適應(yīng)每個(gè)場景包括端、邊緣和云。通過MindSpore自身的技術(shù)創(chuàng)新及MindSpore與華為昇騰AI芯片的協(xié)同優(yōu)化,實(shí)現(xiàn)運(yùn)行態(tài)的高效,大大提高了計(jì)算性能。
(三)AI芯片
早在上世紀(jì)80年代,學(xué)術(shù)界就提出了相當(dāng)完善的AI算法模型,但直到近些年,模型的內(nèi)在價(jià)值也沒有被真正實(shí)現(xiàn)過,這主要是受限于硬件水平難以提供可以支撐深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練/推理過程所需要的算力。AI芯片的出現(xiàn)顯著提高了數(shù)據(jù)處理速度,尤其在處理海量數(shù)據(jù)時(shí)明顯優(yōu)于傳統(tǒng)CPU。一般將AI芯片定義為“專門針對AI算法做了特殊加速設(shè)計(jì)的芯片”,根據(jù)技術(shù)體系結(jié)構(gòu),主要分為GPU、FPGA、ASIC和類腦芯片四大類。AI芯片在邊緣計(jì)算中是提供算力的靈魂和大腦,承載了為各種終端提供強(qiáng)大算力的重要任務(wù),直到近年,GPU、FPGA、ASIC等AI芯片被投入到相關(guān)領(lǐng)域應(yīng)用,才解決了算力不足的問題。
1.基于技術(shù)架構(gòu)分類的AI芯片
(1)GPU
GPU(Graphics Processing Unit,圖形處理器),是利用處理圖形任務(wù)的圖形處理器來計(jì)算原本由中央處理器處理的通用計(jì)算任務(wù)。GPU經(jīng)過多年的生態(tài)發(fā)展,已經(jīng)對機(jī)器學(xué)習(xí)、深度學(xué)習(xí)類應(yīng)用具有良好的兼容性,通用性強(qiáng)、精度支持靈活、性能出眾。GPU面對的則是類型高度統(tǒng)一的、相互無依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的純凈的計(jì)算環(huán)境。GPU的關(guān)鍵性能是并行計(jì)算,主流的GPU具有強(qiáng)大的計(jì)算能力和內(nèi)存帶寬,無論性能還是內(nèi)存帶寬,均遠(yuǎn)大于同代的CPU。CPU 由專為順序串行處理而優(yōu)化的幾個(gè)核心組成,而 GPU 則擁有一個(gè)由數(shù)以千計(jì)的更小、更高效的核心(專為同時(shí)處理多重任務(wù)而設(shè)計(jì))組成的大規(guī)模并行計(jì)算架構(gòu)。同時(shí)CPU相當(dāng)一部分時(shí)間在執(zhí)行外設(shè)的中斷、進(jìn)程的切換等任務(wù),而GPU有更多的時(shí)間并行計(jì)算。
(2)FPGA
FPGA(Field Programma-ble Gate Array,現(xiàn)場可編程門陣列),作為一種半定制電路,含有數(shù)字管理模塊、內(nèi)嵌式單元、輸出單元以及輸入單元等,對于特定運(yùn)算,可以通過編程重組電路,直接生成專用電路,用戶可以通過 FPGA 配置文件來實(shí)現(xiàn)應(yīng)用場景的高度定制,可同時(shí)進(jìn)行數(shù)據(jù)并行和任務(wù)并行計(jì)算,進(jìn)而實(shí)現(xiàn)高性能、低功耗。FPGA一次性成本遠(yuǎn)低于ASIC,在芯片需求還未成規(guī)模、深度學(xué)習(xí)算法暫未穩(wěn)定,仍需不斷迭代改進(jìn)的情況下,利用FPGA具有可重構(gòu)的特性來實(shí)現(xiàn)半定制的AI芯片是最佳選擇之一。FPGA可以面向前端推理場景靈活設(shè)定功能,目前在人工智能推理市場應(yīng)用廣泛。
(3)ASIC
ASIC(Application Specific Integrated Circuits,專用集成電路),是指應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計(jì)、制造的集成電路。ASIC芯片可以面向一些成熟或特定的深度學(xué)習(xí)算法,定制電路和專用指令集,使效率和能效比達(dá)到最優(yōu)。當(dāng)前ASIC芯片主要面向人工智能推理應(yīng)用場景。針對特定用戶場景使用FPGA 進(jìn)行研發(fā),當(dāng)算法成熟、芯片設(shè)計(jì)固定后再以ASIC 的方式進(jìn)行大規(guī)模生產(chǎn),針對適用應(yīng)用場景,ASIC的性能和能耗都要優(yōu)于市場上的現(xiàn)有芯片,包括 FPGA 和 GPU。
TPU(張量處理單元,Tensor Processing Units),是一種定制化的ASIC芯片,TPU的單片存儲器容量是NVIDIA K80 GPU的3.5倍,但是它的體積相對更小。谷歌TPU已為谷歌的主要產(chǎn)品提供了計(jì)算支持,第一代 TPU 僅能用于推理,而目前發(fā)布的 TPU2.0 既可以用于推理,又可以用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
(4)類腦芯片
類腦芯片(Brain-Inspired Chip),可模擬人類大腦信息處理方式,能以極低的功耗對信息進(jìn)行異步、并行、低速和分布式處理,并具備自主感知、識別和學(xué)習(xí)等多種能力,使之能夠在推理、決策、記憶等方面達(dá)到類人智能水平。類腦芯片把數(shù)字處理器當(dāng)作神經(jīng)元,把內(nèi)存作為突觸,跟傳統(tǒng)馮諾依曼結(jié)構(gòu)不一樣,它的內(nèi)存、CPU和通信部件是完全集成在一起。因此信息的處理完全在本地進(jìn)行,而且由于本地處理的數(shù)據(jù)量并不大,傳統(tǒng)計(jì)算機(jī)內(nèi)存與CPU之間的瓶頸不復(fù)存在。
類腦智能借鑒大腦中“內(nèi)存與計(jì)算單元合一”等信息處理的基本規(guī)律,在硬件實(shí)現(xiàn)與軟件算法等多個(gè)層面,對于現(xiàn)有的計(jì)算體系與系統(tǒng)做出本質(zhì)的變革,并實(shí)現(xiàn)在計(jì)算能耗、計(jì)算能力與計(jì)算效率等方面的大幅改進(jìn)。IBM已經(jīng)開始進(jìn)行顛覆馮·諾依曼體系結(jié)構(gòu)的類腦智能算法與技術(shù)的探索,并已成功研制出TrueNorth芯片。
2.AI芯片特征對照及國內(nèi)外主要研制廠商
不同類型的芯片在通用性、應(yīng)用兼容性、編程難度、性能、能效比等方面具有各自的優(yōu)缺點(diǎn),適用于訓(xùn)練、推理等不同的應(yīng)用場景。不同類型AI芯片的特征和優(yōu)缺點(diǎn)如表1所示。
表1 不同類型AI芯片的特征和優(yōu)缺點(diǎn)
當(dāng)前,AI芯片的核心技術(shù)和市場被美國廠商壟斷,雖然國內(nèi)一些廠商也在進(jìn)行AI芯片研制,但無論是技術(shù)成熟度還是市場占有率等方面,與國際巨頭的差距仍然非常明顯。AI芯片國內(nèi)外主要研制廠商如表2所示。
表2 AI芯片國內(nèi)外主要研制廠商
GPU:憑借GPU在當(dāng)前人工智能市場的主導(dǎo)地位,NVIDIA在AI芯片市場一家獨(dú)大。AMD新發(fā)布的GPU產(chǎn)品已經(jīng)實(shí)現(xiàn)了對主流AI框架軟件的良好支持,上升勢頭明顯。Intel也正在進(jìn)行GPU研發(fā)。在國內(nèi),目前海光公司正在按進(jìn)度推進(jìn)類GPU(DPU)芯片研制,目前已經(jīng)取得階段性進(jìn)展。
FPGA:市場份額排名第二的AI芯片F(xiàn)PGA,當(dāng)前完全被美國的兩家公司Xilinx和Intel(收購的Altera)所壟斷,全球市場占有率達(dá)90%。目前國內(nèi)從事FPGA芯片研發(fā)的廠商有紫光同創(chuàng)(Titan)、復(fù)旦微電子等企業(yè),其FPGA產(chǎn)品相比美國廠商落后一代,且產(chǎn)品性能只能達(dá)到國外品牌上一代同系列產(chǎn)品的中高端水平,尚不具備可抗衡實(shí)力。
ASIC:國內(nèi)多采用ASIC芯片架構(gòu)進(jìn)行創(chuàng)新,ASIC芯片相比國外廠商差距相對較小,特別是在芯片本身的性能和能效比方面,而在高性能 GPU 和 FPGA 芯片領(lǐng)域研發(fā)相對滯后。如寒武紀(jì)等的ASIC芯片已形成了量產(chǎn)產(chǎn)品。但相比國外巨頭仍然存在一些先天差距,如Google研制的TPU,可以和自己研發(fā)并開源的主流深度學(xué)習(xí)框架Tensor Flow進(jìn)行深入整合和優(yōu)化,有軟件生態(tài)的加持,將具有更好的生存優(yōu)勢。
二、我國發(fā)展人工智能的三個(gè)建議
(一)打造我國人工智能軟硬件產(chǎn)業(yè)生態(tài)
PC時(shí)代的Wintel體系(微軟+Intel),以及移動終端時(shí)代的AA體系(ARM + Android),都是通過打造完整的產(chǎn)業(yè)生態(tài)來把控產(chǎn)業(yè)的主導(dǎo)權(quán),并且處于絕對的行業(yè)壟斷地位。人工智能產(chǎn)業(yè)屬于新型領(lǐng)域,目前尚未形成絕對主導(dǎo)的技術(shù)路徑依賴,產(chǎn)業(yè)生態(tài)也沒有形成絕對的壁壘,軟硬件協(xié)同優(yōu)化已成為提升技術(shù)的主要手段,單純的數(shù)據(jù)與算法優(yōu)化已不能滿足產(chǎn)業(yè)發(fā)展需求。
面對這一發(fā)展契機(jī),我國應(yīng)強(qiáng)化人工智能產(chǎn)業(yè)發(fā)展頂層設(shè)計(jì),加強(qiáng)人工智能軟硬件協(xié)同布局,如,鼓勵百度飛槳Paddle Paddle、曠視、商湯Parrots、華為Mind Spore等軟件框架企業(yè),與寒武紀(jì)(MLU)、華為(昇騰)、阿里(含光)、中星微(NPU)、比特大陸(算豐)、地平線、百度(昆侖)、海光(DPU)、紫光同創(chuàng)(Titan)、復(fù)旦微電子等AI芯片企業(yè)強(qiáng)強(qiáng)聯(lián)合,重點(diǎn)布局我國自主知識產(chǎn)權(quán)的“框架軟件+AI芯片”的人工智能生態(tài)體系,力爭五年內(nèi)在人工智能領(lǐng)域占據(jù)主導(dǎo)優(yōu)勢。
(二)采取全面布局、分步突破的芯片發(fā)展路徑
AI芯片的核心技術(shù)和市場均處于被美國廠商壟斷的狀態(tài),雖然國內(nèi)一些廠商也在進(jìn)行AI芯片研制,但無論是技術(shù)成熟度還是市場占有率方面,與國際巨頭的差距仍然非常明顯。目前來看我國GPU及FPGA基本完全依賴進(jìn)口。GPU方面全球70%的市場都被NVIDIA占據(jù)。FPGA呈現(xiàn)寡頭壟斷的競爭格局,美國兩家公司Xilinx和Intel(收購的Altera)所壟斷,全球市場占有率達(dá)到90%。三款A(yù)I芯片總體來看,ASIC國產(chǎn)化程度相對較好。
因此,現(xiàn)階段針對我國AI芯片的現(xiàn)實(shí)情況,可采取全面布局、分步突破的發(fā)展路徑,近期重點(diǎn)突破專用芯片ASIC,遠(yuǎn)期依次突破GPU、FPGA等通用芯片。由于ASIC專用性較強(qiáng),不同廠商往往會根據(jù)特定的應(yīng)用場景需求進(jìn)行有針對性的研發(fā),而GPU、FPGA等通用芯片由于目前國外有較為成熟的標(biāo)準(zhǔn)化產(chǎn)品,國內(nèi)廠商自主研發(fā)或國產(chǎn)化替代的意愿并不強(qiáng)烈。因此從產(chǎn)業(yè)布局角度來看,政府應(yīng)加大力度助力有條件有意愿的企業(yè),在GPU、FPGA等通用芯片研制方面投入精力實(shí)現(xiàn)分步突破。
(三)加強(qiáng)類腦芯片等前沿領(lǐng)域的布局
類腦芯片研發(fā)領(lǐng)域?qū)儆谇罢靶灶I(lǐng)域,目前企業(yè)在此方面并不會過多涉及,因此應(yīng)充分發(fā)揮國內(nèi)高校以及科研院所力量進(jìn)行充分布局。目前,IBM研制的TrueNorth芯片作為類腦計(jì)算領(lǐng)域的突破性進(jìn)展,極大地推進(jìn)了人工智能的發(fā)展,但類腦計(jì)算仍存在很大的發(fā)展空間。隨著存儲、邏輯、傳感技術(shù)的改進(jìn),將來類腦計(jì)算芯片有望達(dá)到更低能耗、更緊湊結(jié)構(gòu)和更快速度。
我國針對類腦芯片的研究尚處于理論階段,國際龍頭企業(yè)還沒有形成明確的技術(shù)及知識產(chǎn)權(quán)壁壘,因此全球科技產(chǎn)業(yè)巨頭都在積極推動人工智能技術(shù)生態(tài)的研發(fā)布局,全力搶占人工智能產(chǎn)業(yè)的制高點(diǎn)和話語權(quán)。
三、結(jié)語
人們對人工智能的期望,絕不僅用來解決狹窄的、特定領(lǐng)域的某個(gè)簡單具體的小任務(wù),而是期望能夠真正像人類一樣,解決不同領(lǐng)域、不同類型的復(fù)雜問題,并進(jìn)行判斷和決策。
發(fā)展人工智能的終極目標(biāo)也不是要替代人類智能,而是要與人類智能形成優(yōu)勢互補(bǔ),幫助人類處理許多雖然能夠處理但效率不夠高的工作,使得人類從繁重的重復(fù)性工作中解放出來,從而專注于推動人類自身文明的進(jìn)步。
評論
查看更多