對英特爾來說,“CPU巨頭”的標簽已經(jīng)深入人心。不過,在最近兩個月,CPU在英特爾的關(guān)注度被軟件和獨立GPU搶了風(fēng)頭。不知從何時起,“軟件為先”和“XPU”已經(jīng)成為英特爾新的流行詞。同樣,英偉達對ARM的收購,以及AMD對賽靈思的收購,也昭示著芯片巨頭們與英特爾的“不謀而合”,它們紛紛將未來的布局瞄準了同一個方向:異構(gòu)計算。
“通用”與“專用”相向而行
從20世紀60年代的字符終端時代到如今的智能計算時代,數(shù)據(jù)的量和質(zhì)都發(fā)生了顯著的變化。以文本、圖表為主的結(jié)構(gòu)化數(shù)據(jù)比例不斷下降,融媒體數(shù)據(jù)、實時處理的傳感級數(shù)據(jù)等非結(jié)構(gòu)數(shù)據(jù),以及深度學(xué)習(xí)的元數(shù)據(jù)的持續(xù)激增,將越來越多種類、精度的數(shù)據(jù)以更快的速度進行傳輸和處理,并成為智能計算的剛需。
作為通用處理器的代表型廠商,英特爾已經(jīng)將異構(gòu)計算作為應(yīng)對AI時代算力挑戰(zhàn)的關(guān)鍵戰(zhàn)略。如果將數(shù)據(jù)看作食材,CPU就相當于“瑞士軍刀”,適用于一切食材,卻不一定能將所有食材處理得又快又好。GPU、FPGA、DSP等專用處理器的加入,讓計算架構(gòu)能更有效地應(yīng)對場景化數(shù)據(jù)。
“異構(gòu)計算的產(chǎn)業(yè)的基礎(chǔ)是數(shù)據(jù)的爆炸式增長,這其實是我們發(fā)展異構(gòu)計算的主要驅(qū)動力?!庇⑻貭柤軜?gòu)、圖形和軟件集團副總裁兼中國區(qū)總經(jīng)理謝曉清在接受《中國電子報》采訪時指出,“CPU提供的是通用型計算的能力,解決的問題很廣義。但是GPU、FPGA,或者AI加速芯片解決的是特定領(lǐng)域的問題?,F(xiàn)在很多數(shù)據(jù)的產(chǎn)生都有一定的特點,以至于在CPU上的運算效果不一定是最理想的,在GPU或者其他并行計算能力高的芯片上會跑得更好,這是異構(gòu)計算的主要驅(qū)動力?!?/p>
作為專用處理器廠商,賽靈思從器件向異構(gòu)平臺的轉(zhuǎn)變也已開始。賽靈思大中華區(qū)核心市場業(yè)務(wù)發(fā)展總監(jiān)酆毅向《中國電子報》記者指出,智能駕駛正在從ADAS逐漸向全面自動駕駛持續(xù)演進,傳感器數(shù)量的增多勢必會帶來爆炸式的數(shù)據(jù)增長,這就需要汽車具備強大的異構(gòu)計算平臺。在工業(yè)視覺領(lǐng)域,機器人技術(shù)、工業(yè)PC、I/O的模塊、智能傳感器、人機界面等都在產(chǎn)生不同類型的數(shù)據(jù)。在專業(yè)音視頻和廣播領(lǐng)域,從內(nèi)容采集到內(nèi)容消費的全部過程也需要遠程管理不同的服務(wù)器和計算平臺。
“單獨的計算架構(gòu),無法滿足越來越多樣的開發(fā)需求,因此,異構(gòu)計算是未來的發(fā)展之路。”酆毅指出,“伴隨工藝的進步,F(xiàn)PGA也打破了傳統(tǒng)的應(yīng)用邊界,進入到AI、數(shù)據(jù)中心、視頻處理、自動駕駛、5G等新興領(lǐng)域中。而FPGA也通過集成標量處理引擎、自適應(yīng)硬件引擎和智能引擎,完成了從器件到異構(gòu)平臺的轉(zhuǎn)變。”
引發(fā)芯片巨頭割據(jù)戰(zhàn)
在很長一段時間里,處理器市場維持著英特爾、英偉達各自引領(lǐng)CPU和GPU的狀態(tài),且AMD在兩個市場均為第二。如今,這種局面正在被打破。通過一連串基于收購和自研的“補課”行為,三大處理器頭部廠商都在向CPU+GPU+FPGA/NPU的方向靠攏,為異構(gòu)計算儲備“彈藥”。
上個月,英特爾時隔22年重返獨顯市場,正式發(fā)布獨立顯卡iRIS Xe Max。眾所周知,英特爾從2015年起,陸續(xù)收購了當時第二大FPGA廠商Altera、自動駕駛視覺處理公司Mobileye和云端AI推理芯片Habana Labs等一系列芯片廠商,充實了FPGA和AI專用芯片的產(chǎn)品線。獨立顯卡的發(fā)布,不僅讓英特爾彌補了PC產(chǎn)品線的關(guān)鍵零部件,也補齊了XPU異構(gòu)計算架構(gòu)的關(guān)鍵拼圖。
AMD對賽靈思的收購,也釋放出強化異構(gòu)計算布局的信號。在具備“CPU+GPU”計算架構(gòu)的基礎(chǔ)上,F(xiàn)PGA的可編程特質(zhì),能進一步提升計算平臺的靈活性,從而適應(yīng)AI時代根據(jù)不同工作負載進行加速的需求。同時,賽靈思在異構(gòu)計算上也有所積累,已推出Versal ACAP異構(gòu)計算平臺,以縮短車載多傳感器同步和融合所帶來的系統(tǒng)整體響應(yīng)時間。據(jù)酆毅介紹,賽靈思圍繞異構(gòu)計算的布局已在兩年前開始,包括智能駕駛、專業(yè)音視頻、工業(yè)等相關(guān)領(lǐng)域,都緊密圍繞著異構(gòu)計算的數(shù)據(jù)需求進行開發(fā)。
對于英偉達,收購ARM不僅彌補了缺乏CPU的短板,也將英偉達的AI計算平臺拓展到移動生態(tài)。值得注意的是,ARM也在異構(gòu)計算有所著墨。基于開源的開發(fā)框架ARM NN,開發(fā)者可以調(diào)動ARM CPU、GPU及NPU,實現(xiàn)異構(gòu)AI開發(fā)。據(jù)悉,在去年舉辦的ISC 2019國際超算大會上,英偉達宣布,計劃利用其GPU與使用ARM架構(gòu)的CPU協(xié)作打造超級計算機。在宣布對ARM的收購計劃后,英偉達再次強調(diào)將建造搭載ARM CPU的AI超級計算機?!俺恪庇型蔀橛ミ_與ARM合流異構(gòu)計算的第一個“練兵場”。
如何應(yīng)對“跨生態(tài)”挑戰(zhàn)
“軟件優(yōu)先。”談及異構(gòu)計算的布局思路,謝曉清向記者表示,“在設(shè)計硬件、芯片的時候,甚至在設(shè)計指令集的時候,我們會以軟件優(yōu)先的原則去做?!?/p>
異構(gòu)計算帶來的硬件復(fù)雜性,對編程人員提出了嚴苛的挑戰(zhàn)。如果異構(gòu)計算包含CPU、GPU、FPGA、ASIC四種硬件,就意味著編程人員必須掌握四種硬件的優(yōu)化代碼,才能編寫或遷移程序。屏蔽硬件復(fù)雜性的軟件平臺已經(jīng)成為異構(gòu)計算的必備工具。
oneAPI是英特爾為異構(gòu)計算架構(gòu)打造的開源軟件平臺,使開發(fā)者可以選擇熟悉的語言、單一的代碼庫以及統(tǒng)一的編程模型,來開發(fā)跨架構(gòu)的應(yīng)用程序。
“我們希望生成一個軟件生態(tài),使應(yīng)用程序開發(fā)商基于統(tǒng)一、開放的規(guī)范進行開發(fā)工作,不會因為軟件從CPU遷移到GPU或者是FPGA而進行任何的修改或重復(fù)投資?!?謝曉清說。
英特爾不是唯一意識到異構(gòu)計算需要“軟硬兼施”的廠商。在軟件平臺方面,英偉達推出了CUDA,AMD推出了ROCm,華為也陸續(xù)推出了Atlas、CANN等面向異構(gòu)場景的平臺及架構(gòu)。
異構(gòu)計算的復(fù)雜性和融合性,意味著各大廠商一開始就從生態(tài)競爭的維度進行布局。那么,多種生態(tài)競爭并存的關(guān)系,是否會讓開發(fā)者在免除跨架構(gòu)開發(fā)的麻煩后,又陷入“跨生態(tài)”開發(fā)的困難?
對此,謝曉清認為,如果各家將中間平臺統(tǒng)一起來,形成相對統(tǒng)一的框架,可以在保持差異性的同時降低上層應(yīng)用的開發(fā)難度。
“如果各個芯片廠商都從最底層做軟件,重復(fù)投資會非常大。在理想情況下,應(yīng)當有一個框架,在這個框架下每家做好自己的硬件優(yōu)化。對上層應(yīng)用開發(fā)者來說,硬件復(fù)雜性被屏蔽掉,且編譯器、庫函數(shù)、接口等均已定義好,在這個統(tǒng)一的框架下再開發(fā)編程即可。在運行應(yīng)用的時候,負載會自動流向最合適的硬件,這可能是未來異構(gòu)計算的理想情況?!敝x曉清說。
責(zé)任編輯:tzh
-
處理器
+關(guān)注
關(guān)注
68文章
19384瀏覽量
230488 -
FPGA
+關(guān)注
關(guān)注
1630文章
21772瀏覽量
604663 -
芯片
+關(guān)注
關(guān)注
456文章
51026瀏覽量
425430 -
cpu
+關(guān)注
關(guān)注
68文章
10889瀏覽量
212396
發(fā)布評論請先 登錄
相關(guān)推薦
評論