編者按
2015年,亞馬遜AWS收購Annapurna,開始了芯片自研之路。差不多同一時(shí)間,谷歌自研的AI芯片TPU也開始在內(nèi)部使用。從此,互聯(lián)網(wǎng)云計(jì)算公司紛紛開始了自研芯片之路,這成為了這些年IC行業(yè)重要的趨勢(shì)。
于是,大家開始認(rèn)為,各家互聯(lián)網(wǎng)公司有自己的差異化競(jìng)爭(zhēng)力,需要針對(duì)性定制的芯片來支撐,認(rèn)為芯片定制是未來趨勢(shì)。甚至有一些知名的芯片公司,開始為客戶提供定制化服務(wù)。
但需要大家厘清的一個(gè)事情是:
商業(yè)層次。定制芯片是可行的,許多大客戶有這個(gè)訴求。這塊的論述不是本文的重點(diǎn)。
技術(shù)層次。大芯片功能定制則是不可行的,技術(shù)層次的大芯片架構(gòu)和設(shè)計(jì)實(shí)現(xiàn)需要足夠通用。本篇文章,會(huì)就技術(shù)層面進(jìn)行詳細(xì)分析。
大算力芯片,定制還是通用?向左還是向右?
1 從歷史中借鑒
CPU之前,幾乎所有的芯片功能都是固定的,我們只能對(duì)芯片施加一些基本的控制。要想有不同的功能,就需要不同的芯片。而CPU解決了這一問題,CPU通過支持各類基礎(chǔ)的加減乘除以及各類控制類指令等,然后再通過這些指令,組織成非常復(fù)雜并且功能強(qiáng)大的程序,或者稱為軟件。 CPU最大的價(jià)值在于提供并規(guī)范了標(biāo)準(zhǔn)化的指令集,使得軟件和硬件從此解耦:
硬件工程師不需要關(guān)心場(chǎng)景,只關(guān)注于通過各種“無所不用其極”的方式,快速的提升CPU的性能。
軟件工程師,則完全不用考慮硬件的細(xì)節(jié),只關(guān)注于程序本身。然后有了高級(jí)編程語言/編譯器、操作系統(tǒng)以及各種系統(tǒng)框架/庫的支持,構(gòu)建起一個(gè)龐大的軟件生態(tài)超級(jí)帝國。
從圖中,可以看到,在差不多40年的時(shí)間里,CPU的整體性能提升接近50000倍。一方面,這有賴于處理器架構(gòu)的翻天覆地變化,也有賴于半導(dǎo)體工藝的進(jìn)步。另一方面,更有賴于通過標(biāo)準(zhǔn)化的指令集,使得CPU平臺(tái)的硬件實(shí)現(xiàn)和軟件編程完全解耦,沒有了對(duì)方的掣肘,軟件和硬件均可以完全地放飛自我。
1.2 GPU到GPGPU
GPU,Graphics Processing Units,圖形處理單元。顧名思義,GPU是主要用于做圖形圖形處理的專用加速器。GPU內(nèi)部處理是由很多并行的計(jì)算單元支持,如果只是用來做圖形圖像處理,有點(diǎn)“暴殄天物”,其應(yīng)用范圍太過狹窄。 因此把GPU內(nèi)部的計(jì)算單元進(jìn)行通用化重新設(shè)計(jì),GPU變成了GPGPU。到2012年,GPU已經(jīng)發(fā)展成為高度并行的眾核系統(tǒng),GPGPU有強(qiáng)大的并行處理能力和可編程流水線,既可以處理圖形數(shù)據(jù),也可以處理非圖形數(shù)據(jù)。特別是在面對(duì)SIMD類指令,數(shù)據(jù)處理的運(yùn)算量遠(yuǎn)大于數(shù)據(jù)調(diào)度和傳輸?shù)倪\(yùn)算量時(shí),GPGPU在性能上大大超越了傳統(tǒng)的CPU應(yīng)用程序?,F(xiàn)在大家所稱呼的GPU通常都指的是GPGPU。 NVIDIA因?yàn)樵贕PGPU上的技術(shù)能力和市場(chǎng)占有率,成為了目前市值最高的芯片公司。 只考慮系統(tǒng)架構(gòu),GPGPU的成功可以總結(jié)為兩點(diǎn):
通過通用性設(shè)計(jì),拓寬了GPU的應(yīng)用領(lǐng)域和場(chǎng)景,使得其可以更大規(guī)模的落地;
通過通用性設(shè)計(jì),實(shí)現(xiàn)了軟硬件的解耦,軟件和硬件可以脫離對(duì)方的束縛,努力的提升“自我”。
1.3 從ASIC到DSA的回調(diào)
ASIC是定制芯片AS-IC,對(duì)應(yīng)的,可以把其他偏通用的IC稱之為GP-IC。一般來說, ASIC引擎“指令”復(fù)雜度最高,也即性能最極致。但實(shí)際上,受限于很多其他原因,ASIC的表現(xiàn)并不如大家想象的那么優(yōu)秀:
ASIC是定制的,沒有冗余,理論上是最極致的性能。但因?yàn)锳SIC是場(chǎng)景跟硬件設(shè)計(jì)完全耦合,硬件開發(fā)的難度很高,難以實(shí)現(xiàn)超大規(guī)模的ASIC設(shè)計(jì)。
理論上來說ASIC的資源效率是最高的,但由于ASIC覆蓋的場(chǎng)景較小,芯片設(shè)計(jì)為了覆蓋盡可能多的場(chǎng)景,不得不實(shí)現(xiàn)功能超集。實(shí)際的功能利用率和資源效率(相比DSA)反而不高。
ASIC功能完全確定,難以覆蓋復(fù)雜計(jì)算場(chǎng)景的差異化要求。差異化包含兩個(gè)方面:橫向的不同用戶的差異化需求,縱向的單個(gè)用戶的長期快速迭代。
即使同一場(chǎng)景,不同廠家的ASIC引擎設(shè)計(jì)依然五花八門,毫無生態(tài)可言。
DSA針對(duì)特定應(yīng)用場(chǎng)景定制處理引擎甚至芯片,支持部分軟件可編程。DSA與ASIC在同等晶體管資源下性能接近,兩者最大的不同在于是否可軟件編程。ASIC由于其功能確定,軟件只能通過一些簡(jiǎn)單的配置控制硬件運(yùn)行,其功能比較單一。而DSA則支持一些可編程能力,使得其功能覆蓋的領(lǐng)域范圍相比ASIC要大很多。 DSA,一方面可以實(shí)現(xiàn)ASIC一樣的極致的性能,另一方面,可以像通用CPU一樣執(zhí)行軟件程序。當(dāng)然了,DSA只會(huì)加速某些特定領(lǐng)域的應(yīng)用程序。例如:用于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)處理器以及用于SDN的網(wǎng)絡(luò)可編程處理器。
1.4 千萬種手持設(shè)備,最終都融合進(jìn)了智能手機(jī)
如上圖所示,周圍的這些形態(tài)和功能各異的各種電子設(shè)備,每一樣都具有特定的功能,滿足用戶形形色色的需求,但最終,都幾乎消失在歷史長河中。剩下的,就只有唯一的一個(gè)私人移動(dòng)終端——智能手機(jī)。 第一代iPhone面市時(shí),諾基亞工程師對(duì)其進(jìn)行了全面的研究,最終認(rèn)定,它不會(huì)對(duì)諾基亞產(chǎn)生威脅,原因是造價(jià)太高,并且只兼容2G網(wǎng)絡(luò),而且未能通過基本的抗摔測(cè)試。諾基亞引領(lǐng)了很多手機(jī)功能的“創(chuàng)新”,比如手機(jī)攝像、全功能鍵盤、塞班操作系統(tǒng),當(dāng)然也包括和弦鈴聲、換殼等。此時(shí)的諾基亞,市場(chǎng)占有率最高,如日中天。但是,諾基亞沒能擋住歷史的滾滾潮流,無法改變被市場(chǎng)無情拋棄的命運(yùn)。 智能機(jī)和功能機(jī)最大的區(qū)別是:功能機(jī)是提供產(chǎn)品功能給用戶;而智能機(jī)提供的產(chǎn)品是一個(gè)沒有具體功能的通用平臺(tái),通過安裝開發(fā)者開發(fā)的各種APP,給客戶提供不一樣的功能。這個(gè)改變,使得單個(gè)平臺(tái)就可以適配用戶數(shù)以萬計(jì)的各種個(gè)性化需求。
2 不同類型芯片考慮的因素
2.1 終端小規(guī)模芯片設(shè)計(jì)的思考邏輯
終端場(chǎng)景的小芯片,通常是以SOC方式存在的。一方面終端設(shè)備的數(shù)量龐大;另一方面,許多芯片不需要7nm、5nm這樣的先進(jìn)工藝,其研發(fā)成本也相對(duì)較低。研發(fā)成本在單芯片的成本占比非常低,更多的則是芯片本身量產(chǎn)時(shí)的成本。這類芯片,一定是優(yōu)先考慮芯片的面積等影響量產(chǎn)成本的因素。 除此以外,許多終端場(chǎng)景芯片是電池供電,這就對(duì)芯片的功耗的重視程度放在了第一位。功耗要求嚴(yán)格的話,勢(shì)必需要對(duì)一些不必要的功能進(jìn)行裁剪。不管是內(nèi)部模塊,還是整個(gè)SOC架構(gòu),一定是盡可能精簡(jiǎn)。 總結(jié)一下,終端場(chǎng)景,設(shè)備數(shù)量龐大,成本主要受量產(chǎn)成本的影響,并且功耗敏感。這樣,終端SOC,就表現(xiàn)為定制的特征。
2.2 數(shù)據(jù)中心為什么是以CPU為主?
跟終端場(chǎng)景相比,數(shù)據(jù)中心的需求卻又是另一個(gè)邏輯。這里有一個(gè)非常經(jīng)典的問題:終端非常流行SOC,但為什么數(shù)據(jù)中心服務(wù)器卻依然是CPU打天下? 越是復(fù)雜的場(chǎng)景,對(duì)系統(tǒng)靈活性的要求越高,而只有CPU能夠提供云場(chǎng)景所需的靈活性。CPU作為云計(jì)算場(chǎng)景的主力計(jì)算平臺(tái)有其合理性,主要體現(xiàn)在四個(gè)方面:
硬件的靈活性。軟件應(yīng)用迭代很快,支持軟件運(yùn)行的硬件處理引擎要能夠很好地支持這些迭代。ASIC這樣絕對(duì)定制的處理引擎不太適合云計(jì)算場(chǎng)景,而CPU因?yàn)槠潇`活的基礎(chǔ)指令編程的特點(diǎn),可以認(rèn)為是最適合云計(jì)算的處理引擎。
硬件的通用性。云計(jì)算廠家購買硬件服務(wù)器,然后把服務(wù)器打包成云服務(wù)器賣給不同的用戶,很難預(yù)測(cè)這些硬件服務(wù)器會(huì)運(yùn)行哪類工作任務(wù)。最好的辦法是采用完全通用的服務(wù)器,用在哪里都可以。這樣,CPU由于其絕對(duì)的通用性,成為云計(jì)算場(chǎng)景最優(yōu)的選擇。
硬件的利用率。云計(jì)算的基礎(chǔ)技術(shù)是虛擬化,通過虛擬化把資源切分,實(shí)現(xiàn)資源共享,以此提高資源利用并降低成本。而目前,只有CPU能夠?qū)崿F(xiàn)非常友好的硬件級(jí)別的虛擬化支持。
硬件的一致性。在終端場(chǎng)景,軟件依賴硬件,成為軟硬一體。在云計(jì)算數(shù)據(jù)中心,軟件和硬件是需要相互脫離的。在云計(jì)算場(chǎng)景,各種復(fù)雜系統(tǒng)交織在一起,形形色色各種任務(wù)混合運(yùn)行,這些任務(wù)隨時(shí)可能被創(chuàng)建、復(fù)制、遷移和銷毀。同一個(gè)軟件實(shí)體會(huì)在不同的硬件實(shí)體遷移,同樣的同一個(gè)硬件實(shí)體也需要運(yùn)行不同的軟件實(shí)體。這對(duì)硬件平臺(tái)的一致性提出了很高的要求。
在性能滿足要求的情況下,CPU就成了數(shù)據(jù)中心計(jì)算平臺(tái)的最佳選擇。
2.3 DSA的發(fā)展困境,說明:算力芯片需要性能提升,但不能損失通用靈活性
很不幸的是,CPU已經(jīng)達(dá)到了性能瓶頸。系統(tǒng)越來越復(fù)雜,需要選擇越來越靈活的處理器;而性能挑戰(zhàn)越來越大,需要我們選擇定制加速的處理器。這是一對(duì)矛盾,拉扯著我們的各類算力芯片設(shè)計(jì)。 谷歌TPU是第一個(gè)DSA架構(gòu)的AI加速芯片,從TPU開始,各類DSA架構(gòu)的AI芯片如雨后春筍般出現(xiàn)。但如今,差不多5年時(shí)間過去,AI芯片大規(guī)模落地的案例依然不多。最明星的谷歌TPU,目前也遇到了一些困境。 據(jù)“云頭條”公眾號(hào)報(bào)道:“谷歌發(fā)言人表示,重視TPU源自2018年至2021年在組織上和戰(zhàn)略上的混亂和迷茫,結(jié)果導(dǎo)致投入不足,對(duì)GPU支持并未給予應(yīng)有的重視度,以及缺乏與大型GPU供應(yīng)商英偉達(dá)的合作,不過這幾方面都在迅速改善。公司發(fā)言人表示,谷歌自己的內(nèi)部研究也主要致力于TPU,這導(dǎo)致GPU使用方面缺乏良好的反饋回路?!?/p>
谷歌TPU的困境可以簡(jiǎn)單總結(jié)為:底層芯片平臺(tái)和上層應(yīng)用算法的通用靈活性不匹配問題。上圖對(duì)各類處理引擎的性能和靈活性進(jìn)行了定性的分析,我們來進(jìn)一步分析,DSA架構(gòu)AI芯片的問題可以總結(jié)如下:
AI場(chǎng)景目前從性質(zhì)上來說,屬于應(yīng)用層次:算法眾多,模型眾多,而且算法迭代很快。因此,需要運(yùn)行AI的硬件平臺(tái)具有非常高的適應(yīng)性和靈活性。
實(shí)踐證明,目前,DSA架構(gòu)所能提供的靈活可編程能力無法滿足上層應(yīng)用和算法所需,因此DSA架構(gòu)的AI芯片落地出現(xiàn)困境。
實(shí)踐證明,GPGPU是目前AI算力的主流平臺(tái),因?yàn)镚PGPU的靈活可編程能力和AI算法的需求是相對(duì)匹配的。
AI芯片要想大規(guī)模落地,需要應(yīng)用和平臺(tái)兩方的相向而行:
隨著AI的發(fā)展成熟,場(chǎng)景和算法逐步成熟,AI場(chǎng)景逐步從應(yīng)用層次沉淀成基礎(chǔ)設(shè)施層次。也即對(duì)靈活可編程能力的要求降低。
DSA架構(gòu)AI芯片的持續(xù)創(chuàng)新,在保證性能極致的情況下,盡可能的持續(xù)提升芯片的靈活可編程能力。
3 大芯片,為什么一定要通用
3.1 系統(tǒng)復(fù)雜度上升,使得硬件平臺(tái)必須通用
小系統(tǒng),我們明確地知道使用場(chǎng)景和用戶需求是什么,并且系統(tǒng)的構(gòu)建成本低,場(chǎng)景也有足夠大的規(guī)模。那么可以設(shè)計(jì)一個(gè)功能確定的專用系統(tǒng)來滿足用戶場(chǎng)景需求。 但大系統(tǒng),面對(duì)的多個(gè)場(chǎng)景混合到一起的宏場(chǎng)景,每個(gè)場(chǎng)景用戶需求五花八門,多個(gè)場(chǎng)景疊加,就構(gòu)成了千千萬萬的差別化的用戶需求。如果再考慮到復(fù)雜系統(tǒng)中軟件的持續(xù)快速迭代,和硬件的復(fù)雜度和“漫長”生命周期。硬件構(gòu)建確定的功能,來直接滿足最終用戶的需求,幾乎是不可能的事情。一定要通過一個(gè)中間層,在相對(duì)通用的產(chǎn)品平臺(tái),開發(fā)用戶“千人千面”的功能需求。 系統(tǒng)越來越復(fù)雜以后,不要嘗試著幫助用戶決策,因?yàn)椋河脩舻臉I(yè)務(wù)也在快速的演進(jìn)發(fā)展中,用戶自己可能都不知道自己明天的需求是什么。把功能固化到硬件中,就變得不那么現(xiàn)實(shí)。需要構(gòu)建底層平臺(tái),然后通過中間層的框架、編程環(huán)境等,來開發(fā)特定的功能,以此來服務(wù)更上層的使用者。
3.2 芯片的研發(fā)成本,需要更多的量來攤薄
半導(dǎo)體工藝發(fā)展到現(xiàn)在,5nm芯片的研發(fā)成本大概是5個(gè)多億美金。芯片需要足夠的銷量,才能攤薄研發(fā)成本。 這個(gè)挑戰(zhàn)很大,這意味著在智能終端需要1億顆芯片,數(shù)據(jù)中心需要1百萬顆芯片的量才能有效攤薄研發(fā)成本。
3.3 不同用戶業(yè)務(wù)差異和用戶業(yè)務(wù)迭代
在SDN出現(xiàn)之前,主流的網(wǎng)絡(luò)設(shè)備基本是ASIC的,設(shè)備提供什么功能,用戶才能用什么功能。但是隨著云計(jì)算等更復(fù)雜的網(wǎng)絡(luò)場(chǎng)景出現(xiàn),對(duì)網(wǎng)絡(luò)協(xié)議和功能的個(gè)性化需求越來越多。當(dāng)用戶的需求反饋給芯片廠家(如博通、思科等),它們?cè)僭谛乱淮男酒邪l(fā)中心去支持(并且,是否支持新的協(xié)議或功能還需要內(nèi)部決策,有可能一些認(rèn)為不太重要的協(xié)議或功能就無法得到支持,并且小客戶提的需求就不會(huì)太多考慮),芯片開發(fā)完成后第一時(shí)間交付給用戶,然后等到用戶更新自己的軟件服務(wù),至少需要2年時(shí)間。這么長的周期,對(duì)互聯(lián)網(wǎng)云計(jì)算的客戶來說,是完全不可接受的。 不同用戶的業(yè)務(wù)存在差異;即使同一個(gè)用戶,其業(yè)務(wù)也會(huì)經(jīng)常性地更新迭代;甚至,一些大客戶內(nèi)部,不同部門之間的同一個(gè)場(chǎng)景的業(yè)務(wù)也存在差異。當(dāng)我們面對(duì)客戶千千萬的需求的時(shí)候,不能只做一個(gè)相對(duì)功能固定的產(chǎn)品,這樣無法滿足用戶差異化的場(chǎng)景需求;也無法做千千萬的產(chǎn)品來一一滿足,因?yàn)樾酒腘RE門檻使得這樣的做法就完全不可能;合適的做法則是做一個(gè)通用的平臺(tái)來盡可能地滿足所有需求。 二八定律,是計(jì)算機(jī)領(lǐng)域的一個(gè)常見的規(guī)律。如:CISC指令集太過冗繁,只有20%的指令經(jīng)常用到,這就是RISC指令集的基礎(chǔ);云計(jì)算,是一個(gè)由眾多服務(wù)組成服務(wù)分層體系,隨著不斷的抽象封裝,云運(yùn)營商接管了80%的眾多服務(wù)分層,而用戶只需要關(guān)注20%的應(yīng)用或函數(shù)。 當(dāng)面對(duì)錯(cuò)綜復(fù)雜的用戶差異性需求時(shí),相近場(chǎng)景問題的本質(zhì)必然是相同的。也即不同用戶的差異化需求,特征上是符合“二八定律”的。其中80%共性部分可以通過固化的硬件實(shí)現(xiàn),20%個(gè)性化的部分可以通過軟件編程實(shí)現(xiàn)。當(dāng)然,這里的軟硬件解耦非常考驗(yàn)芯片團(tuán)隊(duì)對(duì)場(chǎng)景和業(yè)務(wù)的整體把控能力,以及軟硬件解耦和再協(xié)同的能力。
4 案例:亞馬遜AWS自研NITRO芯片,通用和自研不矛盾
說到通用,大家一般會(huì)想到芯片公司提供的產(chǎn)品和解決方案;說到定制,大家一般會(huì)想到客戶自研或者找第三方合作伙伴深度合作。但其實(shí),通用和自研是不矛盾的,通用是技術(shù)路徑,自研是商業(yè)選擇,完全可以自研的同時(shí)做通用的產(chǎn)品,亞馬遜AWS就是典型的例子。 DPU/IPU的相關(guān)技術(shù)創(chuàng)新,是從亞馬遜AWS開始的。全球最早的DPU類產(chǎn)品,即亞馬遜AWS的第一代Nitro,是在AWS re:Invent 2017上發(fā)布的。初代Nitro本質(zhì)是一款CPU芯片,幾乎100%的計(jì)算都在CPU完成。之后,后續(xù)的幾代Nitro,開始逐步集成一些相對(duì)彈性一些的加速器。 為什么說Nitro最開始的產(chǎn)品是CPU呢,原因在于:
類似NVIDIA DPU,通過硬件加速實(shí)現(xiàn)了單顆芯片滿足整個(gè)DPU/IPU的工作,而在AWS的NITRO系統(tǒng)里,通常需要5張NITRO不同類型的卡來協(xié)作滿足需求。
從AWS的一些產(chǎn)品功能的描述中可以分析出,Nitro依然是一個(gè)充滿了通用可編程能力的芯片。
即使自研芯片,AWS依然盡可能地保持Nitro系統(tǒng)的通用可編程能力,審慎的加入各類加速引擎??梢钥闯?,其對(duì)通用靈活性的追求,明顯地高過了對(duì)性能的追求。
5 通用算力,支撐數(shù)字經(jīng)濟(jì)繁榮的必由之路
定制還是通用,在技術(shù)層面是一個(gè)技術(shù)選擇問題。但在更宏觀的層次來看,卻又是一個(gè)必須選擇的道路。 算力,是數(shù)字經(jīng)濟(jì)時(shí)代的核心生產(chǎn)力,算力對(duì)推動(dòng)科技進(jìn)步、促進(jìn)行業(yè)數(shù)字化轉(zhuǎn)型以及支撐經(jīng)濟(jì)社會(huì)發(fā)展發(fā)揮著重要的作用?!?020全球計(jì)算力指數(shù)評(píng)估報(bào)告》指出,算力指數(shù)平均提高1個(gè)點(diǎn),數(shù)字經(jīng)濟(jì)和GDP將分布增長0.33%和0.18%。2021年12月,Intel高級(jí)副總裁兼加速計(jì)算系統(tǒng)和圖形部門負(fù)責(zé)人Raja Koduri表示:要想實(shí)現(xiàn)《雪崩》和《頭號(hào)玩家》中天馬行空的體驗(yàn),需將現(xiàn)在的算力至少再提升1000倍;并認(rèn)為,元宇宙可能是繼Web和移動(dòng)互聯(lián)網(wǎng)之后的下一個(gè)主要的互聯(lián)網(wǎng)形態(tài)(也即Web3.0)。 要想算力千倍萬倍提升,不僅僅需要應(yīng)用算法、系統(tǒng)架構(gòu)、工藝封裝等全方位的巨大創(chuàng)新,還需要站在更宏觀更系統(tǒng)的角度,把各個(gè)層次、各個(gè)方向的創(chuàng)新進(jìn)行充分地整合。
首先,體現(xiàn)在微觀層次,算力芯片需要高性能。計(jì)算已經(jīng)從同構(gòu)計(jì)算走向異構(gòu)計(jì)算,但異構(gòu)計(jì)算解決單領(lǐng)域問題,把更多領(lǐng)域的異構(gòu)計(jì)算整合在一起,形成超異構(gòu)計(jì)算。計(jì)算,需要再從異構(gòu)計(jì)算走向超異構(gòu)計(jì)算。 其次,宏觀算力,需要算力芯片大規(guī)模部署。芯片想要大規(guī)模部署,就要能夠靈活地適應(yīng)更多的場(chǎng)景落地,滿足各個(gè)用戶差異化的需求,滿足上層應(yīng)用經(jīng)常性的、持續(xù)數(shù)年的業(yè)務(wù)邏輯迭代。也就是說,芯片的特性方面,需要支持更多的通用靈活可編程能力。 再次,宏觀算力需要充分利用。雖然,可以通過網(wǎng)絡(luò)把各自的計(jì)算設(shè)備連成一體,但其算力仍然是各自的孤島,這些算力無法共享和自動(dòng)化分配,這就需要把各自算力的孤島打通,主題體現(xiàn)在:
計(jì)算需要跨不同的計(jì)算引擎,軟件需要可以在CPU、GPU、DSA等架構(gòu)處理引擎上運(yùn)行;
計(jì)算需要跨不同芯片廠家的平臺(tái),這對(duì)平臺(tái)的一致性提出要求,需要形成開放的架構(gòu)和生態(tài);
計(jì)算需要跨云、網(wǎng)、邊、端設(shè)備,實(shí)現(xiàn)云網(wǎng)邊端的融合;
計(jì)算需要跨不同的CSP的不同數(shù)據(jù)中心,以及不同廠家、不同品牌、不同類型的終端設(shè)備。
萬物互聯(lián),不僅僅是各個(gè)云邊端設(shè)備之間的通信互聯(lián),更是把大大小小的設(shè)備算力連成了一體,如臂使指。這就需要開放的計(jì)算生態(tài)。 總之,通用的、開放的算力技術(shù)生態(tài),是整個(gè)數(shù)字經(jīng)濟(jì)社會(huì)持續(xù)繁榮發(fā)展的必由之路。
編輯:黃飛
評(píng)論
查看更多