以技術(shù)驅(qū)動(dòng)創(chuàng)新,以芯力量擁抱數(shù)智未來(lái)?!缎臼隆吩L談對(duì)話科技創(chuàng)新者、引領(lǐng)者,探索創(chuàng)芯之路,共建硬核算力,賦能科技創(chuàng)新。
媒體合作|eefocus與非網(wǎng)
本期《芯事》人物
張獻(xiàn)濤
阿里云彈性計(jì)算產(chǎn)品線總經(jīng)理
十多年前,當(dāng)業(yè)界還在探討“云計(jì)算將給IT產(chǎn)業(yè)格局帶來(lái)什么變化”時(shí),也許并沒(méi)有想到云計(jì)算會(huì)從當(dāng)初的抽象構(gòu)想成為全球產(chǎn)業(yè)變革的必由之路,并成長(zhǎng)為重要的經(jīng)濟(jì)引擎。
時(shí)至今日,云計(jì)算推動(dòng)的產(chǎn)業(yè)、商業(yè)和社會(huì)變革,已經(jīng)匯聚成承前啟后的關(guān)鍵力量,成長(zhǎng)為數(shù)字經(jīng)濟(jì)的核心生產(chǎn)力,而面向ChatGPT等AI應(yīng)用掀起的新革命,云計(jì)算的創(chuàng)新活力還將持續(xù)釋放,芯片作為重要的算力支撐也將發(fā)揮更大的價(jià)值。
本期《芯事》訪談,與非網(wǎng)采訪到阿里云智能基礎(chǔ)產(chǎn)品部副總裁、阿里云彈性計(jì)算產(chǎn)品線總經(jīng)理張獻(xiàn)濤。
三步見(jiàn)證中國(guó)云計(jì)算發(fā)展
張獻(xiàn)濤在回顧起云計(jì)算發(fā)展的早期階段時(shí)調(diào)侃,“大約在2014年左右,當(dāng)時(shí)還處于傳統(tǒng)算力向云計(jì)算的轉(zhuǎn)移過(guò)程中,用戶多是中小站長(zhǎng)為代表的個(gè)人開(kāi)發(fā)者,負(fù)載可能就是一些中小企業(yè)的網(wǎng)站,不會(huì)有太多客戶關(guān)注高可用性、高性能等指標(biāo)?!?/p>
時(shí)間來(lái)到2015年,新一輪移動(dòng)互聯(lián)網(wǎng)爆發(fā)了,以互聯(lián)網(wǎng)公司為代表的技術(shù)型企業(yè),逐步推動(dòng)傳統(tǒng)IT系統(tǒng)向基于云的IT系統(tǒng)轉(zhuǎn)移。“云計(jì)算的第二發(fā)展階段拉開(kāi)了大幕,對(duì)IaaS、SaaS高穩(wěn)定性、高性能的需求爆發(fā)了?!睆埆I(xiàn)濤說(shuō)道,“也就是在這個(gè)時(shí)間節(jié)點(diǎn),阿里云開(kāi)始了戰(zhàn)略轉(zhuǎn)型,從傳統(tǒng)的服務(wù)中小站長(zhǎng)用戶,面向移動(dòng)互聯(lián)網(wǎng)場(chǎng)景的大信息流、高實(shí)時(shí)性、高性能、高并發(fā)的場(chǎng)景做出調(diào)整。正因如此,我們也承接了移動(dòng)互聯(lián)網(wǎng)發(fā)展的一波紅利,迎來(lái)了中國(guó)云計(jì)算市場(chǎng)的爆發(fā)式增長(zhǎng)?!?/p>
2020年以后,云計(jì)算進(jìn)入了第三發(fā)展階段。張獻(xiàn)濤表示,“云計(jì)算開(kāi)始縱深發(fā)展,上云的趨勢(shì)從消費(fèi)互聯(lián)網(wǎng)向產(chǎn)業(yè)互聯(lián)網(wǎng)轉(zhuǎn)移,以產(chǎn)業(yè)客戶為代表的傳統(tǒng)企業(yè)上云的訴求越來(lái)越明顯。”
這對(duì)云計(jì)算其實(shí)提出了較大的挑戰(zhàn),因?yàn)樾枰U峡蛻魳I(yè)務(wù)在連續(xù)、不間斷的情況下,能夠遷移到云的架構(gòu)。也正是在這個(gè)關(guān)鍵節(jié)點(diǎn),阿里云開(kāi)始了包括計(jì)算架構(gòu)、處理器、存儲(chǔ)等核心技術(shù)的創(chuàng)新變革。
軟硬協(xié)同設(shè)計(jì)應(yīng)“云”而生
在傳統(tǒng)IT時(shí)代,軟件和硬件之間的依存程度并不高,可以分離演進(jìn),并行發(fā)展。但是進(jìn)入云計(jì)算時(shí)代,軟硬件分離迭代的模式逐步顯現(xiàn)出局限性。應(yīng)用變得越來(lái)越復(fù)雜,算法、軟件和硬件的隔閡,已經(jīng)無(wú)法滿足在超大規(guī)模計(jì)算場(chǎng)景下提升IT計(jì)算效率、降低計(jì)算成本的訴求。如何最大化發(fā)揮“云”的價(jià)值,實(shí)現(xiàn)應(yīng)用快速上線且高效運(yùn)行成為發(fā)展的關(guān)鍵。
“其實(shí)這也提供了一個(gè)機(jī)會(huì),如果你對(duì)硬件、系統(tǒng)軟件、中間件等都掌握的話,你就可以很好地進(jìn)行軟硬件協(xié)同設(shè)計(jì),這是云計(jì)算時(shí)代一種新的技術(shù)紅利?!睆埆I(xiàn)濤表示,“我們當(dāng)時(shí)就在深入思考,既然硬件系統(tǒng)、軟件系統(tǒng)都是自研,下一步我們?nèi)绾螐能浖x硬件、定義芯片的視角,來(lái)做軟硬件協(xié)同的設(shè)計(jì)?”
當(dāng)時(shí),傳統(tǒng)的虛擬化技術(shù)應(yīng)用到云計(jì)算過(guò)程中,其實(shí)存在非常多問(wèn)題,比如算力損耗等,而這通常意味著計(jì)算成本可能會(huì)隨之增加。張獻(xiàn)濤談到,“所以在當(dāng)時(shí)的時(shí)間點(diǎn)上,我們首先需要通過(guò)軟硬件協(xié)同設(shè)計(jì),解決傳統(tǒng)虛擬化技術(shù)帶來(lái)的這些問(wèn)題。不過(guò)這一挑戰(zhàn)非常大,因?yàn)楝F(xiàn)有芯片無(wú)法滿足這些需求,我們幾乎評(píng)估了業(yè)界的所有芯片后,決定重新設(shè)計(jì)芯片、設(shè)計(jì)硬件、設(shè)計(jì)服務(wù)器的計(jì)算架構(gòu),并且對(duì)整個(gè)系統(tǒng)軟件棧進(jìn)行重構(gòu),這是一個(gè)浩大的工程。”
后來(lái)的事實(shí)證明,阿里云當(dāng)時(shí)的這一決定極具前瞻性,使它既享受了軟硬件協(xié)同設(shè)計(jì)所實(shí)現(xiàn)的技術(shù)紅利,同時(shí)也給云計(jì)算客戶帶來(lái)更多收益,比如更低的成本、更優(yōu)質(zhì)的算力服務(wù)等。根據(jù)IDC數(shù)據(jù),阿里云數(shù)年來(lái)穩(wěn)居公有云市場(chǎng)排名第一的位置,并領(lǐng)跑金融云、視頻云等領(lǐng)域。
從“芯”出發(fā),為云而生
近年來(lái),跨界造芯成為科技界的一大趨勢(shì),不論是云計(jì)算大廠、AI算法公司或是車(chē)企,對(duì)于芯片的關(guān)注度越來(lái)越高。在這些跨入芯片圈的企業(yè)中,阿里巴巴旗下的平頭哥可以說(shuō)是國(guó)內(nèi)起步最早的企業(yè)之一,一個(gè)核心的研發(fā)方向就是數(shù)據(jù)中心芯片。
成立于2018年的平頭哥,正處于云計(jì)算的拐點(diǎn)之上。
還記得2017年左右,阿里云的廣告語(yǔ)“上云就上阿里云”,雄踞國(guó)內(nèi)各大機(jī)場(chǎng)。短短一句話,傳遞了云計(jì)算當(dāng)時(shí)正在進(jìn)行的變革和創(chuàng)新——它不再是互聯(lián)網(wǎng)企業(yè)的特有應(yīng)用,而是逐漸蔓延到傳統(tǒng)領(lǐng)域,向千行百業(yè)的企業(yè)發(fā)出“上云”邀請(qǐng)。一個(gè)趨勢(shì)已經(jīng)顯現(xiàn)——云計(jì)算將擴(kuò)展到大數(shù)據(jù)、AI、物聯(lián)網(wǎng)等領(lǐng)域,共同成為傳統(tǒng)企業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型、我國(guó)發(fā)展數(shù)字經(jīng)濟(jì)必不可少的基礎(chǔ)支撐。
而這一切,都在倒逼底層技術(shù)加速升級(jí)。對(duì)于當(dāng)時(shí)的云計(jì)算巨頭來(lái)說(shuō),頭等大事就是如何滿足企業(yè)多種多樣的差異化需求?如何提供更具性?xún)r(jià)比的云服務(wù)?一方面是看得見(jiàn)的巨大藍(lán)海,一方面是對(duì)性能效率最大化的迫切需求——在這些推動(dòng)因素下,自研芯片就成了一種自然而然的選擇。
倚天710是阿里巴巴第一顆為云而生的CPU芯片,由平頭哥半導(dǎo)體自研,設(shè)計(jì)核心在于適配阿里云大規(guī)模、多線程、高并發(fā)的業(yè)務(wù)特點(diǎn)。倚天710采用Armv9架構(gòu),擁有128個(gè)核心、主頻2.75GHz。通過(guò)將芯片設(shè)計(jì)與云場(chǎng)景的獨(dú)特需求相結(jié)合,倚天710最終實(shí)現(xiàn)了性能和能效比的雙重突破:性能超過(guò)當(dāng)時(shí)的業(yè)界標(biāo)桿20%,能效比提升50%以上。倚天710發(fā)布后,2021年天貓“雙11”核心交易系統(tǒng)平滑遷移至倚天實(shí)例,算力性?xún)r(jià)比提30%。
隨著部署規(guī)模的不斷擴(kuò)大,自研芯片的種種優(yōu)勢(shì)被不斷放大,不僅有助于打造穩(wěn)定、響應(yīng)快、能快速擴(kuò)展的計(jì)算基礎(chǔ)設(shè)施,更便于云廠商在每個(gè)業(yè)務(wù)流程中做到效率與成本的最優(yōu)化,同時(shí),還可以做到硬件和軟件并行開(kāi)發(fā),這意味著能夠跨越傳統(tǒng)設(shè)計(jì)界限、創(chuàng)新速度更快。
“我們發(fā)現(xiàn)一些客戶對(duì)倚天芯片的擁抱程度其實(shí)是比較高的,尤其是互聯(lián)網(wǎng)客戶,因?yàn)椴恍枰麄冞M(jìn)行太多的業(yè)務(wù)架構(gòu)或代碼層面的改動(dòng),就能獲得更強(qiáng)的性能優(yōu)勢(shì)。此外,阿里云倚天實(shí)例在視頻編解碼業(yè)務(wù)場(chǎng)景中,性?xún)r(jià)比提升超過(guò)80%,在密集型計(jì)算業(yè)務(wù)場(chǎng)景中,性?xún)r(jià)比提升50%以上?!睆埆I(xiàn)濤表示,“這樣的客戶越來(lái)越多,也更加堅(jiān)定了我們與平頭哥半導(dǎo)體一起在自研芯片這條路上繼續(xù)往前走的決心。”
阿里云倚天ECS的用戶中,北京科學(xué)智能研究院在使用密度泛函數(shù)理論軟件時(shí),性?xún)r(jià)比提升70%;匯量科技廣告推理業(yè)務(wù)使用倚天710云實(shí)例,性能和網(wǎng)絡(luò)帶寬雙雙提升,性?xún)r(jià)比提升40% 以上。
談及對(duì)云原生系統(tǒng)中未來(lái)芯片的構(gòu)想,張獻(xiàn)濤表示,“我們還是希望能夠加入更多的云原生元素,與平頭哥半導(dǎo)體繼續(xù)緊密合作。此外,還有對(duì)新的總線比如UCIe、CXL的支持,從而能夠和CPU的計(jì)算架構(gòu)進(jìn)行更為深度的融合,更好地發(fā)揮軟件的協(xié)同效應(yīng)?!?/p>
AI時(shí)代,軟硬件融合是更優(yōu)算力的路徑
在生成式AI掀起的巨大聲浪中,大模型對(duì)計(jì)算能力提出更高要求的同時(shí),也給云計(jì)算帶來(lái)了新的應(yīng)用場(chǎng)景。隨著大模型應(yīng)用逐漸深入到千行百業(yè),未來(lái),每家企業(yè)都可以是“AI大模型企業(yè)”。大模型時(shí)代需要什么樣的云服務(wù)?如何進(jìn)一步降低用戶上云門(mén)檻?
顯然,成本首先是一筆要算的賬,現(xiàn)階段大模型的算力成本非常高昂。對(duì)此,張獻(xiàn)濤表示,還是需要提升算力效率,通過(guò)軟硬件的充分融合,通過(guò)自定義的芯片去加速算力提升,比如和平頭哥進(jìn)行更加深度的合作,能夠讓這個(gè)領(lǐng)域所需要的強(qiáng)大AI算力,通過(guò)軟硬件的深度協(xié)同變得更高效、成本更低。
“無(wú)論是在初代智能時(shí)代,還是這些年AI的發(fā)展,其實(shí)都需要深度的軟硬件融合技術(shù)帶來(lái)提升。而軟硬件融合的本質(zhì)更多還是軟件定義硬件的一種新型模式,通過(guò)這種模式,軟件和硬件之間的協(xié)同程度更高了,能夠讓軟件的效率充分發(fā)揮出來(lái),最終可以把整體計(jì)算效率提升起來(lái)”,張獻(xiàn)濤談到。
面臨AI浪潮的來(lái)襲,云計(jì)算不僅需要通過(guò)算力普惠推動(dòng)企業(yè)的數(shù)字化轉(zhuǎn)型,同時(shí),也肩負(fù)著助力AI更普及、為千行百業(yè)智能化升級(jí)提供核心動(dòng)力的重任。在云計(jì)算和AI深度融合驅(qū)動(dòng)的新一輪變革中,云計(jì)算和AI大模型將共同成為新時(shí)代的基礎(chǔ)設(shè)施,而芯片將提供必不可少的底層支撐,讓算力更普惠、讓 AI 更普及。一個(gè)由算力撬動(dòng)的智能時(shí)代---大幕已經(jīng)拉開(kāi)。
-
平頭哥
+關(guān)注
關(guān)注
0文章
64瀏覽量
9090
原文標(biāo)題:芯事訪談 | 阿里云張獻(xiàn)濤:算力需求暴增,底層創(chuàng)新為云計(jì)算“續(xù)航”
文章出處:【微信號(hào):gh_65bdec3412bd,微信公眾號(hào):平頭哥半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論