在服務器CPU市場,英特爾架構一枝獨秀,市場份額已連續(xù)多年超過90%;POWER和SPARC雖然難挽下滑趨勢,但在關鍵任務領域仍有用武之地;幾乎已經(jīng)退出歷史舞臺的Alpha架構得益于在中國超算“神威·太湖之光”中的大量應用,被注入了一支強心劑。
相比之下,數(shù)年前一度被寄予厚望、曾被視為數(shù)據(jù)中心低功耗變革動力的ARM架構卻似乎慢慢淡出了我們的視線。然而,這并不代表它將在數(shù)據(jù)中心偃旗息鼓。時值2016年收尾和2017年開張之期,高通(Qualcomm)在ARM領域連番發(fā)力,讓沉寂許久的ARM服務器陣營重鳴號角。
2016年11月18日,貴州華芯通半導體技術有限公司北京研發(fā)中心正式啟用?!叭A芯通”是由貴州省人民政府與高通公司共同出資設立的合資企業(yè),已經(jīng)獲得ARM v8-A 64位處理器架構授權?!叭A芯通”將通過引進、消化吸收、再創(chuàng)新,重點針對高端服務器芯片指令集CPU微結構、多核互連、SOC等關鍵技術開展攻關,開發(fā)適合中國市場的先進服務器芯片產(chǎn)品。
2016年12月7日,高通宣布全球首款10納米服務器芯片Qualcomm Centriq 2400開始商用送樣,預計2017下半年進入商用市場。作為Qualcomm Centriq系列的首款產(chǎn)品,Centriq 2400采用最先進的10納米FinFET制程技術,最高可配置48個內核,其所搭載的Qualcomm Falkor CPU,是高通研發(fā)的定制化ARM v8內核,通過高度優(yōu)化可實現(xiàn)高性能,低功耗,特別針對數(shù)據(jù)中心最常見的工作負載而設計。
高通如此高調地對服務器市場“送秋波”、“秀恩愛”,既吸引了從業(yè)者的視線,也不免引發(fā)疑問:眾所周知,高通是移動芯片領域的頂尖廠商,但緣何它會選擇這個時間點發(fā)力ARM服務器芯片市場呢?
ARM芯片是否還有“搞頭”?
這個疑問的根源,離不開ARM架構在服務器市場曾有的戲劇性發(fā)展經(jīng)歷。
大概是2010年,在移動端如日中天的ARM陣營表現(xiàn)出了對于服務器和數(shù)據(jù)中心的野心。當時,數(shù)據(jù)中心能耗瀕臨上限,“大數(shù)據(jù)”已經(jīng)露出了爪牙,數(shù)據(jù)中心迫切地希望找到一種能以較低的功耗來處理大量并行化、輕量化負載的方法,而ARM架構處理器所具備的多內核、高并行、低功耗的特性正好滿足了數(shù)據(jù)中心的這種新需求。
于是,業(yè)內普遍認為,ARM芯片將成為數(shù)據(jù)中心新的“顛覆者”,前景一片光明。隨后,F(xiàn)acebook等大型互聯(lián)網(wǎng)廠商開始定制ARM服務器,Marvel、Cavium、Applied Micro Circuits、三星等芯片廠商紛紛加入ARM服務器芯片的研發(fā),惠普等服務器廠商開始測試ARM服務器,而2012年x86服務器芯片老兵AMD宣布推出64位ARM服務器芯片,更是為ARM進軍數(shù)據(jù)中心加上了助燃劑。
當時,分析師們曾經(jīng)樂觀地預測,到2019年,ARM服務器芯片出貨量將占到總體市場的20%~25%。
然而,ARM的數(shù)據(jù)中心之路走得并不如預料中那樣順暢。2013年底,ARM服務器領域的先驅Calexda成為“先烈”,為ARM在數(shù)據(jù)中心的發(fā)展前景蒙上一層陰影。2016年,Applied Micro表示將出售ARM服務器業(yè)務;也有消息稱博通也將結束ARM服務器計劃;而曾經(jīng)讓人看好的AMD,又將重心轉回了x86和GPU。
所以,回顧這幾年ARM服務器芯片的發(fā)展歷程,好似“一壺水被迅速燒熱又逐漸冷卻”,這種尷尬局面讓人不得不對ARM服務器芯片的未來感到困惑。
再回到上面的問題,ARM服務器芯片還有“搞頭”么?高通為何在有先驅屢屢失利、甚至成為“先烈”的情況下高調進軍服務器和數(shù)據(jù)中心?高通ARM服務器芯片賴以生存的根基和底氣又在哪里?
高通在打怎樣的“小算盤”?
高通是一家精明的企業(yè),否則無以成為移動芯片界的龍頭企業(yè)。在我看來,高通選擇在這個時間點高調入局,其根本原因在于看好ARM服務器芯片市場的復蘇趨勢和發(fā)展前景。
的確,ARM服務器市場正在復蘇。盡管經(jīng)歷了幾年的不溫不火,ARM服務器芯片卻在近兩年,特別是2016年,迎來了一個重要的轉折點。
過去幾年中,ARM服務器芯片在市場、技術和生態(tài)環(huán)境方面尚不成熟,而今,不管是市場、技術還是生態(tài)方面,它都面臨著近年來最佳的一個生長環(huán)境。
第一,先看市場。前文提過,ARM的優(yōu)勢在于多內核、高并行、低功耗,這樣的能力非常適合數(shù)據(jù)中心的并行化、輕量化負載,如搜索、Web、CDN、冷存儲等。但由于ARM服務器芯片發(fā)展過慢,而英特爾x86服務器芯片的能效比也在不斷提升,數(shù)據(jù)中心對于ARM的需求已經(jīng)不是那么強烈。
如今的市場和幾年前已經(jīng)不可同日而語。時下,互聯(lián)網(wǎng)日趨繁榮,移動終端數(shù)量高速增長,物聯(lián)網(wǎng)快速發(fā)展,云計算、大數(shù)據(jù)、移動、社交引領了新一輪的技術革命。在這些新趨勢中,數(shù)據(jù)有集中也有分散,不論是貯藏了海量數(shù)據(jù)的大規(guī)模數(shù)據(jù)中心,還是分散在網(wǎng)絡邊緣的計算節(jié)點,都希望將每瓦特性能放在首位,更加注重空間和能耗的節(jié)約,用更少的成本從數(shù)據(jù)的流動中掘金。
同時,人工智能、深度學習、機器視覺計算等新興應用負載的大熱將異構計算推到了舞臺中央,單一的CPU架構已經(jīng)無法滿足這些應用對于浮點計算能力、并行度、能效等方面的需求,于是,近年來CPU+GPGPU、CPU+FPGA等異構計算方式大行其道,其中,ARM+GPGPU、ARM+FPGA也因更具能效優(yōu)勢,被視為一種理想的異構計算方式。
在這些新興應用和趨勢中,單純的英特爾架構方案已經(jīng)不能完全讓大型數(shù)據(jù)中心的用戶滿意,雖然英特爾CPU的能效比在不斷提升,并且也具備Xeon Phi協(xié)處理器方案,但大型互聯(lián)網(wǎng)用戶更希望追求極致,將數(shù)據(jù)中心的能效做到更高。
于是,ARM又迎來了新的機會。2013年百度在其南京數(shù)據(jù)中心首次應用ARM服務器來支撐百度云服務,將TCO降低了25%,存儲密度提升了70%。本月初,又有消息稱,ARM將與阿里巴巴集團在數(shù)據(jù)中心業(yè)務方面展開合作,阿里巴巴將在自身數(shù)據(jù)中心的服務器上大量采用ARM架構低功耗CPU,以逐步替換英特爾產(chǎn)品。
第二,再看技術。過去幾年中,ARM服務器芯片的絕對性能提升并不高,故而ARM服務器只能被應用于一些輕量化的場景中。
而新近亮相的高通Qualcomm Centriq 2400,則將ARM服務器芯片的規(guī)格提升到了一個新的臺階:集成高達48個內核,率先采用10nm工藝(領先于英特爾的14nm),內核經(jīng)過高度優(yōu)化,可同時實現(xiàn)高性能與低功耗,專門針對數(shù)據(jù)中心最常見的工作負載而設計。雖然高通沒有公布Centriq的進一步細節(jié),但從核心數(shù)量和工藝上來推測,Centriq在性能與功耗方面的綜合表現(xiàn)將能夠與英特爾的主流芯片一較高下,且很有可能也領先于AMD即將推出的Zen服務器芯片。
另一方面,ARM+GPGPU、ARM+FPGA等異構計算技術也在不斷走向成熟,特別是在超算領域。此前,巴塞羅那超算中心就曾采用ARM+GPGPU的異構方式,富士通計劃建造的百億億次超算也將引入ARM芯片,同樣采用異構計算。今年10月,英特爾子公司Altera推出了新一代的Stratix 10 FPGA,其中就采用了四核ARM Cortex-A53處理器。
有趣的是,連英特爾都開始重新接受ARM架構,這足以說明ARM技術的誘人之處。
第三,最后看生態(tài)。由于缺少生態(tài)系統(tǒng),特別是軟件生態(tài),ARM這些年來發(fā)展得不太順利。而今,互聯(lián)網(wǎng)的繁榮發(fā)展帶動了開源生態(tài)的發(fā)展,也給ARM的軟件生態(tài)帶來了利好消息。
對此,Qualcomm產(chǎn)品管理副總裁樂美科(Americo Lemos)曾表示,軟件過去大多是垂直的架構,而現(xiàn)在更多是使用開放源代碼軟件——這對Qualcomm來說是一件好事,因為入門的門檻變得非常低,不必再投資幾十億美金用于搭建軟件架構。
他說:“就像x86系統(tǒng)原來做的那樣。開放源代碼軟件的普及和應用降低了Qualcomm進入這一領域的門檻?!?/p>
所以,無論市場、技術還是生態(tài),ARM進軍數(shù)據(jù)中心已經(jīng)處于一個“臨界點”,高通在這個時間點高調入局,稱得上是恰逢其時。
評論
查看更多