沒有先進(jìn)的制程,再頂尖的科學(xué)家也無法用少量的晶體管完成復(fù)雜計算;沒有更高的頻率和更大的緩存,再高效結(jié)構(gòu)也無法轉(zhuǎn)化為強大的計算能力;但對于實際的算力來說,這些都只是表象。真正的算力,是云數(shù)據(jù)中心里能跑多少應(yīng)用,是超算中心里的科學(xué)家能夠多快獲得結(jié)果,是用戶能夠把經(jīng)歷集中在業(yè)務(wù)和應(yīng)用之上。
有人說這是智能時代,有人說這是數(shù)據(jù)的時代,有人說這是云時代……但無論我們?nèi)绾味x當(dāng)下與未來,算力卻總是一個繞不開的話題。但當(dāng)我們在討論算力的時候,我們究竟在談什么?是幾nm的制程?是多少GHz、多少L3緩存?是多少核心、多少線程?這些都對,但也都不對。
沒有先進(jìn)的制程,再頂尖的科學(xué)家也無法用少量的晶體管完成復(fù)雜計算;沒有更高的頻率和更大的緩存,再高效結(jié)構(gòu)也無法轉(zhuǎn)化為強大的計算能力;但對于實際的算力來說,這些都只是表象。真正的算力,是云數(shù)據(jù)中心里能跑多少應(yīng)用,是超算中心里的科學(xué)家能夠多快獲得結(jié)果,是用戶能夠把經(jīng)歷集中在業(yè)務(wù)和應(yīng)用之上。
還有哪些核心競爭力?
眾所周知,英特爾在挑戰(zhàn)新制程的道路上遇到了一些困難。這使得英特爾很難在兼顧功耗、良率及芯片面積的情況下,在晶片之上集成更多的晶體管。相應(yīng)的,也就無法構(gòu)建更多核心、更多線程。這的確給英特爾繼續(xù)挑戰(zhàn)更高的處理器性能帶來了麻煩,但實際的情況卻遠(yuǎn)非如此簡單。
硬件的性能需要依靠軟件來體現(xiàn),而軟件層面的優(yōu)化則直接關(guān)系到硬件的性能。舉個例子,2000年,索尼推出的PS2主機使用的Emotion Engine處理器使用180nm制程,包含1050萬個晶體管,每秒能夠生成6600萬個多邊形(概括系統(tǒng)3D能力的核心指標(biāo)之一);同年英偉達(dá)發(fā)布的GeForce 2 Ultra使用同樣的工藝制程,包含2500萬個晶體管,理論上每秒?yún)s只能生成3100萬個多邊形。前者運行著定制的操作系統(tǒng),并且軟件都由專門的開發(fā)機進(jìn)行開發(fā);而后者則面向PC市場,運行在Windows環(huán)境中。
當(dāng)然,如此簡單粗暴的對比索尼EE處理器和英偉達(dá)顯卡的每秒多邊形生成率并沒有太大的實際意義,但這也足以說明軟件優(yōu)化的意義。
誠然,我們無法要求今日的商用系統(tǒng)全部運行經(jīng)過深度定制開發(fā)的操作系統(tǒng)和應(yīng)用軟件,但細(xì)致且廣泛的調(diào)優(yōu)仍舊關(guān)系到硬件最終性能及用戶價值的體現(xiàn)。
回到今日的主題,當(dāng)我們在看到英特爾遇到的種種問題時,我們也應(yīng)當(dāng)注意到,英特爾始終在投入更多的人力和資源于軟件及系統(tǒng)的優(yōu)化之上。而通過這些優(yōu)化,英特爾所獲得不僅是一個個用戶的認(rèn)可,更是海量用戶價值的體現(xiàn)。
開放的云服務(wù)提供商
開放的選擇
在處理器廠商的各類客戶群中,CSP絕對是一個十分特殊的存在。CSP的價值在于向外界提供高性價比的基礎(chǔ)設(shè)施類服務(wù);換句話說,如何以更低的價格對外提供更多服務(wù)是CSP的核心盈利模式。這意味著,CSP對于性能是十分敏感的。當(dāng)兩款處理器價格持平,那么CSP會毫不猶豫的選擇算力更高的那一款。
青云QingCloud是國內(nèi)一家特色十分鮮明的CSP,堅持中立可靠的為客戶提供云計算服務(wù)。但是相對于財大氣粗的BAT,青云QingCloud更在乎基礎(chǔ)設(shè)施的性價比。同時,青云QingCloud對于基礎(chǔ)架構(gòu)中計算平臺的選擇也始終保持開放態(tài)度,任何能夠提供優(yōu)勢性價比的產(chǎn)品都會成為青云QingCloud未來基礎(chǔ)架構(gòu)的選項。所以,對于不同的計算平臺,青云QingCloud不僅始終保持關(guān)注,更會通過不斷的對比測試來決定下一次升級的對象。
顯然,對于此時的英特爾,想要拿下青云QingCloud,難度自然不小。但就在大家都以為青云QingCloud會選擇目前外界呼聲更高的對手產(chǎn)品時,英特爾卻再次成為其采購對象。在這一結(jié)果的背后,則是英特爾戰(zhàn)略客戶支持部門的大力支持。
2020年1月,青云QingCloud在測試后認(rèn)為對手產(chǎn)品在一些場景中的性能表現(xiàn)要優(yōu)于英特爾。但在英特爾戰(zhàn)略客戶支持部門的努力下,英特爾軟件工程團隊對青云QingCloud的軟件測試環(huán)境進(jìn)行了細(xì)致的調(diào)優(yōu),而經(jīng)過調(diào)優(yōu)后的測試結(jié)果則完全逆轉(zhuǎn)。最終,開放的青云QingCloud在對自身軟件環(huán)境進(jìn)行調(diào)整后仍舊選擇了英特爾的產(chǎn)品。
另一方面,在英特爾團隊的協(xié)助下,青云QingCloud還上線了基于英特爾至強處理器的AI推理業(yè)務(wù),直接擴展了青云QingCloud的服務(wù)目錄,讓青云QingCloud能夠更快的加入普惠AI的大潮,在競爭中不落人后。同時,青云QingCloud也是首個將傲騰產(chǎn)品應(yīng)用在企業(yè)級存儲的緩存層中的CSP,在成本平衡的前提下實現(xiàn)了更好的性能。
對于英特爾平臺所帶來的一系列應(yīng)用新體驗和新業(yè)務(wù),青云QingCloud供應(yīng)鏈總監(jiān)廖洋直言不諱:作為CSP,青云QingCloud不僅關(guān)注硬件的采購成本,更關(guān)注硬件在使用和對外服務(wù)過程中的成本。而英特爾對于青云QingCloud的關(guān)注、溝通及服務(wù)不僅讓彼此之間形成了深度的默契,更幫助青云QingCloud解決了業(yè)務(wù)層面的諸多實際問題。
而對于青云QingCloud,英特爾也通過自身真金白銀的服務(wù)付出換來了客戶選擇與信賴。
超級算力背后的超強服務(wù)
如果說云計算是讓大量的資源去服務(wù)更大量的用戶,那么與之相對的便是HPC領(lǐng)域的用大量資源去滿足幾個應(yīng)用的需求。在算力應(yīng)用的道路上,云和超算,一個向左,一個向右。但在對用戶的支持方面,英特爾的支持卻是一以貫之的。
與前面的CSP不同,HPC的用戶多為高校和科研機構(gòu)。如果說以CSP為代表的企業(yè)用戶對算力的追求是全生命周期的極致性價比,那么以高校和科研單位為主的HPC用戶群則更關(guān)注算力的絕對性能和在專業(yè)領(lǐng)域的支持。因為在云之中,算力是以各種高度模板化的服務(wù)列表來呈現(xiàn)的;而在科研類應(yīng)用之中,HPC很可能昨天還在處理氣象問題,今天就需要轉(zhuǎn)戰(zhàn)重金屬污染的防治。不確定的應(yīng)用方向,不確定的計算規(guī)?!ㄒ淮_定的是,HPC的用戶需要更多支持與幫助。
清華大學(xué)、中南大學(xué),前者是如雷貫耳的中國頂級學(xué)府,后者則是擁有6個國家一級重點學(xué)科、12個二級重點學(xué)科的知名高校。而為了方便科研,兩所高校同樣也是HPC的老用戶。
在傳統(tǒng)的商業(yè)領(lǐng)域,很多成熟的應(yīng)用都有龐大的開發(fā)支持和用戶基礎(chǔ),軟硬件的適配能夠獲得很好的保障。但在超算領(lǐng)域,應(yīng)用的開發(fā)者和使用者都是小眾用戶,能夠理解業(yè)務(wù)和軟件邏輯的人少之又少,針對硬件變化的軟件優(yōu)化也就更少。因此,無論使用這些軟件的是本科生、研究生還是博士生,軟件的優(yōu)化都需要有專業(yè)人員的支持。
另一方面,從硬件的構(gòu)成方面,不同的高校和科研機構(gòu)也有不同的傾向。以清華大學(xué)為例,在其擁有的包含近2000個節(jié)點的超算系統(tǒng)中包含800多個Westmere-EX架構(gòu)節(jié)點(2010年興建)、200多個Broadwell架構(gòu)節(jié)點(2016年興建)和900多個Cascade Lake架構(gòu)節(jié)點。顯然,清華大學(xué)的超算建設(shè)思路屬于“常用常新”的滾動建設(shè)型。而中南大學(xué)則直接使用了新的Cascade Lake架構(gòu)至強Gold 6248R構(gòu)建了1000多個節(jié)點。顯然,中南大學(xué)屬于“一步到位”型。
而無論采用哪種建設(shè)思路,從最開始的架構(gòu)設(shè)計到處理器具體型號選擇,到供應(yīng)商設(shè)備再到最后的應(yīng)用移植與調(diào)整優(yōu)化;英特爾都全程參與。
對此,清華大學(xué)高性能計算中心張武生老師舉了一個生動的例子:在超算的使用過程中,清華發(fā)現(xiàn)在某一個應(yīng)用上英特爾處理器的計算結(jié)果與其他平臺不一致。在得知這一消息后英特爾第一時間調(diào)集全球研發(fā)力量進(jìn)行響應(yīng),并最終找到了原因、對硬件進(jìn)行了修正。而在另外一個要求實時性、高帶寬、高IO的金融類研究項目中,由于計算模式不一樣,清華在實際的研究過程中遇到了很大困難。英特爾得知之后更第一時間為清華提供了全新的測試平臺,保證了實驗的進(jìn)度;整個過程只用了兩三周時間。響應(yīng)及時,支持到位。
對于英特爾的支持,中南大學(xué)鄒有老師則表示:英特爾平臺有著完整的編譯器和文檔支持,軟件的開發(fā)和移植都能夠比較方便的展開。同時,英特爾對客戶實際應(yīng)用中的真實需求有著很深的理解,并提供了眾多的培訓(xùn)項目,幫助學(xué)校的老師和同學(xué)提升了深度學(xué)習(xí)方面的能力。而這些軟硬件和技術(shù)層面的開放性使得英特爾成為了一個更方便使用的平臺。
當(dāng)超算遇到云
作為一種高精尖的IT應(yīng)用,對超算有需求的也絕不止清華、中南大學(xué)這樣的頂尖學(xué)府,更有廣泛的其他企業(yè)、高效和研究機構(gòu)。如果每個單位在遇到HPC需求時都以自建的形式來滿足,那么無論從經(jīng)濟成本還是時間成本來看,很多研究都是無法繼續(xù)的。因此,更合理的解決方案就是讓超算具備對外提供服務(wù)的能力,換句話說就是“超算云”。
并行科技是一家專注于高性能軟件開發(fā)、服務(wù)的公司;而超算云則是并行科技近幾年的戰(zhàn)略發(fā)展重點。相較于自建超算的高校或其他研究機構(gòu),作為一家商業(yè)公司,并行科技在超算建設(shè)方面更注重系統(tǒng)的性價比——讓硬件以更高的效率為高性能應(yīng)用服務(wù)。
在底層硬件領(lǐng)域,并行科技一方面在基于英特爾Cascade Lake-AP架構(gòu)處理器構(gòu)建自營硬件平臺,另一方面也在積極聯(lián)系擁有超算系統(tǒng)的高校和科研機構(gòu),使之能夠?qū)㈤e時的計算資源貢獻(xiàn)出來,為其他用戶服務(wù),獲得更多資金以支持教學(xué)科研發(fā)展。
而在軟件平臺層,并行科技則基于英特爾系列處理器的硬件特點開發(fā)了高效且靈活的超算云OS,在實現(xiàn)用戶管理和計費功能的同時,也讓平臺能夠充分調(diào)動底層硬件資源實現(xiàn)更具效率的計算。當(dāng)然,并行科技的超算云還將常用的、經(jīng)過細(xì)致優(yōu)化的超算應(yīng)用以服務(wù)目錄的形式提供給用戶,免去用戶軟件部署和調(diào)優(yōu)的麻煩。
與此同時,并行科技還聯(lián)手英特爾每年舉辦并行編程大賽,在高校中普及高性能計算編程技巧和方法,為超算領(lǐng)域的持續(xù)發(fā)展培養(yǎng)更多的跨界編程人才。
當(dāng)我們在聊算力時
我們到底在討論什么?
伴隨社會與商業(yè)的數(shù)字化,算力已經(jīng)成為支持社會、科研和商業(yè)的不可或缺的基礎(chǔ)設(shè)要素。而這一要素更要在軟件應(yīng)用當(dāng)中體現(xiàn)其具體價值。再強大的算力也需要配套的應(yīng)用和優(yōu)化,才能充分發(fā)揮效能。
因此,當(dāng)我們在聊算力時,我們所說的不僅僅是制程、核數(shù)、頻率,更是算力之上的軟件以及算力背后的優(yōu)化、服務(wù)與長期的支持。
在這些方面,英特爾對用戶的重視與支持毋庸置疑;以“客戶至上”作為公司的價值觀,英特爾一直在深入各行各業(yè),緊密聆聽客戶的心聲,從推動應(yīng)用落地的角度有針對性地對產(chǎn)品和解決方案策略進(jìn)行調(diào)整。而在此之外,英特爾還提供了軟件、內(nèi)存與存儲、網(wǎng)絡(luò)、安全等多種配套技術(shù)。加之架構(gòu)、制程與封裝,英特爾圍繞數(shù)據(jù)價值所構(gòu)建的六大支柱正在成為各行各業(yè)用戶實現(xiàn)價值方便捷徑。
而隨著算力需求和以英特爾為代表的ICT企業(yè)的技術(shù)發(fā)展,在聊算力時,我們討論的話題還可以更多。
-
芯片
+關(guān)注
關(guān)注
455文章
50816瀏覽量
423613 -
英特爾
+關(guān)注
關(guān)注
61文章
9964瀏覽量
171771 -
云數(shù)據(jù)
+關(guān)注
關(guān)注
0文章
117瀏覽量
16619
發(fā)布評論請先 登錄
相關(guān)推薦
評論