采用人工智能的工作負(fù)載如今變得無處不在,其中有的工作負(fù)載在世界上運(yùn)行最快的計(jì)算機(jī)上運(yùn)行,從而改進(jìn)高性能計(jì)算(HPC)。隨著組織規(guī)劃未來的發(fā)展,需要解決人工智能工作負(fù)載的編程、軟件需求、硬件需求和培訓(xùn)需求等問題。在2019年,行業(yè)專家和人工智能專家將繼續(xù)創(chuàng)造創(chuàng)新的解決方案。
以下是人工智能在2019年對高性能計(jì)算產(chǎn)生最大影響的十種方式:
1. 張量(Tensors):人工智能計(jì)算的通用語言
向量代數(shù)的應(yīng)用催生出為向量計(jì)算設(shè)計(jì)的計(jì)算機(jī)。Cray公司早期推出的超級計(jì)算機(jī)就是一種向量超級計(jì)算機(jī),它將應(yīng)用程序表達(dá)為向量和矩陣代數(shù)問題,這反過來又加強(qiáng)了計(jì)算機(jī)的設(shè)計(jì),以確保向量計(jì)算的快速運(yùn)行。多年來,這種強(qiáng)化循環(huán)強(qiáng)烈定義了高性能計(jì)算(HPC)。張量代數(shù)可以被接受為廣義矩陣代數(shù),因此它是超級計(jì)算機(jī)數(shù)學(xué)能力的自然演化,而不是一場革命。任何支持矩陣運(yùn)算的機(jī)器都可以進(jìn)行張量運(yùn)算。如今的CPU的用戶采用編譯器,加速采用Pythons,加強(qiáng)庫和優(yōu)化框架的支持,獲得對向量和張量的高性能支持,所有這些都允許軟件開發(fā)人員使用高性能環(huán)境中的向量和張量。
張量技術(shù)在硬件、軟件和人們的思想上都在高性能計(jì)算應(yīng)用中留下了深刻的印象。
2.語言:高級程序設(shè)計(jì)
Fortran程序在消耗周期方面占據(jù)了高性能計(jì)算的主導(dǎo)地位,C和C ++程序幾乎耗盡了高性能計(jì)算中的其他資源。通常通過C接口、擴(kuò)展和庫來支持加速器周期。嘗試使用新語言來破壞這種情況已經(jīng)失敗,因?yàn)楝F(xiàn)有語言具有適合構(gòu)成高性能計(jì)算的應(yīng)用程序的用戶、代碼和支持。
人工智能為新用戶帶來了新的需求,這將擴(kuò)展與高性能計(jì)算相關(guān)的語言,并不會改變大多數(shù)使用Fortran代碼的物理學(xué)家的活動,但使用MATLAB和Python的數(shù)據(jù)科學(xué)家需要根據(jù)他們的需求量身定制解決方案。
Python以及其他生產(chǎn)力語言和框架似乎將成為越來越多的高性能計(jì)算(HPC)周期的主人。他們的實(shí)際數(shù)字運(yùn)算程序仍將用C/C ++/Fortran編寫,但人工智能程序員既不會知道,也不會關(guān)心它。
3.以不同方式思考:通過利用機(jī)會重新思考方法來替換遺留代碼
高性能計(jì)算(HPC)是一種傳統(tǒng)技術(shù),人工智能相對來說是一種新技術(shù)。顯然,隨著人工智能的成熟,它將創(chuàng)造自己需要支持的重要遺產(chǎn)。就目前而言,當(dāng)這兩種技術(shù)結(jié)合時(shí),它將鼓勵有關(guān)重新實(shí)現(xiàn)遺留代碼的對話,這在某些情況下可能已經(jīng)過期。其借口可能是為代碼添加一些人工智能功能,但現(xiàn)實(shí)將是一些有益的努力以及一些嚴(yán)重的時(shí)間浪費(fèi)。
4.可移植性和安全性:虛擬化和容器
可以安全地在機(jī)器上運(yùn)行嗎?這是虛擬化和容器試圖解決的安全性和可移植性問題。當(dāng)然,安全性來自于良好構(gòu)建的硬件和軟件的安全功能。對于許多人來說,虛擬化和容器似乎是最好的組合。
容器已引起許多開發(fā)人員對虛擬機(jī)的關(guān)注,因?yàn)樵诓渴?、修補(bǔ)、云計(jì)算多功能性方面,它們被視為比虛擬機(jī)更靈活,并且可以節(jié)省虛擬機(jī)許可成本。
在面向高性能計(jì)算或人工智能的會議上談?wù)撊萜骷夹g(shù)似乎并沒有太大的進(jìn)展,這并不奇怪。例如,Python和Julia在精心配置時(shí)可以更好地?cái)U(kuò)展,而容器可以幫助部署。
容器提供了一種為用戶提供良好調(diào)整環(huán)境的自然方式,高性能計(jì)算行業(yè)將在2019年看到越來越多的容器使用,部分原因是由于人工智能用戶的興趣。毫無疑問,高性能計(jì)算會對其實(shí)例施加壓力,這是需要優(yōu)化的生態(tài)系統(tǒng)。這個(gè)領(lǐng)域正在進(jìn)行這方面的大量工作,高性能計(jì)算的社區(qū)將幫助所有人實(shí)現(xiàn)這一目標(biāo),以滿足對容器的渴望。
5.規(guī)模問題:大數(shù)據(jù)
哪里有人工智能,哪里就有大數(shù)據(jù)。人工智能社區(qū)的主要關(guān)注點(diǎn)是在使用非常大的數(shù)據(jù)模型中獲取意義。采用的高性能計(jì)算應(yīng)用程序需要大量文件,許多高性能計(jì)算運(yùn)行中心已經(jīng)有很多基礎(chǔ)設(shè)施可以很好地處理大數(shù)據(jù)問題。
所有高性能計(jì)算中心都將大數(shù)據(jù)作為新系統(tǒng)的主要要求考慮在內(nèi),人工智能工作負(fù)載是大數(shù)據(jù)需求的主要動力。
內(nèi)存的價(jià)格高昂,但人們已經(jīng)看到內(nèi)存容量與flop/s的比率多年來一直在下降。這是影響大數(shù)據(jù)發(fā)展的趨勢。圍繞內(nèi)存的新功能提供了扭轉(zhuǎn)這一趨勢的希望,并支持人們需要的大型機(jī)器(包括高性能計(jì)算機(jī))中的大數(shù)據(jù)模型。這些新的內(nèi)存技術(shù)提供了內(nèi)存和本地存儲器(SSD)的擴(kuò)展。
高性能計(jì)算對于人工智能的發(fā)展發(fā)揮重要作用。組織希望把數(shù)據(jù)放在離處理器更近的地方,這是最適合做真實(shí)數(shù)據(jù)可視化的處理器,是高性能計(jì)算影響人工智能/機(jī)器學(xué)習(xí)的最大方式之一。使用和理解大數(shù)據(jù)的概念,以及可視化數(shù)據(jù)和分析,是相互交織的。
6. 人工智能采用云計(jì)算
人工智能開發(fā)人員可能比高性能計(jì)算開發(fā)人員更多地接受云計(jì)算。雖然應(yīng)用在云中的高性能計(jì)算已經(jīng)出現(xiàn),但是針對人工智能應(yīng)用的高性能計(jì)算將加速云中的高性能計(jì)算。
7.硬件:,專注于庫和框架的交互式功能
人工智能的工作量并不大。這意味著少數(shù)庫接口和框架支配 “人工智能加速器”需要作為賣點(diǎn)。
交互性是一個(gè)長期存在的請求,通常在高性能計(jì)算系統(tǒng)中一直處于“次要地位”,被人工智能程序員直接置于前沿和核心。高性能計(jì)算這種變化的速度還有待觀察,但2019年這一領(lǐng)域的創(chuàng)新將是值得注意的,即使是零散的和有些隱蔽的。交互性也可以稱為“個(gè)性化”。
高性能計(jì)算支持更多的硬件多樣性、交互性支持以及針對性能優(yōu)化的額外庫/框架抽象,以支持人工智能工作負(fù)載。高性能計(jì)算社區(qū)對性能的關(guān)注將有助于說明基礎(chǔ)設(shè)施的額外融合將有利于數(shù)據(jù)中心部署。沒有人愿意放棄性能,如果不必這樣做,高性能計(jì)算社區(qū)的專業(yè)知識將有助于商品化人工智能/機(jī)器學(xué)習(xí)的性能,從而導(dǎo)致社區(qū)之間更多的硬件技術(shù)融合。
8.人員融合:用戶多樣性和對高性能計(jì)算的興趣增加
人工智能將注入許多不同背景的新人才。人工智能將以前所未有的規(guī)模給高性能計(jì)算帶來民主化。在過去的幾年中,“高性能計(jì)算的民主化”這個(gè)短語用于描述高性能計(jì)算如何被工程師和科學(xué)家群體的訪問。數(shù)學(xué)和物理問題可能推動了早期的超級計(jì)算工作量,但最近越來越多的用戶發(fā)現(xiàn),在醫(yī)學(xué)、天氣預(yù)報(bào)和風(fēng)險(xiǎn)管理等領(lǐng)域,高性能計(jì)算工作量是不可或缺的。
人工智能的用戶群體比高性能計(jì)算要廣泛得多,給高性能計(jì)算的民主化帶來了全新的維度。如今,高性能計(jì)算專家和人工智能專家正在聯(lián)合起來進(jìn)行開發(fā)。
9.新投資:推理
機(jī)器學(xué)習(xí)通常被認(rèn)為是由稱為“訓(xùn)練”的學(xué)習(xí)階段和稱為“推理”的實(shí)施階段組成。似乎需要更多的周期來進(jìn)行推理,而不是進(jìn)行訓(xùn)練,特別是當(dāng)人們看到機(jī)器學(xué)習(xí)無處不在地嵌入到周圍的解決方案中時(shí)。
有了如此巨大的市場機(jī)會,讓人覺得整個(gè)世界都在試圖從這一推理市場中獲得更大的份額。推理已經(jīng)在處理器、FPGA、GPU、DSP和大量定制ASIC上實(shí)現(xiàn)。功率、延遲和總體成本是關(guān)鍵因素,這些因素為人們提供了一系列具有不同賣點(diǎn)的選項(xiàng)。高性能CPU加上低延遲、易于重新編程和可預(yù)測延遲的FPGA似乎是補(bǔ)充當(dāng)前CPU主導(dǎo)的推導(dǎo)世界的合理選擇。時(shí)間會證明一切。
人們將發(fā)現(xiàn)推理工作負(fù)載將對包括高性能計(jì)算在內(nèi)的所有計(jì)算產(chǎn)生重大影響。
10.應(yīng)用程序的融合:不是在“重新思考”之后進(jìn)行更換
擴(kuò)展工作負(fù)載多樣性,并將看到各種工作負(fù)載進(jìn)行融合。那些有遠(yuǎn)見的人已經(jīng)證明,當(dāng)高性能計(jì)算機(jī)和人工智能結(jié)合在一起時(shí),有許多機(jī)會。從將系統(tǒng)集成到能夠預(yù)測極端天氣(如颶風(fēng))的模式,再到氣候或天氣預(yù)報(bào)系統(tǒng)?,F(xiàn)在出現(xiàn)了各種想法。生成對抗網(wǎng)絡(luò)(GAN)是許多人高度重視的一類機(jī)器學(xué)習(xí)系統(tǒng),生成對抗網(wǎng)絡(luò)(GAN)無疑將有助于融合高性能計(jì)算和人工智能/機(jī)器學(xué)習(xí)工作。
雖然現(xiàn)在很少有應(yīng)用程序結(jié)合高性能計(jì)算和人工智能技術(shù),而基于該領(lǐng)域的早期結(jié)果,很容易預(yù)測這是高性能計(jì)算應(yīng)用程序的未來,并將構(gòu)成高性能計(jì)算因人工智能而面臨的最大變化。
理解這十種方式
計(jì)算的故事在某種意義上并沒有改變:它完全取決于整個(gè)系統(tǒng)對用戶的作用。雖然需求發(fā)生變化,但完整系統(tǒng)由硬件和軟件組成的事實(shí)并沒有改變。很容易被單一技術(shù)(硬件或軟件)分散注意力,最好的系統(tǒng)會在最有幫助的地方小心地應(yīng)用新技術(shù)。
結(jié)論:人工智能將使用高性能計(jì)算,并將永遠(yuǎn)改變
事實(shí)上,人工智能可能是高性能計(jì)算歷史上最大的變革推動者。高性能計(jì)算不斷發(fā)展,因?yàn)橐呀?jīng)通過自己的工作負(fù)載來實(shí)現(xiàn),并且它也將在人工智能中發(fā)展。
即人工智能用戶只需加入高性能計(jì)算社區(qū)并在其上加上自己的標(biāo)記。他們也將使用非高性能計(jì)算系統(tǒng),就像其他高性能計(jì)算用戶一樣。
將有專為人工智能工作負(fù)載設(shè)計(jì)和構(gòu)建的定制高性能機(jī)器,而其他機(jī)器的人工智能工作負(fù)載也在具有非人工智能工作負(fù)載的更通用的高性能設(shè)施上運(yùn)行。平衡機(jī)器在需要高性能靈活機(jī)器的情況下才能實(shí)現(xiàn)加速。人工智能將有助于未來定義什么成為超級計(jì)算機(jī),因此可能將會調(diào)整高性能計(jì)算機(jī)的進(jìn)程。
評論
查看更多