由麻省理工學(xué)院助理教授Philip Harris和核科學(xué)實(shí)驗(yàn)室博士后Dylan Rankin等國(guó)際科學(xué)家團(tuán)隊(duì)測(cè)試的新機(jī)器學(xué)習(xí)技術(shù)可以在眨眼間發(fā)現(xiàn)大型強(qiáng)子對(duì)撞機(jī)(LHC)海量數(shù)據(jù)中的特定粒子特征。
MIT助理教授Philip Harris和核科學(xué)實(shí)驗(yàn)室博士后Dylan Rankin等國(guó)際科學(xué)家團(tuán)隊(duì)正在測(cè)試一種新的機(jī)器學(xué)習(xí)技術(shù),該技術(shù)可以在眨眼間在大型強(qiáng)子對(duì)撞機(jī)(LHC)浩瀚如海的數(shù)據(jù)中發(fā)現(xiàn)特定粒子特征。
新系統(tǒng)既復(fù)雜又迅速,可以在數(shù)據(jù)集不斷變大變復(fù)雜的情況下,讓我們得以一窺機(jī)器學(xué)習(xí)將在粒子物理學(xué)的未來(lái)發(fā)現(xiàn)中,會(huì)發(fā)揮怎樣舉足輕重的作用。
機(jī)器學(xué)習(xí)成為攻堅(jiān)利器
大型強(qiáng)子對(duì)撞機(jī)每秒造成大約4000萬(wàn)次碰撞。篩選如此大量數(shù)據(jù),需要強(qiáng)大的計(jì)算機(jī),來(lái)識(shí)別其中需要科學(xué)家去關(guān)注的碰撞,無(wú)論是暗物質(zhì)還是希格斯粒子。
現(xiàn)在,費(fèi)米實(shí)驗(yàn)室(Fermilab),歐洲核子研究中心(CERN),麻省理工學(xué)院,華盛頓大學(xué)和其他地方的科學(xué)家們已經(jīng)測(cè)試了一種新的機(jī)器學(xué)習(xí)系統(tǒng),與現(xiàn)有方法相比,該系統(tǒng)可將處理速度提高30到175倍!
傳統(tǒng)方法目前每秒只能處理不到一個(gè)圖像。相比之下,新的機(jī)器學(xué)習(xí)系統(tǒng)每秒最多可以查看600張圖像。在訓(xùn)練期間,系統(tǒng)學(xué)會(huì)挑選出一種特定類型的后碰撞粒子模式。
哈里斯說(shuō):“我們所識(shí)別的碰撞模式,頂夸克是大型強(qiáng)子對(duì)撞機(jī)上探測(cè)的基本粒子之一。能夠分析盡可能多的數(shù)據(jù)非常重要,每一條數(shù)據(jù)都帶有關(guān)于粒子如何相互作用的有趣信息。“
等目前的LHC升級(jí)完成后,數(shù)據(jù)將以前所未有的方式涌入;到2026年,17英里的粒子加速器預(yù)計(jì)將產(chǎn)生20倍于目前的數(shù)據(jù),同時(shí)圖像也將以比現(xiàn)在更高的分辨率拍攝??偠灾?,科學(xué)家和工程師估計(jì)大型強(qiáng)子對(duì)撞機(jī)所需的計(jì)算能力是目前的10倍以上。
哈里斯繼續(xù)說(shuō)道:“未來(lái)的挑戰(zhàn)迫在眉睫,隨著計(jì)算變得更加準(zhǔn)確,以及探測(cè)出更加精確的效果,它變得越來(lái)越難?!?/p>
該項(xiàng)目的研究人員對(duì)他們的新系統(tǒng)進(jìn)行了訓(xùn)練,以識(shí)別頂夸克的圖像,這是最龐大的基本粒子類型,比質(zhì)子重180倍。
“通過(guò)我們提供的機(jī)器學(xué)習(xí)架構(gòu),就能夠獲得高質(zhì)量的科學(xué)質(zhì)量結(jié)果,與世界上最好的頂夸克識(shí)別算法相媲美,”哈里斯解釋說(shuō)?!案咚賹?shí)施核心算法使我們能夠靈活地在最需要的關(guān)鍵時(shí)刻增強(qiáng)LHC計(jì)算?!?/p>
EB級(jí)的數(shù)據(jù)集也能輕松處理
憑借大型數(shù)據(jù)集和高數(shù)據(jù)采集速率,高性能和高吞吐量計(jì)算資源是實(shí)驗(yàn)粒子物理計(jì)劃的基本要素。這些實(shí)驗(yàn)在探測(cè)器技術(shù)的復(fù)雜性和粒子束的強(qiáng)度方面不斷增加。
因此,粒子物理數(shù)據(jù)集的大小正在增加,就像處理數(shù)據(jù)的算法的復(fù)雜性一樣。例如,大型強(qiáng)子對(duì)撞機(jī)(HL-LHC)的高亮度階段,將提供比當(dāng)前LHC運(yùn)行多15倍的數(shù)據(jù)。
HL-LHC將以40 MHz的速率碰撞質(zhì)子束,碰撞環(huán)境中每次碰撞的粒子數(shù)將是原來(lái)的5倍。
Compact Muon Solenoid(CMS)實(shí)驗(yàn)將針對(duì)HL-LHC進(jìn)行升級(jí),讀取通道的數(shù)量將增加10倍。通過(guò)一系列在線過(guò)濾器,CMS旨在以5 kHz的速率存儲(chǔ)HL-LHC碰撞事件。
這樣的數(shù)據(jù)速率導(dǎo)致數(shù)據(jù)集的規(guī)模為EB級(jí)。未來(lái)的中微子實(shí)驗(yàn),如深層地下中微子實(shí)驗(yàn)(DUNE)和宇宙學(xué)實(shí)驗(yàn)、平方公里陣列(SKA),預(yù)計(jì)將產(chǎn)生百億億字節(jié)的數(shù)據(jù)集。
大規(guī)模粒子物理實(shí)驗(yàn)面臨著高吞吐量計(jì)算資源的挑戰(zhàn)。在具有增強(qiáng)的并行化的專用硬件上新的異構(gòu)計(jì)算范例,例如現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA),能夠提供具有極大潛在增益的解決方案。
機(jī)器學(xué)習(xí)算法在粒子物理中用于模擬,重建和分析中,不斷增長(zhǎng)的應(yīng)用,自然地部署在這樣的平臺(tái)上。
實(shí)驗(yàn)證明,機(jī)器學(xué)習(xí)推理的加速即Web服務(wù),代表了粒子物理實(shí)驗(yàn)的異構(gòu)計(jì)算解決方案,只需要對(duì)當(dāng)前計(jì)算模型的最小修改。
作為示例,我們重新訓(xùn)練ResNet50卷積神經(jīng)網(wǎng)絡(luò),以展示LHC頂級(jí)夸克噴射標(biāo)記的最先進(jìn)性能,并應(yīng)用ResNet50模型和中微子事件分類的遷移學(xué)習(xí)。
使用Microsoft的Project Brainwave來(lái)加速ResNet50圖像分類模型,我們使用Brainwave作為云(邊緣或本地)服務(wù)的實(shí)驗(yàn)物理軟件框架實(shí)現(xiàn)了60(10)毫秒的平均推斷時(shí)間,顯示了一個(gè)因素導(dǎo)致模型推斷延遲比傳統(tǒng)CPU推斷提高了30-175倍。
作為粒子物理計(jì)算模型的邊緣或云服務(wù),協(xié)處理器加速器可以具有更高的占空比,并且可能更具成本效益。
-
FPGA
+關(guān)注
關(guān)注
1630文章
21759瀏覽量
604296 -
圖像
+關(guān)注
關(guān)注
2文章
1087瀏覽量
40501 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8425瀏覽量
132770
原文標(biāo)題:MIT提出FPGA加速機(jī)器學(xué)習(xí)推理,提速175倍輕松處理EB數(shù)據(jù)集
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論