0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種新的機(jī)器學(xué)習(xí)技術(shù):FPGA加速機(jī)器學(xué)習(xí)推理,提速175倍輕松處理EB數(shù)據(jù)集

DPVg_AI_era ? 來(lái)源:lq ? 2019-09-01 07:59 ? 次閱讀

由麻省理工學(xué)院助理教授Philip Harris和核科學(xué)實(shí)驗(yàn)室博士后Dylan Rankin等國(guó)際科學(xué)家團(tuán)隊(duì)測(cè)試的新機(jī)器學(xué)習(xí)技術(shù)可以在眨眼間發(fā)現(xiàn)大型強(qiáng)子對(duì)撞機(jī)(LHC)海量數(shù)據(jù)中的特定粒子特征。

MIT助理教授Philip Harris和核科學(xué)實(shí)驗(yàn)室博士后Dylan Rankin等國(guó)際科學(xué)家團(tuán)隊(duì)正在測(cè)試一種新的機(jī)器學(xué)習(xí)技術(shù),該技術(shù)可以在眨眼間在大型強(qiáng)子對(duì)撞機(jī)(LHC)浩瀚如海的數(shù)據(jù)中發(fā)現(xiàn)特定粒子特征。

新系統(tǒng)既復(fù)雜又迅速,可以在數(shù)據(jù)集不斷變大變復(fù)雜的情況下,讓我們得以一窺機(jī)器學(xué)習(xí)將在粒子物理學(xué)的未來(lái)發(fā)現(xiàn)中,會(huì)發(fā)揮怎樣舉足輕重的作用。

機(jī)器學(xué)習(xí)成為攻堅(jiān)利器

大型強(qiáng)子對(duì)撞機(jī)每秒造成大約4000萬(wàn)次碰撞。篩選如此大量數(shù)據(jù),需要強(qiáng)大的計(jì)算機(jī),來(lái)識(shí)別其中需要科學(xué)家去關(guān)注的碰撞,無(wú)論是暗物質(zhì)還是希格斯粒子。

現(xiàn)在,費(fèi)米實(shí)驗(yàn)室(Fermilab),歐洲核子研究中心(CERN),麻省理工學(xué)院,華盛頓大學(xué)和其他地方的科學(xué)家們已經(jīng)測(cè)試了一種新的機(jī)器學(xué)習(xí)系統(tǒng),與現(xiàn)有方法相比,該系統(tǒng)可將處理速度提高30到175倍!

傳統(tǒng)方法目前每秒只能處理不到一個(gè)圖像。相比之下,新的機(jī)器學(xué)習(xí)系統(tǒng)每秒最多可以查看600張圖像。在訓(xùn)練期間,系統(tǒng)學(xué)會(huì)挑選出一種特定類型的后碰撞粒子模式。

哈里斯說(shuō):“我們所識(shí)別的碰撞模式,頂夸克是大型強(qiáng)子對(duì)撞機(jī)上探測(cè)的基本粒子之一。能夠分析盡可能多的數(shù)據(jù)非常重要,每一條數(shù)據(jù)都帶有關(guān)于粒子如何相互作用的有趣信息。“

等目前的LHC升級(jí)完成后,數(shù)據(jù)將以前所未有的方式涌入;到2026年,17英里的粒子加速器預(yù)計(jì)將產(chǎn)生20倍于目前的數(shù)據(jù),同時(shí)圖像也將以比現(xiàn)在更高的分辨率拍攝??偠灾?,科學(xué)家和工程師估計(jì)大型強(qiáng)子對(duì)撞機(jī)所需的計(jì)算能力是目前的10倍以上。

哈里斯繼續(xù)說(shuō)道:“未來(lái)的挑戰(zhàn)迫在眉睫,隨著計(jì)算變得更加準(zhǔn)確,以及探測(cè)出更加精確的效果,它變得越來(lái)越難?!?/p>

該項(xiàng)目的研究人員對(duì)他們的新系統(tǒng)進(jìn)行了訓(xùn)練,以識(shí)別頂夸克的圖像,這是最龐大的基本粒子類型,比質(zhì)子重180倍。

“通過(guò)我們提供的機(jī)器學(xué)習(xí)架構(gòu),就能夠獲得高質(zhì)量的科學(xué)質(zhì)量結(jié)果,與世界上最好的頂夸克識(shí)別算法相媲美,”哈里斯解釋說(shuō)?!案咚賹?shí)施核心算法使我們能夠靈活地在最需要的關(guān)鍵時(shí)刻增強(qiáng)LHC計(jì)算?!?/p>

EB級(jí)的數(shù)據(jù)集也能輕松處理

憑借大型數(shù)據(jù)集和高數(shù)據(jù)采集速率,高性能和高吞吐量計(jì)算資源是實(shí)驗(yàn)粒子物理計(jì)劃的基本要素。這些實(shí)驗(yàn)在探測(cè)器技術(shù)的復(fù)雜性和粒子束的強(qiáng)度方面不斷增加。

因此,粒子物理數(shù)據(jù)集的大小正在增加,就像處理數(shù)據(jù)的算法的復(fù)雜性一樣。例如,大型強(qiáng)子對(duì)撞機(jī)(HL-LHC)的高亮度階段,將提供比當(dāng)前LHC運(yùn)行多15倍的數(shù)據(jù)。

HL-LHC將以40 MHz的速率碰撞質(zhì)子束,碰撞環(huán)境中每次碰撞的粒子數(shù)將是原來(lái)的5倍。

Compact Muon Solenoid(CMS)實(shí)驗(yàn)將針對(duì)HL-LHC進(jìn)行升級(jí),讀取通道的數(shù)量將增加10倍。通過(guò)一系列在線過(guò)濾器,CMS旨在以5 kHz的速率存儲(chǔ)HL-LHC碰撞事件。

這樣的數(shù)據(jù)速率導(dǎo)致數(shù)據(jù)集的規(guī)模為EB級(jí)。未來(lái)的中微子實(shí)驗(yàn),如深層地下中微子實(shí)驗(yàn)(DUNE)和宇宙學(xué)實(shí)驗(yàn)、平方公里陣列(SKA),預(yù)計(jì)將產(chǎn)生百億億字節(jié)的數(shù)據(jù)集。

大規(guī)模粒子物理實(shí)驗(yàn)面臨著高吞吐量計(jì)算資源的挑戰(zhàn)。在具有增強(qiáng)的并行化的專用硬件上新的異構(gòu)計(jì)算范例,例如現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA),能夠提供具有極大潛在增益的解決方案。

機(jī)器學(xué)習(xí)算法在粒子物理中用于模擬,重建和分析中,不斷增長(zhǎng)的應(yīng)用,自然地部署在這樣的平臺(tái)上。

實(shí)驗(yàn)證明,機(jī)器學(xué)習(xí)推理的加速即Web服務(wù),代表了粒子物理實(shí)驗(yàn)的異構(gòu)計(jì)算解決方案,只需要對(duì)當(dāng)前計(jì)算模型的最小修改。

作為示例,我們重新訓(xùn)練ResNet50卷積神經(jīng)網(wǎng)絡(luò),以展示LHC頂級(jí)夸克噴射標(biāo)記的最先進(jìn)性能,并應(yīng)用ResNet50模型和中微子事件分類的遷移學(xué)習(xí)。

使用Microsoft的Project Brainwave來(lái)加速ResNet50圖像分類模型,我們使用Brainwave作為云(邊緣或本地)服務(wù)的實(shí)驗(yàn)物理軟件框架實(shí)現(xiàn)了60(10)毫秒的平均推斷時(shí)間,顯示了一個(gè)因素導(dǎo)致模型推斷延遲比傳統(tǒng)CPU推斷提高了30-175倍。

作為粒子物理計(jì)算模型的邊緣或云服務(wù),協(xié)處理器加速器可以具有更高的占空比,并且可能更具成本效益。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1630

    文章

    21759

    瀏覽量

    604296
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1087

    瀏覽量

    40501
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8425

    瀏覽量

    132770

原文標(biāo)題:MIT提出FPGA加速機(jī)器學(xué)習(xí)推理,提速175倍輕松處理EB數(shù)據(jù)集

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    共同挑戰(zhàn):如何從高維噪聲數(shù)據(jù)中提取有效特征?如何平衡模型復(fù)雜度和計(jì)算效率?如何保證系統(tǒng)在真實(shí)環(huán)境中的穩(wěn)定性?書(shū)中提出的技術(shù)方案對(duì)我的工作很有啟發(fā)。多模態(tài)融合策略可用于處理異構(gòu)數(shù)據(jù)源,元
    發(fā)表于 12-24 15:03

    zeta在機(jī)器學(xué)習(xí)中的應(yīng)用 zeta的優(yōu)缺點(diǎn)分析

    的應(yīng)用(基于低功耗廣域物聯(lián)網(wǎng)技術(shù)ZETA) ZETA作為一種低功耗廣域物聯(lián)網(wǎng)(LPWAN)技術(shù),雖然其直接應(yīng)用于機(jī)器學(xué)習(xí)的場(chǎng)景可能并不常見(jiàn),
    的頭像 發(fā)表于 12-20 09:11 ?284次閱讀

    自然語(yǔ)言處理機(jī)器學(xué)習(xí)的關(guān)系 自然語(yǔ)言處理的基本概念及步驟

    Learning,簡(jiǎn)稱ML)是人工智能的個(gè)核心領(lǐng)域,它使計(jì)算機(jī)能夠從數(shù)據(jù)學(xué)習(xí)并做出預(yù)測(cè)或決策。自然語(yǔ)言處理機(jī)器
    的頭像 發(fā)表于 12-05 15:21 ?543次閱讀

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智
    的頭像 發(fā)表于 11-16 01:07 ?447次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過(guò)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門(mén)為深度學(xué)習(xí)
    的頭像 發(fā)表于 11-15 09:19 ?515次閱讀

    FPGA加速深度學(xué)習(xí)模型的案例

    FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)加速深度學(xué)習(xí)模型是當(dāng)前硬件加速領(lǐng)域的個(gè)熱門(mén)研究方向。以下是
    的頭像 發(fā)表于 10-25 09:22 ?260次閱讀

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來(lái)點(diǎn)也不輕松,加油。 作者首先說(shuō)明了時(shí)間序列的信息提取是時(shí)間序列分析的個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列
    發(fā)表于 08-14 18:00

    【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)知識(shí)學(xué)習(xí)

    語(yǔ)言的表達(dá)方式和生成能力。通過(guò)預(yù)測(cè)文本中缺失的部分或下個(gè)詞,模型逐漸掌握語(yǔ)言的規(guī)律和特征。 常用的模型結(jié)構(gòu) Transformer架構(gòu):大語(yǔ)言模型通常基于Transformer架構(gòu),這是一種能夠處理序列
    發(fā)表于 08-02 11:03

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 、深度學(xué)習(xí)加速 訓(xùn)練和推理過(guò)程
    發(fā)表于 07-29 17:05

    如何理解機(jī)器學(xué)習(xí)中的訓(xùn)練、驗(yàn)證和測(cè)試

    理解機(jī)器學(xué)習(xí)中的訓(xùn)練、驗(yàn)證和測(cè)試,是掌握機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-10 15:45 ?4367次閱讀

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

    機(jī)器學(xué)習(xí)的整個(gè)流程中,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進(jìn)而影響模型的訓(xùn)練效果和泛化能力。本文將從數(shù)據(jù)
    的頭像 發(fā)表于 07-09 15:57 ?486次閱讀

    機(jī)器學(xué)習(xí)數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)量的爆炸性增長(zhǎng)對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,
    的頭像 發(fā)表于 07-02 11:22 ?656次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無(wú)疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來(lái)了革命性的變化。然而,盡管它們都屬于
    的頭像 發(fā)表于 07-01 11:40 ?1432次閱讀

    機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

    關(guān)于數(shù)據(jù)機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)中尋找一種相應(yīng)的關(guān)系。Iris鳶尾花數(shù)據(jù)
    的頭像 發(fā)表于 06-27 08:27 ?1679次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典算法與應(yīng)用

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈鶪PU

    將 AI 框架模型映射到硬件架構(gòu)。 Larzul 的公司 Mipsology 希望通過(guò) Zebra 來(lái)彌合這差距。Zebra 是一種軟件平臺(tái),開(kāi)發(fā)者可以輕松地將深度學(xué)習(xí)代碼移植到
    發(fā)表于 03-21 15:19