歐洲核子研究中心的粒子物理學(xué)家在2012年發(fā)現(xiàn)了希格斯玻色子?,F(xiàn)在,人們的任務(wù)是進(jìn)一步了解其性質(zhì)。 人工智能在其中起著至關(guān)重要的作用。
今天是星期天。 您和我正在公園散步。 我們的狗冥王星在我們周圍蹦蹦跳跳,渴望玩耍。 你扔一根棍子抓住它。
然后你轉(zhuǎn)向我。 '你曾經(jīng)在希格斯玻色子上工作,對(duì)嗎?
'好! 那是發(fā)現(xiàn)后的四年。'
'如果已經(jīng)發(fā)現(xiàn),該怎么辦?'
'好吧,我們現(xiàn)在知道希格斯玻色子的存在。 但是它的許多特性仍然未知。 我和我的同事正在研究如何找出希格斯玻色子是否會(huì)在粒子對(duì)撞機(jī)內(nèi)衰減成暗物質(zhì)的策略。'
'因此,希格斯玻色子斷裂,而殘余物是暗物質(zhì)?'
人工智能可能會(huì)揭開希格斯玻色子的奧秘
'那是理論,是的。 我們不確定這是否真的發(fā)生。 但是值得研究。 因此,我和我的同事考慮了如何檢測(cè)到這些衰變(如果存在)。 而且我們發(fā)現(xiàn)人工智能是做到這一點(diǎn)的最佳方法。'
'AI? 怎么樣?'
'為此,您首先需要了解我們要解決的問題。
'在CERN,當(dāng)兩個(gè)粒子以非常高的能量碰撞時(shí),粒子探測(cè)器會(huì)捕獲發(fā)生的情況。 每種類型的粒子(例如夸克或希格斯玻色子)都會(huì)在粒子檢測(cè)器中留下特征性的痕跡。 如果我們將這些痕跡放在一起,就可以重建兩個(gè)粒子碰撞期間發(fā)生的過程。'
Traces of a collision in the CMS detector where a Higgs boson is produced. Courtesy of CERN
'那么您使用AI找出發(fā)生了哪些過程?'
'不是那么快! 讓我解釋。
'在某些碰撞中,會(huì)產(chǎn)生希格斯玻色子。 但是希格斯玻色子的壽命很短,因此會(huì)迅速衰減成其他粒子。 這些可能是夸克或其他玻色子,或者可能是暗物質(zhì)粒子。 后者我們稱為信號(hào)事件-碰撞,其中暗物質(zhì)位于生成的粒子中。
'當(dāng)然,我們可以簡(jiǎn)單地在檢測(cè)器注冊(cè)的許多過程中搜索信號(hào)-我們說的是每秒發(fā)生十億次碰撞。
'問題在于,有些事件看上去確實(shí)與信號(hào)相似。 但實(shí)際上它們是不同的過程。 這些我們稱為背景事件。 而且我們不希望那些人歪曲我們的數(shù)據(jù)。 因此,我們的任務(wù)是教檢測(cè)器區(qū)分信號(hào)與背景。'
'人工智能在這里如何發(fā)揮作用?'
'如果沒有AI,我們只會(huì)查看信號(hào)的不同屬性,然后將數(shù)據(jù)集剪切到幾乎找不到的位置。
'例如,人們可以利用夸克的數(shù)量作為希格斯玻色子向暗物質(zhì)衰變的副產(chǎn)物而發(fā)出。 除暗物質(zhì)粒子外,根據(jù)過程的基本物理原理,我們可能還會(huì)產(chǎn)生兩次夸克。 有時(shí)可能會(huì)有更多的夸克,有時(shí)會(huì)少一些。 可能存在統(tǒng)計(jì)差異。
Schematic overview of the signal and background events and their respective number of quarks. If one selects only the events that have one, two or three quarks, one gets a dataset with less background events. Image by the author
'因此,在本示例中,我們可以從沒有發(fā)現(xiàn)夸克或不超過夸克的數(shù)據(jù)集中刪除碰撞。 我們可以很有把握地說,它們不是信號(hào)事件。 這樣,我們改進(jìn)了數(shù)據(jù)集,因?yàn)樗谋尘氨纫郧吧倭恕?#39;
'這是AI發(fā)揮作用的地方嗎?'
'對(duì),就是這樣。 聰明的是,我們可以使AI算法學(xué)習(xí)信號(hào)事件的屬性。 這使我們的工作變得容易得多,因?yàn)檫@意味著我們不一定需要了解很多基礎(chǔ)物理知識(shí)。'
'你很懶-不研究基礎(chǔ)物理學(xué)!'
'我稱之為高效。'
'好吧。 人工智能如何學(xué)習(xí)信號(hào)是什么,背景是什么?'
'有很多不同的方法。 在我們的案例中,我們使用了非常簡(jiǎn)單的算法,稱為決策樹。 基本原理是,您首先使用偽數(shù)據(jù)集訓(xùn)練算法。 該數(shù)據(jù)集來(lái)自計(jì)算機(jī)模擬,僅包含已經(jīng)正確標(biāo)記為信號(hào)或背景的事件。
Machine learning algorithms, such as decision trees, can improve the quality of datasets much faster. Photo by Javier Allegue Barros on Unsplash
'決策樹將隨機(jī)剪切應(yīng)用于訓(xùn)練集,然后檢查其是否將信號(hào)與背景分離。 然后,它會(huì)反復(fù)出現(xiàn),直到找到最佳的裁切效果為止。'
'但是為什么你不能手動(dòng)做呢?'
'我們是手動(dòng)進(jìn)行的-但需要大量有關(guān)基礎(chǔ)流程的知識(shí),否則將需要很長(zhǎng)時(shí)間。 而且,由于信號(hào)的屬性通常相互依賴,因此很快變得復(fù)雜。
'例如,在信號(hào)碰撞中發(fā)出的兩個(gè)夸克可能彼此之間有一定距離。 但是可能還有其他涉及三個(gè)夸克的信號(hào)事件。 在這種情況下,三個(gè)夸克之間的距離可能會(huì)不同。 因此,我們不能只在夸克之間切一段距離。 決策樹非常適合考慮此類依賴關(guān)系。'
'因此,在某種程度上,機(jī)器比您更了解!"
'真正! 這有助于我們發(fā)現(xiàn)希格斯玻色子的特性。'
您再次向冥王星投擲棍子。
"這對(duì)希格斯有什么幫助?"
'使用AI,我們可以生成非常好的數(shù)據(jù)集,其中包含大量信號(hào)和少量背景事件。 在我們的案例中,信號(hào)事件是碰撞,此后希格斯玻色子衰減為暗物質(zhì)。
'現(xiàn)在,我們要做的就是計(jì)算發(fā)現(xiàn)的信號(hào)事件的數(shù)量。 如果我們發(fā)現(xiàn)一定數(shù)量,就可以說我們發(fā)現(xiàn)了希格斯玻色子對(duì)暗物質(zhì)的衰變!'
'你發(fā)現(xiàn)了嗎?'
'不。 至少-尚未。 我們的論文只是實(shí)現(xiàn)這一發(fā)現(xiàn)的眾多步驟之一。 研究需要時(shí)間!'
希格斯玻色子的未來(lái)仍然令人興奮
'看看您是否會(huì)發(fā)現(xiàn)它將會(huì)很有趣! 還是這些衰變甚至不存在。'
'等著瞧!'
'我肯定會(huì)…實(shí)際上,我認(rèn)為AI真的很難理解。 但是現(xiàn)在看來(lái)還不算瘋狂。'
'公平地說,我們使用了現(xiàn)有的最簡(jiǎn)單的AI工具之一。 如今,科學(xué)家經(jīng)常使用更復(fù)雜的算法,包括監(jiān)督式深度學(xué)習(xí)和GAN。 但是,如果您愿意,我們可以再談一談。'
"我很樂意!"當(dāng)您試圖從我們狗的嘴里擺動(dòng)棍子時(shí),您大叫。 "拜托冥王星,我們要回家了!"
-
人工智能
+關(guān)注
關(guān)注
1792文章
47387瀏覽量
238900 -
希格斯玻色子
+關(guān)注
關(guān)注
0文章
4瀏覽量
5812
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論