簡(jiǎn)介
天文學(xué)是研究天體的學(xué)科,其研究對(duì)象包含恒星、星系、黑洞等。研究天體有點(diǎn)像在自然物理實(shí)驗(yàn)室做實(shí)驗(yàn)。在這個(gè)實(shí)驗(yàn)室里,會(huì)發(fā)生自然界中最為極端的變化過程,而這些過程中的絕大部分都無(wú)法在地球上重現(xiàn)。通過比較我們對(duì)物理學(xué)的了解和在宇宙中發(fā)現(xiàn)的事實(shí),觀察宇宙中的極端事件可以檢驗(yàn)并深化我們對(duì)物理的認(rèn)知。
在天文學(xué)家眼中,發(fā)生在大質(zhì)量恒星生命末期的特殊類型事件就非常有趣。恒星由氫通過引力作用聚集而成,當(dāng)氫的密度足夠高時(shí),氫原子開始聚變,繼而發(fā)出光,并產(chǎn)生氦、碳、氧、氖等元素。聚變過程會(huì)產(chǎn)生向外的壓力,而引力則會(huì)產(chǎn)生向內(nèi)的壓力,二者相互作用,使恒星在燃燒燃料時(shí)保持穩(wěn)定。當(dāng)恒星試圖融合鐵原子時(shí),這種穩(wěn)定的狀態(tài)就會(huì)發(fā)生變化。由于融合過程不會(huì)產(chǎn)生能量,而是必須從恒星中提取能量,從而導(dǎo)致恒星的核心坍塌并發(fā)生超新星爆炸。
蟹狀星云,超新星遺跡(圖片來自 hubblesite.org)
這個(gè)過程對(duì)天文學(xué)家而言極具意義。借助爆炸過程中出現(xiàn)的極端條件,天文學(xué)家可以觀察重元素的合成、測(cè)試物質(zhì)在高壓和高溫下的行為,也可以觀察爆炸的產(chǎn)物,即中子星或黑洞。
超新星也可以用作標(biāo)準(zhǔn)燭光。如何測(cè)量天體的距離是天文學(xué)中的一個(gè)典型問題。因?yàn)楹阈蔷嚯x地球太遠(yuǎn),所以我們很難判斷所看到的恒星是離我們很近但是很暗的恒星,還是離我們很遠(yuǎn)但是很亮的恒星。宇宙中大多數(shù)的超新星爆炸過程都非常相似;因此,天文學(xué)家選擇使用超新星來測(cè)量距離,而距離對(duì)宇宙學(xué)家研究宇宙膨脹和暗能量等都非常重要。
盡管超新星爆炸時(shí)非常亮(與其宿主星系的亮度相比),但由于它們距離地球太遠(yuǎn)、爆炸的發(fā)生率太低(每個(gè)星系每個(gè)世紀(jì)大約只有一顆超新星)并且爆炸的持續(xù)時(shí)間太短(可能持續(xù)數(shù)天到數(shù)周),因此這類事件很難被發(fā)現(xiàn)。
此外,要從超新星中獲得有用的信息就必須進(jìn)行跟進(jìn),也就是使用一種稱為光譜儀的儀器來觀察目標(biāo)超新星,并測(cè)量爆炸時(shí)在不同頻率下釋放的能量。由于許多有趣的物理過程發(fā)生在爆炸開始后的數(shù)小時(shí)內(nèi),因此,最好盡早開始跟進(jìn)。
那么,我們?nèi)绾尾拍茉谟钪嬷杏^測(cè)到的所有天體中快速找到這些超新星爆炸事件呢?
當(dāng)今的天文學(xué)
幾十年前,天文學(xué)家必須選擇并對(duì)準(zhǔn)天空中的某個(gè)特定天體才能研究該天體。而目前的現(xiàn)代望遠(yuǎn)鏡(例如正在投入使用的茲威基瞬變?cè)O(shè)施 (ZTF) 或薇拉·魯賓天文臺(tái))能以非常高的速度拍攝天空的大幅圖像,每三天觀察一次可視范圍內(nèi)的天空,還能制作一段南半球天空的影片。如今,ZTF 望遠(yuǎn)鏡每晚會(huì)生成1.4TB的數(shù)據(jù),實(shí)時(shí)識(shí)別天空中有趣的變化物體并傳送相關(guān)信息。
當(dāng)某個(gè)物體的亮度發(fā)生變化時(shí),這些望遠(yuǎn)鏡能夠探測(cè)到這種變化并發(fā)出警報(bào)。這些警報(bào)通過數(shù)據(jù)流發(fā)送,每個(gè)警報(bào)由三張 63x63 像素的裁剪圖像組成。這三張圖像分別被稱為科學(xué)圖像、參照?qǐng)D像和差值圖像。
科學(xué)圖像是對(duì)特定觀察位置的最新觀察結(jié)果。通常會(huì)在探測(cè)開始時(shí)拍攝模板,然后將該模板與科學(xué)圖像進(jìn)行比較??茖W(xué)圖像與模板之間的任何不同之處都會(huì)出現(xiàn)在差值圖像中。在對(duì)圖像進(jìn)行一些處理后,用科學(xué)圖像減去參照?qǐng)D像,計(jì)算得到的便是差值。
目前,ZTF 望遠(yuǎn)鏡平均每晚發(fā)送 10 萬(wàn)次警報(bào),最多可發(fā)送 100 萬(wàn)次。如果有人想手動(dòng)檢查每一個(gè)警報(bào),我們不妨假設(shè)檢查每一個(gè)警報(bào)需要 3 秒鐘,那么對(duì)于一個(gè)普通的夜晚(發(fā)送 10 萬(wàn)次警報(bào)),檢查一晚上所有的警報(bào)則需要大約 3.5 天時(shí)間。
從左至右分別是科學(xué)圖像、參照?qǐng)D像和差值圖像:這三張圖像加上其他的重要數(shù)據(jù),如觀測(cè)條件和有關(guān)物體的信息。第四張圖像來自 PanSTARRS,經(jīng) Aladin Sky Atlas 上色。您可以在 ALeRCE 前端看到超新星的亮度在不同時(shí)間的完整變化過程
整理這些接收到警報(bào)是一項(xiàng)繁重的任務(wù)。當(dāng)收到新的警報(bào)時(shí),產(chǎn)生該警報(bào)的天體類型可能是未知的。因此,我們首先需確認(rèn)是否已在其他觀測(cè)中了解到這個(gè)天體(交叉匹配)。我們還需要確認(rèn)是哪一種天體產(chǎn)生的警報(bào)(分類)。最后,我們需要整理數(shù)據(jù)并將其提供給社區(qū)。這項(xiàng)任務(wù)需要 ALeRCE、Lasair、Antares 等天文分類系統(tǒng)來完成。
由于這些警報(bào)基本上包含天空中發(fā)生的一切變化,因此我們應(yīng)該能夠在 ZTF 望遠(yuǎn)鏡發(fā)出的所有警報(bào)中找到超新星。但問題在于,其他天體也會(huì)發(fā)出警報(bào),例如會(huì)發(fā)生亮度變化的恒星(變星)、活動(dòng)星系核 (AGN) 和小行星,而且有時(shí)也會(huì)出現(xiàn)測(cè)量誤差(誤報(bào))。幸運(yùn)的是,科學(xué)圖像、參照?qǐng)D像和差值圖像中的一些可區(qū)分特征,能夠幫助我們確定警報(bào)來自超新星還是其他天體。我們需要有效地區(qū)分以下五類天體。
只需使用第一個(gè)警報(bào)就能區(qū)分這五類天體:這些分別是每一類天體的五個(gè)示例警報(bào),每個(gè)警報(bào)都包含科學(xué)圖像、參照?qǐng)D像和差值圖像
簡(jiǎn)而言之,活動(dòng)星系核往往出現(xiàn)在星系中心。超新星通常出現(xiàn)在宿主星系附近。我們會(huì)在太陽(yáng)系平面附近觀測(cè)到小行星,并且,它們不會(huì)出現(xiàn)在模板圖像中。變星大多會(huì)在銀河系中觀測(cè)到,因此其圖像中還可以看到其他恒星。出現(xiàn)誤報(bào)的原因有很多種,包括相機(jī)中有壞的像素點(diǎn)、用于生成差值圖像的減法出錯(cuò)、宇宙射線(警報(bào)圖像中心非常明亮、密集且銳利的區(qū)域)等。
如上文所述,人們不可能手動(dòng)檢查每一個(gè)警報(bào),所以我們需要一種自動(dòng)分類的方法,這樣天文學(xué)家就可以查看更有可能是超新星的最有意義的來源。
利用神經(jīng)網(wǎng)絡(luò)尋找超新星
由于我們已大致了解上述五類天體的警報(bào)圖像之間的差異,因此原則上我們可以計(jì)算特定特征以正確對(duì)這些圖像進(jìn)行分類。但是,手動(dòng)設(shè)計(jì)特征通常非常難,并且需要長(zhǎng)時(shí)間的反復(fù)試驗(yàn)。正因如此,我們決定通過訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò) (CNN) 來解決分類問題(Carrasco-Davis 等人,2020 年)。在本研究中,我們僅使用第一個(gè)警報(bào)來快速找出超新星。
Carrasco-Davis 等人,2020 年
https://arxiv.org/abs/2008.03309
我們通過在訓(xùn)練集中加入每個(gè)圖像旋轉(zhuǎn) 90° 后的副本來提供具有旋轉(zhuǎn)不變性的架構(gòu),然后對(duì)圖像的每個(gè)旋轉(zhuǎn)后版本的密集表示應(yīng)用平均池化。在此問題上加上旋轉(zhuǎn)不變性非常有用,因?yàn)榫瘓?bào)圖像中的結(jié)構(gòu)沒有固定的顯示方向(Cabrera-Vives 等人,2017 年、E. Reyes 等人,2018 年)。我們還添加了警報(bào)中包含的部分元數(shù)據(jù),例如,天空坐標(biāo)上的位置、到其他已知物體的距離,以及大氣狀況指標(biāo)等。在使用交叉熵訓(xùn)練模型后,即使出現(xiàn)分類器預(yù)測(cè)錯(cuò)類別的情況,分類結(jié)果的概率也高度集中在 0 或 1 附近。如果專家要在模型給出預(yù)測(cè)后,進(jìn)一步篩選出超新星,那么這個(gè)方法就不太方便。飽和值 0 或 1 無(wú)法提供與模型錯(cuò)誤分類的概率,以及做出的第二或第三可能的類別預(yù)測(cè)有關(guān)的數(shù)據(jù)分析。
Cabrera-Vives 等人,2017 年
https://doi.org/10.3847/1538-4357/836/1/97
E. Reyes 等人,2018 年
https://doi.org/10.1109/IJCNN.2018.8489627
因此,除損失函數(shù)中的交叉熵項(xiàng)之外,我們還添加了額外的項(xiàng)來盡可能地提高預(yù)測(cè)的熵,以分散輸出概率的值(Pereyra 等人,2017 年)。此舉改善了預(yù)測(cè)的細(xì)粒度或定義,模型輸出的概率不再聚集,而是分散在 0 到 1 的整個(gè)范圍內(nèi),因此模型做出的預(yù)測(cè)更易理解,進(jìn)而能夠幫助天文學(xué)家選擇符合條件的超新星候選者進(jìn)行報(bào)告跟進(jìn)。
Pereyra 等人,2017 年
https://arxiv.org/abs/1701.06548
具有增強(qiáng)的旋轉(zhuǎn)不變性的卷積神經(jīng)網(wǎng)絡(luò):為每個(gè)輸入圖像創(chuàng)建旋轉(zhuǎn)副本并將其饋送到相同的 CNN 架構(gòu),然后在將其與元數(shù)據(jù)串聯(lián)之前,在密集層中應(yīng)用平均池化。最后,應(yīng)用另外兩個(gè)完全連接的層和 softmax 以獲得預(yù)測(cè)結(jié)果
我們對(duì) ZTF 整個(gè)覆蓋范圍內(nèi)均勻分布在太空中的 40 萬(wàn)個(gè)物體進(jìn)行了推斷,以對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行合理性檢查。檢查結(jié)果證明,CNN 預(yù)測(cè)的每個(gè)天體類別的空間分布均符合預(yù)期(基于每個(gè)天體的性質(zhì))。
例如,AGN 和超新星 (SNe) 大多會(huì)在銀河平面之外(即河外天體)找到,因?yàn)橛衅渌祗w的遮擋,所以不太可能透過銀河平面看到更遠(yuǎn)位置上的天體。模型正確預(yù)測(cè)了靠近銀道面(銀道緯度接近 0)的天體數(shù)量較少。在銀道內(nèi)正確發(fā)現(xiàn)了具有較高密度的變星。和預(yù)期的一樣,在太陽(yáng)系平面(也稱為黃道,用黃線標(biāo)出)附近發(fā)現(xiàn)了小行星,而誤報(bào)也隨處可見。在大型未標(biāo)記數(shù)據(jù)集中進(jìn)行推斷,可為我們提供有關(guān)訓(xùn)練集內(nèi)偏差的重要線索,還可幫助我們確定 CNN 所使用的重要元數(shù)據(jù)。
我們發(fā)現(xiàn),雖然圖像(科學(xué)圖像、參照?qǐng)D像和差值圖像)內(nèi)的信息足以讓我們?cè)谟?xùn)練集中獲得良好的分類結(jié)果,但是整合來自元數(shù)據(jù)的信息對(duì)獲得預(yù)測(cè)結(jié)果的正確空間分布至關(guān)重要。
未標(biāo)記天體集的空間分布:每張圖均采用銀道坐標(biāo)。銀道的緯度中心位于銀河系,因此,維度接近 0 也意味著更接近銀道面。銀道經(jīng)度表示我們?cè)阢y道面內(nèi)看到的是銀盤的哪一部分。黃線表示太陽(yáng)系平面(黃道)
Supernova Hunter
此項(xiàng)目的重要組成部分是網(wǎng)絡(luò)界面,通過此界面,天文學(xué)家可瀏覽由我們的神經(jīng)網(wǎng)絡(luò)按照該候選者屬于超新星的置信度排序的候選天體名單。Supernova Hunter 是一款可視化工具,可用于展示與警報(bào)相關(guān)的重要信息,天文學(xué)家可利用此工具選擇應(yīng)將哪些天體報(bào)告為超新星。此工具還設(shè)有一個(gè)按鈕,可用來報(bào)告模型做出的錯(cuò)誤分類。我們收到報(bào)告的錯(cuò)誤分類后,會(huì)將其添加到訓(xùn)練集中,并會(huì)在稍后手動(dòng)標(biāo)記這些錯(cuò)誤示例來改進(jìn)模型。
Supernova Hunter
https://snhunter.alerce.online/
Supernova Hunter:瀏覽超新星候選者的用戶界面。此界面顯示一串警報(bào)列表,而這些警報(bào)有很大的可能性是超新星。對(duì)于每個(gè)警報(bào),警報(bào)的圖像、天體的位置和元數(shù)據(jù)均會(huì)顯示在網(wǎng)頁(yè)上
通過使用神經(jīng)網(wǎng)絡(luò)分類器和 Supernova Hunter,我們已利用光譜方法確認(rèn)出 394 個(gè)超新星,并在 2019 年 6 月 26 日至 2020 年 7 月 21 日期間向 Transient Name Server 報(bào)告了 3060 個(gè)超新星候選者,平均每天報(bào)告 9.2 個(gè)。這樣的發(fā)現(xiàn)速度可極大提高在爆炸早期找到的超新星數(shù)量。
展望未來
目前,我們正在努力改善模型的分類性能,以獲得更符合條件的超新星候選者,并減少報(bào)告過程中所需的專家助手人數(shù)。理想情況下,我們希望擁有一個(gè)能夠自動(dòng)報(bào)告每個(gè)可能的超新星候選者的系統(tǒng)。
此外,我們還希望擴(kuò)展我們模型的功能,讓其能夠使用多個(gè)時(shí)間戳。我們開發(fā)了一個(gè)神經(jīng)網(wǎng)絡(luò)模型,此模型能夠接收一系列的圖像而不是單個(gè)時(shí)間戳的圖像,因此,每當(dāng)特定物體有新圖像可用時(shí),此模型就能夠整合新收取的信息,從而可以提高其對(duì)每個(gè)類別的預(yù)測(cè)結(jié)果的置信度。
使用多個(gè)時(shí)間戳
https://doi.org/10.1088/1538-3873/aaef12
我們研究工作的另一大重點(diǎn)是使用異常檢測(cè)技術(shù)發(fā)現(xiàn)稀有物體。這項(xiàng)任務(wù)非常重要,因?yàn)榈靡嬗谛滦屯h(yuǎn)鏡空前龐大的采樣率和每次觀測(cè)的空間深度,我們很可能能夠發(fā)現(xiàn)新的天體類型。
我們認(rèn)為這種分析大量天文數(shù)據(jù)的新方法不僅有用,而且很有必要。為科學(xué)界提供數(shù)據(jù)的管理、分類和再分發(fā)是利用天文數(shù)據(jù)進(jìn)行科學(xué)研究的重要一環(huán)。這項(xiàng)任務(wù)需要整合來自不同領(lǐng)域的專業(yè)知識(shí),例如計(jì)算機(jī)科學(xué)、天文學(xué)、工程學(xué)和數(shù)學(xué)。隨著新型現(xiàn)代望遠(yuǎn)鏡的建成(如薇拉·魯賓天文臺(tái)),勢(shì)必會(huì)極大地改變天文學(xué)家研究天體的方式,而作為 ALeRCE 代理,我們將做好一切準(zhǔn)備來實(shí)現(xiàn)這一點(diǎn)。如需了解詳細(xì)信息,請(qǐng)?jiān)L問我們的網(wǎng)站,或?yàn)g覽我們的論文:ALeRCE 演示論文,文中描述了完整的處理流水線;時(shí)間戳分類器(本文中描述的研究項(xiàng)目);以及光曲線分類器,該分類器通過使用稱為光曲線的時(shí)間序列,提供了更復(fù)雜的分類和更大的分類學(xué)。
責(zé)任編輯:lq
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4773瀏覽量
100889 -
圖像
+關(guān)注
關(guān)注
2文章
1087瀏覽量
40498 -
光譜儀
+關(guān)注
關(guān)注
2文章
966瀏覽量
30836
原文標(biāo)題:神經(jīng)網(wǎng)絡(luò)破解天文難題,快速探測(cè)超新星
文章出處:【微信號(hào):tensorflowers,微信公眾號(hào):Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論