近日,天津大學(xué)精密儀器與光電子工程學(xué)院的光子芯片實(shí)驗(yàn)室提出了一種基于深度學(xué)習(xí)的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification through deep-learning-based two-dimensional Raman spectroscopy”為題,發(fā)表在《Analytica Chimica Acta》上。
表面增強(qiáng)拉曼光譜(Surface-enhanced Raman spectroscopy, SERS)可以提供分子獨(dú)特的振動(dòng)指紋,具有預(yù)處理簡(jiǎn)單、靈敏度高和無(wú)創(chuàng)檢測(cè)等優(yōu)點(diǎn)。隨著人工智能(artificial intelligence, AI)技術(shù)的快速發(fā)展,基于AI的拉曼光譜分析在細(xì)菌識(shí)別等生物傳感領(lǐng)域具有廣闊前景。目前,為了更加精確地實(shí)現(xiàn)細(xì)菌識(shí)別,研究者們提出將一維拉曼光譜轉(zhuǎn)換為二維拉曼光譜圖來(lái)獲取更加豐富的數(shù)據(jù)信息。但是,高分辨率的二維拉曼光譜圖在提高識(shí)別準(zhǔn)確度的同時(shí),通常會(huì)引起計(jì)算時(shí)間過(guò)長(zhǎng)等問(wèn)題。
在本項(xiàng)工作中,研究者們提出了一種低分辨率、多信息量的二維拉曼光譜圖處理算法,驗(yàn)證了其在細(xì)菌識(shí)別中的可行性。該算法基于小波包變換與格拉姆角場(chǎng)(Wavelet Packet transform and Gramian Angular field, WPGA)技術(shù),利用深度學(xué)習(xí)模型實(shí)現(xiàn)快速高效地識(shí)別細(xì)菌。如圖1所示,識(shí)別過(guò)程主要包括三個(gè)步驟,首先,采集細(xì)菌樣品的SERS光譜并進(jìn)行預(yù)處理;其次,利用WPGA算法將一維拉曼光譜轉(zhuǎn)換成二維拉曼光譜圖,這是本項(xiàng)工作能夠?qū)崿F(xiàn)快速高效分類的關(guān)鍵。由于分子振動(dòng),拉曼光譜常會(huì)出現(xiàn)微小的特征峰,但由于這些信息頻率相對(duì)較高,在光譜平滑過(guò)程中容易被忽略。因此,我們采用小波包變換技術(shù),對(duì)高頻信息成分進(jìn)行更為精細(xì)的篩選,以減少有用信息的損失。然后利用格拉姆角場(chǎng)技術(shù),對(duì)篩選后的有效特征添加序列信息來(lái)提高識(shí)別精確度。最后,通過(guò)訓(xùn)練深度學(xué)習(xí)模型來(lái)識(shí)別細(xì)菌。
圖1.細(xì)菌識(shí)別的主要步驟。包括三個(gè)步驟:拉曼數(shù)據(jù)收集、WPGA算法處理和二維光譜圖分類。
基于提出的算法,研究者們對(duì)枯草芽孢桿菌和酵母菌的SERS光譜進(jìn)行了分類驗(yàn)證。圖2(a)展示了基于卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行該二元分類問(wèn)題的訓(xùn)練過(guò)程,結(jié)果表明驗(yàn)證集的精度可以達(dá)到99.75%,損失為0.0074。圖2(b)展示了模型訓(xùn)練完成后,使用測(cè)試集來(lái)評(píng)估分類性能,識(shí)別準(zhǔn)確率為99.64%,初步證明了該算法的可行性。為了驗(yàn)證該算法的泛化能力,研究者們進(jìn)一步開(kāi)展了基于Bacteria-ID公共數(shù)據(jù)集的多分類識(shí)別任務(wù)。圖2(c)展示了沒(méi)有進(jìn)行WPGA算法處理時(shí),30種細(xì)菌在二維空間中的分布,不同類別之間的相互混合,難以區(qū)分。如圖2(d)所示,利用所提算法后,不同種類的細(xì)菌彼此分離,基于Resnet網(wǎng)絡(luò)模型的分類識(shí)別準(zhǔn)確率可以達(dá)到90.55%。
圖2.兩種及多種細(xì)菌的分類識(shí)別結(jié)果。(a)訓(xùn)練集和驗(yàn)證集的準(zhǔn)確率和損失曲線;(b)測(cè)試集的混淆矩陣;(c)數(shù)據(jù)集在二維空間中的分布;(d)使用WPGA算法后,數(shù)據(jù)集在二維空間中的聚類效果。
本論文第一作者為天津大學(xué)精密儀器與光電子工程學(xué)院的碩士生劉怡辰,通信作者為天津大學(xué)精密儀器與光電子工程學(xué)院的程振洲教授、胡浩豐教授和高翊盛博士。該工作得到了國(guó)家自然科學(xué)基金(62161160335、62175179、62475188、61805175、12304428)、天津市自然科學(xué)基金(23JCJQJC00250)、廣東省自然科學(xué)基金(2022B1515130002)和日本學(xué)術(shù)振興會(huì)(JP18K13798)項(xiàng)目的支持。
-
算法
+關(guān)注
關(guān)注
23文章
4612瀏覽量
92884 -
二維
+關(guān)注
關(guān)注
0文章
40瀏覽量
11984 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5503瀏覽量
121157 -
拉曼光譜
+關(guān)注
關(guān)注
0文章
83瀏覽量
2743
原文標(biāo)題:面向細(xì)菌識(shí)別應(yīng)用的二維拉曼光譜處理算法
文章出處:【微信號(hào):光子芯片實(shí)驗(yàn)室,微信公眾號(hào):光子芯片實(shí)驗(yàn)室】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論