DNA作為一種數(shù)據(jù)存儲(chǔ)介質(zhì),只有在讀取、復(fù)制和發(fā)送到其他地方時(shí)才有用。從細(xì)胞核中傳遞遺傳信息的介質(zhì)是RNA(https://www.genome.gov/genetics-glossary/RNA-Ribonucleic-Acid)——從DNA轉(zhuǎn)錄而來(lái),它本身永遠(yuǎn)不會(huì)離開(kāi)細(xì)胞核?,F(xiàn)在,伊利諾伊州埃文斯頓西北大學(xué)的研究人員利用深度學(xué)習(xí),解開(kāi)了RNA轉(zhuǎn)錄過(guò)程中的一個(gè)復(fù)雜部分:細(xì)胞如何知道何時(shí)停止復(fù)制。
在RNA轉(zhuǎn)錄中,知道何時(shí)停止是至關(guān)重要的。編碼成RNA的信息在整個(gè)細(xì)胞中用于合成蛋白質(zhì)和調(diào)節(jié)廣泛的代謝過(guò)程。要想將正確的信息傳遞給預(yù)期的目標(biāo),需要這些RNA鏈盡可能多地表達(dá)——僅此而已。
“This is a very useful prescreening tool for investigating genetic variants in a high-throughput manner.”
—EMILY KUNCE STROUP, NORTHWESTERN UNIVERSITY
停止RNA復(fù)制過(guò)程——稱為聚腺苷酸化(polyA,https://en.wikipedia.org/wiki/Polyadenylation),是指它連接在切斷的RNA鏈末端的一系列腺嘌呤分子——涉及一系列相互作用從未被完全理解的蛋白質(zhì)。
因此,為了幫助解開(kāi)polyA,西北大學(xué)的研究人員Zhe Ji和Emily Kunce Stroup開(kāi)發(fā)了一個(gè)機(jī)器學(xué)習(xí)模型,可以定位和識(shí)別polyA位點(diǎn)。它的工作原理是將經(jīng)過(guò)訓(xùn)練以匹配遺傳密碼中重要序列的卷積神經(jīng)網(wǎng)絡(luò)(CNNs,https://spectrum.ieee.org/tag/convolutional-neural-networks)與經(jīng)過(guò)訓(xùn)練以研究CNN輸出的遞歸神經(jīng)網(wǎng)絡(luò)(RNN,https://spectrum.ieee.org/the-neural-network-that-remembers)配對(duì)。
雖然之前的模型采用了類似的方法,同時(shí)使用了CNNs和RNN,但這些研究人員隨后將CNN/RNN模型的輸出輸入到另外兩個(gè)經(jīng)過(guò)訓(xùn)練的深度學(xué)習(xí)模型中,以定位和識(shí)別基因組中的polyA位點(diǎn)。
另外兩個(gè)模型似乎起到了幫助作用。Stroup說(shuō):“擁有這些串聯(lián)輸出是我們工作中真正獨(dú)特的東西。讓模型向外延伸到兩個(gè)獨(dú)立的輸出分支,然后我們將其組合起來(lái)以高分辨率識(shí)別站點(diǎn),這是我們與現(xiàn)有工作的區(qū)別。”
從他們的模型中,研究人員了解了導(dǎo)致polyA進(jìn)展順利或不佳的幾個(gè)重要方面。模型的CNN部分學(xué)習(xí)了已知能吸引控制polyA的蛋白質(zhì)的DNA中的遺傳模式,而模型的RNN部分揭示了可靠地切斷轉(zhuǎn)錄需要在這些模式之間仔細(xì)間隔。由于該模型的核苷酸分辨率,這些研究人員可以得出如此精確的結(jié)論。Ji說(shuō):“我們的模型能夠準(zhǔn)確地捕捉到這一點(diǎn),這令人震驚。”
該團(tuán)隊(duì)表示,今后他們計(jì)劃將他們的模型和類似技術(shù)應(yīng)用于識(shí)別可能導(dǎo)致疾病的關(guān)鍵基因突變的研究,然后從中開(kāi)發(fā)出一種可能的更有針對(duì)性的治療藥物。Stroup說(shuō):“這是一種非常有用的預(yù)篩選工具,可以以高通量的方式研究基因變異。這有望幫助減少候選突變的數(shù)量,使這一過(guò)程更加有效。”
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4789瀏覽量
101612 -
DNA
+關(guān)注
關(guān)注
0文章
243瀏覽量
31198 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5527瀏覽量
121892
原文標(biāo)題:深度學(xué)習(xí)破解DNA數(shù)據(jù)復(fù)制難題
文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
電力行業(yè)應(yīng)用案例:頂堅(jiān)防爆巡檢記錄儀如何破解高危場(chǎng)景取證難題

中興通訊AiCube:破解AI模型部署難題
NPU在深度學(xué)習(xí)中的應(yīng)用
GPU深度學(xué)習(xí)應(yīng)用案例
AI大模型與深度學(xué)習(xí)的關(guān)系
FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?
DNA計(jì)算機(jī)研究取得突破性進(jìn)展:PB級(jí)數(shù)據(jù)存儲(chǔ)與高效處理
深度學(xué)習(xí)中的時(shí)間序列分類方法
深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)方法綜述
深度學(xué)習(xí)與nlp的區(qū)別在哪
深度學(xué)習(xí)常用的Python庫(kù)
深度學(xué)習(xí)模型訓(xùn)練過(guò)程詳解
深度學(xué)習(xí)的模型優(yōu)化與調(diào)試方法
深度解析深度學(xué)習(xí)下的語(yǔ)義SLAM

評(píng)論