最近,研究者借助 AI 技術(shù)發(fā)現(xiàn)了近 6000 種前所未聞的新病毒,這一工作已在 3 月 15 號由美國能源部(DOE)組織的一場會議中展示,成為了一種探索發(fā)現(xiàn)數(shù)量巨大、種類繁多的病毒的新工具。
盡管從人類健康到垃圾降解,病毒的影響力無處不在,卻很難被研究??茖W(xué)家無法在實驗室培植絕大多數(shù)病毒,確定其基因序列的嘗試也多遭失敗,因為它們的基因組極小,且進(jìn)化迅速。
近年來,通過將取自不同環(huán)境的樣本中的 DNA 進(jìn)行排序,研究者已經(jīng)獲得了一些未知的病毒。為了確定目前存在的微生物,研究者搜集了已知病毒和細(xì)菌的基因特征,就如同文字處理器的「查找」功能會突出顯示文檔中包含特定字母的單詞。但這一方法經(jīng)常失敗,因為病毒學(xué)家無法搜集他們不知道的東西。機(jī)器學(xué)習(xí)解決了這一問題,因為它可以發(fā)現(xiàn)海量數(shù)據(jù)中的潛在模式。機(jī)器學(xué)習(xí)算法解析數(shù)據(jù),從中學(xué)習(xí),接著自動分類信息。
南加州大學(xué)洛杉磯分校的計算生物學(xué)家 Jie Ren 說:「從前沒有研究病毒的好方法,但現(xiàn)在就不同了,我們有了新工具。」
上周日,美國能源部聯(lián)合基因組研究所(JGI)的計算生物學(xué)家 Simon Roux 訓(xùn)練計算機(jī)識別不常見的 Inoviridae 病毒家族的基因序列。這些病毒生存在細(xì)菌中并改變宿主的行為:比如,它們會使引起霍亂的細(xì)菌即霍亂弧菌的毒性變得更強(qiáng)。Roux 在 JGI 組織的會議上(加州,舊金山)展示了其研究,稱在他的研究開始前已識別到的基因組種類不到 100 種。
Roux 展示了一個機(jī)器學(xué)習(xí)算法,該算法使用兩個數(shù)據(jù)集:一個包含 805 個來自已知 Inoviridae 的基因序列,另一個包含 2000 個來自細(xì)菌和其他病毒的基因序列。算法可以找到一種方式來區(qū)分二者。
然后,Roux 向模型饋送大量宏基因組學(xué)數(shù)據(jù)集。計算機(jī)恢復(fù)了一萬多種 Inoviridae 基因組,并將其分成不同種類的集群。這些集群之間的基因變異非常大,意味著 Inoviridae 可能有很多家族。
病毒學(xué)習(xí)
在另一項獨(dú)立研究中,巴西圣保羅大學(xué)的生物信息學(xué)家 Deyvid Amgarten 應(yīng)用機(jī)器學(xué)習(xí)來在城市動物園的天然肥料堆中尋找病毒。他將算法設(shè)計為可以搜索病毒基因組的幾個可分辨特征,例如給定長度的 DNA 雙鏈的基因密度。經(jīng)過訓(xùn)練之后,計算機(jī)復(fù)原了幾種可能是新型的基因組,Amgarten 說。他將這個結(jié)果在 JGI 會議上進(jìn)行了展示。最后一步是學(xué)習(xí)這些病毒生成的蛋白質(zhì)種類,然后檢查哪些蛋白質(zhì)將加速有機(jī)物的破壞?!肝覀兿M纳品柿系馁|(zhì)量。」他說。
Amgarten 是從去年報告的一項機(jī)器學(xué)習(xí)工具即 Ren 的團(tuán)隊開發(fā)的 VirFinder 中得到靈感的。VirFinder 被設(shè)計用于尋找 DNA 堿基組合,例如 DNA 雙鏈中的 AT 或 GC。Ren 將算法應(yīng)用到從健康人和肝硬化患者(由肝炎或慢性酒精中毒導(dǎo)致的疾?。┑哪槻咳拥暮昊蚪M。機(jī)器將取樣的病毒完成了分組之后,該團(tuán)隊注意到樣本中某些特定類型的基因組在健康人群中相對更少或更多,這意味著這些基因組相關(guān)的病毒可能導(dǎo)致了疾病。Ren 的成果是一項很誘人的發(fā)現(xiàn):生物醫(yī)學(xué)研究者長期以來一直很困惑,到底是哪些病毒導(dǎo)致了那些疑難雜癥,例如慢性疲勞綜合癥(也稱為肌痛性腦脊髓炎),以及炎癥性腸病。
康涅狄格州法明頓市的基因組醫(yī)學(xué)杰克遜實驗室的免疫學(xué)家 Derya Unutmaz 推測,病毒可能觸發(fā)了一些毀滅性的反應(yīng),或者改變了人體微生物群系的細(xì)菌行為,從而使新陳代謝和免疫系統(tǒng)變得不穩(wěn)定。Unutmaz 說,通過應(yīng)用機(jī)器學(xué)習(xí),研究者可以發(fā)現(xiàn)患者體內(nèi)仍被隱藏的病毒。此外,由于 AI 可以在大規(guī)模數(shù)據(jù)集中發(fā)現(xiàn)模式,該方法也許可以將病毒數(shù)據(jù)和細(xì)菌關(guān)聯(lián)起來,然后和癥狀相關(guān)的蛋白質(zhì)變化關(guān)聯(lián)起來?!笝C(jī)器學(xué)習(xí)可以揭示出我們甚至從沒思考過的問題?!筓nutmaz 說。
-
醫(yī)療
+關(guān)注
關(guān)注
8文章
1824瀏覽量
58797 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8422瀏覽量
132723 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1451瀏覽量
34071
原文標(biāo)題:前沿 | 機(jī)器學(xué)習(xí)助力醫(yī)療,通過數(shù)據(jù)分析發(fā)現(xiàn)近6000種新病毒
文章出處:【微信號:gh_211d74f707ff,微信公眾號:重慶人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論