去年冬天,隨著流感季節(jié)的到來(lái),全球各地的醫(yī)療機(jī)構(gòu)都在加班加點(diǎn)地工作。美國(guó)疾病控制與預(yù)防中心(CDC)公布的數(shù)據(jù)現(xiàn)實(shí),近幾個(gè)月來(lái),已有超過(guò)18萬(wàn)美國(guó)人住院,另有1萬(wàn)人死亡,而新型冠狀病毒(現(xiàn)已正式命名為COVID-19)也以驚人的速度在全球蔓延。
對(duì)全球范圍內(nèi)流感疫情爆發(fā)的擔(dān)憂,甚至促使2020年移動(dòng)世界大會(huì)(MWC 2020)這樣的盛會(huì),在距離開(kāi)幕僅剩7天時(shí)間宣布取消。但在不久的將來(lái),人工智能(AI)增強(qiáng)的藥物開(kāi)發(fā)過(guò)程可以幫助以足夠快的速度生產(chǎn)疫苗,并找到治療方法,在致命病毒變異成全球性疫情之前阻止它們的傳播。
傳統(tǒng)的藥物和疫苗開(kāi)發(fā)方法效率極低。研究人員可以花費(fèi)近十年的時(shí)間,通過(guò)密集的試驗(yàn)和糾錯(cuò)技術(shù),對(duì)每個(gè)候選分子進(jìn)行詳細(xì)審查。塔夫茨藥物開(kāi)發(fā)研究中心2019年的一項(xiàng)研究現(xiàn)實(shí),開(kāi)發(fā)一種藥物的平均成本為26億美元,這是2003年成本的兩倍多。而且,只有大約12%進(jìn)入臨床開(kāi)發(fā)階段的藥物獲得了FDA批準(zhǔn)。
美國(guó)佐治亞大學(xué)藥學(xué)和生物醫(yī)學(xué)科學(xué)助理教授伊娃-瑪麗亞·斯特拉克博士(Eva-Maria Strauch)指出:“你繞不過(guò)FDA,后者真的需要5到10年的時(shí)間才能批準(zhǔn)某種藥物。”然而,在機(jī)器學(xué)習(xí)系統(tǒng)的幫助下,生物醫(yī)學(xué)研究人員基本上可以顛覆試錯(cuò)方法。研究人員可以使用AI來(lái)對(duì)大量候選化合物數(shù)據(jù)庫(kù)進(jìn)行排序,并推薦最有可能有效的治療方法,而不是手動(dòng)嘗試每種潛在的治療方法。
華盛頓大學(xué)計(jì)算生物學(xué)家S·約書(shū)亞·斯瓦米達(dá)斯(S.Joshua Swamidass)在2019年接受采訪時(shí)稱(chēng):“藥物開(kāi)發(fā)團(tuán)隊(duì)真正面臨的許多問(wèn)題,不再是人們認(rèn)為他們只需在腦海中整理數(shù)據(jù)就能處理的那種問(wèn)題,而是必須有某種系統(tǒng)方式來(lái)處理大量數(shù)據(jù)、回答問(wèn)題并洞察如何做事?!?/p>
例如,口服抗真菌藥物terbinafine于1996年上市,名稱(chēng)為拉米非,被用于治療鵝口瘡。然而,在三年內(nèi),有多人報(bào)告了服用該藥物的不良反應(yīng)。到2008年,已有3人死于肝中毒,另有70人患病。醫(yī)生發(fā)現(xiàn)terbinafine的一種代謝物(TBF-A)是造成肝臟損傷的原因,但當(dāng)時(shí)無(wú)法弄清楚它是如何在體內(nèi)產(chǎn)生的。
這種代謝途徑十年來(lái)始終是醫(yī)學(xué)界的一個(gè)謎,直到2018年,華盛頓大學(xué)研究生Na Le Dang訓(xùn)練了一臺(tái)關(guān)于代謝途徑的AI,并讓機(jī)器找出了肝臟將terbinafine分解為T(mén)BF-A的潛在途徑。事實(shí)證明,創(chuàng)建有毒代謝物是個(gè)兩步過(guò)程,而且這是個(gè)很難通過(guò)實(shí)驗(yàn)識(shí)別的過(guò)程,但用AI強(qiáng)大的模式識(shí)別能力卻非常簡(jiǎn)單。
事實(shí)上,在過(guò)去的50年里,已經(jīng)有450多種藥物被從市場(chǎng)上撤下,其中許多藥物像拉米菲爾一樣導(dǎo)致肝中毒。這促使FDA推出Tox21.gov網(wǎng)站,這是個(gè)關(guān)于分子及其對(duì)各種重要人類(lèi)蛋白質(zhì)相對(duì)毒性的在線數(shù)據(jù)庫(kù)。通過(guò)在這個(gè)數(shù)據(jù)集上訓(xùn)練AI,研究人員希望更快地確定潛在的治療是否會(huì)導(dǎo)致嚴(yán)重的副作用。
美國(guó)先進(jìn)翻譯科學(xué)中心的首席信息官山姆·邁克爾(Sam Michael)幫助創(chuàng)建了這個(gè)數(shù)據(jù)庫(kù),他解釋稱(chēng):“我們過(guò)去遇到過(guò)一個(gè)挑戰(zhàn),本質(zhì)上是,‘你能提前預(yù)測(cè)這些化合物的毒性嗎?’這與我們對(duì)藥物進(jìn)行小分子篩查的做法正好相反。我們不想找到匹配的藥物,我們只是想說(shuō)‘嘿,這種(化合物)有可能是有毒的。’”
當(dāng)AI不忙于解開(kāi)十年來(lái)的醫(yī)學(xué)謎團(tuán)時(shí),他們正在幫助設(shè)計(jì)一種更好的流感疫苗。2019年,澳大利亞弗林德斯大學(xué)的研究人員使用AI為開(kāi)發(fā)一種普通流感疫苗提供增強(qiáng)效應(yīng),這樣當(dāng)人體接觸到它時(shí),就會(huì)產(chǎn)生更高濃度的抗體。從技術(shù)上講,研究人員并沒(méi)有“使用”AI,而是啟動(dòng)它,讓它自己尋找用例路徑,因?yàn)樗耆亲约涸谠O(shè)計(jì)疫苗。
該團(tuán)隊(duì)由弗林德斯大學(xué)醫(yī)學(xué)教授尼古拉·彼得羅夫斯基(Nikolai Petrovsky)領(lǐng)導(dǎo),首先建立了AI Sam(配體搜索算法)。AI Sam接受的訓(xùn)練是區(qū)分那些對(duì)流感有效和無(wú)效的分子。然后,研究小組訓(xùn)練了第二個(gè)程序,以生成數(shù)萬(wàn)億個(gè)潛在的化合物結(jié)構(gòu),并將這些結(jié)構(gòu)反饋給AI Sam,后者開(kāi)始決定它們是否有效。
然后,研究小組挑選出排名靠前的候選化合物結(jié)構(gòu),并對(duì)他們進(jìn)行了物理合成。隨后的動(dòng)物試驗(yàn)證實(shí),增強(qiáng)后的疫苗比未改進(jìn)的前身更有效。最初的人體試驗(yàn)于今年年初在美國(guó)開(kāi)始,預(yù)計(jì)將持續(xù)12個(gè)月。如果審批過(guò)程順利,增強(qiáng)版疫苗可能在幾年內(nèi)公開(kāi)上市。對(duì)于只需要兩年(而不是正常的5-10年)就研發(fā)出來(lái)疫苗來(lái)說(shuō),這絕非壞事。
雖然機(jī)器學(xué)習(xí)系統(tǒng)可以比生物研究人員更快地篩選巨大的數(shù)據(jù)集,并通過(guò)更脆弱的聯(lián)系做出準(zhǔn)確的知情估計(jì),但在可預(yù)見(jiàn)的未來(lái),人類(lèi)仍將留在藥物開(kāi)發(fā)循環(huán)中。畢竟,人類(lèi)需要生成、整理、索引、組織和標(biāo)記所有的訓(xùn)練數(shù)據(jù),并教授AI他們應(yīng)該尋找的東西。
即使機(jī)器學(xué)習(xí)系統(tǒng)變得更有能力,當(dāng)使用有缺陷或有偏見(jiàn)的數(shù)據(jù)時(shí),它們?nèi)匀缓苋菀桩a(chǎn)生次優(yōu)結(jié)果,就像其他所有AI一樣。Unlearn.AI創(chuàng)始人兼首席執(zhí)行官查爾斯·費(fèi)舍爾博士(Dr.Charles Fisher)在去年11月寫(xiě)道:“醫(yī)學(xué)上使用的許多數(shù)據(jù)集大多來(lái)自白人、北美和歐洲人群。如果研究人員在機(jī)器學(xué)習(xí)中只是用這樣的數(shù)據(jù)集,并發(fā)現(xiàn)某個(gè)生物標(biāo)記物來(lái)預(yù)測(cè)對(duì)治療的反應(yīng),就不能保證該生物標(biāo)記物在更多樣化的人群中發(fā)揮作用?!睘榱藢?duì)抗數(shù)據(jù)偏見(jiàn)帶來(lái)的扭曲效應(yīng),費(fèi)舍爾主張使用“更大的數(shù)據(jù)集、更復(fù)雜的軟件和更強(qiáng)大的計(jì)算機(jī)”。
另一個(gè)重要組成部分將是干凈的數(shù)據(jù),正如Kebotix首席執(zhí)行官吉爾·貝克爾博士(Jill Becker)解釋的那樣。Kebotix是2018年成立的初創(chuàng)公司,它將AI與機(jī)器人技術(shù)結(jié)合起來(lái),設(shè)計(jì)和開(kāi)發(fā)奇異的材料和化學(xué)品。
貝克爾博士解釋說(shuō):“我們有三個(gè)數(shù)據(jù)來(lái)源,并有能力生成我們自己的數(shù)據(jù)。我們也有自己的合成實(shí)驗(yàn)室來(lái)生成數(shù)據(jù),然后使用外部數(shù)據(jù)?!边@些外部數(shù)據(jù)可以來(lái)自開(kāi)放期刊或訂閱期刊,也可以來(lái)自專(zhuān)利和公司的研究伙伴。但貝克爾指出,無(wú)論來(lái)源如何,“我們都花了很多時(shí)間清理它?!?/p>
美國(guó)先進(jìn)翻譯科學(xué)中心的首席信息官山姆·邁克爾(Sam Michael)也稱(chēng):“確保數(shù)據(jù)具有與這些模型相關(guān)聯(lián)的適當(dāng)元數(shù)據(jù)是絕對(duì)關(guān)鍵的。而且這不是隨隨便便就能發(fā)生的,你必須付出真正的努力。這很難,因?yàn)檫@個(gè)過(guò)程既昂貴又耗時(shí)。”
-
AI
+關(guān)注
關(guān)注
87文章
31429瀏覽量
269826 -
人工智能
+關(guān)注
關(guān)注
1793文章
47604瀏覽量
239526
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論