今年3月,距離新冠肺炎疫情首次被發(fā)現(xiàn)不到3個月,針對該病毒的疫苗已經(jīng)開始在人類身上進行試驗,如果在一年前,這一成就可能會讓生物醫(yī)學研究人員感到震驚。其中許多疫苗的研發(fā)要歸功于人工智能(AI)。?在200多年的免疫史上,這一壯舉是個很有前景的重要轉(zhuǎn)折。此次經(jīng)驗可能會徹底改變疫苗的制造方式,有可能在未來的流行病中挽救無數(shù)人的生命。?據(jù)世界衛(wèi)生組織(WHO)統(tǒng)計,截至2020年9月初,共有34款候選疫苗正在人類身上進行試驗,另有145款候選疫苗正在開展動物試驗或?qū)嶒炇以囼灒澜缧l(wèi)生組織有一份不斷更新的全球名單。不到一年前,還沒有人聽說過這種新冠病毒(被命名為SARS-CoV-2,其引起的呼吸道疾病被命名為COVID-19),這些數(shù)字非常驚人。研制一種疫苗通常需要很多年,甚至幾十年的時間。到目前為止,腮腺炎疫苗保持著最快的研發(fā)紀錄,從樣本采集到產(chǎn)品上市,大約用了4年。
毫無疑問,研究在飛速進行。在全球大部分人口注射高效疫苗之前,我們的社會和經(jīng)濟可能不會恢復正常。尋找疫苗現(xiàn)在是一項巨大的事業(yè),涉及全世界成百上千個實驗室的成千上萬名研究人員,花費達數(shù)十億美元。其規(guī)模、雄心和強度不亞于對月發(fā)射。 各大實驗室正在開展至少8種不同類型的疫苗研究。這些疫苗包括基于滅活病毒的傳統(tǒng)疫苗;使用遺傳物質(zhì)、更具實驗性的新疫苗,稱為DNA疫苗和RNA疫苗;以及其他基于特殊蛋白質(zhì)或其他生物制劑的疫苗。 處于緊要關頭的不僅有人們的生命,還有部分全球疫苗市場,在COVID-19出現(xiàn)之前,這個市場的估值就高達350億美元。政府、慈善機構(gòu)和制藥公司一直在進行相應投入。
2020年7月,美國政府同意在相關疫苗上市時向制藥巨頭輝瑞和德國生物技術公司BioNTech支付近20億美元,以購買1億劑疫苗。全球其他主要疫苗計劃也涉及10位數(shù)的資金。 機器學習系統(tǒng)和計算分析在疫苗研究中發(fā)揮了重要作用。這些工具有助于研究人員了解病毒及其結(jié)構(gòu),并預測病毒的哪些成分會引發(fā)免疫應答,這是疫苗設計中的關鍵一步。它們可以幫助科學家選擇潛在疫苗的成分,并理解實驗數(shù)據(jù)。還可以幫助科學家追蹤病毒隨時間推移而發(fā)生的基因突變,這些信息將決定未來各種疫苗的價值。
“人工智能是一種強大的催化劑?!奔s翰斯?霍普金斯大學懷廷工程學院教授兼機器學習和醫(yī)療保健實驗室的負責人蘇奇?薩里亞(Suchi Saria)說。她解釋道,借助人工智能,科學家“能夠結(jié)合來自多個實驗的數(shù)據(jù)和現(xiàn)實世界的數(shù)據(jù)得出見解”,她補充說,這些數(shù)據(jù)集往往非?;靵y且具有挑戰(zhàn)性,以至于科學家們以前甚至沒有嘗試過此類分析。 隨著人工智能工具變得越來越強大,研究人員期待有一天,計算方法可以幫助科學家解決最棘手的疫苗挑戰(zhàn),比如找到一種有效的HIV疫苗,或者研制一種有效期超過一年的流感疫苗。 盡管新型計算技術令我們很興奮,但還有一個警告隨之而來:人工智能不能取代或加速疫苗研發(fā)過程中最關鍵、最耗時的工作。
動物和人體試驗必須通過純?nèi)祟惖墓ぷ鬟M行,需要成千上萬名科學家、醫(yī)療衛(wèi)生工作者和參與者實時記錄其疫苗體驗。Distributed Bio公司及其子公司Centivax(正在利用計算生物工程技術研發(fā)流感、HIV及其他病原體疫苗)的創(chuàng)始合伙人雅各布?格蘭維爾(Jacob Glanville)說:“計算可以幫你優(yōu)化成功的機會,但最終你還得卷起袖子在實驗室里做這件事?!?盡管如此,在尋找新冠病毒疫苗的過程中,人工智能做的工作已經(jīng)比以往任何時候都多。它只是一套規(guī)模更大、正在徹底改變疫苗研發(fā)的計算工具的一部分。也許很少有人會考慮下一次大規(guī)模流行病,但研究人員已經(jīng)開始去了解這些工具下一次將如何發(fā)揮更大的作用。━━━━現(xiàn)代疫苗設計是一項龐大的信息密集型工作,首先需要大量數(shù)據(jù)來了解病毒和人類免疫系統(tǒng)對它的反應。
目前已知有200多種病毒可以感染人類,而每一種病毒的機制、行為以及最終的治療方法都不相同。 盡管它們在細節(jié)上各不相同,但病毒開始攻擊人體的方式大多相同。當病毒通過口腔或鼻腔進入人體后,它會與細胞表面的受體結(jié)合從而滲透到健康細胞中,然后,病毒會劫持細胞機器實現(xiàn)自我復制,緊接著感染便發(fā)生了。 免疫系統(tǒng)負責阻止這一切,它會獵殺并消滅致病的病毒和細菌等病原體。第一步,免疫系統(tǒng)會向感染細胞發(fā)送各種基本武器,這就是所謂的先天性免疫應答。
如果這還不足以控制感染,比如,若我們的身體之前不認識這種病原體,普通武器不起作用,那么免疫系統(tǒng)的適應性免疫應答就會使用更厲害的武器。適應性免疫依賴于兩類白細胞——B細胞和T細胞。B細胞可以產(chǎn)生一種稱特殊蛋白質(zhì),也就是抗體,它能與病原體結(jié)合,阻止病原體進入健康細胞。同時,T細胞可以破壞被病毒感染的細胞,阻止它們復制更多的病毒。 適應性免疫應答需要幾天才能做好準備開始消滅一種新病毒。我們身體里的B細胞和T細胞可以對世界上幾乎每一種病原體做出調(diào)整,但正確的免疫細胞找到入侵者并進行增殖需要時間。在此期間,我們便生病了。 好消息是,當“戰(zhàn)爭”激烈之時,免疫系統(tǒng)也會產(chǎn)生記憶B細胞和T細胞來記錄這場戰(zhàn)爭。如果我們再次接觸同一種病原體,免疫系統(tǒng)早已準備好了武器庫,就能更加快速地做出反應。我們可能會有輕微癥狀,或者一點癥狀都沒有。 因此,疫苗的目標是讓身體接觸病原體而不讓人生病,這樣免疫系統(tǒng)就可以在隨后的任何暴露中做好準備與之抗衡。這可以通過將身體暴露于特定的病毒片段或弱化病毒來實現(xiàn)。最關鍵的是,疫苗必須包含病毒的關鍵部分——抗原,抗原具有免疫原性,這意味著它們可以被B細胞和T細胞識別,從而觸發(fā)所需要的適應性免疫應答。
在面對新的病原體時,疫苗設計者首先要了解它的哪一部分最具免疫原性。病毒通常由遺傳物質(zhì)(DNA或RNA)組成,外面被一層或多層蛋白質(zhì)包裹。外膜通常含有刺突蛋白,這種蛋白能夠使病毒與宿主細胞上的受體結(jié)合,并注入其有效的遺傳物質(zhì)。因此,刺突蛋白是疫苗的典型靶點。如果免疫系統(tǒng)能產(chǎn)生抗體,使刺突蛋白失效,病毒就無法進入細胞。
不過,對于任何一種特定的病毒來說,免疫系統(tǒng)能識別的外膜蛋白有成千上萬種不同的亞成分,因此有成千上萬種不同的疫苗靶點可能性。這是人工智能發(fā)揮作用的一個好機會。機器學習工具可以根據(jù)已知病原體的訓練數(shù)據(jù)集預測免疫系統(tǒng)最有可能識別的病毒片段。
利用這些信息,免疫學家可以圍繞一系列在數(shù)量上更易管理的潛在靶點設計疫苗,然后將這些靶點整合到候選疫苗中,并在動物體內(nèi)進行試驗,以確定它們是否能觸發(fā)良好的免疫應答。美國免疫學家協(xié)會公共政策研究員、弗吉尼亞州諾福克瓦格納黃斑及視網(wǎng)膜中心(Wagner Macula & Retina Center)醫(yī)學信息學和人工智能集成主任塔亞布?瓦西姆(Tayab Waseem)說,機器學習會“給你打分,如果各項得分都超過了一定的分數(shù),比如99%,那么我會愿意進行實驗室測試”。 在疫情暴發(fā)后的最初幾周,斯坦福大學“以人為本”人工智能研究院(HAI)的羅斯?阿特曼(Russ Altman)和陳斌斌(Binbin Chen,音)帶領的一個計算機科學家團隊就利用機器學習這樣做了。研究人員利用神經(jīng)網(wǎng)絡算法NetMHCpan-4.0和MARIA,以及一個被稱為DiscoTope的線性回歸模型,列出了一份最有可能引發(fā)這種新型冠狀病毒免疫應答的靶點清單。這些靶點或表位是B細胞和T細胞可能識別的病毒成分。 正如預期的那樣,該系統(tǒng)推薦的許多最佳靶點都在病毒的刺突蛋白上。陳斌斌的團隊在一篇發(fā)表于預印本服務器bioRxiv的論文中建議,應將這些表位納入COVID-19疫苗的設計中?!拔覀兒苡行判模覀冾A測的靶點在細胞層面會產(chǎn)生免疫應答。”陳斌斌說,“但細胞反應和臨床反應之間還有很大的差距?!?/p>
多年來,人們?yōu)閹椭庖吖ぷ鏖_發(fā)了幾十種工具,陳斌斌的機器學習工具就是其中之一。據(jù)他說,機器學習過去一直是疫苗研發(fā)“不起眼的小助手”,但對于新冠病毒,“學術界和行業(yè)實驗室的人都開展了更多的計算研究?!彼f,“我懷疑所有研發(fā)疫苗的制藥公司也都進行了計算分析?!?/p>
確定病毒表面的靶點后,研究人員接下來就可以開發(fā)疫苗了。比如,如果計劃使用滅活病毒作為疫苗,研究人員將在實驗室培育活病毒,利用加熱、輻射或化學方法將其殺死,使其在注入體內(nèi)時無法復制。之后研究人員必須確保關鍵的免疫原性成分在病毒被殺死時沒有受損,因為這些部分必須完好無損才能激發(fā)免疫應答。接下來是在實驗室里測試疫苗,然后在小動物身上試驗,最后在人類身上進行試驗。━━━━要訓練軟件來篩選病毒靶點,首先要了解病毒蛋白質(zhì)的三維結(jié)構(gòu),這一點很重要。病毒蛋白質(zhì)由名為氨基酸的線性化學鏈組成,它們會自發(fā)折疊成緊湊的帶狀結(jié)構(gòu)。疫苗研發(fā)人員必須選擇病毒外層面朝外的靶點,這樣免疫系統(tǒng)的武器才能對它們進行攻擊。 疫情來襲時,瑞士巴塞爾大學的研究人員使用了一種叫做Swiss-Model的蛋白質(zhì)建模工具來預測SARS-CoV-2病毒外表面上的蛋白質(zhì)結(jié)構(gòu)。后來證明,他們的預測與病毒的實際蛋白質(zhì)結(jié)構(gòu)一致。同樣,總部位于倫敦的人工智能公司DeepMind應用了其神經(jīng)網(wǎng)絡AlphaFold,根據(jù)病毒的基因序列預測了SARS-CoV-2蛋白質(zhì)的三維形狀。
盡管取得了這些成功,但并非所有研究人員都看好人工智能在疫苗研發(fā)過程中的作用。他們認為,無論是否借助人工智能,基于對其他冠狀病毒的了解和對SARS-CoV-2的實驗研究都可得知,刺突蛋白是一個明顯的靶點。Distributed Bio公司的格蘭維爾表示:“有很多方法可以識別病原體的免疫原區(qū)域,這些方法不需要人工智能?!彼f,擁有能夠預測這些靶點的算法是好事,但是對于COVID-19來說可能不是必要的。他指出:“人工智能仍然面臨著挑戰(zhàn),需要證明它比簡單方法更有效。”例如血清篩查、表位作圖和結(jié)構(gòu)生物學等。
不過人工智能也可以針對病毒的免疫原性位點發(fā)揮更多作用。許多疫苗研發(fā)人員已經(jīng)在使用計算工具來設計和合成DNA疫苗的遺傳成分。圣地亞哥的Inovio Pharmaceuticals公司便是其中之一,該公司是34個在進行COVID-19疫苗人體試驗的研發(fā)組織之一。 “Inovio的研究小組熱切地等待著網(wǎng)上發(fā)布病毒的基因序列。”Inovio研發(fā)部高級副總裁凱特?布羅德里克(Kate Broderick)說,“1月10日中國機構(gòu)上傳序列后,我們的科學家立即將該序列輸入到我們的算法中,不到3個小時,他們就有了一款經(jīng)過充分設計和優(yōu)化的DNA藥物疫苗?!彼f。 Inovio的DNA疫苗通過模仿病原體的一部分基因序列發(fā)揮作用。
這些核酸疫苗含有DNA或RNA形式的基因指令片段,為病毒的關鍵免疫原成分指定遺傳密碼。當核酸進入人體細胞時,細胞會產(chǎn)生抗原,從而觸發(fā)免疫應答。根據(jù)先前對其他冠狀病毒的研究,Inovio的研究人員知道SARS-CoV-2的刺突蛋白很可能會引起免疫應答。因此,病毒基因組的該區(qū)域成為了他們研制疫苗的出發(fā)點。 寫出一個產(chǎn)生相同蛋白質(zhì)DNA序列的方法有許多。為了找到最有效的疫苗方法,需要結(jié)合其他基因成分和分子成分來共同增強這段遺傳密碼。借助Inovio的專利基因優(yōu)化算法,研究人員了解了如何以這樣的方式使疫苗激發(fā)免疫原性刺突蛋白的大規(guī)模產(chǎn)生。 布羅德里克說,Inovio的COVID-19疫苗從實驗室到臨床僅用了83天。她和她的同事今年5月在《自然?通訊》(Nature Communications)上發(fā)表的一項研究表明,這種疫苗在動物身上表現(xiàn)良好。
6月下旬,該公司宣布,在美國進行的一項試驗證明該疫苗是安全的,并且似乎能激發(fā)40名健康人士體內(nèi)的免疫應答。Inovio在7月底的一份報告表明,這種疫苗還為接種疫苗后接觸病毒的猴子提供了4個月的保護。 與病毒的基因變化同步也給計算機分析帶來了挑戰(zhàn)。病毒在不斷以微小的方式發(fā)生變異,因此疫苗必須圍繞病毒基因組中相對穩(wěn)定的區(qū)域來設計,這是病毒遺傳密碼中不會發(fā)生突變的區(qū)域。瓦格納黃斑和視網(wǎng)膜中心的瓦西姆說:“病毒表面蛋白質(zhì)的某些部分具有很高的代謝回轉(zhuǎn)率,只有對病毒進行測序時才能發(fā)現(xiàn)這一點,并且病毒結(jié)構(gòu)也會隨著它的變異而發(fā)生變化?!?過去10個月里,從世界各地患者身上采集的數(shù)萬份COVID-19病毒樣本已經(jīng)進行了基因測序,并上傳到了位于德國的全球流感數(shù)據(jù)共享倡議組織(GISAID)主辦的在線資料庫中。通過算法比較這些序列,可以揭示病毒基因組中哪些片段經(jīng)常改變,哪些片段不經(jīng)常改變。隨著病毒繼續(xù)在新的地區(qū)肆虐,研究人員將密切關注這個不斷變化的敵人。
所有這些工作都需要大量的計算能力。
2020年3月,白宮宣布將與公共和私人團體合作,為全世界的研究人員提供最強大的超級計算機,以“迅速推進治療方案和疫苗的科學研究”。 這個名為“COVID-19高性能計算聯(lián)盟”的計劃包括了來自美國能源部國家實驗室和幾所大學及私營公司(如IBM和惠普企業(yè))的資源。該聯(lián)盟擁有將近80個正在運行的項目,能夠?qū)崿F(xiàn)超過400千萬億次的浮點計算能力。 阿肯色大學費耶特維爾分校的計算化學家馬哈茂德?莫拉迪(Mahmoud Moradi)領導了其中一個項目。他使用了得克薩斯高級計算中心(TACC)的超級計算機來創(chuàng)建新冠病毒刺突蛋白的三維強化模擬。模擬結(jié)果顯示,與曾于2003年在亞洲暴發(fā)的傳染性冠狀病毒SARS-CoV-1相比,這些刺突蛋白的活躍速度和感染人類細胞的速度快得多。 Inovio的布羅德里克表示,這類研究對疫苗研發(fā)團隊至關重要?!翱茖W家可以學習大量相關信息來協(xié)助疫苗設計。”她說,“同時也可以了解這種病毒致病機理背后的機制。”
一旦一款候選疫苗被設計出來,大部分的工作將轉(zhuǎn)移到試驗上。疫苗首先會在實驗室經(jīng)歷細胞和動物試驗,然后在更多的人身上進行臨床試驗。在美國監(jiān)管機構(gòu)批準疫苗之前,數(shù)萬名試驗志愿者將接受疫苗注射。 可惜人工智能工具無法取代那些耗時的步驟。它們也許能夠預測免疫系統(tǒng)會看到哪些抗原,但免疫系統(tǒng)在人體內(nèi)實際將發(fā)生哪些反應則超出了當今計算機的能力。艾倫人工智能研究所的首席執(zhí)行官奧倫?艾奇奧尼(Oren Etzioni)說:“人體非常復雜,我們的模型不一定能夠可靠地預測這種分子或疫苗對人體的作用。這就是為什么我們要進行這些緩慢而艱難的試驗,我們的預測模型尚不足以提供可靠的數(shù)據(jù)?!?/p>
雖然人工智能無法預測人體試驗能否成功,但它可以查看所有參數(shù)并找到人腦可能無法發(fā)現(xiàn)的模式,從而理解這些試驗中的大量數(shù)據(jù)。隨著候選疫苗進入臨床試驗的二期和三期,成千上萬名患者將參與其中,而人工智能系統(tǒng)將成為快速分析臨床和免疫數(shù)據(jù)的關鍵。 越來越多的研究人員在開展研究,有關新冠病毒的文獻也越來越多,科學家們需要外部幫助來整理這些論文。艾倫研究所開發(fā)了一項名為CORD-19的資源,以機器可讀格式提供了超過13萬篇關于COVID-19的學術文章。其中,Kaggle社區(qū)利用這些數(shù)據(jù)集創(chuàng)建了多個人工智能系統(tǒng),能夠幫助研究人員跟上文獻的更新速度并解答高優(yōu)先級的研究問題。 艾奇奧尼說:“我相信,人工智能將在10年內(nèi)成為醫(yī)學研究人員工具包中不可或缺的一部分,無論是用于搜索文獻還是分析實驗數(shù)據(jù)?!碑斚乱淮未罅餍胁砼R時(總會有下一次大規(guī)模流行?。?,研究人員將做好解開致命病原體秘密的準備,設計許多可能的疫苗來保護我們,并迅速找到疫苗以防止類似COVID-19的災難再次降臨到人類身上。
原文標題:人工智能發(fā)揮了前所未有的作用
文章出處:【微信公眾號:IEEE電氣電子工程師學會】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
責任編輯:haq
-
AI
+關注
關注
87文章
31396瀏覽量
269787 -
人工智能
+關注
關注
1793文章
47588瀏覽量
239465
原文標題:人工智能發(fā)揮了前所未有的作用
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論