藥物發(fā)現(xiàn)領(lǐng)域正處于一個(gè)迷人的轉(zhuǎn)折點(diǎn)。這個(gè)問題的物理學(xué)是可以理解和計(jì)算的,然而量子力學(xué)計(jì)算太昂貴和耗時(shí)。 Eroom’s Law 觀察到,盡管技術(shù)有所進(jìn)步,但藥物發(fā)現(xiàn)速度越來越慢,成本越來越高。
最近一篇研究 GPU 計(jì)算和深度學(xué)習(xí)在藥物發(fā)現(xiàn)中的轉(zhuǎn)變作用 顯示出這種趨勢可能很快逆轉(zhuǎn)的希望。
該綜述發(fā)表在 自然機(jī)器智能 上,詳細(xì)介紹了從分子模擬和蛋白質(zhì)結(jié)構(gòu)測定到生成性藥物設(shè)計(jì)等挑戰(zhàn)方面的許多進(jìn)展,這些挑戰(zhàn)加速了計(jì)算機(jī)輔助藥物發(fā)現(xiàn)工作流程。在高度并行化 GPU 和支持 GPU 的算法的發(fā)展推動下,這些進(jìn)步為計(jì)算化學(xué)和結(jié)構(gòu)生物學(xué)開發(fā)新藥帶來了新的可能性。
研究人員在藥物發(fā)現(xiàn)和機(jī)器學(xué)習(xí)方面的合作,以確定 GPU 加速的深度學(xué)習(xí)工具,為這些挑戰(zhàn)創(chuàng)造了新的可能性,如果這些挑戰(zhàn)得到解決,將成為更快、更廉價(jià)藥物開發(fā)的關(guān)鍵。
研究作者寫道:“我們預(yù)計(jì),越來越強(qiáng)大的 GPU 體系結(jié)構(gòu)的日益可用性,以及先進(jìn) DL 策略和 GPU 加速算法的開發(fā),將有助于讓世界范圍內(nèi)更廣泛的科學(xué)界能夠負(fù)擔(dān)得起藥物發(fā)現(xiàn),并使其易于獲得。”。
分子模擬與自由能計(jì)算
分子模擬為藥物發(fā)現(xiàn)中的許多重要計(jì)算提供了動力,是一種計(jì)算顯微鏡,可用于利用物理定律進(jìn)行虛擬實(shí)驗(yàn)。 GPU 驅(qū)動的分子動力學(xué)框架可以模擬細(xì)胞的機(jī)制,從而深入了解基本機(jī)制,并通過自由能微擾等計(jì)算計(jì)算候選藥物與其預(yù)期蛋白質(zhì)靶點(diǎn)的結(jié)合強(qiáng)度。對分子模擬來說,最重要的是計(jì)算勢能面。
在重點(diǎn)綜述中,作者介紹了機(jī)器學(xué)習(xí)潛能是如何從根本上改變分子模擬的。機(jī)器學(xué)習(xí)勢或神經(jīng)網(wǎng)絡(luò)勢是一種模型,用于學(xué)習(xí)能量和力,以便用量子力學(xué)的精度進(jìn)行分子模擬。
作者報(bào)告說,自由能模擬從 GPU 中受益匪淺?;谏窠?jīng)網(wǎng)絡(luò)的力場,如 ANI 和 AIMNet 減少了絕對束縛自由能誤差和力場開發(fā)的人力。其他深度學(xué)習(xí)框架,如重加權(quán)自動編碼器 Bayes (RAVE) 正在推動分子模擬的邊界,采用增強(qiáng)的采樣方案來估計(jì)蛋白質(zhì)-配體結(jié)合自由能。像 Deep Docking 這樣的方法現(xiàn)在正在使用 DL 模型來估計(jì)分子對接分?jǐn)?shù)并加速虛擬篩選。
蛋白質(zhì)結(jié)構(gòu)測定進(jìn)展
在過去的 10 年中,有一個(gè) 蛋白質(zhì)結(jié)構(gòu)數(shù)量增加 2.13 倍 是公開的。低溫結(jié)構(gòu)沉積速率的增加和蛋白質(zhì)組學(xué)的增殖進(jìn)一步促進(jìn)了結(jié)構(gòu)和序列數(shù)據(jù)的豐富。
CryoEM 憑借其簡單、魯棒性和對大分子成像的能力,預(yù)計(jì)在未來幾年內(nèi)將主導(dǎo)高分辨率大分子結(jié)構(gòu)測定。它對樣品的破壞性也較小,因?yàn)樗恍枰Y(jié)晶。
然而,數(shù)據(jù)存儲需求和計(jì)算需求是相當(dāng)大的。該研究的作者詳細(xì)說明了像 DEFMap 和 DeepPicker 這樣的基于深度學(xué)習(xí)的方法是如何在 GPU 的幫助下為 CryoEM 的高通量自動化提供動力,以確定蛋白質(zhì)結(jié)構(gòu)的。通過 DEFMap ,可以理解局部密度數(shù)據(jù)關(guān)系的分子動力學(xué)模擬與深度學(xué)習(xí)算法相結(jié)合,以提取與隱藏原子漲落相關(guān)的動力學(xué)。
用原子精確度預(yù)測蛋白質(zhì)結(jié)構(gòu)的 AlphaFold-2 和 RoseTTAFold 模型的突破性發(fā)展,正迎來一個(gè)新的結(jié)構(gòu)測定時(shí)代。 Mosalaganti 等人最近發(fā)表的一篇文章強(qiáng)調(diào)了這些模型的預(yù)測能力。它還展示了如何將蛋白質(zhì)結(jié)構(gòu)預(yù)測模型與 cryoelectron 層析成像( CryoET )相結(jié)合,以確定核孔復(fù)合體的結(jié)構(gòu),核孔復(fù)合體是一種由 1000 多個(gè)蛋白質(zhì)組成的大規(guī)模細(xì)胞結(jié)構(gòu)。 MosaLaMagniti 等人繼續(xù)對核孔復(fù)合體進(jìn)行粗粒度分子動力學(xué)模擬。這讓我們對基于人工智能的蛋白質(zhì)結(jié)構(gòu)預(yù)測模型、 CryoEM 和 CryoET 的結(jié)合所帶來的各種模擬的未來一瞥。
生成模型和深度學(xué)習(xí)架構(gòu)
藥物發(fā)現(xiàn)的核心挑戰(zhàn)之一是化學(xué)空間的巨大規(guī)模。有 10 個(gè)60因此,研究人員需要一種有組織和可搜索的化學(xué)空間表示。通過在現(xiàn)有分子的大基礎(chǔ)上進(jìn)行訓(xùn)練,生成模型可以學(xué)習(xí)化學(xué)規(guī)則,并在模型的潛在空間中表示化學(xué)空間。
生成模型通過隱含地學(xué)習(xí)化學(xué)規(guī)則,產(chǎn)生了他們以前從未見過的分子。這將導(dǎo)致比原始訓(xùn)練數(shù)據(jù)庫中的分子具有指數(shù)級的唯一性和有效性。研究人員還可以構(gòu)建數(shù)值優(yōu)化算法,在模型的潛在空間中運(yùn)行,以搜索最優(yōu)分子。這些在潛在空間中起著梯度的作用,計(jì)算化學(xué)家可以利用這些梯度來引導(dǎo)分子生成朝著理想的性質(zhì)發(fā)展。
作者報(bào)告稱,許多最先進(jìn)的深度學(xué)習(xí)架構(gòu)正在推動更強(qiáng)大的生成模型。圖形神經(jīng)網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)、變分編碼器和轉(zhuǎn)換器正在創(chuàng)建生成模型,以改變分子表征和從頭藥物設(shè)計(jì)。
卷積神經(jīng)網(wǎng)絡(luò),如化學(xué)感受,已被訓(xùn)練用于預(yù)測化學(xué)性質(zhì),如毒性、活性和溶劑化。遞歸神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)化學(xué)空間潛在表示的能力,可以對多個(gè)數(shù)據(jù)集和任務(wù)進(jìn)行預(yù)測。
MegaMolBART 是一種基于變壓器的生成模型,在 AI 超級計(jì)算規(guī)模上實(shí)現(xiàn)了 98.7% 的獨(dú)特分子生成。借助對模型并行訓(xùn)練的支持, MegaMolBART 可以訓(xùn)練 1B +個(gè)參數(shù)模型,以便在大型化學(xué)數(shù)據(jù)庫上進(jìn)行訓(xùn)練,并且可以針對廣泛的任務(wù)進(jìn)行調(diào)整。
科學(xué)計(jì)算的百萬倍飛躍
今天, GPU 正在加速計(jì)算機(jī)輔助藥物發(fā)現(xiàn)工作流程的每一步,從目標(biāo)闡明到 FDA 批準(zhǔn),在所有方面都顯示出了有效性。隨著計(jì)算速度的加快,科學(xué)計(jì)算正在 GPU 上大規(guī)模并行化。
超級計(jì)算機(jī)有助于將這些計(jì)算擴(kuò)展到多個(gè)節(jié)點(diǎn)和 GPU ,利用快速通信結(jié)構(gòu)將 GPU 和節(jié)點(diǎn)連接在一起。
關(guān)于作者
AbrahamStern )是 NVIDIA Clara Discovery 的產(chǎn)品經(jīng)理。他的興趣在于科學(xué)計(jì)算和機(jī)器學(xué)習(xí)的交叉點(diǎn),尤其是在化學(xué)和藥物發(fā)現(xiàn)問題上。 Abe 在南佛羅里達(dá)大學(xué)獲得了計(jì)算化學(xué)博士學(xué)位,之前是加州大學(xué)歐文分校的博士后學(xué)者。
Nate Bradford 是 NVIDIA 的醫(yī)療內(nèi)容經(jīng)理,分享 AI 框架和解決方案,以幫助開發(fā)人員、研究人員和創(chuàng)新者完成畢生的工作。從加速新療法的發(fā)現(xiàn)到實(shí)現(xiàn)醫(yī)療設(shè)備的實(shí)時(shí)傳感,人工智能正在開創(chuàng)醫(yī)療保健的新時(shí)代。
審核編輯:郭婷
-
變壓器
+關(guān)注
關(guān)注
159文章
7517瀏覽量
135982 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5063瀏覽量
103435 -
AI
+關(guān)注
關(guān)注
87文章
31335瀏覽量
269721
發(fā)布評論請先 登錄
相關(guān)推薦
評論