0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用 AI 獲得科學發(fā)現(xiàn)

Tensorflowers ? 來源:工程師李察 ? 2019-04-29 16:30 ? 次閱讀

今天,我們很高興與大家分享 DeepMind 在論證人工智能研究如何推動并加速科學新發(fā)現(xiàn)方面的首個重要里程碑。由于我們的研究涉及大量學科領(lǐng)域,DeepMind 匯集了結(jié)構(gòu)生物學、物理學和機器學習領(lǐng)域的多方專家,以應(yīng)用前沿技術(shù)單獨根據(jù)蛋白質(zhì)的基因序列預(yù)測其 3D 結(jié)構(gòu)。

在過去兩年中,我們一直在研究 AlphaFold 系統(tǒng),該系統(tǒng)基于之前使用海量基因組數(shù)據(jù)預(yù)測蛋白質(zhì)結(jié)構(gòu)的多年研究構(gòu)建。AlphaFold 生成的蛋白質(zhì) 3D 模型遠比過去的任何模型都要精確,也因此在某個生物學核心挑戰(zhàn)方面取得了重大進展。

什么是蛋白質(zhì)折疊問題?

蛋白質(zhì)是維持生命所必需的復(fù)雜大分子。人體的每項功能幾乎都可以追溯至一種或多種蛋白質(zhì),以及這些蛋白質(zhì)的移動和變化過程,例如收縮肌肉、感知光線或?qū)⑹澄镛D(zhuǎn)化為能量。這些蛋白質(zhì)的配方(即基因)則以編碼形式留在我們的 DNA 中。

任何一種蛋白質(zhì)的功能,都取決于其獨一無二的 3D 結(jié)構(gòu)。例如,構(gòu)成人體免疫系統(tǒng)的抗體蛋白呈 “Y 字形”,類似于形狀獨特的鉤子。通過黏附在病毒和細菌上,抗體蛋白能夠檢測并標記致病微生物,從而將其消滅。與之類似,膠原蛋白的形狀像繩子,可在軟骨、韌帶、骨骼和皮膚之間傳遞張力。Cas9 等其他類型的蛋白質(zhì)以 CRISPR 序列為導(dǎo)向,像剪刀一樣剪切并粘貼 DNA 片段;抗凍蛋白的 3D 結(jié)構(gòu)使其能夠與冰晶結(jié)合,并防止有機體凍結(jié);核糖體的行動如同程序化的裝配線一般,幫助蛋白質(zhì)實現(xiàn)自身構(gòu)建。

然而,僅依靠蛋白質(zhì)的基因序列來找出其 3D 形狀是一項非常復(fù)雜的任務(wù)。幾十年來,這項難題一直困擾著科學家。這項任務(wù)的難點在于,DNA 僅包含關(guān)于氨基酸殘基(可形成長鏈)這一蛋白質(zhì)組成塊的信息。所謂的 “蛋白質(zhì)折疊問題” 便是預(yù)測這些鏈如何折疊成錯綜復(fù)雜的 3D 蛋白質(zhì)結(jié)構(gòu)。

蛋白質(zhì)越大,需要考慮的氨基酸相互作用就越多,進行建模的復(fù)雜性和難度也就越高。正如利文索爾佯謬中所述,在我們獲得正確的 3D 結(jié)構(gòu)之前,我們枚舉所有可能的典型蛋白質(zhì)構(gòu)型所需的時間可能比宇宙的年齡還要久遠。

為什么蛋白質(zhì)折疊很重要?

預(yù)測蛋白質(zhì)形狀的能力對科學家而言非常實用,因為這種能力對理解蛋白質(zhì)在人體內(nèi)的作用,以及診斷和治療業(yè)界認為是由錯誤折疊的蛋白質(zhì)所引起的疾?。ɡ绨柎暮DY、帕金森癥、亨廷頓舞蹈癥和囊腫性纖維化)至關(guān)重要。

尤其令我們興奮的是了解到蛋白質(zhì)折疊可能會如何增強我們對人體及其工作原理的理解,進而幫助科學家更高效地設(shè)計出能夠有效治愈疾病的新療法。隨著我們通過模擬和模型深入了解蛋白質(zhì)形狀及其工作原理,它不僅在藥物發(fā)現(xiàn)領(lǐng)域展現(xiàn)出新潛力,同時還降低了實驗的相關(guān)成本。最終,這會改善全世界數(shù)百萬患者的生活質(zhì)量。

此外,對蛋白質(zhì)折疊的理解還將助力蛋白質(zhì)設(shè)計,這將為我們不可勝數(shù)的益處。例如,生物可降解酶(可通過蛋白質(zhì)設(shè)計實現(xiàn))領(lǐng)域的進展有助于管理塑料和石油等污染物,進而幫助我們以更環(huán)保的方式分解廢物。事實上,研究人員已經(jīng)開始對細菌進行工程改造,令其分泌出使廢物可經(jīng)過生物降解并更易處理的蛋白質(zhì)。

為了促進研究和衡量用于提高預(yù)測準確度的最新方法取得的進步,業(yè)界于 1994 年成立了名為蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)關(guān)鍵評估 (CASP) 的社區(qū)范圍實驗,該全球競賽每兩年舉行一次,現(xiàn)已成為評估此類技術(shù)的黃金標準。

AI 如何大顯身手?

在過去 50 年間,科學家已經(jīng)能夠在實驗室中使用低溫電子顯微技術(shù)、核磁共振或 X 射線晶體學等實驗性技術(shù)確定蛋白質(zhì)的形狀。但每種方法都要經(jīng)過大量嘗試與失敗,每個結(jié)構(gòu)都需耗時數(shù)年,且成本高達數(shù)萬美元。這正是為什么生物學家將目光轉(zhuǎn)向 AI 方法,希望用其取代這種漫長而艱苦的復(fù)雜蛋白質(zhì)處理過程。

幸運的是,得益于基因測序成本的迅速降低,基因組學領(lǐng)域的數(shù)據(jù)相當豐富。因此在過去幾年里,越來越多的研究人員利用深度學習方法來處理依賴于基因組數(shù)據(jù)的預(yù)測問題。在 DeepMind 對此類問題的研究中,AlphaFold 應(yīng)運而生。今年,我們已向 CASP 提交了該作品。令我們引以為傲的是,CASP 的組織方評價 AlphaFold 是 “在預(yù)測蛋白質(zhì)結(jié)構(gòu)的計算方法能力方面取得的空前進展”,并在入圍的眾多參賽團隊中,將第一名的桂冠頒發(fā)給我們(我們的參賽名稱是 A7D)。

我們的團隊特別關(guān)注從零開始對目標形狀進行建模這一難題,而且并未使用此前已經(jīng)解決的蛋白質(zhì)結(jié)構(gòu)作為模板。我們在預(yù)測蛋白質(zhì)結(jié)構(gòu)的物理屬性時實現(xiàn)了高準確度,然后使用兩種截然不同的方法來構(gòu)建對蛋白質(zhì)完整結(jié)構(gòu)的預(yù)測。

利用神經(jīng)網(wǎng)絡(luò)預(yù)測物理屬性

上述兩種方法均依賴深度神經(jīng)網(wǎng)絡(luò),這些經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可以從其基因序列中預(yù)測蛋白質(zhì)屬性。該網(wǎng)絡(luò)預(yù)測的屬性包括:(a) 氨基酸對的間距和 (b) 連接這些氨基酸的化學鍵之間的角度。此方法的首要進步是改進了常用技術(shù),這些技術(shù)可以估算氨基酸對是否彼此接近。

我們訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò),以預(yù)測蛋白質(zhì)中每個殘基對之間的單獨距離分布。然后,我們將這些概率合并為分數(shù),以估計所提出的蛋白質(zhì)結(jié)構(gòu)的精確程度。我們還訓(xùn)練了一個單獨的神經(jīng)網(wǎng)絡(luò),其綜合使用所有距離來估算所提出的結(jié)構(gòu)與正確答案的接近程度。

構(gòu)建蛋白質(zhì)結(jié)構(gòu)預(yù)測的新方法

使用這些評分功能,我們能夠搜索蛋白質(zhì)結(jié)構(gòu),以找到符合預(yù)測的結(jié)構(gòu)。第一種方法基于結(jié)構(gòu)生物學的常用技術(shù)構(gòu)建,并使用新的蛋白質(zhì)片段反復(fù)替換蛋白質(zhì)片段。我們訓(xùn)練了一個生成式神經(jīng)網(wǎng)絡(luò)來創(chuàng)建新片段,并針對所提出的蛋白質(zhì)結(jié)構(gòu),利用這些片段不斷提高其分數(shù)。

第二種方法通過梯度下降(機器學習領(lǐng)域常用的一種數(shù)學技術(shù),能夠不斷產(chǎn)生微小的改進)來優(yōu)化分數(shù),進而生成高度精確的結(jié)構(gòu)。此技術(shù)應(yīng)用于整條蛋白質(zhì)鏈,而非在組裝前須分開折疊的片段,因而可簡化預(yù)測過程。

未來如何發(fā)展?

我們首次涉足蛋白質(zhì)折疊領(lǐng)域便取得成功,展示了機器學習系統(tǒng)如何整合各類信息來源,幫助科學家快速提出解決復(fù)雜問題的創(chuàng)造性解決方案。正如我們所見,AI 可通過 AlphaGo 和 AlphaZero 等系統(tǒng)幫助人們掌握復(fù)雜的游戲。同樣地,我們希望某一天 AI 技術(shù)的突破也能幫助我們處理基本的科學問題。

我們很高興看到蛋白質(zhì)折疊領(lǐng)域的早期發(fā)展跡象,這證明了 AI 在科學發(fā)現(xiàn)中的作用。盡管該技術(shù)在對治療疾病、管理環(huán)境等方面產(chǎn)生可量化影響之前仍需深入研究,但我們明白,AI 的潛力不可限量。在擁有重點研究機器學習如何推動科學世界進步的專門團隊后,我們期待自己的技術(shù)能夠在眾多領(lǐng)域大展身手。

在我們發(fā)表關(guān)于此項研究的論文之前,請將其引用為:《通過基于評分的深度學習進行從頭結(jié)構(gòu)預(yù)測》(De novo structure prediction with deep-learning based scoring)R.Evans、J.Jumper、J.Kirkpatrick、L.Sifre、T.F.G.Green、C.Qin、A.Zidek、A.Nelson、A.Bridgland、H.Penedones、S.Petersen、K.Simonyan、S.Crossan、D.T.Jones、D.Silver、K.Kavukcuoglu、D.Hassabis、A.W.Senior發(fā)表于 2018 年 12 月 1 日至 4 日舉行的第 13 屆蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)關(guān)鍵評估(摘要)。如需查看摘要,請點擊 此處(https://deepmind.com/documents/262/A7D_AlphaFold.pdf)。

此項研究是與以下人員協(xié)作完成:Richard Evans、John Jumper、James Kirkpatrick、Laurent Sifre、Tim Green、Chongli Qin、Augustin Zidek、Sandy Nelson、Alex Bridgland、Hugo Penedones、Stig Petersen、Karen Simonyan、Steve Crossan、David Jones、David Silver、Koray Kavukcuoglu、Demis Hassabis 和 Andrew Senior

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31395

    瀏覽量

    269785
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3290

    瀏覽量

    49020
  • 光線
    +關(guān)注

    關(guān)注

    0

    文章

    72

    瀏覽量

    10563

原文標題:AlphaFold:利用 AI 獲得科學發(fā)現(xiàn)

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA 攜手行業(yè)領(lǐng)先機構(gòu)推動基因組學、藥物發(fā)現(xiàn)及醫(yī)療健康行業(yè)發(fā)展

    ——NVIDIA 今日宣布新的合作伙伴關(guān)系,旨在通過加速藥物發(fā)現(xiàn)、提升基因組研究,以及利用代理式和生成式 AI 開創(chuàng)先進醫(yī)療服務(wù),推動規(guī)模達 10 萬億美元的醫(yī)療健康與生命科學產(chǎn)業(yè)的變
    發(fā)表于 01-14 13:39 ?91次閱讀
    NVIDIA 攜手行業(yè)領(lǐng)先機構(gòu)推動基因組學、藥物<b class='flag-5'>發(fā)現(xiàn)</b>及醫(yī)療健康行業(yè)發(fā)展

    西湖大學:科學家+AI,科研新范式的樣本

    北京2024年12月11日?/美通社/ -- 今年的諾貝爾獎,將AI推到了科學舞臺的中央,標志著AI科學研究中的重要地位得到了認可,也體現(xiàn)了學科交叉賦能將成為
    的頭像 發(fā)表于 12-12 15:59 ?215次閱讀
    西湖大學:<b class='flag-5'>科學</b>家+<b class='flag-5'>AI</b>,科研新范式的樣本

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    領(lǐng)域的重要工具和方法,推動生命科學的深入發(fā)展和廣泛應(yīng)用。同時,我們也應(yīng)該清醒地認識到,這個過程中也伴隨著諸多挑戰(zhàn)和困難。只有不斷克服這些挑戰(zhàn),才能充分利用AI技術(shù)的優(yōu)勢,為生命科學的發(fā)
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得

    人工智能在科學研究中的核心技術(shù),包括機器學習、深度學習、神經(jīng)網(wǎng)絡(luò)等。這些技術(shù)構(gòu)成了AI for Science的基石,使得AI能夠處理和分析復(fù)雜的數(shù)據(jù)集,從而發(fā)現(xiàn)隱藏在數(shù)據(jù)中的模式和規(guī)
    發(fā)表于 10-14 09:16

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不
    發(fā)表于 10-14 09:12

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學創(chuàng)新

    ! 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家一起去了解: 人工智能究竟幫科學家做了什么? 人工智能
    發(fā)表于 09-09 13:54

    如何利用traceroute命令發(fā)現(xiàn)網(wǎng)絡(luò)中的負載均衡

    在網(wǎng)絡(luò)管理和故障排除中,了解數(shù)據(jù)包的路徑和識別負載均衡節(jié)點是非常重要的。traceroute 命令是一個用于跟蹤數(shù)據(jù)包在網(wǎng)絡(luò)中經(jīng)過的路由路徑的工具。本文將詳細介紹如何利用 traceroute 命令發(fā)現(xiàn)網(wǎng)絡(luò)中的負載均衡,并解釋相關(guān)的概念和技術(shù)細節(jié)。
    的頭像 發(fā)表于 08-07 15:13 ?467次閱讀
    如何<b class='flag-5'>利用</b>traceroute命令<b class='flag-5'>發(fā)現(xiàn)</b>網(wǎng)絡(luò)中的負載均衡

    中國科學發(fā)現(xiàn)新型高溫超導(dǎo)體

    據(jù)新華社報道,我國科學家再立新功,又一新型高溫超導(dǎo)體被發(fā)現(xiàn)。 復(fù)旦大學物理學系趙俊團隊利用高壓光學浮區(qū)技術(shù)成功生長了三層鎳氧化物,成功證實在鎳氧化物中具有壓力誘導(dǎo)的體超導(dǎo)電性,而且超導(dǎo)體積分數(shù)達到
    的頭像 發(fā)表于 07-19 15:14 ?748次閱讀

    如何利用AI進行提升自我呢?

    利用AI進行學習是一個高效且富有創(chuàng)新性的過程。以下是一些建議,幫助你充分利用AI進行學習: 選擇適合的AI學習工具 : 深度學習框架 :如飛
    的頭像 發(fā)表于 07-19 10:46 ?623次閱讀

    NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持,實現(xiàn)邊緣實時醫(yī)療、工業(yè)和科學 AI 應(yīng)用

    醫(yī)療、工業(yè)和科學計算領(lǐng)域的解決方案提供商利用企業(yè)級軟件和支持來加快開發(fā)和部署邊緣 AI 解決方案。 ? NVIDIA AI Enterprise-IGX 是一款全新產(chǎn)品,其為企業(yè)的邊緣
    發(fā)表于 06-03 09:48 ?329次閱讀
      NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持,實現(xiàn)邊緣實時醫(yī)療、工業(yè)和<b class='flag-5'>科學</b> <b class='flag-5'>AI</b> 應(yīng)用

    助力科學發(fā)展,NVIDIA AI加速HPC研究

    科學家和研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應(yīng)用于代碼生成、天氣預(yù)報、遺傳學和材料科學領(lǐng)域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?439次閱讀
    助力<b class='flag-5'>科學</b>發(fā)展,NVIDIA <b class='flag-5'>AI</b>加速HPC研究

    發(fā)現(xiàn)Minitab 22的強大之處!#人工智能 #Ai #Minitab

    AIMinitab
    MinitabUG
    發(fā)布于 :2024年04月17日 11:50:39

    微軟支付6.5億美元獲得Inflection AIAI模型授權(quán)

    微軟近日宣布向人工智能初創(chuàng)公司Inflection AI支付高達6.5億美元的巨額資金,這一舉動在業(yè)內(nèi)引起了廣泛關(guān)注。據(jù)悉,這筆資金主要用于獲得Inflection AIAI模型授權(quán)
    的頭像 發(fā)表于 03-25 10:39 ?529次閱讀

    安進將開發(fā)生成式AI模型,以獲取新的人類數(shù)據(jù)洞察并推動藥物發(fā)現(xiàn)

    生成式 AI 正在改變藥物研發(fā),以前所未有的速度實現(xiàn)新藥物發(fā)現(xiàn)。作為全球領(lǐng)先的生物技術(shù)公司之一,安進(Amgen)正在利用這項技術(shù)推進科研工作。
    的頭像 發(fā)表于 03-20 11:30 ?464次閱讀