IBM 研究部主任達(dá)里奧吉爾表示,科學(xué)的緊迫性從未如此強(qiáng)烈。Gil 指的是為 Covid-19 開發(fā)疫苗的競賽,但他說,這種緊迫性并沒有消失,他引用了氣候變化、未來流行病、糧食短缺和能源安全等規(guī)模問題。解決這些問題所需要的是加快發(fā)現(xiàn)速度。
該解決方案將結(jié)合人工智能 (AI)、量子計(jì)算、高性能計(jì)算 (HPC) 和混合云技術(shù)。
達(dá)里奧吉爾(圖片:IBM)
“使用[這些技術(shù)],我們可以從根本上改變我們進(jìn)行發(fā)現(xiàn)的過程,”吉爾說?!拔覀兛梢约铀俸驮鰪?qiáng)傳統(tǒng)的科學(xué)方法?!?/p>
Gil 的例子是材料科學(xué),它在歷史上一直依賴于偶然發(fā)現(xiàn)(想想鐵氟龍,它是在尋找新制冷劑時(shí)發(fā)現(xiàn)的。凡士林和石墨烯是類似的驚喜)。如果不是偶然發(fā)現(xiàn)的,有用的新材料通常是通過反復(fù)試驗(yàn)發(fā)現(xiàn)的,即使使用最新的基于 HPC 的復(fù)雜分子建模和模擬,這也非常昂貴并且可能需要數(shù)年時(shí)間。
這就是人工智能的用武之地。
“[AI] 真正實(shí)現(xiàn)了前所未有的大規(guī)模速度和自動(dòng)化水平,幫助我們解決越來越復(fù)雜的問題,”Gil 說?!罢侨斯ぶ悄芸梢詭椭覀冇瓉磉@個(gè)加速發(fā)現(xiàn)的新時(shí)代。它可以幫助我們增強(qiáng)科學(xué)方法,將其從線性過程轉(zhuǎn)變?yōu)殚]環(huán)?!?/p>
閉環(huán) Gil 設(shè)想使用 AI 篩選現(xiàn)有知識(shí)庫,然后使用 HPC(或未來的量子計(jì)算)通過模擬增強(qiáng)數(shù)據(jù)并尋找該知識(shí)庫中的空白。這些信息被輸入到生成 AI 模型中,該模型可以建議候選新分子來填補(bǔ)空白。然后,人工智能驅(qū)動(dòng)的機(jī)器人可以根據(jù)數(shù)據(jù)和過去化學(xué)反應(yīng)的例子生成候選分子。
Gil 說:“這個(gè)過程將隨著新知識(shí)引發(fā)新問題而達(dá)到高潮,循環(huán)再次開始?!?“所以這將是一個(gè)持續(xù)的發(fā)現(xiàn)循環(huán),越來越自動(dòng)化和越來越自主?!?/p>
Gil 將這個(gè)循環(huán)稱為“加速發(fā)現(xiàn)”,并強(qiáng)調(diào)這不是在遙遠(yuǎn)的未來,而是現(xiàn)在肯定會(huì)發(fā)生的事情。
PAG 發(fā)現(xiàn)
Gil 演講中的另一個(gè)例子是基于加速發(fā)現(xiàn)更可持續(xù)的光刻膠材料。光刻膠對(duì)半導(dǎo)體制造過程至關(guān)重要;化學(xué)放大光刻膠使用稱為光酸產(chǎn)生劑 (PAG) 的化學(xué)物質(zhì)。
使用傳統(tǒng)工藝,發(fā)現(xiàn)一個(gè)新的 PAG 可能需要 10 年時(shí)間,并且至少要花費(fèi) 1000 萬美元??茖W(xué)家們將搜索已發(fā)表的文獻(xiàn),并利用他們能找到的東西以及他們自己的知識(shí)來設(shè)計(jì)一種分子并針對(duì)所需的特性。然后,他們將經(jīng)歷合成、表征和測試的迭代循環(huán),直到獲得令人滿意的化合物。即使有超級(jí)計(jì)算機(jī)可供使用,這個(gè)過程也是漫長而艱難的,尤其是因?yàn)橐紤]大量的化合物。
加速發(fā)現(xiàn)已將該過程縮短到一年多 100 萬美元。
加速發(fā)現(xiàn)工作流程有四個(gè)階段。首先,一個(gè)名為 Deep Search 的人工智能會(huì)“讀取”所有現(xiàn)有的關(guān)于 PAG 的科學(xué)文獻(xiàn)。
“使用深度搜索通常會(huì)將該過程加快一千倍,因?yàn)?AI 可以在每個(gè)處理核心每秒攝取和處理大約 20 頁,”Gil 說?!傲硪环矫妫夹g(shù)文獻(xiàn)的人類讀者通常每頁需要一到兩分鐘?!?/p>
該知識(shí)庫由已知 PAG 系列的樹狀圖表示(下圖的內(nèi)部灰色部分)。樹狀圖中的空白區(qū)域代表數(shù)據(jù)丟失的地方。
第二步是通過 AI 驅(qū)動(dòng)的模擬來豐富數(shù)據(jù)。另一個(gè) AI 模擬已知 PAG 的實(shí)驗(yàn)參數(shù),比常規(guī)模擬快 2-40 倍。
“對(duì)于某些房產(chǎn),可用數(shù)據(jù)非常稀疏或嘈雜且不可靠,幾乎沒有用,”吉爾說?!拔覀儽仨氂米銐虻念A(yù)測屬性數(shù)據(jù)來擴(kuò)充這個(gè)數(shù)據(jù)集,以訓(xùn)練人工智能模型。在這里,我們使用 AI 豐富的模擬來為數(shù)據(jù)集中 PAG 的重要屬性提供定量值?!?/p>
這些特性包括毒性(上表中的紫色數(shù)據(jù))、生物降解性(藍(lán)色)和 λ max,即材料吸收最強(qiáng)的光波長(綠色)。
這些信息被輸入第三種類型的人工智能,稱為生成模型。如今,生成式 AI 被用于為社交媒體檔案、與人類書寫的散文、計(jì)算機(jī)代碼和現(xiàn)在的分子無法區(qū)分的長論文文本生成虛假的檔案圖像。這個(gè)想法是有效地填補(bǔ)(灰色)樹狀圖中的空白。在 IBM 的案例中,他們希望尋找一種具有更好可持續(xù)性特性(尤其是生物降解性)的 PAG 材料。
“我們已經(jīng)看到使用生成模型來識(shí)別差距并為測試創(chuàng)建材料概念的 10 倍加速,”Gil 說。
該過程的最后一步是在 AI 驅(qū)動(dòng)的實(shí)驗(yàn)室中測試結(jié)果,根據(jù) Gil 的說法,該實(shí)驗(yàn)室的合成速度比傳統(tǒng)方法快一百倍。
在這個(gè)階段有一些人為的參與;專家選擇最佳候選者進(jìn)行實(shí)驗(yàn)驗(yàn)證,盡管產(chǎn)生現(xiàn)實(shí)生活中化學(xué)物質(zhì)的化學(xué)合成是由機(jī)器完成的。在位于蘇黎世的 IBM RoboRXN 實(shí)驗(yàn)室,人工智能、自動(dòng)化和云技術(shù)的驚人組合已經(jīng)學(xué)習(xí)了合成有機(jī)化學(xué),并且可以通過機(jī)器人遠(yuǎn)程應(yīng)用它。
IBM 在 11 月使用這種加速發(fā)現(xiàn)過程發(fā)現(xiàn)了其第一個(gè)新的 PAG 材料。
“[新材料] 帶來了一個(gè)未來會(huì)有更多、更多加速發(fā)現(xiàn)的世界的希望,”吉爾說。
未來愿景
除了解決流行病和氣候變化等人類問題外,IBM 的愿景是加速發(fā)現(xiàn)將定義未來最具創(chuàng)新性的業(yè)務(wù)。以科學(xué)發(fā)現(xiàn)為核心業(yè)務(wù)的公司顯然會(huì)受益,包括生命科學(xué)、化學(xué)品和材料公司。當(dāng)今大企業(yè)的另一大部分依賴于科學(xué)發(fā)現(xiàn),包括汽車制造商、科技公司、醫(yī)療保健和公用事業(yè)。還有更多是由信息和發(fā)現(xiàn)驅(qū)動(dòng)的,也就是說,他們通過數(shù)據(jù)實(shí)驗(yàn)和學(xué)習(xí)獲得了競爭優(yōu)勢。第三類是軟件、金融市場、媒體和娛樂、電信公司、銀行和零售)。加速科學(xué)和發(fā)現(xiàn)將影響所有這些業(yè)務(wù)。
三種類型的科學(xué)驅(qū)動(dòng)型企業(yè)(圖片:IBM)
“我確信明天最具創(chuàng)新性的企業(yè)將是發(fā)現(xiàn)驅(qū)動(dòng)型企業(yè),”吉爾說?!八麄儗で笃脚_(tái)、工具和技術(shù),使他們能夠加速發(fā)現(xiàn)過程,從而賦予他們競爭優(yōu)勢。但這需要對(duì)科學(xué)和研發(fā)進(jìn)行大量投資?!?/p>
吉爾再次提到了在 14 個(gè)月內(nèi)開發(fā)的 Covid-19 疫苗。如果發(fā)現(xiàn)按照傳統(tǒng)方式進(jìn)行,疫苗要到 2033 年才能上市。
“為了應(yīng)對(duì)我們最大的挑戰(zhàn),我們需要更快地發(fā)現(xiàn),”他說?!拔覀冃枰尫偶铀侔l(fā)現(xiàn)的力量,我們需要有目的地去做,不僅僅是數(shù)字產(chǎn)品和服務(wù)的數(shù)字創(chuàng)新,還要引導(dǎo)我們的數(shù)字能力來改善我們的物理世界?!?/p>
審核編輯 黃昊宇
-
AI
+關(guān)注
關(guān)注
87文章
31028瀏覽量
269367 -
先進(jìn)技術(shù)
+關(guān)注
關(guān)注
0文章
24瀏覽量
6242
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論