來源|中科院之聲(zkyzswx)編者按:中科院之聲與中國科學(xué)院上海硅酸鹽研究所聯(lián)合開設(shè)“科普硅立方”專欄,為大家介紹先進(jìn)無機(jī)非金屬材料的前世今生。我們將帶你——認(rèn)識晶格,挑戰(zhàn)勢壘,尋覓暗物質(zhì),今古論陶瓷;彌補(bǔ)缺陷,能級躍遷,嫦娥織外衣,溢彩話琉璃。
被戲稱為諾貝爾“理綜獎”的化學(xué)獎今年再度授予給生物學(xué)家,以表彰她們對新一代基因編輯技術(shù)的貢獻(xiàn)。生物基因是生物體內(nèi)攜帶遺傳信息的DNA片段,影響甚至決定著生物體的生長發(fā)育、衰老病死等所有生理過程。生物基因工程則是在分子水平上對基因進(jìn)行重組,改變生物原本的遺傳信息,旨在按需設(shè)計(jì)新品種和產(chǎn)生新產(chǎn)品。那么,同樣是由微觀粒子(原子、分子、離子等)構(gòu)成的材料,是否也存在決定材料性能的“基因”呢?人們能否利用材料基因工程技術(shù),按需設(shè)計(jì)特定性能的材料呢?
材料基因工程
答案是肯定的,而且已經(jīng)引起各國的重視。早在2011年,美國聯(lián)邦政府率先啟動了一項(xiàng)名為“材料基因組計(jì)劃”(Materials Genome Initiative, MGI)的研究計(jì)劃,通過先進(jìn)實(shí)驗(yàn)和計(jì)算技術(shù)和數(shù)據(jù)共享等方式,加速新材料的發(fā)現(xiàn),縮短材料研發(fā)周期,同時降低成本。同年年底,中國科學(xué)院和中國工程院召開了香山科學(xué)會議研討“材料科學(xué)系統(tǒng)工程”,并由徐匡迪院士、顧秉林院士、陳立泉院士和張統(tǒng)一院士等學(xué)者提出啟動中國的“材料基因組計(jì)劃”。此外,其他國家和地區(qū),例如歐盟、日本和俄羅斯等也相繼啟動類似的材料研究計(jì)劃。
圖1 美國材料基因組計(jì)劃框架(圖片來自網(wǎng)絡(luò))
雖然“材料基因”一詞經(jīng)過多年的探討,但是至今依舊沒有明確的科學(xué)定義,其復(fù)雜性就可見一斑。相比生物基因僅由幾種核苷酸排列而成,材料組成和結(jié)構(gòu)顯得更加復(fù)雜,材料基因工程的研究也更具有挑戰(zhàn)性。傳統(tǒng)的科學(xué)研究范式可能并不能滿足快速解碼材料基因圖譜的需求,因此材料信息學(xué)就應(yīng)運(yùn)而生。
人工智能+材料科學(xué)
在了解材料信息學(xué)之前,我們首先需要對材料科學(xué)研究四大范式的發(fā)展脈絡(luò)有整體的認(rèn)識。四大范式包括,實(shí)驗(yàn)試錯、理論推演、模擬計(jì)算和數(shù)據(jù)科學(xué)。
新材料的研發(fā)最傳統(tǒng)的方式是實(shí)驗(yàn)試錯法,即通過改變材料成分、合成手段、工藝參數(shù)等條件制備系列樣品,選出其中性能最合適的材料。很顯然,試錯法存在效率低、成本高、研發(fā)周期長等缺點(diǎn),因此往往被戲稱為“炒菜法”,但是多年以來也為材料科學(xué)積累了大量的數(shù)據(jù)和經(jīng)驗(yàn)法則。
理論推演則是在對自然有充分認(rèn)識、掌握足夠多的規(guī)律之后,科學(xué)家將自然現(xiàn)象抽象成數(shù)量關(guān)系,構(gòu)造數(shù)學(xué)模型,并在模型預(yù)測的指導(dǎo)下研發(fā)材料。然而,由于實(shí)際問題往往相當(dāng)復(fù)雜,理論模型的建立需要采用近似處理方法,因而不可避免地存在偏差和局限。隨著電子計(jì)算機(jī)的發(fā)展,科學(xué)家可以依據(jù)更本質(zhì)的物理定律,對復(fù)雜過程進(jìn)行多空間尺度模擬,從而定向設(shè)計(jì)材料成分、結(jié)構(gòu)和性能。即便如此,模擬計(jì)算需要基于理論框架和依賴參數(shù)設(shè)置,因此計(jì)算結(jié)果與實(shí)驗(yàn)結(jié)果大相徑庭的情況時有發(fā)生。
材料信息學(xué)一改以往研究范式對經(jīng)驗(yàn)和理論模型的依賴,直接針對可能與目標(biāo)量相關(guān)的數(shù)據(jù),分析其中統(tǒng)計(jì)關(guān)聯(lián)性,再從中研究材料成分、結(jié)構(gòu)、工藝和性能之間的物理內(nèi)涵。這種由數(shù)據(jù)驅(qū)動的方法借助如今快速發(fā)展的大數(shù)據(jù)和人工智能方法,從大量、復(fù)雜的變量集合中提取決定性因素,構(gòu)建數(shù)據(jù)之間的定量關(guān)系,指導(dǎo)新規(guī)律的發(fā)現(xiàn)和新材料的快速研發(fā)。
圖2 科學(xué)研究四大范式(圖片來自網(wǎng)絡(luò))
說白了,材料信息學(xué)可以簡單地認(rèn)為是“人工智能+材料科學(xué)”。提起“人工智能”,你可能會想起幾年前的圍棋人機(jī)大戰(zhàn):圍棋世界冠軍柯潔完敗。人類冠軍低頭拭淚,痛苦感嘆“它太完美,我看不到任何勝利的希望”的場景依舊歷歷在目。在柯潔戰(zhàn)敗之前,“AI+”早已引起學(xué)術(shù)界的重視。2016年1月27日“AI+圍棋”登上頂尖科學(xué)期刊《自然》封面,報(bào)道了谷歌 Deep Mind 的人工智能系統(tǒng)阿爾法圍棋(Alpha Go)完勝歐洲圍棋冠軍。同年5月4日,“AI+材料科學(xué)”也登上了《自然》封面,報(bào)道了材料科學(xué)領(lǐng)域的“人機(jī)大戰(zhàn)”。這項(xiàng)研究由哈弗福德學(xué)院(Haverford College)主導(dǎo),針對一種有機(jī)-無機(jī)雜化材料的水熱合成反應(yīng),通過機(jī)器學(xué)習(xí)方法從大量成功和失敗的實(shí)驗(yàn)數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,并建立判斷反應(yīng)能否成功的預(yù)測模型。機(jī)器學(xué)習(xí)模型成功率高達(dá)89%,高于有經(jīng)驗(yàn)的化學(xué)家的人工判斷78%。這項(xiàng)報(bào)道充分展示了人工智能在材料科學(xué)研究中的強(qiáng)大潛力,掀起了“AI+材料科學(xué)”的浪潮。
圖3 Nature封面文章:“AI+圍棋”和“AI+材料科學(xué)” (圖片來自網(wǎng)絡(luò))
“數(shù)據(jù)困境”與破解之法
兩場“人機(jī)大戰(zhàn)”之中,戰(zhàn)勝人類棋手的Alpha Go背后主要利用了深度神經(jīng)網(wǎng)絡(luò),戰(zhàn)勝人類化學(xué)家的預(yù)測模型背后主要是支持向量機(jī),它們都屬于機(jī)器學(xué)習(xí)方法。機(jī)器學(xué)習(xí)是實(shí)現(xiàn)人工智能的一類方法,其基本過程是采用程序算法利用大量的數(shù)據(jù)進(jìn)行建模訓(xùn)練,從數(shù)據(jù)中學(xué)習(xí)規(guī)律,最終對未知事物做出決策和預(yù)測。機(jī)器學(xué)習(xí)方法研究材料科學(xué)一般分為數(shù)據(jù)集構(gòu)造、數(shù)據(jù)預(yù)處理、數(shù)據(jù)降維、模型訓(xùn)練、模型測試與評價等步驟。其中,數(shù)據(jù)集構(gòu)造是首要步驟,數(shù)據(jù)收集是材料信息學(xué)的重點(diǎn)和難點(diǎn)。你或許會疑惑,數(shù)據(jù)收集不是很簡單嗎?我們只需要在購物app內(nèi)點(diǎn)擊某件商品,在新聞app內(nèi)瀏覽某條新聞,在地圖app內(nèi)搜索某個地點(diǎn)……我們在互聯(lián)網(wǎng)上的一切行為,每時每刻都在都轉(zhuǎn)化為數(shù)據(jù)被收集。然而,在材料科學(xué)領(lǐng)域,獲取一個數(shù)據(jù)可能意味著幾個小時的模擬計(jì)算,幾天的材料制備,幾周的循環(huán)測試……因此,材料學(xué)的數(shù)據(jù)很難成為“大數(shù)據(jù)”,至少現(xiàn)階段只能是“小數(shù)據(jù)”。正是由于數(shù)據(jù)量小,數(shù)據(jù)偏差和噪聲對模型的影響將會十分顯著。機(jī)器學(xué)習(xí)的算法再優(yōu)化,計(jì)算機(jī)的算力再提升,我們手里只有稀疏、高維、有偏差和帶噪音的數(shù)據(jù),材料信息學(xué)將面臨“巧婦難為無米之炊”的困境。
圖4 機(jī)器學(xué)習(xí)方法研究材料科學(xué)的基本流程(圖片來自網(wǎng)絡(luò))
破解“數(shù)據(jù)困境”需要從兩個方面著手:生產(chǎn)和流通。在數(shù)據(jù)生產(chǎn)方面,隨著各國有關(guān)材料基因工程的項(xiàng)目推進(jìn),高通量實(shí)驗(yàn)和計(jì)算快速發(fā)展,對數(shù)據(jù)的標(biāo)準(zhǔn)化和高效產(chǎn)出有非常積極的作用。在數(shù)據(jù)流通方面,國外的Materials Project以及我國的Atomly等數(shù)據(jù)庫免費(fèi)開放大量的計(jì)算數(shù)據(jù),便于數(shù)據(jù)共享。哈弗福德學(xué)院建立了“黑暗反應(yīng)計(jì)劃”(Dark Reaction Project)平臺,鼓勵研究者們在發(fā)表“成功的”數(shù)據(jù)之后,再將不發(fā)表的“失敗的”數(shù)據(jù)上傳到平臺,以供機(jī)器學(xué)習(xí)模型對化學(xué)反應(yīng)進(jìn)行更加深入的分析。借助高通量、數(shù)據(jù)庫、互聯(lián)網(wǎng)等新技術(shù)加速材料數(shù)據(jù)生產(chǎn)和流通方興未艾,這個時代留給了材料人大展拳腳的廣闊舞臺。
我們不妨?xí)诚胛磥淼牟牧蠈?shí)驗(yàn)室成為“數(shù)據(jù)工廠”的那天:智能化的實(shí)驗(yàn)機(jī)器人,嚴(yán)格標(biāo)準(zhǔn)化的樣品制備和測試表征,完全電子化的實(shí)驗(yàn)記錄,融合物聯(lián)網(wǎng)的內(nèi)部即時數(shù)據(jù)共享平臺,融合區(qū)塊鏈技術(shù)的國際數(shù)據(jù)交易平臺,以及更加先進(jìn)的處理和分析數(shù)據(jù)的人工智能方法。我們材料人將會從“磨金相、守爐子、過柱子”,甚至復(fù)雜的數(shù)據(jù)分析之中解放出來,轉(zhuǎn)型為“開發(fā)者”、“合作者”和“研究者”。“開發(fā)者”負(fù)責(zé)AI算法和智能化實(shí)驗(yàn)機(jī)器的開發(fā)與維護(hù);“合作者”熟悉編程和材料研究的兩套邏輯和語言,促進(jìn)“開發(fā)者”和“研究者”的溝通交流;“研究者”捕捉行業(yè)痛點(diǎn),提出科學(xué)問題,創(chuàng)新研究思路。到那一天,或許我們能夠解碼出材料基因圖譜,每一位材料人都能像鋼鐵俠一樣帥氣地研發(fā)材料。
參考文獻(xiàn):
1. Agrawal A, Choudhary A. Perspective: Materials informatics and big data: Realization of the “fourth paradigm” of science in materials science[J]. APL Materials, 2016, 4(5):053208-1-10.
2. Liu Y, Zhao T, Ju W, et al. Materials discovery and design using machine learning[J]. Journal of Materiomics, 2017, 3(3).
3. Dima A, Bhaskarla S , Becker C , et al. Informatics Infrastructure for the Materials Genome Initiative[J]. JOM - Journal of the Minerals, Metals and Materials Society, 2016, 68(8):2053-2064.
4. Anubhav J, Shyue P O, Geoffroy H, et al. Commentary: The Materials Project: A materials genome approach to accelerating materials innovation[J]. APL Materials, 2013, 1():011002-1-11
5. Hanoch S, Alexander T. Materials Informatics. Journal of Chemical Information and Modeling 2018 58 (7), 1313-1314
6. 施思齊,徐積維,崔艷華 等. 多尺度材料計(jì)算方法[J]. 科技導(dǎo)報(bào), 2015, 33(10):20-30
責(zé)任編輯:xj
原文標(biāo)題:材料信息學(xué):解碼材料基因圖譜丨科普硅立方
文章出處:【微信公眾號:中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
材料
+關(guān)注
關(guān)注
3文章
1228瀏覽量
27294 -
晶格
+關(guān)注
關(guān)注
0文章
94瀏覽量
9218 -
非金屬
+關(guān)注
關(guān)注
0文章
13瀏覽量
5701
原文標(biāo)題:材料信息學(xué):解碼材料基因圖譜丨科普硅立方
文章出處:【微信號:bdtdsj,微信公眾號:中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論