摘要
材料的結(jié)構(gòu)直接決定了其物理和化學(xué)性質(zhì),這種關(guān)系也常稱(chēng)之為“構(gòu)效關(guān)系”。如何快速有效地建立起這種“構(gòu)效關(guān)系”是探索和設(shè)計(jì)新型功能材料的關(guān)鍵。理論模擬能夠根據(jù)材料的原子級(jí)構(gòu)型較為精確地計(jì)算出材料的各種性質(zhì),對(duì)實(shí)驗(yàn)具有指導(dǎo)意義,然而對(duì)復(fù)雜體系的模擬計(jì)算過(guò)去通常受限于計(jì)算機(jī)的性能和成本,尤其是精確的密度泛函理論模擬計(jì)算。通用計(jì)算顯卡(General-Purpose Computing on Graphics Processing Units,GPGPU)的發(fā)展可改善這種情況,在GPGPU加速的情況下,材料模擬所需的時(shí)間將會(huì)顯著縮短。近年來(lái),人工智能在各個(gè)領(lǐng)域展現(xiàn)出令人矚目的能力,其中GPGPU扮演著至關(guān)重要的角色。
人工智能與材料科學(xué)在GPGPU的助力下有機(jī)地結(jié)合在一起,使得材料科學(xué)的研究模式進(jìn)入一個(gè)新的階段:AI4Materials,有望大幅加速新材料的研發(fā)。接下來(lái),讓我們一起來(lái)了解材料科學(xué)邁向AI4Materials的關(guān)鍵因素。本文將從密度泛函理論出發(fā),首先介紹其理論框架的發(fā)展,其次討論基于密度泛函理論的常用軟件及其特點(diǎn),同時(shí)介紹GPGPU對(duì)這些軟件的加速效果,最后簡(jiǎn)要介紹材料基因組計(jì)劃。下篇將介紹AI4Materials中的“材料大數(shù)據(jù)”以及人工智能算法結(jié)合材料科學(xué)取得的一些進(jìn)展。
01
材料科學(xué)研究范式4.0:AI4materials
每種材料都是由眾多原子按特定方式排列組合而成的,排列方式?jīng)Q定了材料的物理和化學(xué)性質(zhì),這種結(jié)構(gòu)與性質(zhì)之間的關(guān)系常被稱(chēng)為“構(gòu)效關(guān)系”。尋找并理解這種關(guān)系,以及根據(jù)它來(lái)設(shè)計(jì)新材料,一直是科學(xué)家們不斷努力的方向。
傳統(tǒng)的新材料開(kāi)發(fā)通常采用試錯(cuò)法,然而其實(shí)驗(yàn)步驟繁瑣、周期長(zhǎng)且成本高,制約了材料研發(fā)的速度。隨著理論的發(fā)展和計(jì)算機(jī)技術(shù)的進(jìn)步,理論模擬計(jì)算已成為發(fā)現(xiàn)新材料的重要方法之一。如基于密度泛函理論的電子結(jié)構(gòu)計(jì)算、蒙特卡羅模擬、分子動(dòng)力學(xué)模擬、相場(chǎng)法和有限元分析等高精度計(jì)算方法被廣泛應(yīng)用于新材料的探索和發(fā)現(xiàn)。然而,這些方法通常僅適用于特定系統(tǒng),對(duì)于復(fù)雜系統(tǒng)的計(jì)算則具有一定挑戰(zhàn)性。近年來(lái),GPGPU的快速發(fā)展正在改善這一情況。此外,目前的理論發(fā)展仍不足以滿(mǎn)足對(duì)材料定量表征的需求。因此,亟需開(kāi)發(fā)新的方法和工具來(lái)指導(dǎo)新材料的探索和設(shè)計(jì)。
隨著實(shí)驗(yàn)研究和材料理論的發(fā)展,上述實(shí)驗(yàn)和計(jì)算模擬產(chǎn)生了大量數(shù)據(jù)。在材料科學(xué)研究范式經(jīng)歷了實(shí)驗(yàn)科學(xué)、理論科學(xué)和模擬計(jì)算三個(gè)階段后,長(zhǎng)期積累所形成的“材料大數(shù)據(jù)”為材料科學(xué)步入“第四范式”提供了“養(yǎng)料”,如圖 1所示,大數(shù)據(jù)和人工智能的結(jié)合被稱(chēng)為“科學(xué)的第四范式”或“第四次工業(yè)革命”。機(jī)器學(xué)習(xí)已成為材料信息學(xué)的核心技術(shù)之一,以材料數(shù)據(jù)庫(kù)為基礎(chǔ)的機(jī)器學(xué)習(xí)能夠快速實(shí)現(xiàn)材料的預(yù)測(cè),有望加快新材料的設(shè)計(jì),縮短材料的開(kāi)發(fā)周期。即使在不了解潛在物理機(jī)制的情況下,機(jī)器學(xué)習(xí)也能夠從現(xiàn)有數(shù)據(jù)中學(xué)習(xí)其蘊(yùn)含的行為和趨勢(shì),在材料科學(xué)中正在發(fā)揮越來(lái)越重要的作用。
圖 1 材料科學(xué)研究四個(gè)范式。
圖片來(lái)源于文獻(xiàn)[1]
02
密度泛函理論扮演的角色
密度泛函理論(Density Functional Theory, DFT)是量子力學(xué)中一種重要的計(jì)算方法,被廣泛應(yīng)用于研究原子、分子核凝聚態(tài)物質(zhì)的性質(zhì)。DFT可用于準(zhǔn)確地描述材料和分子的電子結(jié)構(gòu),通過(guò)計(jì)算電子密度來(lái)獲得分子結(jié)構(gòu)、能量、電子親和力、離子化勢(shì)等物理和化學(xué)性質(zhì)。借助 DFT,科學(xué)家可以設(shè)計(jì)新型材料并預(yù)測(cè)其性質(zhì),包括但不限于催化劑、半導(dǎo)體、超導(dǎo)體等,為實(shí)驗(yàn)室合成和材料應(yīng)用提供理論指導(dǎo)。例如,DFT 能夠揭示催化劑表面上的吸附、反應(yīng)和表面結(jié)構(gòu),幫助解釋催化作用的機(jī)理,并加速新型催化劑的設(shè)計(jì)與優(yōu)化。在能源研究中,DFT可用于模擬電池材料的性能、儲(chǔ)能材料的吸附特性以及光催化劑的能量轉(zhuǎn)換過(guò)程。DFT還可用于理解生物分子(如蛋白質(zhì)和酶)的結(jié)構(gòu)和活性,幫助科學(xué)家解釋生物化學(xué)過(guò)程和生物分子的相互作用。
二維材料通常指只具有幾個(gè)原子厚度的平面薄膜材料,這一概念起源于2004年,當(dāng)時(shí)曼切斯特大學(xué)(University of Manchester)Geim小組成功分離出單層原子層的石墨材料:石墨烯(Graphene)。由于Geim在實(shí)驗(yàn)中(通過(guò)機(jī)械剝離法)發(fā)現(xiàn)了二維石墨烯,他獲得了2010年的諾貝爾物理學(xué)獎(jiǎng),這標(biāo)志著一個(gè)新材料領(lǐng)域的誕生:二維材料。可以想象一下,二維材料的原子級(jí)厚度會(huì)限制電子的運(yùn)動(dòng),使其呈現(xiàn)出與三維材料不同的性質(zhì),這種效應(yīng)也稱(chēng)為量子限域效應(yīng)。因此,單原子層厚度的石墨烯具有出色的特性,如高載流子遷移率、高開(kāi)關(guān)比、高力學(xué)強(qiáng)度(在二維平面內(nèi)比金剛石還要硬,當(dāng)然了,在垂直平面的方向上是很軟的)等等。目前,基于石墨烯的研究和應(yīng)用已經(jīng)取得了長(zhǎng)足的進(jìn)步,如圖 2所示,并將對(duì)我們的生活產(chǎn)生深遠(yuǎn)影響。
圖 2 石墨烯材料發(fā)展中的重要事件時(shí)間線(xiàn)[2]
除了石墨的單層結(jié)構(gòu)有這種特性,其他層狀材料的單層是否存在?除了碳(C)元素,其他元素的組合形成的二維材料也是否存在?性質(zhì)如何呢?再進(jìn)一步,二維材料是否可以在三維空間“搭積木”?這些都引起了科學(xué)家們極大的興趣。如果理論上能夠快速、準(zhǔn)確模擬計(jì)算出材料的性質(zhì),例如穩(wěn)定性、電子結(jié)構(gòu)、帶隙、電荷傳輸?shù)?。這種模擬方法可以為科學(xué)家提供寶貴的信息,具有指導(dǎo)意義,幫助篩選出具有特定性質(zhì)的候選物質(zhì),以便進(jìn)行進(jìn)一步的實(shí)驗(yàn)驗(yàn)證和研究。這種篩選方法可以節(jié)約大量的時(shí)間、精力和資源,提高實(shí)驗(yàn)工作的效率。
經(jīng)過(guò)科學(xué)家多年的努力和耕耘,已經(jīng)發(fā)展出了很多方法來(lái)模擬計(jì)算材料的基礎(chǔ)性質(zhì)。在這些方法中,DFT由于能夠較為精確地模擬計(jì)算出基態(tài)性質(zhì)而被廣泛應(yīng)用。通過(guò)DFT模擬計(jì)算,我們可以輕松地獲得石墨烯的基態(tài)性質(zhì)。如圖 3所示,根據(jù)密度泛函理論可以計(jì)算出石墨烯的電子能帶圖和聲子譜,其結(jié)果與實(shí)驗(yàn)值符合得非常好。結(jié)合理論模擬計(jì)算和實(shí)驗(yàn)制備與測(cè)量,科學(xué)家們已經(jīng)發(fā)現(xiàn)了多種二維材料,如二維氮化硼、二維硫?qū)僮寤衔?、MXene材料等,以及如何用這些層狀二維材料“搭積木”(稱(chēng)為范德華異質(zhì)結(jié),van der Waals heterostructures。注:二維材料層與層之間靠van der Waals作用力連接。)來(lái)獲得不同的物理、化學(xué)性質(zhì),如圖 4所示。
圖 3 石墨烯的密度泛函理論計(jì)算結(jié)果。
(a)石墨烯的電子能帶結(jié)構(gòu)[3]。其中費(fèi)米面設(shè)為0 eV。(b)石墨烯的聲子譜[4]。其中,黑色實(shí)線(xiàn)是DFT計(jì)算值,空心三角形和方形散點(diǎn)是實(shí)驗(yàn)值,紅色實(shí)線(xiàn)是基于優(yōu)化的Tersoff經(jīng)驗(yàn)勢(shì)計(jì)算的結(jié)果。中間的六邊形是石墨烯的K空間及高對(duì)稱(chēng)點(diǎn)
圖 4 (a)二維材料所組成的“積木”(異質(zhì)結(jié))示意圖。(b)典型的二維材料家族。
圖片來(lái)源于文獻(xiàn)[5]。
近年來(lái),“魔角”石墨烯的發(fā)現(xiàn)引領(lǐng)了轉(zhuǎn)角電子學(xué)領(lǐng)域的發(fā)展[6–9]。在小角度轉(zhuǎn)角(約1.08°)下,雙層石墨烯表現(xiàn)出在費(fèi)米面附近出現(xiàn)平帶的電子結(jié)構(gòu),這導(dǎo)致其顯示出神奇的超導(dǎo)效應(yīng)。“魔角”石墨烯的晶胞包含了11164個(gè)原子,每層石墨烯含有5582個(gè)碳原子。密度泛函理論的模擬計(jì)算也證實(shí)了魔角石墨烯在費(fèi)米面附近出現(xiàn)平臺(tái)的電子特征[10],如圖 5所示,然而,計(jì)算這一電子結(jié)構(gòu)需要使用2880至5760個(gè)CPU核計(jì)算約30天。這種耗時(shí)的模擬計(jì)算在一定程度上限制了科學(xué)家們對(duì)大體系新材料的研究和探索。隨著GPGPU的發(fā)展,其強(qiáng)大的計(jì)算能力將大大加速科學(xué)家們對(duì)大體系和新材料的研究進(jìn)展。以雙層石墨烯轉(zhuǎn)角5.086°(包含508個(gè)C原子)為例,在GPGPU上利用密度泛函理論計(jì)算其電子能帶結(jié)構(gòu)僅需要4.1個(gè)小時(shí),如圖 5所示。隨著GPGPU的快速發(fā)展,基于密度泛函理論進(jìn)行高精度大體系的模擬計(jì)算將會(huì)變得“唾手可得”。
圖 5 轉(zhuǎn)角石墨烯結(jié)構(gòu)與基于密度泛函理論模擬計(jì)算的電子能帶圖。(a)轉(zhuǎn)角為1.08°的魔角石墨烯原胞,包含11164個(gè)C原子,其中顏色表示層間不同的原子間距[10]。(b)在2880至5760個(gè)CPU核計(jì)算出的基于密度泛函理論的電子結(jié)構(gòu)[10],其中費(fèi)米能設(shè)為0 eV。(c)和(d)是轉(zhuǎn)角為5.086°雙層石墨烯在GPGPU上的基于密度泛函理論計(jì)算出的結(jié)果。(c)經(jīng)過(guò)結(jié)構(gòu)弛豫后的原胞,其中包含508個(gè)C原子。(b)電子能帶結(jié)構(gòu),其中藍(lán)色虛線(xiàn)是費(fèi)米能級(jí)位置(0 eV)。
通過(guò)上面的介紹,我們可以看出密度泛函理論的計(jì)算結(jié)果與實(shí)驗(yàn)測(cè)量非常吻合,已成為材料性質(zhì)預(yù)測(cè)和物理理論研究中的重要工具,對(duì)實(shí)驗(yàn)研究具有一定的理論指導(dǎo)意義。然而,高精度密度泛函理論模擬大體系十分昂貴且耗時(shí),這限制了其應(yīng)用范圍。但隨著GPGPU技術(shù)的發(fā)展,密度泛函理論的計(jì)算效率將會(huì)大大提高。
為什么密度泛函理論能夠準(zhǔn)確地計(jì)算材料的基態(tài)性質(zhì)呢?接下來(lái),讓我們回顧一下密度泛函理論的發(fā)展歷程,了解科學(xué)家們?cè)谶@一領(lǐng)域的貢獻(xiàn),感受物理學(xué)家智慧的閃光點(diǎn)。在下一節(jié)的介紹中,我們將探究這一理論的發(fā)現(xiàn)和演變,以及背后的科學(xué)思想。
03
密度泛函理論發(fā)展歷史
在海森堡、薛定諤和狄拉克等人相繼建立非相對(duì)論和相對(duì)論的量子力學(xué)后,狄拉克在1929年提出:“The fundamental laws necessary for the mathematical treatment of large parts of physics and the whole of chemistry are thus fully known, and the difficulty lies only in the fact that application of these laws leads to equations that are too complex to be solved.” (處理大部分物理學(xué)和整個(gè)化學(xué)所需的數(shù)學(xué)基本定律已完全了解,困難僅在于應(yīng)用這些定律會(huì)產(chǎn)生過(guò)于復(fù)雜而無(wú)法解決的方程。)[11]。以當(dāng)時(shí)的計(jì)算能力,想通過(guò)求解量子力學(xué)方程來(lái)嚴(yán)格地進(jìn)行材料的理論計(jì)算是根本不可能的。自1960年代初以來(lái),經(jīng)過(guò)眾多物理學(xué)家、數(shù)學(xué)家和化學(xué)家的努力,特別是計(jì)算機(jī)技術(shù)的進(jìn)步,這種情況得到了很大的改變。目前,基于密度泛函理論的第一性原理計(jì)算已經(jīng)成為科學(xué)研究的重要方法之一。更值得一提的是,在GPGPU算力的支持下,密度泛函理論的模擬計(jì)算速度得到了顯著提升。
密度泛函理論由于其清晰的物理原理,相對(duì)較小的計(jì)算量以及較為準(zhǔn)確的計(jì)算結(jié)果,在當(dāng)前廣泛應(yīng)用于材料性質(zhì)的理論模擬計(jì)算。密度泛函理論的發(fā)展過(guò)程體現(xiàn)了物理學(xué)家們的努力和智慧。
如果一個(gè)函數(shù)的變量也是一個(gè)函數(shù),則稱(chēng)為泛函,它是函數(shù)的函數(shù),也常稱(chēng)“函數(shù)的函數(shù)就是泛函”。通常,泛函是一個(gè)積分,這是因?yàn)榉e分表示了函數(shù)整體的特點(diǎn)。如果只是涉及函數(shù)在某一位置的信息,如F=exp(cos(θ)),它可以說(shuō)是cos(θ)的函數(shù),但只是在θ處計(jì)算,因而是一般的函數(shù),不必歸之于泛函。對(duì)于密度泛函理論,其表述的是材料基態(tài)能量是電子密度的泛函(基態(tài)能量是電子密度的積分),而電子密度又是位置坐標(biāo)的函數(shù)。
1927年,Thomas和Fermi基于理想狀態(tài)下的均勻自由電子氣體模型,認(rèn)為能量是電子密度的泛函,其中,電子密度是位置的函數(shù)。該模型包含了體系的基態(tài)能量,考慮了動(dòng)能項(xiàng)以及核與電子、電子與電子之間的庫(kù)倫相互作用。然而,Thomas-Fermi模型并未考慮電子之間的交換關(guān)聯(lián)作用,后來(lái),Dirac于1930年對(duì)這個(gè)方法進(jìn)行了擴(kuò)展,把局部近似的電子間交換作用也表示成電子密度泛函的形式,并作為T(mén)homas和Fermi模型的補(bǔ)充,即Thomas-Fermi-Dirac模型,此模型相比較薛定諤方程有了非常大的簡(jiǎn)化,是密度泛函理論的雛形,但是由于其近似過(guò)于粗糙,計(jì)算出的結(jié)果誤差比較大。
到了1963年,Walter Kohn在巴黎高等師范學(xué)院(école Normale Supérieure)閱讀一些關(guān)于冶金相關(guān)的文獻(xiàn)時(shí)發(fā)現(xiàn),合金中原子的有效電荷的概念非常有趣,它能粗略地表征原子間的電荷轉(zhuǎn)移,這里的有效電荷在坐標(biāo)空間是局域化的,這種觀點(diǎn)與在動(dòng)量空間中的非局域化波是不同的,如周期性邊界條件下的Bloch波。Walter Kohn聯(lián)想到Thomas-Fermi近似中能量可以表示為電子密度的泛函,并敏銳地發(fā)現(xiàn),對(duì)于單個(gè)粒子,勢(shì)能V(r)和基態(tài)的電子密度n(r)之間存在明確的基本關(guān)系,那么對(duì)于包含N個(gè)電子系統(tǒng),其電子密度也決定了這個(gè)體系的總哈密頓量H。
接著,Walter Kohn用他“擅長(zhǎng)”(“beloved”)的Rayleigh Ritz變分原理僅用三行論證就證實(shí)了這個(gè)猜想,以至于當(dāng)時(shí)他都不敢相信自己這么輕易就得到了這個(gè)如此了不起的結(jié)果[12]。接著,Walter Kohn邀請(qǐng)Pierre Hohenberg加入進(jìn)來(lái),首先是調(diào)研文獻(xiàn),看這個(gè)簡(jiǎn)單的結(jié)果是否已知(顯然是沒(méi)有),并短時(shí)間內(nèi),根據(jù)電子密度n(r)而不是多電子波函數(shù)得到基態(tài)能量的Rayleigh-Ritz定理,也就是現(xiàn)在的Hohenberg Kohn (HK)變分原理,并于1964年發(fā)表[13]。盡管這個(gè)工作并沒(méi)有給出泛函的具體形式,但是毋庸置疑的是,HK定理直接奠定了密度泛函理論的理論根基。不久之后,Walter Kohn回到了加州大學(xué)圣地亞哥分校,和剛來(lái)的博士后Lu Jeu Sham一起從HK定理出發(fā),推導(dǎo)出了現(xiàn)在被稱(chēng)為Kohn-Sham方程的結(jié)果,即下式,并于1965年發(fā)表[14]。
其中,中括號(hào)第一項(xiàng)是動(dòng)能項(xiàng),第二項(xiàng)是等效勢(shì)能項(xiàng),φnk(r)是波函數(shù),n是能帶指標(biāo),k是倒空間K點(diǎn)位置,r是實(shí)空間位置。
圖 6 密度泛函理論發(fā)展歷史
總的來(lái)說(shuō),密度泛函理論的發(fā)展歷史大致可分為三個(gè)階段,如圖 6所示:
第一階段
Thomas和Fermi基于理想狀態(tài)下的均勻自由氣體模型,把電子密度作為能量的泛函,首次引入密度泛函的概念,但是處理太過(guò)粗糙;
第二階段
Pierre Hohenberg和Walter Kohn用簡(jiǎn)潔的方式證明了兩個(gè)重要的定理,為密度泛函理論奠定了理論基礎(chǔ),但沒(méi)有給出泛函的具體表達(dá)式;
第三階段
Walter Kohn和Lu Jeu Sham提出了非相對(duì)論密度泛函理論的具體實(shí)現(xiàn)方法。
受到Hatree-Fork近似的啟發(fā),Kohn和Sham用一個(gè)非相互作用的電子系統(tǒng)代替具有相互作用的電子系統(tǒng),把由具有非相互作用電子近似帶來(lái)的動(dòng)能和勢(shì)能的誤差放在交換關(guān)聯(lián)項(xiàng)中。自從Kohn-Sham方程提出以來(lái),DFT方法一直是物理、化學(xué)領(lǐng)域計(jì)算電子結(jié)構(gòu)及其特征最有力的工具之一。因此,Walter Kohn因提出DFT方法獲得1998年諾貝爾化學(xué)獎(jiǎng)(與之分享的是John A. Pople),表明DFT方法在量子化學(xué)計(jì)算領(lǐng)域的核心地位和廣泛應(yīng)用。在1964年的時(shí)候,開(kāi)發(fā)高效的計(jì)算機(jī)代碼是物理理論學(xué)家面臨的主要任務(wù)之一,其中John A. Pople為整個(gè)量子化學(xué)方法論的發(fā)展做出了巨大貢獻(xiàn)。Pople將計(jì)算化學(xué)理論方法工具化,開(kāi)發(fā)了Gaussian計(jì)算機(jī)程序,并于1970年發(fā)布第一個(gè)版本,而且多年來(lái)不斷更新發(fā)展。目前Gaussian程序已經(jīng)成為許多高校、研究所和商業(yè)公司重要的研究工具。
圖 7. 1998年諾貝爾化學(xué)獎(jiǎng)由沃爾特·科恩(Walter Kohn)和約翰·A·波普爾(John A. Pople)平分,以分別表彰他們對(duì)密度泛函理論和量子化學(xué)計(jì)算方法發(fā)展的貢獻(xiàn)。
04
典型的基于密度泛函理論的材料模擬軟件
基于密度泛函理論的第一性原理有很多軟件,這里簡(jiǎn)單介紹一些典型和常用的軟件平臺(tái),如The Vienna Ab initio Simulation Packag(VASP)、CP2K、Gaussian、Materials Studio(MS)、Quantum Espresso(QE)等軟件。
圖 8 一些典型的第一性原理密度泛函理論計(jì)算軟件平臺(tái)
The Vienna Ab initio Simulation Packag(VASP)是維也納大學(xué)Hafner小組開(kāi)發(fā)的基于密度泛函理論的材料模擬計(jì)算軟件包,能夠進(jìn)行電子結(jié)構(gòu)計(jì)算和量子力學(xué)-分子動(dòng)力學(xué)模擬,由于其簡(jiǎn)單易用,準(zhǔn)確性好,是材料模擬和計(jì)算物質(zhì)科學(xué)研究中最流行的商用軟件之一。VASP是在密度泛函理論(DFT)框架下計(jì)算多體Schr?dinger方程的近似解,求解Kohn-Sham方程,或者在Hartree-Fock(HF)近似下解決Roothaan方程。VASP還實(shí)現(xiàn)了將Hartree-Fock方法與密度泛函理論混合的混合泛函。此外,還提供了Green函數(shù)方法(GW準(zhǔn)粒子和ACFDT-RPA)和多體微擾理論(二階M?ller-Plesset)。在VASP中,一些核心量都是由以平面波基組來(lái)表示的,如單電子軌道、電子電荷密度和局域勢(shì)。電子和離子之間的相互作用使用模守恒贗勢(shì)、超軟贗勢(shì)或投影綴加波方法進(jìn)行描述。為了確定電子基態(tài),VASP利用了高效的迭代矩陣對(duì)角化技術(shù),如迭代子空間下的殘差最小化方法(RMM-DIIS)或Blocked Davison算法。這些與高效的Broyden和Pulay密度混合方案相結(jié)合,以加快自洽循環(huán)速度。
在VASP(5.4.4)中基于MPI的并行過(guò)程如圖 9所示,在計(jì)算KS軌道的過(guò)程中,可以通過(guò)KPAR,即倒空間K點(diǎn)個(gè)數(shù),來(lái)控制同時(shí)計(jì)算K點(diǎn)個(gè)數(shù),以及NCORE來(lái)控制同時(shí)計(jì)算每個(gè)K點(diǎn)上的能帶個(gè)數(shù)。這種并行方式,尤其K點(diǎn)可以獨(dú)立計(jì)算的這種特性也非常適用于GPGPU平臺(tái)的加速計(jì)算。在這種并行框架下,VASP提供了基于CUDA和OpenACC的GPU加速方案,并在VASP.6.2.0之后全面轉(zhuǎn)向OpenACC加速方案。在OpenACC加速方案下,VASP6.1.0版本(2020年)在GPGPU下的計(jì)算速度約是純CPU的2.6-5.1倍[15],經(jīng)過(guò)多次版本的更新以及GPGPU的發(fā)展,VASP6.4.1版本(2023年)在GPGPU下的計(jì)算速度約能達(dá)到純CPU的8.2倍[16]。另外,從VASP.6.3.0版本開(kāi)始,還支持on-the-fly機(jī)器學(xué)習(xí)力場(chǎng),這進(jìn)一步加快整個(gè)計(jì)算過(guò)程。
圖 9 VASP 5.4.4的并行框架[17]。在求解KS波函數(shù)(Wavefunction)過(guò)程中,KPAR控制K點(diǎn)的并行度,NCORE控制Bands/Orbitals的并行度
CP2K是開(kāi)源的用于量子化學(xué)和固體物理的第一性原理材料計(jì)算和模擬軟件,可以模擬固態(tài)、液態(tài)、分子等材料體系。CP2K使用Fortran2008編寫(xiě),可以利用多線(xiàn)程、MPI和CUDA的組合高效地并行運(yùn)行,能夠輕松模擬計(jì)算包含上千原子的體系。CP2K最開(kāi)始是由馬克斯-普朗克研究中心于2000年發(fā)起的一項(xiàng)用于固體物理研究的項(xiàng)目,現(xiàn)在已轉(zhuǎn)由蘇黎世聯(lián)邦理工學(xué)院和蘇黎世大學(xué)維護(hù),成為一個(gè)開(kāi)源的項(xiàng)目,遵從GPL協(xié)議。相比較VASP,CP2K輸入文件的結(jié)構(gòu)比較復(fù)雜,沒(méi)有像VASP wiki類(lèi)似的比較完整的使用和學(xué)習(xí)文檔,學(xué)習(xí)曲線(xiàn)較為陡峭;對(duì)導(dǎo)體、磁性和小體系計(jì)算不太合適;但是CP2K中基于第一性原理的分子動(dòng)力學(xué)模擬功能非常優(yōu)秀。CP2K也開(kāi)發(fā)了GPU相關(guān)的加速方案,基于GPGPU的計(jì)算相比較于純CPU計(jì)算約能達(dá)到3.7倍的加速效果[18]。
Gaussian是一個(gè)量子化學(xué)軟件包,它是目前應(yīng)用最廣泛的計(jì)算化學(xué)軟件之一。如前所述,其代碼最初由理論化學(xué)家、1998年諾貝爾化學(xué)獎(jiǎng)得主John A. Pople編寫(xiě),其名稱(chēng)來(lái)自于Pople在軟件中所使用的高斯型基組,使用高斯型基組是Pople為簡(jiǎn)化計(jì)算過(guò)程縮短計(jì)算時(shí)間所引入的一項(xiàng)重要近似。其前期是免費(fèi)的,后期發(fā)展成為成熟的商用軟件,目前已經(jīng)發(fā)展到Gaussian 16,可用于預(yù)測(cè)化合物和反應(yīng)在各種化學(xué)環(huán)境中的能量、分子結(jié)構(gòu)、振動(dòng)頻率和分子性質(zhì)。Gaussian 16的模型既可以應(yīng)用于穩(wěn)定物質(zhì),也可以應(yīng)用于難以或不可能通過(guò)實(shí)驗(yàn)觀察到的化合物,無(wú)論是由于它們的性質(zhì)(例如,毒性、可燃性、放射性)還是它們固有的轉(zhuǎn)瞬即逝的性質(zhì)(例如,短時(shí)間內(nèi)的中間體和過(guò)渡結(jié)構(gòu))。而且,Gaussian 16提供了用戶(hù)友好的界面(GaussianView),大大降低了科研工作者從事量子力學(xué)計(jì)算模擬的門(mén)檻。并且,Gaussian 16支持GPU的加速方案,在8張GPGPU上的加速效果約是純CPU的2.3-4.2倍[19]。
BIOVIA Materials Studio(MS)是一個(gè)商業(yè)軟件,包含完整的建模和仿真環(huán)境,旨在使材料科學(xué)和化學(xué)研究人員能夠預(yù)測(cè)和理解材料的原子和分子結(jié)構(gòu)與其特性和行為的關(guān)系。使用MS,許多行業(yè)的研究人員正在設(shè)計(jì)各種類(lèi)型的性能更好的材料,包括催化劑、聚合物、復(fù)合材料、金屬、合金、制藥、電池等。Cambridge Sequential Total Energy Package(CASTEP)是MS軟件中的第一性原理計(jì)算模塊,用Fortran 2003語(yǔ)言編寫(xiě),其基本可實(shí)現(xiàn)VASP中的主要功能,與VASP不同的是其在MS上提供了可視化、用戶(hù)十分友好的操作界面。值得一提的是,CASTEP的Linux學(xué)術(shù)版是免費(fèi)的。CASTEP的OpenACC加速方案還在積極開(kāi)發(fā)中,在GPGPU的加速下,其計(jì)算速度約能達(dá)到純CPU的2倍[20]。
Quantum Espresso(QE)(前期被稱(chēng)為PWscf)是一款開(kāi)源的、被廣泛使用的第一性原理密度泛函理論計(jì)算軟件。與VASP一樣也是基于平面波基組和贗勢(shì),相比較于VASP,QE具有開(kāi)源免費(fèi)、功能更加豐富、自帶后處理程序等特點(diǎn)。本著開(kāi)源項(xiàng)目的精神,QE已經(jīng)發(fā)展成為一個(gè)獨(dú)立且可互操作的代碼分發(fā)版。QE發(fā)行版由一組“歷史”核心組件和一組執(zhí)行更高級(jí)任務(wù)的插件組成,以及許多旨在與核心組件互操作的第三方軟件包。鼓勵(lì)活躍在電子結(jié)構(gòu)計(jì)算領(lǐng)域的研究人員通過(guò)貢獻(xiàn)自己的代碼或?qū)⒆约旱南敕▽?shí)施到現(xiàn)有代碼中來(lái)參與該項(xiàng)目。自QE v.6.4版本后,QE開(kāi)始加入了基于CUDA的GPU加速方案,QE-GPU v.6.5(2020年)在GPGPU上的加速效果是純CPU的1.4-4.6倍[21]。
還有很多優(yōu)秀的第一性原理計(jì)算軟件,例如WIEN2K[22]、ORCA[23]、SIESTA[24]、ABINIT[25]以及國(guó)產(chǎn)軟件RESCU[26]、ABACUS[27]等,這里就不一一介紹了。
圖 10 在不同密度泛函理論模擬計(jì)算軟件中GPU相對(duì)于CPU的加速效果。(a)VASP,(b)CP2K,(c)CASTEP,(d)QE
圖片來(lái)源于文獻(xiàn)[15,16,18,20-21]。
05
材料基因組計(jì)劃
新材料是人類(lèi)文明社會(huì)進(jìn)步的基石,新材料的革新對(duì)技術(shù)的進(jìn)步和產(chǎn)業(yè)的發(fā)展發(fā)揮著重要的作用。材料基因組計(jì)劃(Materials Genome Initiative,MGI)于2011年6月24日由美國(guó)率先提出,如圖 11所示,其是從應(yīng)用需求出發(fā),倒推符合相應(yīng)結(jié)構(gòu)功能的材料,旨在通過(guò)新材料研制周期內(nèi)各個(gè)階段的團(tuán)隊(duì)相互協(xié)作,加強(qiáng)“官產(chǎn)學(xué)研用”相結(jié)合,注重實(shí)驗(yàn)技術(shù)、計(jì)算技術(shù)和數(shù)據(jù)庫(kù)之間的協(xié)作和共享,達(dá)到縮短新材料研發(fā)周期的目的,降低研發(fā)成本。材料基因組計(jì)劃的一個(gè)突出重點(diǎn)是強(qiáng)調(diào)材料計(jì)算模擬、實(shí)驗(yàn)和數(shù)據(jù)庫(kù)的協(xié)同性對(duì)加快材料研發(fā)的貢獻(xiàn)。
圖 11 材料基因組計(jì)劃(Materials Genome Initiative,MGI)[28]
中國(guó)也重點(diǎn)專(zhuān)項(xiàng)全方位布局研究材料基因組計(jì)劃。材料高效計(jì)算、高通量實(shí)驗(yàn)和大數(shù)據(jù)技術(shù)構(gòu)成材料基因工程的基礎(chǔ)技術(shù)體系。通過(guò)材料高效計(jì)算和高通量實(shí)驗(yàn),可實(shí)現(xiàn)新材料的快速篩選和材料數(shù)據(jù)的快速積累;通過(guò)大數(shù)據(jù)和人工智能技術(shù)的應(yīng)用,可實(shí)現(xiàn)材料成分和工藝的全局優(yōu)化、材料性能的提升;通過(guò)創(chuàng)新平臺(tái),實(shí)現(xiàn)材料基因工程關(guān)鍵技術(shù)的深度融合和協(xié)同創(chuàng)新。材料基因工程關(guān)鍵技術(shù)的應(yīng)用,將材料傳統(tǒng)順序迭代的試錯(cuò)法研發(fā)模式,變革成全過(guò)程關(guān)聯(lián)并行的新模式如圖 12所示,全面加速材料發(fā)現(xiàn)、開(kāi)發(fā)、生產(chǎn)、應(yīng)用等全過(guò)程的進(jìn)程,促進(jìn)新材料研發(fā)和工程化應(yīng)用[29]。
通過(guò)MGI項(xiàng)目,材料科學(xué)家們可獲得更多的工具和資源,可更快、更高效地進(jìn)行新材料的研發(fā)。雖然短期內(nèi)具體新材料的商業(yè)應(yīng)用可能有限,但長(zhǎng)期來(lái)看,MGI的努力有望加速材料創(chuàng)新的進(jìn)程,推動(dòng)科學(xué)、工業(yè)和社會(huì)的發(fā)展。
圖 12 材料基因組工程變革研發(fā)模式。
圖片來(lái)源于文獻(xiàn)[29]
06
小結(jié)
通過(guò)上面的介紹,我們可以了解到在材料研究的第三和第四范式中,密度泛函理論占據(jù)著重要的地位。密度泛函理論作為第一性原理計(jì)算的基礎(chǔ)工具,為研究人員提供了解釋和預(yù)測(cè)材料性質(zhì)的強(qiáng)有力手段。它不僅推動(dòng)了新型功能材料的探索,還為實(shí)驗(yàn)研究提供了理論指導(dǎo),并為材料研究的第四范式提供了可靠的數(shù)據(jù)支持。盡管密度泛函理論在幾十年的發(fā)展中取得了長(zhǎng)足進(jìn)步,但隨著研究體系的增大和精度要求的提高,計(jì)算機(jī)算力一直是限制其應(yīng)用的主要因素。然而,隨著通用計(jì)算(GPGPU)技術(shù)的發(fā)展,其為材料模擬計(jì)算提供了強(qiáng)大的算力支持,使得理論上精確模擬計(jì)算大體系基態(tài)性質(zhì)成為可能。隨著社會(huì)對(duì)新型功能材料需求的不斷增加,傳統(tǒng)的研究模式已經(jīng)不能滿(mǎn)足需求。因此,材料基因組計(jì)劃的出現(xiàn)對(duì)加速新材料開(kāi)發(fā)和應(yīng)用具有重要意義,其中,GPGPU提供的高算力也扮演著關(guān)鍵的角色。這一計(jì)劃將指導(dǎo)并加速新型功能材料的發(fā)現(xiàn)和應(yīng)用,為社會(huì)發(fā)展提供更多可能性。
07
預(yù)告
隨著材料基因組計(jì)劃的提出,在科學(xué)計(jì)算和人工智能算法的不斷發(fā)展下,AI4Materials正在如火如荼地進(jìn)行著,材料科學(xué)研究模式正在發(fā)生前所未有的變革,展現(xiàn)出巨大的潛力。接下來(lái)(下篇),我們將介紹不斷發(fā)展的晶體材料數(shù)據(jù)庫(kù)、科學(xué)計(jì)算對(duì)材料模擬計(jì)算加速以及人工智能算法在材料科學(xué)的應(yīng)用。
審核編輯:劉清
-
人工智能
+關(guān)注
關(guān)注
1792文章
47508瀏覽量
239223 -
石墨烯
+關(guān)注
關(guān)注
54文章
1559瀏覽量
79828 -
DFT
+關(guān)注
關(guān)注
2文章
231瀏覽量
22771 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132838
原文標(biāo)題:【智算新聞】材料科學(xué)邁向AI4Materials的關(guān)鍵因素:密度泛函理論、GPGPU與人工智能(上)
文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論