細(xì)胞分析 | 分子圖譜 |IND
生物識別| 基因測序 |膜蛋白
前幾天,著名的結(jié)構(gòu)生物科學(xué)家顏寧宣布將辭去美國普林斯頓大學(xué)教職,回國出任深圳醫(yī)學(xué)科學(xué)院創(chuàng)始院長的消息在網(wǎng)上刷屏,并迅速沖上了熱搜第一。
顏寧,山東章丘人,1977年11月生, 2007年受聘清華大學(xué)醫(yī)學(xué)院擔(dān)任教授和博士生導(dǎo)師,2012年獲得長聘教授資格,2013年成為拜耳講席教授。2017年受聘普林斯頓大學(xué),成為首位雪莉·蒂爾曼終身講席教授。
她主要致力于跨膜運(yùn)輸?shù)鞍椎慕Y(jié)構(gòu)與機(jī)理研究,在國際上首次揭示人源葡萄糖轉(zhuǎn)運(yùn)蛋白、真核生物電壓門控鈉離子通道和鈣離子通道等一系列具有重要生理與病理意義跨膜蛋白的原子分辨率結(jié)構(gòu),為理解相關(guān)疾病的致病機(jī)理及藥物開發(fā)提供了分子基礎(chǔ)。
自2009年以來,顏寧作為通訊或者共同通訊作者發(fā)表學(xué)術(shù)研究論文近80篇,其中33篇發(fā)表于《細(xì)胞》、《自然》、《科學(xué)》。
顏寧于2005年獲得Science/AAAS和GE Healthcare “青年科學(xué)家獎”(北美地區(qū));2012年獲得美國HHMI首屆國際青年科學(xué)家獎、“中國優(yōu)秀青年女科學(xué)家獎”;2014年獲何梁何利基金科學(xué)與技術(shù)進(jìn)步獎;2015年獲國際蛋白質(zhì)學(xué)會青年科學(xué)家獎,賽克勒國際生物物理獎,并受聘長江講座教授(2018年終止);2016年成為戈登學(xué)術(shù)會議(Gordon Research Conference)首位來自中國大陸地區(qū)的Alexander Cruickshank報告人;2018年獲亞洲及大洋洲生物化學(xué)家和分子生物學(xué)家聯(lián)盟(FAOBMB)“卓越研究獎”;2019年獲得以色列魏斯曼研究所頒發(fā)的國際“女科學(xué)家獎”;2021年獲得國際生物物理協(xié)會頒發(fā)的Anatrace膜蛋白研究獎。
顏寧突然回國所謂何?
2014年,顏寧帶領(lǐng)一個平均年齡不到30歲的團(tuán)隊,只用了6個月時間,首次解析了人源葡萄糖轉(zhuǎn)運(yùn)蛋白GLUT1的晶體結(jié)構(gòu)和工作機(jī)理,成功攻克了橫亙在全世界分子結(jié)構(gòu)科學(xué)家面前長達(dá)50年的一個難題,這一成就也使得顏寧收獲了無數(shù)的榮譽(yù)。而這樣的研究成果并沒有引發(fā)網(wǎng)絡(luò)輿論的廣泛關(guān)注。最大的兩次爭議,一次是離開,一次是回來。顏寧此次回國最主要的爭議是:”據(jù)說她在美國已經(jīng)學(xué)術(shù)破產(chǎn)干不下去了,因為她的工作已經(jīng)被AI取代了。”很多完全不懂科學(xué)、不懂AI的鍵盤俠們抱著一種幸災(zāi)樂禍的感覺吃瓜。一篇網(wǎng)上熱轉(zhuǎn)的文章,開頭就用極其夸張和簡單的幾句話概括了整個事件。
首先來看此次爭議中的另一個主角——“AlphaFold”是什么?又做了什么?
AlphaFold可以說是生物界的AlphaGo,它的所做出的貢獻(xiàn)也被該領(lǐng)域的科學(xué)家們稱為“劃時代的進(jìn)步”。同樣出自于DeepMind公司AlphaFold,和橫掃頂尖人類圍棋職業(yè)選手的AlphaGo一樣,分別在2018年(首次參加)和2020年國際蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽(CASP)上一舉擊敗了其余的參會選手摘得頭魁,并在生物學(xué)領(lǐng)域引發(fā)轟動。
在DeepMind公開了AlphaFold的源代碼之后,生物學(xué)界也掀起了一陣“AlphaFold狂熱”的研究。
AlphaFold誕生之前的50年中,科學(xué)家們需要進(jìn)行大量的試錯,耗費(fèi)大量的時間和精力,采用冷凍電子顯微鏡、核磁共振或 X 射線晶體學(xué)等實驗手段在實驗室中確定蛋白質(zhì)的形狀。
1972年,諾貝爾化學(xué)獎得主Christian Anfinsen提出,理論上,蛋白質(zhì)的氨基酸序列應(yīng)該能夠完全決定它的3D結(jié)構(gòu)。這一假說讓科學(xué)家們開始了基于氨基酸序列,通過計算方法預(yù)測蛋白質(zhì)3D結(jié)構(gòu)的探索。
然而,這樣的探索面臨著極其重大的挑戰(zhàn),20世紀(jì)80、90年代用計算機(jī)預(yù)測蛋白質(zhì)結(jié)構(gòu)的早期嘗試并不成功。AlphaFold的出現(xiàn)改變了這一局面。2021年,DeepMind宣布已經(jīng)用AlphaFold預(yù)測了人體內(nèi)近乎所有蛋白質(zhì)的結(jié)構(gòu),以及20個其他被大量研究的生物體的完整“蛋白質(zhì)組”,其中包括小鼠和大腸桿菌,累計共有36.5萬個結(jié)構(gòu)。
而今年,DeepMind更是計劃發(fā)布總計1億多個結(jié)構(gòu)預(yù)測——相當(dāng)于所有已知蛋白的近一半,是蛋白質(zhì)數(shù)據(jù)銀行(PDB,Protein Data Bank)結(jié)構(gòu)數(shù)據(jù)庫中經(jīng)過實驗解析的蛋白數(shù)量的幾百倍之多。顏寧的成就攻克了困擾生物學(xué)界50年的一個難題,AlphaFold的成就同樣解決了困擾生物學(xué)界50年的重大挑戰(zhàn)。
所以就有人說:你看顏寧跟她的團(tuán)隊研究那么久才搞出來一個結(jié)構(gòu),AlphaFold一下子就能預(yù)測出上億個,等于是把整個游戲都顛覆了,然后像顏寧他們這樣的人當(dāng)然是下崗沒地兒去了。
這里面有幾點(diǎn)需要思考:
一、現(xiàn)在小學(xué)生都知道的無理數(shù)和虛數(shù)在歷史上花費(fèi)了人們上千年的思考才出現(xiàn),我們不能說之前那些數(shù)學(xué)家搞得就是小學(xué)生都懂的玩意兒。
二、AI的能力來自于前人積累的數(shù)據(jù)。AlphaFold之所以能夠做到這件事兒,恰恰是因為前面有科學(xué)家做了無數(shù)的理論和實驗的工作,它才有一個非常好的基礎(chǔ)。AI是站在很多個巨人的肩膀上才能達(dá)到這樣的高度的,如果沒有這些科學(xué)家之前的結(jié)果,AI和機(jī)器學(xué)習(xí)是不可能自己學(xué)會做生物學(xué)研究的。
三、科學(xué)家并不是只做這一件事,AI能做了他們就要被取代了。因為AlphaFold研究如此復(fù)雜,如果AI能解決的話,那恰恰是可以把這些科學(xué)家從大量重復(fù)且繁重的實驗中解放出來,讓他們?nèi)パ芯扛喔幸馑嫉恼n題。其實就相當(dāng)于我們發(fā)明了自行車、汽車,然后它們可以幫助人類行走,這并不是意味著人類就不需要走路了,而是說人把這個時間節(jié)省下來,給人類提供了更大的自由,可以讓人去做更有意義的事情。
四、顏寧并不是在國外混不下去才要回國。顏寧這樣的頂級的科學(xué)家,發(fā)了這么多《Nature》、《Science》、《CELL》,僅靠悶頭做做重復(fù)性的實驗是不可能的。沒有發(fā)過論文的人憑空臆想以為只是努力熬夜做重復(fù)工作就可以發(fā)頂刊的論文了。
深圳醫(yī)學(xué)科學(xué)院為何可以吸引顏寧任職
據(jù)深圳發(fā)布報道,深圳醫(yī)學(xué)科學(xué)院由市政府設(shè)立,登記為市政府舉辦的事業(yè)單位,實行黨委領(lǐng)導(dǎo)下的院長負(fù)責(zé)制;不定編制,不定級別,實行社會化用人制度。理事會是深圳醫(yī)學(xué)科學(xué)院的決策機(jī)構(gòu);院長是深圳醫(yī)學(xué)科學(xué)院的法定代表人,面向全球招聘,由理事會聘任,實行任期制。
據(jù)透露,深圳醫(yī)學(xué)科學(xué)院將按照全新機(jī)制的要求,主要建設(shè)“四平臺一智庫”,力爭到本世紀(jì)中葉成為全球著名醫(yī)學(xué)研究機(jī)構(gòu)。
也就是說,深圳醫(yī)學(xué)科學(xué)院是一所國家支持建設(shè)的全新機(jī)制醫(yī)學(xué)科學(xué)院。所謂“全新機(jī)制”包括兩個方面。
一、定位新
就是說,深圳醫(yī)科院不僅是一個單純的研究機(jī)構(gòu),按官方說法,它更是一個“組織科研的科研組織”。其核心功能,一要承擔(dān)醫(yī)學(xué)科技研究方面的公共管理和服務(wù)職能。另外,還要引領(lǐng)深圳醫(yī)學(xué)科技發(fā)展。為此,深圳市政府還設(shè)立了“深圳市醫(yī)學(xué)研究專項資金”,委托深圳醫(yī)科院進(jìn)行專業(yè)化管理。
二、機(jī)制新
不定編制,不定級別,自主設(shè)崗,遵循理事會治理、學(xué)術(shù)自治原則。對包括院長在內(nèi)的科研人才,實行市場化薪酬、社會化用人制度。去年9月,深圳衛(wèi)健委就曾發(fā)布過一波深圳醫(yī)學(xué)科學(xué)院管理崗位人員的招聘。
三、政府政策的支持
機(jī)制新不止體現(xiàn)在人事方面。深圳醫(yī)科院雖然登記為深圳市政府的直屬事業(yè)單位,但本質(zhì)上是一個法定機(jī)構(gòu),實行“一院一法”。具體來講,就是政府會出臺《深圳醫(yī)學(xué)科學(xué)院管理辦法》,可以不用顧及傳統(tǒng)事業(yè)單位的體制,依法自主辦院。
四、深圳醫(yī)學(xué)科學(xué)學(xué)院財力雄厚
首先是政府專項資助,這就是上文提到的“深圳市醫(yī)學(xué)研究專項資金”。今年5月份釋出的文件中顯示,2022年政府為其預(yù)算撥款2848萬元。同時,深圳醫(yī)科院還會設(shè)立聯(lián)合基金、接受慈善捐贈、引入風(fēng)險投資,逐步探索設(shè)立“粵港澳大灣區(qū)衛(wèi)生健康科技創(chuàng)新引導(dǎo)基金”。此外,醫(yī)科院的另外一大資金來源便是藥物、器械的轉(zhuǎn)化及生產(chǎn),轉(zhuǎn)化而來的收益直接反哺給自己。
五、深圳醫(yī)學(xué)科學(xué)院未來發(fā)展規(guī)劃
關(guān)于深圳醫(yī)學(xué)科學(xué)院未來發(fā)展規(guī)劃,總結(jié)下來有兩點(diǎn)。
1)聚合資源
深圳醫(yī)學(xué)科學(xué)院就相當(dāng)于一個醫(yī)學(xué)科技協(xié)同創(chuàng)新平臺,解決國內(nèi)醫(yī)學(xué)科技資源配置分散的問題,避免資源交叉浪費(fèi),科研經(jīng)費(fèi)使用效率低。
2)幫助轉(zhuǎn)化科研成果
深圳將允許科研人員通過“技術(shù)入股”,在轉(zhuǎn)化項目中持有股份,直接參與科技成果的轉(zhuǎn)化過程,提高轉(zhuǎn)化積極性。
此外,深圳醫(yī)科院還將通過天使投資等形式,“入股”轉(zhuǎn)化企業(yè),逐步從單一科技研發(fā)向科研產(chǎn)業(yè)混合體過渡。據(jù)深圳醫(yī)學(xué)科學(xué)院建設(shè)方案消息,深圳醫(yī)學(xué)科學(xué)院將在2025年基本建成。
顏寧也談到:
“深圳醫(yī)學(xué)科學(xué)院的一個重要使命是把研、藥、醫(yī)緊密結(jié)合在一起,打通從病床到實驗室,再到制藥公司,最后回到病床這樣端到端的順暢聯(lián)系。希望深圳醫(yī)學(xué)科學(xué)院不僅能夠產(chǎn)生若干原創(chuàng)的科研突破,還能探索一個科學(xué)合理的機(jī)制,在保障科研人員術(shù)業(yè)有專攻,專注科研的同時,可以有效地幫助大家實現(xiàn)科研成果的轉(zhuǎn)化?!?/p>
藍(lán)海大腦攜液冷服務(wù)器助力生命醫(yī)藥發(fā)展
某學(xué)院單細(xì)胞基因組研究技術(shù)中心(簡稱“該中心”)旨在建立標(biāo)準(zhǔn)化、自動化的工程技術(shù),提高單細(xì)胞結(jié)構(gòu)分析水平,高精度確定從蛋白質(zhì)分子到全細(xì)胞的三維結(jié)構(gòu),并在此基礎(chǔ)上揭示蛋白質(zhì)及其復(fù)合體功能,大規(guī)模制備蛋白/抗體,建成具有國際一流水平和綜合示范功能的蛋白質(zhì)科學(xué)研究核心基地。
就生命科學(xué)研究項目而言,每個項目涉及的數(shù)據(jù)量小在上百TB。對于時間周期長、領(lǐng)域廣的項目,未來數(shù)據(jù)需求可能在PB級。此外,該中心需要考慮支持多種生命科學(xué)研究項目,而其中,不同應(yīng)用對高性能平臺計算環(huán)境有不同的要求,如基因測序需要高I/O性能和內(nèi)存大消耗,而分子動力學(xué)研究除了I/O性能外,還需要較高的網(wǎng)絡(luò)和并發(fā)處理能力。
一、當(dāng)前生命科學(xué)領(lǐng)域面臨的挑戰(zhàn)
1)數(shù)據(jù)量增長10多倍,計算能力也要“跟上”
研究團(tuán)隊采用的冷凍電鏡技術(shù)在近兩年取得了革命性的進(jìn)展,具體來說就是相機(jī)技術(shù)實現(xiàn)了飛躍,采集數(shù)據(jù)的能力提高了10多倍,甚至上百倍,從而使得研究蛋白質(zhì)結(jié)構(gòu)的源數(shù)據(jù)呈幾何級數(shù)增長,這就需要中心在后期全面提升數(shù)據(jù)處理和計算能力。
2)亟需簡化管理保障服務(wù)品質(zhì)
隨著生命科學(xué)研究項目越來越多,如何根據(jù)不同項目和研究人員個性化需求分配資源,及時回收資源,實現(xiàn)跨整個高性能資源池的集中統(tǒng)一管理,簡化維護(hù)管理,減輕運(yùn)維人員負(fù)擔(dān),是科研高性能計算平臺普遍面臨問題。
3)TCO居高不下
生命科學(xué)研究迅速成為國家戰(zhàn)略發(fā)展方向,導(dǎo)致研究項目和跨學(xué)科研究需求快速增加。傳統(tǒng)的分層計算存儲資源利用率低,導(dǎo)致新增費(fèi)用快速增加。此外,能耗也成為阻礙高性能計算中心擴(kuò)展的不可逾越的“高墻”。
4)網(wǎng)絡(luò)性能不能拖后腿
作為保證高性能集群正常運(yùn)行的關(guān)鍵,高性能網(wǎng)絡(luò)承擔(dān)著重要的連接任務(wù)。隨著單節(jié)點(diǎn)計算和存儲性能的不斷提升,高性能用戶需要萬兆,四萬兆,十萬兆,InfiniBand網(wǎng)絡(luò)選擇以滿足不同的高性能計算需求。
二、解決方案特點(diǎn)
藍(lán)海大腦基于融合架構(gòu)助力某學(xué)院單細(xì)胞基因組研究技術(shù)中心搭建了一個分布式高性能平臺,擁有250個物理計算節(jié)點(diǎn),5000個計算核心,總存儲容量1.92PB,理論計算能力208Tflops。通過Lustre技術(shù)實現(xiàn)了跨20個融合架構(gòu)的集中統(tǒng)一管理。
1)4.1TFLOPS/U的計算密度,4倍性能提升
可針對不同項目量身定制配置。其中,高密度計算節(jié)點(diǎn)支持14核英特爾?至強(qiáng)TM E5-2600v3處理器,在2U中擁有224個計算核心的密度,單U空間的計算性能密度達(dá)到業(yè)界領(lǐng)先的4.1TFLOPS,同時支持64個DIMM高密度內(nèi)存,確保高性能和低延遲的性能要求。此外,還支持InfiniBand接口,非常適合要求超低延遲的工作負(fù)載。在強(qiáng)大計算能力的保證下,計算效率提升3-4倍,過去4-5天才能完成的計算任務(wù),一天就能完成。
2)簡化高性能資源池監(jiān)控管理
根據(jù)項目要求定制不同的系統(tǒng)配置,同時通過機(jī)箱管理控制器(CMC),可以集中監(jiān)控和管理20個FX系統(tǒng)。此外,無代理生命周期管理和一對多遠(yuǎn)程管理功能可確保BIOS和固件程序更新不會影響業(yè)務(wù)穩(wěn)定性,并提高系統(tǒng)中計算節(jié)點(diǎn)生命周期管理的效率。而且在擴(kuò)展服務(wù)器時,IT人員可以通過下發(fā)配置文件,使系統(tǒng)自動更新BIOS和固件程序,避免了重復(fù)輸入配置參數(shù)的繁瑣過程,減少了人工輸入錯誤導(dǎo)致的系統(tǒng)故障,簡化了管理運(yùn)維,降低了管理費(fèi)用。
3)TCO降低約20%
自動化、高密度、低能耗的集成部署、集中統(tǒng)一管理,可以使中心的TCO降低20%左右。其中,藍(lán)海大腦將通過主板連接服務(wù)器、存儲和1G0b網(wǎng)絡(luò),通過模塊化設(shè)計形成融合一體機(jī),同時提供散熱、供電、網(wǎng)絡(luò)、管理和PCIe擴(kuò)展的共享插槽,降低數(shù)據(jù)中心的占地和能耗,幫助中心獲得良好的性價比。
4)高速網(wǎng)絡(luò)保障平臺I/O性能
藍(lán)海大腦為中心提供四萬兆高性能網(wǎng)絡(luò),在保持成本優(yōu)勢的基礎(chǔ)上,為用戶提供穩(wěn)定的網(wǎng)絡(luò)性能,保證高性能、低延遲要求。
5)打破原有的服務(wù)器散熱方式,采用液冷散熱
藍(lán)海大腦液冷服務(wù)器系統(tǒng)突破傳統(tǒng)風(fēng)冷散熱模式,采用風(fēng)冷和液冷混合散熱模式——服務(wù)器內(nèi)主要熱源 CPU 利用液冷冷板進(jìn)行冷卻,其余熱源仍采用風(fēng)冷方式進(jìn)行冷卻。通過這種混合制冷方式,可大幅提升服務(wù)器散熱效率,同時,降低主要熱源 CPU 散熱所耗電能,并增強(qiáng)服務(wù)器可靠性。經(jīng)檢測,采用液冷服務(wù)器配套基礎(chǔ)設(shè)施解決方案的數(shù)據(jù)中心年均 PUE 值可降低至 1.2 以下。
三、客戶收益
1)藍(lán)海大腦HPC高性能計算與AI平臺已成為高性能、多功能、專業(yè)的前沿計算平臺,尤其在AI深度學(xué)習(xí)方面,為校內(nèi)外生物學(xué)研究提供高效的計算支持。同時為計算生物學(xué)、深度學(xué)習(xí)、基因測序等多個研究組提供計算服務(wù)。包括測序儀的離線處理、序列搜尋比對分析、分子動力學(xué)模擬、計算機(jī)輔助藥物設(shè)計和分子對接、生物網(wǎng)絡(luò)的計算。
2)全力支持基于深度學(xué)習(xí)的分子圖編碼和基于深度學(xué)習(xí)的中藥方劑系統(tǒng)的研發(fā)。研發(fā)人員可以利用HPC高性能計算和AI平臺開發(fā)基于三維分子圖譜的深度學(xué)習(xí)編碼,進(jìn)行基于深度學(xué)習(xí)的中醫(yī)診斷處方。多任務(wù)分子預(yù)測模型由卷積神經(jīng)網(wǎng)絡(luò)或遞歸神經(jīng)網(wǎng)絡(luò)構(gòu)成。交叉驗證用于調(diào)整和驗證參數(shù),外部數(shù)據(jù)用于測試和評估模型。同時,從預(yù)測模型中挖掘關(guān)鍵信息。同時通過卷積神經(jīng)網(wǎng)絡(luò)或遞歸神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)大量的方劑配伍信息,然后用主藥生成語義自動關(guān)聯(lián)分析得到的輔藥,從而生成新的方劑。藍(lán)海大腦HPC高性能計算和AI平臺提供了高效并行的計算資源,大大加快了模型的訓(xùn)練速度,從而在有效的時間內(nèi)完成最終的任務(wù)。
3)支持基于化學(xué)片段的從頭計算藥物設(shè)計,對疾病的治療和生物學(xué)功能的理解有重要的促進(jìn)作用。傳統(tǒng)的藥物篩選過程耗時長,成本高,導(dǎo)致整個藥物設(shè)計和發(fā)現(xiàn)過程效率低下。為了加快藥物設(shè)計和發(fā)現(xiàn)的進(jìn)程,研究人員利用這一平臺逐步發(fā)展了分子從頭設(shè)計的方法,并取得了良好的效果。研究人員通過蒙特卡洛樹搜索和神經(jīng)網(wǎng)絡(luò)模型的結(jié)合,實現(xiàn)了巨大化學(xué)空間的搜索和最優(yōu)結(jié)構(gòu)的采樣,快速完成了完整的從頭計算藥物設(shè)計過程,并探索了蛋白質(zhì)口袋表征和評分功能。
4)利用深度學(xué)習(xí)框架構(gòu)建深度學(xué)習(xí)模型,加強(qiáng)學(xué)習(xí)模型的訓(xùn)練,實現(xiàn)深度學(xué)習(xí)的評分函數(shù)模型的訓(xùn)練和測試,并對模型進(jìn)行訓(xùn)練。對于模型生成的分子,通過聚類分析分子的合成、毒性和理化性質(zhì),選擇合適的分子。
審核編輯 黃昊宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9262瀏覽量
85765 -
AI
+關(guān)注
關(guān)注
87文章
31315瀏覽量
269659
發(fā)布評論請先 登錄
相關(guān)推薦
評論