命運(yùn)攸關(guān)的時(shí)刻充滿戲劇性,在個(gè)人的一生及歷史的進(jìn)程中都是難得出現(xiàn)的;這種時(shí)刻可能集中在某一天、某一時(shí),甚至常常發(fā)生在某一分鐘,但它們的決定性影響超越時(shí)間。對(duì)于許東來說,這一分鐘,可能在志愿填報(bào)單上、在出國(guó)的飛機(jī)上、在1995年的那一場(chǎng)會(huì)議上。 ? 許東在密蘇里大學(xué)哥倫比亞分校生活了二十年。 2003年,38歲的許東來到該校計(jì)算機(jī)科學(xué)系,開始了他第一份教職。這也是他近二十年來唯一一份教職。許東在這所學(xué)校安了家,做起科研,2007年成為了該校最年輕的系主任。 這所學(xué)校坐落在美國(guó)密蘇里州的第四大城市哥倫比亞。因?yàn)樗幫恋貜V闊,農(nóng)業(yè)發(fā)達(dá),被稱為美國(guó)中部大農(nóng)村,得名“哥村”。 許東總說,自己是被這座小城留住,研究了半輩子的生物信息學(xué)。
這些年里,許東主動(dòng)投入到跨學(xué)科研究風(fēng)潮中,先后為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、單細(xì)胞數(shù)據(jù)分析、DNA序列、蛋白序列分析、系統(tǒng)生物學(xué)建模、圖像文本分析、中醫(yī)舌相、分子動(dòng)力學(xué)模擬等,做出了每個(gè)時(shí)期好用的算法工具。 2001年,許東憑借蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具——Prospect,與好友徐鷹(現(xiàn)任佐治亞大學(xué)校董事會(huì)教授)共同獲得《R&D》100獎(jiǎng)。該獎(jiǎng)項(xiàng)由《R&D Magazine》1963年創(chuàng)設(shè),被國(guó)際科技領(lǐng)域譽(yù)為科技界的“創(chuàng)新奧斯卡獎(jiǎng)”。 此后,許東又在2015年和2020年接連當(dāng)選美國(guó)科學(xué)促進(jìn)會(huì)(AAAS)會(huì)士和美國(guó)醫(yī)學(xué)與生物工程院(AIMBE)會(huì)士,并成為了密蘇里大學(xué)的校董事會(huì)教授。 ? 這些高光時(shí)刻,映射了他人生中的黃金三十年。 二十五年前,他趟過生物信息學(xué)泡沫期;十五年前,他成為密大最年輕的系主任;十年前,他先于大多數(shù)人換到深度學(xué)習(xí)賽道。 在那些時(shí)刻,許東大放異彩。正如茨威格在《人類群星閃耀時(shí)》的第一章“巴爾博亞發(fā)現(xiàn)太平洋” 中寫到:人生中最大的幸事,莫過于在富于創(chuàng)造力的壯年發(fā)現(xiàn)了自己的使命。
18歲的決定:
寧選北大,不去清華“教育是一個(gè)很特殊的行業(yè),很難高質(zhì)量地批量生產(chǎn),培養(yǎng)一個(gè)人效率低、成才的確定性也不高?!?站在父母的高起點(diǎn)上,許東對(duì)這句話深有體會(huì)。 新中國(guó)成立后四五年里,許東父母考入清華,就讀于電子工程系。 隨后,父親留在了本校,在工程力學(xué)系(現(xiàn)航天航空學(xué)院)任教,并于1981年在國(guó)家支持下赴丹麥讀博,成為了中國(guó)最早出國(guó)研究流體力學(xué)的一批人。母親則去了北京燈泡二廠、燈泡總廠擔(dān)任廠長(zhǎng),并在八九十年代擔(dān)任了十多年的北京電光源研究所所長(zhǎng)。 這是一個(gè)標(biāo)準(zhǔn)的知識(shí)分子家庭,許東稱,雖算不上大戶人家,倒有機(jī)會(huì)從小接觸到教授級(jí)的叔叔阿姨。 回憶起來,許東覺得那是一種無差別的人際交往,“絕想不到其中一個(gè)人就是某一領(lǐng)域的領(lǐng)軍人物。” 但許東沒去清華,而是選擇了北大。相比于清華的工程師氣息,北大要更加自由,尤其是北大沒有校訓(xùn),沒有校歌,甚至北大校園中的標(biāo)志性湖泊,也被錢穆先生帶頭喚為“未名湖”。 在許東看來,這代表了北大上上下下的一種求學(xué)態(tài)度,要敢于不合群,不聽話、既要批判,也要兼容,做中國(guó)維新圖強(qiáng)的“先鋒者”。 1983年,十八歲的許東走進(jìn)了北大物理系。
這是在中國(guó)高校中設(shè)立的第一個(gè)物理系。許東入校時(shí),北大物理系已經(jīng)走過70年歲月,期間還誕生了四個(gè)首創(chuàng)學(xué)科,如我國(guó)第一個(gè)原子能人才培養(yǎng)基地——物理研究室、我國(guó)第一個(gè)半導(dǎo)體專業(yè)、我國(guó)第一個(gè)地球物理專業(yè)、我國(guó)第一個(gè)計(jì)算機(jī)系微電子專業(yè)。 而與北大頗有淵源的西南聯(lián)合大學(xué)物理系,也走出了李政道、楊振寧、朱光亞、鄧稼先、黃昆等一大批杰出科學(xué)家。 這是許東第一次感受到國(guó)內(nèi)學(xué)科的昂揚(yáng)姿態(tài),“原來中國(guó)人在物理方面做得很好,我也躍躍欲試?!?一進(jìn)大學(xué),許東被各種“奇奇怪怪”的研究吸引住。大一上學(xué)期快要結(jié)束時(shí),他無意中看到學(xué)生宿舍里貼著一個(gè)告示——“自然之謎研究會(huì),研究氣功、特異功能等人體科學(xué)現(xiàn)象”。 許東對(duì)這些神奇現(xiàn)象特別好奇,加上告示中寫到能夠去北京師范學(xué)院(現(xiàn)首都師范大學(xué))做研究特異功能的實(shí)驗(yàn),當(dāng)即報(bào)上了名。 大一寒假,許東都泡在了實(shí)驗(yàn)室。盡管沒有研究出什么名堂,但許東卻產(chǎn)生了非常多的奇思妙想,還寫成了一份挺長(zhǎng)的實(shí)驗(yàn)報(bào)告,全文論證人體特異現(xiàn)象的真實(shí)性和其中的問題。
1983年寒假,許東(前排左二)在北京師范學(xué)院和部分研究人員及特異功能人士合影 為此,許東還擔(dān)任了一屆的自然之謎研究會(huì)會(huì)長(zhǎng)。 80年代前后,人體特異現(xiàn)象研究方興未艾,時(shí)任國(guó)防科委科技委副主任的錢學(xué)森和主任張震寰兩位,都是特異功能現(xiàn)象的支持者與參與者。 尤其是錢學(xué)森,他認(rèn)為,人還沒有能動(dòng)地去發(fā)掘人體的潛在能力,今后應(yīng)該用現(xiàn)代科學(xué)技術(shù)進(jìn)行研究,對(duì)中醫(yī)理論、氣功、特異功能等,都要科學(xué)地進(jìn)行研究。
那段時(shí)間,各種人體特異功能研究會(huì)成立,從科學(xué)界到醫(yī)學(xué)界,一場(chǎng)關(guān)于人類生命現(xiàn)象的研究開始風(fēng)靡全國(guó)。北大加入了這場(chǎng)研究中,由許東所在的協(xié)會(huì)協(xié)助承辦了人體特異功能的表演,錢學(xué)森到場(chǎng)觀看。 這之后,許東對(duì)生命現(xiàn)象的研究熱情更加高漲,他對(duì)很多同學(xué)講到,“我跟錢學(xué)森握過手了,雖然沒說過話?!?/p>
1983年錢學(xué)森成立人體特異功能研究所,與90年代的氣功熱
但許東沒想到,到了90年代,“氣功熱”出現(xiàn)神論傾向,冒出了氣功治病、滅火、攔截核武器等言論,學(xué)術(shù)研究也受此波及,被視為偽科學(xué)研究。 1994年,國(guó)家下達(dá)《關(guān)于加強(qiáng)科學(xué)普及工作的若干意見》,一部分嘗試用現(xiàn)代科學(xué)做出解釋的科學(xué)家就此偃旗息鼓。 給許東講授固體物理課的嚴(yán)守勝教授,也曾勸大家不要研究這個(gè)方向。他講到,布賴恩·約瑟夫森三十歲出頭就拿了物理學(xué)諾貝爾獎(jiǎng),之后專注于超自然神秘現(xiàn)象研究,卻一生沒有實(shí)質(zhì)性的進(jìn)展。 這也讓許東決定留在北大繼續(xù)做物理研究。他被保送碩士研究生,選擇了固體物理方向,師從磁學(xué)研究的導(dǎo)師周文生教授。 在周教授的指導(dǎo)下,許東將研究放在了固體物理中一個(gè)基礎(chǔ)問題——自旋玻璃。
簡(jiǎn)單來說,自旋玻璃理論研究的是物理學(xué)中的復(fù)雜系統(tǒng),對(duì)于理解無序自旋相互作用系統(tǒng)發(fā)揮了非常重要的作用,近年來該理論框架為約束滿足、組合優(yōu)化、統(tǒng)計(jì)推斷、神經(jīng)網(wǎng)絡(luò)等理論研究提供了眾多啟發(fā)。 但在當(dāng)時(shí),自旋玻璃更多體現(xiàn)在陶瓷、高溫超導(dǎo)等應(yīng)用領(lǐng)域,需要用到大量的實(shí)驗(yàn)研究,記錄不同陶瓷所用的配方,測(cè)量陶瓷的屬性。
許東將其描述為“工匠型”研究,每天就是燒爐子、測(cè)材料屬性。他發(fā)現(xiàn)自己的動(dòng)手能力不強(qiáng),實(shí)驗(yàn)做得不好,還把老師的儀器弄壞了。 回憶起那段經(jīng)歷,許東稱,“我最大的實(shí)驗(yàn)結(jié)論,就是我不適合做實(shí)驗(yàn)?!?既然實(shí)驗(yàn)不成功,許東也不再硬著頭皮做,他開始想著兌現(xiàn)自己的理論天賦,經(jīng)常在碩士論文中順著幾個(gè)實(shí)驗(yàn)結(jié)果自我發(fā)揮,寫出十幾張紙的理論猜想。 在導(dǎo)師看來,這些猜想毫無根據(jù),多次提醒許東不需要寫進(jìn)畢業(yè)論文,許東就在草稿上繼續(xù)寫?,F(xiàn)在看來,盡管那些猜想稱不上科研,甚至沒什么價(jià)值,卻在無意中鍛煉了許東舉一反三、觸類旁通的能力。 這是一種天賦,冥冥之中決定了他將終生與理論研究打交道。
一生中最重要的導(dǎo)師
許東博士就讀于美國(guó)的伊利諾伊大學(xué)厄巴納—香檳分校(University of Illinois at Urbana-Champaign,UIUC),但前面還有段小序曲。 1990年,許東碩士畢業(yè)后,來到美國(guó)紐約市立大學(xué)皇后學(xué)院讀起了物理博士。但因?yàn)楫?dāng)時(shí)女朋友(現(xiàn)在的妻子)讀研選在了UIUC,許東果斷轉(zhuǎn)校。次年5月,許東向西出發(fā),跨越千里與愛人會(huì)和。 他與妻子在北大結(jié)識(shí),妻子就讀于化學(xué)系,比他小三屆,兩人從相戀時(shí)就約定去更遠(yuǎn)的地方,從北大到UIUC,兩所學(xué)校成了二人從相識(shí)到婚姻的重要見證。 這段經(jīng)歷有一位見證人——許東的博士導(dǎo)師Klaus J. Schulten教授,也是許東一生中最重要的一位導(dǎo)師。
Klaus J. Schulten教授
Klaus是一位理論物理學(xué)家、也是一位計(jì)算生物學(xué)家,博士師從諾貝獎(jiǎng)獲得者M(jìn)artin Karplus(從學(xué)術(shù)脈絡(luò)上看,現(xiàn)在深圳灣實(shí)驗(yàn)室周耀旗的博士后導(dǎo)師也是Martin Karplus,與許東一脈相承)。 早在1978年,Klaus就較為完整地描述了磁感應(yīng)和動(dòng)物遷徙的Radical Pair假說(也稱為化學(xué)指南針假說),此后便投身到生物學(xué)領(lǐng)域。1991年許東加入時(shí),Klaus實(shí)驗(yàn)室已經(jīng)非?;钴S,他本人是UIUC里最搶手的導(dǎo)師之一。
許東的導(dǎo)師首選是Klaus。但進(jìn)入Klaus組里,許東覺得多少沾了些運(yùn)氣。 UIUC有一個(gè)重要的導(dǎo)師雙選機(jī)制,學(xué)生可以和許多導(dǎo)師單獨(dú)見面,由學(xué)生提交5個(gè)導(dǎo)師的排序志愿,導(dǎo)師也排序選擇5個(gè)和他(她)見過面的學(xué)生交到系里,由系里協(xié)調(diào)分配。
所以,這份實(shí)力和運(yùn)氣兼具的選擇機(jī)制總會(huì)伴隨意外和驚喜。 談到被選的原因,許東猜測(cè),或許是自己初到UIUC時(shí)一次性通過了博士資格考試,一下子讓Klaus注意到了。但其他同學(xué)就沒有這么幸運(yùn)了,很多美國(guó)同學(xué)在這場(chǎng)入學(xué)考試中表現(xiàn)吃力,或者沒有參加,兩次補(bǔ)考也有一半的博士生沒有通過考試,被降為了碩士。 時(shí)至今日,談起選擇導(dǎo)師時(shí)的經(jīng)歷,許東還深有感慨,“我們是選擇了彼此,夸張點(diǎn)說,師生關(guān)系對(duì)職業(yè)的發(fā)展可能不亞于配偶關(guān)系?!?/p>
許東博士畢業(yè)時(shí)和Klaus J. Schulten教授的合影
進(jìn)了Klaus組之后,許東在校內(nèi)的貝克曼研究所(Beckman Institute)做研究。這是伊利諾伊大學(xué)里一棟專門為跨學(xué)科研究而建設(shè)的大樓,主要集中在工程和物理科學(xué)、生命和行為科學(xué)方面的研究,超越了當(dāng)時(shí)眾多傳統(tǒng)大學(xué)在組織和結(jié)構(gòu)方面所存在的眾多內(nèi)在局限性,一切服務(wù)于跨學(xué)科交流。 在那里,許東第一次同時(shí)運(yùn)用起“生物、計(jì)算機(jī)、物理”三門學(xué)科的知識(shí)。 對(duì)許東來講,最難的還是補(bǔ)上生物的背景。組里的同學(xué)一起成立了“學(xué)習(xí)小組”,一起讀沃森等人寫的《細(xì)胞分子生物學(xué)》一書,每人輪流負(fù)責(zé)主講一章,相互交流學(xué)習(xí)筆記。只用了半年,許東連同組的同學(xué),都補(bǔ)上了生物知識(shí)。 從事交叉學(xué)科研究仍不輕松。那個(gè)年代的學(xué)術(shù)界有一種說法:只有在本領(lǐng)域做得不好的人,或者在本領(lǐng)域做到了天花板,才會(huì)轉(zhuǎn)向交叉學(xué)科。
90年代初,生物信息學(xué)甚至不能被看作一門學(xué)科,Klaus所領(lǐng)導(dǎo)的小組對(duì)外也是自稱為“理論生物物理研究組”。 許東談到,他所認(rèn)識(shí)的物理系同學(xué)中,轉(zhuǎn)向生物物理的人并不多,甚至有人不理解許東的轉(zhuǎn)行。但許東相信自己的選擇,導(dǎo)師Klaus就是一顆定心丸。他也曾在父親多年的流體力學(xué)研究中,感受過交叉學(xué)科的魅力。 對(duì)于走上生物信息學(xué)這條路,他只做出過一次解釋,“就像在計(jì)算機(jī)上設(shè)計(jì)波音777飛機(jī),可以先根據(jù)數(shù)據(jù)建立模型并預(yù)測(cè)結(jié)果,等確定設(shè)計(jì)無誤,再實(shí)際建構(gòu)飛機(jī),既省力、省時(shí),也省錢。同樣的道理,生物信息學(xué)剛剛起步,主要結(jié)合生物、計(jì)算機(jī)、統(tǒng)計(jì)三門學(xué)科的知識(shí),發(fā)展計(jì)算軟件,用來分析生物數(shù)據(jù)、建立模型、預(yù)測(cè)結(jié)果,從而輔助設(shè)計(jì)藥物,或者改良農(nóng)作物?!?這種說法遭到嘲笑,許東確實(shí)遇到了一些問題。
他研究的是當(dāng)時(shí)最火的蛋白質(zhì)結(jié)構(gòu)的分子動(dòng)力學(xué)問題,簡(jiǎn)而言之就是研究蛋白質(zhì)怎么運(yùn)動(dòng)。由于蛋白質(zhì)的生物功能與結(jié)構(gòu)動(dòng)力學(xué)特征緊密相關(guān),并且其研究對(duì)象為蛋白質(zhì)分子個(gè)體,所以也是一門與分子生物學(xué)互補(bǔ)的研究。 但在90年代初,計(jì)算機(jī)內(nèi)存容量太小,用計(jì)算機(jī)模擬分子運(yùn)動(dòng)常常受限,算力局限導(dǎo)致能做的事情也不是特別多。許東稱,“當(dāng)時(shí)最好的機(jī)器才一個(gè)G,學(xué)生們都要搶著用,這與現(xiàn)在用云平臺(tái)模擬出來的效果不能相提并論?!?在那個(gè)環(huán)境下,但他與導(dǎo)師做的第一個(gè)工作——《光合反應(yīng)中心蛋白質(zhì)運(yùn)動(dòng)與電子轉(zhuǎn)移的耦合:在自旋玻色子模型框架下研究低溫行為》,發(fā)揮理論研究?jī)?yōu)勢(shì)。 許東借鑒了系里另一位教授安東尼·萊格特(2003年諾貝爾物理獎(jiǎng)得主)的自旋波色子理論,在量子力學(xué)的知識(shí)體系下做出了一個(gè)新的理論模型,細(xì)致解釋了光和反應(yīng)中電子在蛋白質(zhì)里電子傳遞的現(xiàn)象,在領(lǐng)域內(nèi)得到了高度認(rèn)可。 直到許東畢業(yè)十幾年后,Klaus還會(huì)經(jīng)常提到許東的這項(xiàng)研究。
此后,在與導(dǎo)師的合作中,許東接連發(fā)出了9篇論文,其中6篇發(fā)布于1995年,與當(dāng)時(shí)最火的分子動(dòng)力學(xué)、活細(xì)胞中超分子系統(tǒng)等領(lǐng)域相關(guān)。 回憶起那段時(shí)光,許東稱,在學(xué)術(shù)上對(duì)他影響最大的人就是Klaus,在遇到Klaus之前,他的理論天賦被隱匿以來,甚至不能寫在論文中,他一度質(zhì)疑什么才算是真正的科研。直到遇到Klaus,許東才有種找到了科研大門的感覺。 許東至今對(duì)一個(gè)場(chǎng)景印象深刻:半夜兩點(diǎn)鐘,Klaus為了一篇論文把許東叫到家里改稿,尖銳的點(diǎn)評(píng)與詳細(xì)的建議劈頭蓋臉般地過來,一直改到他滿意為止。 “我就是在批評(píng)中成長(zhǎng)起來的。世界上有一些領(lǐng)域可以自無師自通,但在科研上,我還沒有見過誰(shuí)是自學(xué)成才的,每一個(gè)真正會(huì)做科研的人,至少是被另一個(gè)科研高手口傳心授、精心調(diào)教,才能入得了科研的門。” 所以,Klaus屬于那種“嚴(yán)父型”的教授,但他對(duì)學(xué)生卻不乏真誠(chéng)的關(guān)心和驕傲。在他的實(shí)驗(yàn)室里有一面特殊的墻,上面掛滿了學(xué)生們的論文封面,一一做了裝裱。
在許東的印象中,Klaus每天只睡4個(gè)小時(shí),從不鍛煉、從不養(yǎng)生,卻能每周高效率地工作上百小時(shí)。 2016年,Klaus去世。許東回到那所實(shí)驗(yàn)室,對(duì)墻感嘆,“或許我一生都到不了Klaus那樣的高度,他完全是用生命做科研?!?葬禮那天,在西式的吊唁中,歡聲笑語(yǔ)與掩面拭淚同步進(jìn)行。Klaus在遺言中留給大家的最后一句話——“我不喜歡你們這樣消沉,打起精神,還是像過去那樣想起我?!?回顧起與導(dǎo)師相處的那四年,許東說到,Klaus是最感染自己的是他對(duì)自然與生命之美的洞察與摯愛。 Klaus把自己大分子模擬的工作當(dāng)成“分子顯微鏡”。他告訴朋友,生命之大美不僅僅在春天歡快的小鹿身上和秋天斑斕的落葉里面,也在我們?nèi)庋劭床坏降纳锎蠓肿又虚g。他雖然不在了,他的學(xué)生們會(huì)繼續(xù)他的事業(yè),去探索更多的生命之美。 直到現(xiàn)在,許東也堅(jiān)信,Klaus是他人生中最重要的一位老師。
90年代的生信研究“寒武紀(jì)”
1990年10月,經(jīng)美國(guó)國(guó)會(huì)批準(zhǔn)的人類基因組計(jì)劃正式啟動(dòng)。 這項(xiàng)大約耗資30億美元來測(cè)定30億個(gè)堿基對(duì)的國(guó)際計(jì)劃,從美國(guó)迅速席卷到英、日、法、德、中等國(guó)家。與此同時(shí),這項(xiàng)研究也從多國(guó)政府間的合作小組,分散到諸多私營(yíng)性質(zhì)的基因研究機(jī)構(gòu)中。 其中,最具代表性的就是文特爾(J. C. Venter)創(chuàng)立了塞萊拉基因公司,并用1991年提出的“散彈法”新型測(cè)序技術(shù),多次走到“國(guó)際人類基因計(jì)劃”的前面。 一場(chǎng)公私之間的科研賽跑,在三十年前拉開帷幕。 1994年,由美國(guó)科學(xué)家約翰·莫爾特(John Moult)發(fā)起的全球蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CASP),召集科研界所有人士,開始了真正的較量。 這個(gè)兩年舉辦一次的競(jìng)賽,一亮相便吸引了計(jì)算機(jī)科學(xué)、生物物理學(xué)等不同領(lǐng)域的專家參與到蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)中。在那個(gè)年代,基因測(cè)序和蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)如火如荼,生物信息學(xué)(Bioinformatics)也成為了一門正式學(xué)科。
那是波詭云譎的90年代,一段即將進(jìn)入生命科學(xué)時(shí)代的“寒武紀(jì)大爆發(fā)”。 許東所在的貝克曼研究所,就站在了浪潮最前沿。1993年,在那所大樓第五層的國(guó)家超級(jí)計(jì)算機(jī)應(yīng)用中心(NCSA)中誕生的Mosaic瀏覽器,迅速在整棟大樓中傳開。 這樣一個(gè)純粹好玩兒的作品,成為點(diǎn)燃后來互聯(lián)網(wǎng)熱潮的火種之一。后來,網(wǎng)景導(dǎo)航者瀏覽器的開發(fā)工作,聘用了許多原有的Mosaic瀏覽器工程師,但是沒有采用Mosaic網(wǎng)頁(yè)瀏覽器的任何代碼。傳承網(wǎng)景瀏覽器代碼的后裔為Firefox瀏覽器。 在計(jì)算機(jī)技術(shù)的支持下,生物信息學(xué)迎來第一次黃金期,成為當(dāng)時(shí)的前沿學(xué)科之一。 1995年,許東博士畢業(yè)。他來到美國(guó)國(guó)立衛(wèi)生研究院的國(guó)家癌癥研究所,拿到了一份博士后工作。 “在美國(guó)走學(xué)術(shù)這條路必須要讀博士后,Ruth Nussinov做的是蛋白的相互作用,我就進(jìn)了她的組。”
許東在博士后辦公室里工作
測(cè)序工作與生物信息學(xué)大火,帶動(dòng)了工業(yè)界對(duì)人才的渴求。在拜師Ruth門下時(shí),許東曾看到一個(gè)制藥公司一口氣招了80多個(gè)生物信息學(xué)背景的人——全職。 甚至一家公司獵頭打電話找到許東,開出了他博士后的三倍薪資,“會(huì)寫C(語(yǔ)言)就夠了,你還會(huì)用BLAST工具(生物大分子序列比對(duì)搜索工具),明天就來上班?!?許東至今仍對(duì)那段時(shí)期印象深刻,盡管已經(jīng)走上進(jìn)了學(xué)術(shù)的大門,但依舊有不少公司想讓他加入。 去公司拿高額薪水,還是只拿三分之一做博士后?這個(gè)問題,事關(guān)內(nèi)心最真實(shí)的選擇。 幫許東做決定的,是一場(chǎng)會(huì)議。 這場(chǎng)會(huì)議由美國(guó)國(guó)立衛(wèi)生研究院舉辦,邀請(qǐng)知名學(xué)者做分享,其中三位就是后來的2013年諾貝爾獎(jiǎng)得主——Martin Karplus、Michael Levitt、Arieh Warshel。 當(dāng)天,許東趕到現(xiàn)場(chǎng)。他忘了那三位學(xué)者說了什么,但他對(duì)臺(tái)上三個(gè)人侃侃而談的樣子記憶猶新。
那種感覺讓他心動(dòng),有幾秒鐘讓他好像看到自己未來的樣子。 那一晚從會(huì)議里走出來,許東心里有了答案。 許東把希望放在了新的研究領(lǐng)域。此前在分子動(dòng)力學(xué)領(lǐng)域,他經(jīng)常受限于動(dòng)力學(xué)的模擬時(shí)間,只能做小部分的生物學(xué)問題?,F(xiàn)在跳出來后,他想試試能不能做一些更廣譜的問題。 談起導(dǎo)師Ruth,許東稱她是一位極具科研情懷的科學(xué)家,并且身為一位以色列女性學(xué)者,科研道路十分奇妙:Ruth在碩士畢業(yè)后做了八年的全職母親,而后跟隨丈夫來美國(guó)伴讀,突然萌生了對(duì)生物化學(xué)的興趣,才再讀了博士、博士后,走上了學(xué)術(shù)道路。 許東表示,許多科學(xué)家對(duì)科研都有真愛,但Ruth對(duì)科研的鐘愛與專注程度相當(dāng)罕見,她對(duì)RNA、毒物蛋白的工作精益求精,要求極高。
Ruth Nussinov教授
Ruth曾在1978年提出了用于RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)的動(dòng)態(tài)規(guī)劃算法(Nussinov Algorithm),迄今該算法及其變種仍在業(yè)內(nèi)廣泛使用,是生物信息學(xué)課程中常談到的方法。 另外,她挑戰(zhàn)了生物化學(xué)教科書中長(zhǎng)達(dá)半個(gè)世紀(jì)倡導(dǎo)的生物大分子識(shí)別理論(誘導(dǎo)擬合機(jī)制),許東讀研究生時(shí)學(xué)的就是這一理論,那時(shí)被告知生物大分子就像變形金剛一樣可以粘到別的分子上,至于怎么變形及如何被驅(qū)動(dòng)一直眾說紛紜,沒有靠譜的解釋。 直到九十年代后期,Ruth用構(gòu)象分布與選擇替代的理論成功解釋了許多分子識(shí)別的現(xiàn)象,并得到同行越來越多的支持,一舉改寫了教科書。 回憶起和Ruth相處的那兩年,許東能想起很多場(chǎng)景。
一天,許東做了一個(gè)小工作,想找個(gè)低端點(diǎn)的雜志草草發(fā)了。但和Ruth討論好,并迅速寫好文章交給她后,Ruth并沒有像以往一樣馬上給許東改文章,而是直接退了回來。 Ruth找到許東說,不能因?yàn)榈头蛛s志就不認(rèn)真。接下來的日子,她和許東一起反復(fù)推敲科研細(xì)節(jié),文章也是改了又改,最終那篇文章(《蛋白質(zhì)相互作用界面的氫鍵和鹽橋》)沒有少花時(shí)間,卻成為了一篇高被引的論文(被引五百余次)。 還有一次,許東和Ruth一起到香港一所大學(xué)做大會(huì)主題報(bào)告,許東提議兩人出去轉(zhuǎn)一轉(zhuǎn),以盡地主之誼,卻遭到了Ruth的一口回絕,“我沒時(shí)間,做完講座要馬上返程了,有太多的工作等著我呢?!?此后多年,許東慢慢跳出了分子動(dòng)力學(xué)和生物大分子的研究范圍,與Klaus以及Ruth的研究漸行漸遠(yuǎn),但要說從Klaus和Ruth身上傳承到什么,那就是想象力和精益求精。
“他們從不想著自己要老了,無所謂了,總覺得還有非常多的未知要解開。你會(huì)看到,他們的學(xué)術(shù)生命都很長(zhǎng),一生都未退休?!?博士后結(jié)束的二十多年后,許東仍對(duì)導(dǎo)師充滿敬佩,他在朋友圈歷數(shù)Ruth過往,并在最后寫下了一段話: 對(duì)于基礎(chǔ)科學(xué)工作者來說,最高的成就莫過于把自己的學(xué)說寫在教科書上,或者將自己的姓氏冠名于某個(gè)定理、算法,能做到其中之一的在學(xué)術(shù)界都是鳳毛麟角,Ruth卻把兩件事都做到了。
1997年6月,許東博士后工作結(jié)束,注意到橡樹嶺國(guó)家實(shí)驗(yàn)室的一份招人廣告——需要生物背景,從事蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)。 “這份工作很合適我,雖然不是一份教職,但也不是去了工業(yè)界,算是找到了一份折中又適合的工作。” 把許東招進(jìn)來的,正是擔(dān)任蛋白質(zhì)折疊項(xiàng)目組長(zhǎng)的徐鷹。彼時(shí),徐鷹剛剛從橡樹嶺的數(shù)學(xué)與計(jì)算機(jī)科學(xué)部轉(zhuǎn)到生命科學(xué)部。他們一拍即合,徐鷹偏數(shù)學(xué)計(jì)算背景,許東偏生物物理背景,而橡樹嶺的另一位研究員——俄國(guó)數(shù)學(xué)家Victor Olman博士,則具備統(tǒng)計(jì)學(xué)背景。 1997年,他們組成了橡樹嶺的“三劍客”,在此后的6年時(shí)間里,合作了40多篇論文,在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域打出了名堂。
許東、徐鷹2001年在R&D100的領(lǐng)獎(jiǎng)儀式上
那段時(shí)間里,許東和徐鷹還一起做出了那個(gè)時(shí)代中最好的蛋白三維結(jié)構(gòu)預(yù)測(cè)工具——Prospect,在人類基因組測(cè)序中刻下了重要一筆。2001年,兩人以此拿下R&D100獎(jiǎng),在新世紀(jì)初拿下開頭彩。 橡樹嶺實(shí)驗(yàn)室坐落在山溝溝里,偏僻冷清卻環(huán)境優(yōu)美,是個(gè)安心做學(xué)問的好地方。 “在那里,收獲的不僅僅是科研論文,更是一種經(jīng)歷,對(duì)國(guó)家實(shí)驗(yàn)室如何運(yùn)作,科研水平有了更深入的了解。實(shí)驗(yàn)室提倡科研合作,也逐漸學(xué)會(huì)與他人相處、共同進(jìn)步。” 2003年實(shí)驗(yàn)室改組后,限于經(jīng)費(fèi)問題,原生命科學(xué)部大部分人去了工業(yè)界,許東和其他人也各自踏上了教職之路。
當(dāng)最年輕的系主任遇上深度學(xué)習(xí)
許東一行人是幸運(yùn)的,這群從橡樹嶺出來的人在美國(guó)高校大受歡迎。 新世紀(jì)初,幾乎所有高校都在建設(shè)生物信息研究所,徐鷹最終去到佐治亞大學(xué),成為了該校生信研究所的首任所長(zhǎng),并拉去了Victor Olman,兩人繼續(xù)共事。 許東則去了密蘇里大學(xué)的哥倫比亞分校(University of Missouri,Columbia,下稱“密大”)。 2003年8月,許東以計(jì)算機(jī)科學(xué)系副教授、James C. Dowell講座副教授,以及Christopher S. Bond生命科學(xué)中心研究員的身份,被正式引進(jìn)到該校。 而他將在這個(gè)被稱為“哥村”的地方,一待近二十年。 2007年底,42歲的許東擔(dān)任該校計(jì)算機(jī)科學(xué)系的系主任,成為了密大所有系主任中最年輕的一位。這是許東人生中的一個(gè)重要時(shí)刻,也是在美國(guó)高校管理人員中為數(shù)不多的華人面孔。
?
2007年,許東任職系主任時(shí)留影 在這個(gè)非母語(yǔ)環(huán)境中,許東不善言辭,但這次任職,卻收獲了全院的支持。 許東說到,“如果要說我有什么合適的地方,或許是我學(xué)問做得還不錯(cuò),文章比較多,更重要的是,大家覺得我不會(huì)借機(jī)給自己謀什么福利?!?上任第一件事,就是設(shè)計(jì)課程。許東在橡樹嶺這所千人實(shí)驗(yàn)室的經(jīng)歷派上了用場(chǎng)。他考慮了系內(nèi)近20名教授的專長(zhǎng),準(zhǔn)備將研究方向集中于三個(gè)領(lǐng)域,分別為網(wǎng)絡(luò)、多媒體、生物信息。 許東認(rèn)為,計(jì)算機(jī)學(xué)科領(lǐng)域太廣,必須專精才能突出?!爱?dāng)時(shí)的密大計(jì)算機(jī)系有50名博士生,人力資源豐富,如果善加整合,提供明確研究方向,必能協(xié)助教授,做出量多質(zhì)佳的研究,提高計(jì)算機(jī)系的整體素質(zhì)?!?許東將學(xué)術(shù)機(jī)構(gòu)則比作私人企業(yè),學(xué)術(shù)合作的關(guān)鍵在于最后的產(chǎn)值,而系主任就是拉拉隊(duì)鼓舞士氣,讓團(tuán)隊(duì)有最好表現(xiàn)。 那些年里,許東也長(zhǎng)期奔走在國(guó)內(nèi)高校,一邊做學(xué)術(shù)講座,一邊推動(dòng)國(guó)內(nèi)大學(xué)與密蘇里大學(xué)3+2、2+2等聯(lián)合培養(yǎng)項(xiàng)目。許東回憶,他跑遍了中國(guó)幾十所雙一流高校,回國(guó)次數(shù)不計(jì)其數(shù)。 特別是吉林大學(xué),他每年都去講學(xué),并擔(dān)任過大約十年的唐敖慶客座教授,和許多的老師同學(xué)建立了深厚的友誼,合作發(fā)了幾十篇論文。比如,時(shí)任吉林大學(xué)計(jì)算機(jī)學(xué)院副院長(zhǎng)的梁艷春教授,也有十年每年到密蘇里大學(xué)許東的實(shí)驗(yàn)室訪問、合作。
2015年許東到西安電子科技大學(xué)訪問交流(右四),近年許東和梁艷春教授在密蘇里河畔 在擔(dān)任系主任的那段時(shí)間,許東參加了很多的領(lǐng)導(dǎo)培訓(xùn)課程,看到課件上將領(lǐng)導(dǎo)人打上四類標(biāo)簽:冒險(xiǎn)型、守成型、改革型和善后型。 許東沒想那么多,“天底下很多東西都有專業(yè),但做領(lǐng)導(dǎo)是沒有專業(yè)的,沒有誰(shuí)見到哪個(gè)系科是專門培養(yǎng)領(lǐng)導(dǎo)的,就算是MBA,教的也是金融的東西?!?他反而覺得,不如從過去的經(jīng)歷中找養(yǎng)分,看看能不能把一個(gè)系管理得井井有條。直到2016年,密大計(jì)算機(jī)系與電機(jī)系合并,許東十年的系主任正式卸任。
2022年8月的Digital Biology Lab
這十年里,學(xué)校資源沒有大幅擴(kuò)大,許東所在的計(jì)算機(jī)系師資穩(wěn)定在16~18人,學(xué)生人數(shù)卻增加了一倍(從2007年的279人到2016年的700多人),科研經(jīng)費(fèi)也增加了一倍。 而他自己的實(shí)驗(yàn)室(Digital Biology Lab),也從2003成立初的七個(gè)人,到如今他直接指導(dǎo)13個(gè)博士生,還有一些職員和不少的碩士、本科生,在實(shí)驗(yàn)室待過三個(gè)月以上的成員前后有兩百多人,其中三十幾位目前在中國(guó)國(guó)內(nèi)任教職。
2018年,許東(右五)實(shí)驗(yàn)室15周年慶?;顒?dòng)留影
此外,許東的一個(gè)重要工作,是2012年密大的BS-CS課程通過了美國(guó)工程與技術(shù)認(rèn)證委員會(huì)(ABET)的正式認(rèn)證。如此一來,國(guó)內(nèi)外的密大訪學(xué)人員便獲得了中美兩國(guó)的雙向?qū)W位認(rèn)證。 去年,許東與兒子騎行到密蘇里州最大的毛刺橡樹那里,在那棵哥村的地標(biāo)大橡樹下,許東回憶起過去的點(diǎn)點(diǎn)滴滴。 他對(duì)兒子講到,“過去十幾年,密大接待了很多國(guó)內(nèi)的學(xué)生和學(xué)者,許多人在神樹下打卡紀(jì)念,這棵樹陪伴了他們的重要時(shí)刻??鋸堻c(diǎn)說,這棵樹就是中美友好的見證,我希望越來越多的人到這棵神樹下打卡?!?2012年,是許東學(xué)術(shù)生涯中的一個(gè)重要轉(zhuǎn)折。此時(shí),距離Alphafold運(yùn)用深度學(xué)習(xí)算法在生物信息學(xué)領(lǐng)域一炮而紅還有6年。 這一年,學(xué)術(shù)界發(fā)生了一件大事。
在李飛飛號(hào)召的ImageNet競(jìng)賽中,多倫多大學(xué)的Geoffrey Hinton、Ilya Sutskever和Alex Krizhevsky提出了一種深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):AlexNet,奪得了ImageNet冠軍,成績(jī)比當(dāng)時(shí)的第二名高出一大截。 競(jìng)賽結(jié)束后,一場(chǎng)關(guān)于深度學(xué)習(xí)算法的討論在學(xué)術(shù)界傳開。 業(yè)內(nèi)有種聲音,如果這種使用大規(guī)模數(shù)據(jù)集所做出的決策結(jié)果是真實(shí)的,那么它將走出計(jì)算機(jī)視覺、神經(jīng)語(yǔ)言處理和語(yǔ)音識(shí)別等子領(lǐng)域的研究困境,就連生物信息學(xué)領(lǐng)域的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、基因測(cè)序等問題也都迎刃而解。 但在當(dāng)時(shí),大多數(shù)人對(duì)此持強(qiáng)烈的懷疑和批判態(tài)度,“深度學(xué)習(xí)無非是大號(hào)的神經(jīng)網(wǎng)絡(luò),換個(gè)馬甲而已,結(jié)果也是作弊來的?!?這種想法不無道理。許東稱,當(dāng)時(shí)深度學(xué)習(xí)在決策準(zhǔn)確度上一舉增加了10個(gè)點(diǎn)。在此之前,無數(shù)學(xué)者在十幾年的研究過程中,每年幾乎都是0.1%式的、非常微弱的進(jìn)步。 因此,對(duì)于辛苦鉆研的學(xué)者來說,深度學(xué)習(xí)的碾壓式進(jìn)步會(huì)讓他們產(chǎn)生一種深深的“無力感”,甚至?xí)a(chǎn)生一種難以言說的憤怒。 兩股思潮的碰撞,許東身在密蘇里州也聽到各種聲音。 密蘇里州一直以來都因?yàn)椤皊how me state”出名,意為“索證之州”。許東把所有的細(xì)節(jié)都看了一遍,也讓組里的人也測(cè)試深度學(xué)習(xí)。結(jié)果不出所料,深度學(xué)習(xí)在幾個(gè)生物信息學(xué)的問題上有很大的提高。
2012年,許東不顧所有人的質(zhì)疑轉(zhuǎn)向了深度學(xué)習(xí),這是他人生中第二個(gè)重要時(shí)刻。 此后,許東的課題組把深度學(xué)習(xí)在生物、醫(yī)學(xué)上的應(yīng)用作為第一研究方向,合作對(duì)象也從本系擴(kuò)大到美國(guó)、中國(guó)高校。在深度學(xué)習(xí)的影響下,許東關(guān)注到農(nóng)業(yè)植物作物、中醫(yī)研究、單細(xì)胞數(shù)據(jù)分析、蛋白的分析、修飾、定位,結(jié)構(gòu)預(yù)測(cè)等其他領(lǐng)域的課題。 過去三年,許東第一大合作對(duì)象是俄亥俄州立大學(xué)的馬勤教授,基于深度學(xué)習(xí)做單細(xì)胞基因測(cè)序的問題上發(fā)表了7篇有影響的文章。 許東的課題變化依然有,但主線已放在了深度學(xué)習(xí)上。
許東最直觀的感受是,跳出原有的分子動(dòng)力學(xué)模擬的框架后,反而做的東西更多了,合作對(duì)象也更多了。一個(gè)顯著特點(diǎn)是,過去二十多年,許東所發(fā)表的論文中,作者少則四五人,多則十幾人,合著期刊論文近300篇,會(huì)議論文和著作章節(jié)共計(jì)超百篇。 在不同時(shí)刻,許東與不同人結(jié)成戰(zhàn)友,迅速?zèng)_到科研落地最前線,而他自己,也從一名物理學(xué)者,逐漸蛻變?yōu)樯镂锢韺W(xué)者、再到生物信息學(xué)者。 許東坦言,“我們做交叉學(xué)科,誰(shuí)都無法把一個(gè)問題的方方面面都解決,所以需要很多合作,在我身上就非常明顯?!?許東的老友徐鷹也講過,許東做出了非常多的計(jì)算工具,如果沒有他的生物物理背景,是做不出來的。 在許東的理解里,他并不覺得自己成了“工具人”,而是在那些合作中,和別人一起成就更多的事,而不是把研究?jī)H僅當(dāng)作飯碗或工作量。 同是物理出身,后轉(zhuǎn)向理論生命科學(xué)研究的郝柏林院士也曾講過,“要想做生物,不能當(dāng)票友,這是一個(gè)義無反顧、全心全意研究生物的“中心” ,而不是出身物理學(xué)的人參與一些生物學(xué)的問題?!?/p>
給18歲的許東一個(gè)答案
在密大做研究,許東已經(jīng)不知不覺做了二十年了。 他每天七點(diǎn)起床,十二點(diǎn)前睡覺,每周都要審一篇稿,并且花大量的時(shí)間(包括周末和晚上)和組員及合作者討論科研,這是許東二十多年來的常態(tài)。 這些年來,許東好像沒什么變化,他也同樣對(duì)外界充滿新鮮感。 他愛拍照,出門時(shí)常帶著一臺(tái)相機(jī),習(xí)慣將鏡頭對(duì)向自己之外的人。在他那里,好像隨時(shí)能將視角切換到其他人,永遠(yuǎn)都有一種置身事外的能力。 對(duì)于許東個(gè)體和科研總體而言,時(shí)常的“局外人”身份具有重要的意義,科學(xué)研究不能總以自己的位置作為參照,要時(shí)不時(shí)跳出來,在復(fù)雜多變的現(xiàn)象中看清最深刻自然的本質(zhì)。
正是如此,在過去三十多年的時(shí)間里,許東趟過了生物信息學(xué)的泡沫期,與導(dǎo)師在那棟交叉研究大樓一起拼搏、與橡樹嶺同事們組成了生物信息學(xué)三劍客、又在密大親身推動(dòng)了交叉學(xué)科的建設(shè)、最后在漫長(zhǎng)的科技長(zhǎng)河中,找到了深度學(xué)習(xí)這對(duì)船槳。 人過半百,許東還在做著他最喜歡的交叉學(xué)科研究?;蛟S這也是即將58歲的許東,要給18歲的自己的一個(gè)回答。 最后,許東談到自己,說到,“或許我永遠(yuǎn)做不到Klaus、Martin Karplus、Ruth那樣的頂流。” 他停頓了一下,“但我會(huì)延續(xù)他們的學(xué)術(shù)熱情,抻長(zhǎng)我的學(xué)術(shù)生命,始終站在科研的一線?!?/p>
作者注: 1993年,中國(guó)參與人類基因組計(jì)劃,生物信息學(xué)科迎來大爆發(fā)。 在近三十年的時(shí)間里,一大批生物、化學(xué)、物理、計(jì)算等專業(yè)的學(xué)者,前仆后繼加入到學(xué)科的產(chǎn)研建設(shè),那是一個(gè)靈感迸發(fā)、情誼綿長(zhǎng)的年代,也是一個(gè)走出質(zhì)疑、迷茫的年代。 目前,雷峰網(wǎng)啟動(dòng)《生物信息學(xué)的三十年往事》專題,將陸續(xù)推出徐鷹、潘毅、周耀旗、許東、唐建等新老學(xué)者的人物故事,記錄光輝歲月,以照后人之路。
編輯:黃飛
評(píng)論
查看更多