近年來,AI制藥賽道狂奔,但參與大分子藥物研發(fā)的AI制藥公司寥寥可數(shù)。一款“人人可用”的蛋白質(zhì)設(shè)計(jì)平臺(tái)能否帶來新氣象?
AlphaFold 近年來展現(xiàn)給世人的驚喜層出不窮,使得向來被稱為生物學(xué)圣杯的蛋白質(zhì)折疊問題有了新的解決方法,為整個(gè)計(jì)算生物領(lǐng)域帶來了更大的關(guān)注量。
其中,AI蛋白質(zhì)預(yù)測與設(shè)計(jì)賽道不斷吸引著創(chuàng)業(yè)者與Meta、騰訊等大廠的加入。
各種算法、模型互相比拼,不斷刷新準(zhǔn)確度、運(yùn)行速度與數(shù)據(jù)庫數(shù)量。在AI的賦能下,蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)大大增加,使得AI蛋白質(zhì)從頭設(shè)計(jì)變得可行起來。
相關(guān)算法、平臺(tái)突增,但在追求硬核指標(biāo)之外,也有其他值得關(guān)注之處。
“我們發(fā)現(xiàn),雖然人工智能現(xiàn)在具備了蛋白質(zhì)從頭設(shè)計(jì)的能力,但要推動(dòng)整個(gè)領(lǐng)域的快速發(fā)展,比算法開發(fā)更重要的是要解決大家在產(chǎn)業(yè)實(shí)踐中遇到的種種困難?!?/p>
苗洪江來自天壤XLab,是該實(shí)驗(yàn)室負(fù)責(zé)人。
他表示,基于上述背景,天壤XLab發(fā)布了一款蛋白質(zhì)設(shè)計(jì)工作臺(tái)——CREATOR,試圖解決跨領(lǐng)域技術(shù)門檻高、工作流程碎片化的問題,在同個(gè)工作臺(tái)上一站式地完成全部蛋白質(zhì)設(shè)計(jì)項(xiàng)目。
在賽道發(fā)展的早期階段,這個(gè)工作臺(tái)還需要直面AI蛋白質(zhì)預(yù)測與設(shè)計(jì)所遭受的質(zhì)疑,通過降低使用門檻是否能為賽道帶來新的氣象?
如何實(shí)現(xiàn)“人人”都能設(shè)計(jì)蛋白質(zhì)?
蛋白質(zhì)設(shè)計(jì)有著非常廣泛的應(yīng)用場景,除了新藥研發(fā),還能應(yīng)用在新材料、新食品等領(lǐng)域。蛋白質(zhì)設(shè)計(jì)的重要性毋庸置疑,但在AI介入前進(jìn)展緩慢。
苗洪江認(rèn)為,蛋白質(zhì)設(shè)計(jì)共經(jīng)歷3個(gè)階段,每一階段的能力提升都與人類對(duì)蛋白質(zhì)結(jié)構(gòu)的理解分不開。
第一個(gè)階段是最早期的20世紀(jì)90年代。
這個(gè)階段只有少量的蛋白質(zhì)結(jié)構(gòu),對(duì)于蛋白質(zhì)折疊的理解也非常局限,這使得當(dāng)時(shí)完全無法實(shí)現(xiàn)功能上的設(shè)計(jì),只能通過手動(dòng)拼接出很簡單的二級(jí)結(jié)構(gòu)片段。
第二個(gè)階段,隨著蛋白質(zhì)數(shù)據(jù)庫中的結(jié)構(gòu)信息增加,研究人員得以從這些信息中總結(jié)出理性經(jīng)驗(yàn)以及更為復(fù)雜的蛋白質(zhì)能量函數(shù)關(guān)系,通過實(shí)踐設(shè)計(jì)出越來越多功能的蛋白質(zhì)。
但在這個(gè)階段,蛋白質(zhì)設(shè)計(jì)的流程很復(fù)雜,落地也非常困難。
而第三階段,也就是當(dāng)下,借助AI的技術(shù)能力,研究人員已經(jīng)能夠從頭設(shè)計(jì)蛋白質(zhì),蛋白質(zhì)設(shè)計(jì)的產(chǎn)業(yè)化應(yīng)用也變得更加容易,標(biāo)志著蛋白質(zhì)設(shè)計(jì)已經(jīng)進(jìn)入了全新的時(shí)代。
在AI算法的加持下,蛋白質(zhì)結(jié)構(gòu)預(yù)測與設(shè)計(jì)賽道結(jié)束了“無人問津”的狀態(tài),逐步收獲了巨大的關(guān)注。
但在實(shí)際的產(chǎn)業(yè)實(shí)踐中,仍有各種困難阻礙推廣。在苗洪江看來,在這個(gè)階段,要推動(dòng)整個(gè)領(lǐng)域的快速發(fā)展,比算法開發(fā)更重要的是要解決一些難以避免的困難。
首先,蛋白質(zhì)設(shè)計(jì)本身就是一個(gè)門檻超高的交叉領(lǐng)域,串聯(lián)著非常多的學(xué)科知識(shí)。
苗洪江介紹,在這個(gè)領(lǐng)域的研究人員不僅需要具備生物計(jì)算的能力,可能還要具備結(jié)構(gòu)生物學(xué)、計(jì)算化學(xué)、物理學(xué)等多方面的知識(shí)背景,高門檻導(dǎo)致了整個(gè)領(lǐng)域的推廣很難進(jìn)行。
其次,現(xiàn)有平臺(tái)的能力過于單一。
苗洪江畢業(yè)于倫敦帝國理工學(xué)院計(jì)算生物系,在校時(shí),他就曾參與開發(fā)Phyre2蛋白質(zhì)結(jié)構(gòu)預(yù)測及分析平臺(tái),該平臺(tái)是目前全球最常用的模擬工具之一。
他注意到,即使平臺(tái)相對(duì)開源算法已經(jīng)大大減輕研究員的使用門檻,但平臺(tái)依然掣肘研究工作。
在AI+蛋白質(zhì)設(shè)計(jì)工作里,需要調(diào)用多種算法能力,而單個(gè)平臺(tái)往往難以滿足所有需求。因此,一種很普遍的研究流程出現(xiàn)了——研究員需要在不同的算法平臺(tái)之間切換。
“在這個(gè)平臺(tái)上做計(jì)算,然后下來再去另一家平臺(tái)上做計(jì)算,把結(jié)果拿下來后,還要對(duì)不同平臺(tái)的計(jì)算結(jié)果進(jìn)行對(duì)比分析,整個(gè)流程就非常亂套,嚴(yán)重阻礙了工作效率。”
CREATOR 要解決的正是這些痛點(diǎn)。
CREATOR工作臺(tái)集成了市面上優(yōu)秀的算法,包括天壤XLab自研的算法與所有外部開源和合作伙伴的算法。
研究員可以自由地選取算法,在CREATOR 上完成結(jié)構(gòu)預(yù)測、蛋白質(zhì)設(shè)計(jì)、特性分析優(yōu)化的工作,省去繁瑣的切換步驟。
工作臺(tái)采用可視化呈現(xiàn),在使用過程中,研究員無需了解算法及其背后的原理,只需進(jìn)行簡單的輸入,建立任務(wù)并運(yùn)行,就能得到結(jié)果。
在工作臺(tái)上,研究員還可以對(duì)歷史任務(wù)進(jìn)行跟蹤查看,以項(xiàng)目的方式對(duì)原本零散的任務(wù)進(jìn)行分類、串聯(lián)和管理,一站式地完成從項(xiàng)目規(guī)劃到結(jié)果分析的整個(gè)流程。
CREATOR 適用于多肽、酶、抗體和各類功能蛋白質(zhì),使用時(shí)無需安裝軟件,在線登陸賬號(hào)就能啟用核心功能。
苗洪江這樣形容CREATOR 的作用,“當(dāng)跨進(jìn)門要上樓的時(shí)候,我們就是一個(gè)電梯,而不是需要一步一步走的樓梯?!?/p>
如EDA出現(xiàn)后,復(fù)雜的芯片功能設(shè)計(jì)、驗(yàn)證與物理設(shè)計(jì)都能交由計(jì)算機(jī)處理,大大節(jié)省了時(shí)間及人力,推動(dòng)芯片設(shè)計(jì)不斷往高精方向發(fā)展。
下一步,天壤XLab 將繼續(xù)擴(kuò)充CREATOR 工作臺(tái)的功能和算法,建設(shè)蛋白質(zhì)知識(shí)圖譜,并擴(kuò)展已有的功能motif庫,以進(jìn)一步賦能研發(fā)人員。
能否破除對(duì)AI蛋白質(zhì)設(shè)計(jì)的質(zhì)疑?
天壤XLab成立于2019年。
到目前為止,團(tuán)隊(duì)已推出了單鏈蛋白質(zhì)結(jié)構(gòu)預(yù)測平臺(tái)TRFold2、蛋白質(zhì)設(shè)計(jì)平臺(tái)TRDesign,專注復(fù)合體結(jié)構(gòu)預(yù)測的TRComplex,以及不依賴MSA信息就能預(yù)測蛋白質(zhì)結(jié)構(gòu)的TRFold-single。
在這些單點(diǎn)能力上,天壤XLab 的TRFold2成績比較理想,去年在基于CASP14蛋白質(zhì)測試集內(nèi)測中,獲得了TM-score 打分82.7/100的成績,今年經(jīng)數(shù)據(jù)增強(qiáng)和模型參數(shù)擴(kuò)增后得分達(dá)到90.2/100,僅次于全球第一名AlphaFold2的91.1/100的成績。
今年6月,天壤XLab宣布基于TRDesign成功設(shè)計(jì)了新冠刺突蛋白結(jié)合劑,意圖證明AI不僅能準(zhǔn)確預(yù)測蛋白質(zhì)結(jié)構(gòu),還能主動(dòng)設(shè)計(jì)蛋白質(zhì)。
但這些天壤XLab引以為傲的成績,在圈子外的人看來還不足以令人信服。實(shí)際上,整個(gè)AI蛋白質(zhì)預(yù)測與設(shè)計(jì)賽道都面臨這樣的尷尬境地。
就在不久前,DeepMind宣布,AlphaFold 已經(jīng)確定了地球上幾乎所有已知生物體中大約2億種蛋白質(zhì)的結(jié)構(gòu),以后確定科學(xué)已知的蛋白質(zhì)預(yù)測模型將像用“谷歌搜索”一樣簡單。這一消息引起信徒們的狂歡,但遭受外界諸多質(zhì)疑。
潘毅、周耀旗、許東等幾位生物信息學(xué)領(lǐng)域的學(xué)者在接受《醫(yī)健AI掘金志》采訪時(shí)表示,AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫新更新的海量數(shù)據(jù)中存在著部分結(jié)果結(jié)構(gòu)不穩(wěn)定、不能應(yīng)用于研究中等問題。
美國一位有著30年資深藥企從業(yè)經(jīng)歷的專家也發(fā)文抨擊:AlphaFold的作用純屬媒體夸大,靠結(jié)構(gòu)預(yù)測做藥“純屬自嗨”。
苗洪江坦承,由于研發(fā)人員的背景經(jīng)歷不同,對(duì)事物的理解也存在差異,大家對(duì)于AI預(yù)測蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確度和實(shí)用性尚有較大分歧,現(xiàn)在就讓大家理解并相信AI可以實(shí)現(xiàn)蛋白質(zhì)設(shè)計(jì)及應(yīng)用更是難上加難。
這是還處在年幼階段的賽道必須面對(duì)的現(xiàn)實(shí)。正是基于這些認(rèn)知,天壤XLab選擇此時(shí)推出CREATOR工作臺(tái),希望能通過降低蛋白質(zhì)設(shè)計(jì)的門檻,推動(dòng)技術(shù)普及。
據(jù)《醫(yī)健AI掘金志》了解,CREATOR工作臺(tái)將于10月1日正式上線,面向高校師生免費(fèi)開放。到后期,天壤XLab也將推動(dòng)CREATOR工作臺(tái)面向企業(yè)用戶的合作。
苗洪江表示,企業(yè)級(jí)的應(yīng)用對(duì)于后端算力的壓力會(huì)更大,且相比高校,企業(yè)的需求也會(huì)偏向個(gè)性化,面向企業(yè)的服務(wù)還需要更完善的團(tuán)隊(duì)來支持,公司正在積極籌備。
“這個(gè)工作臺(tái)能幫助我們解決很多問題,比如說,試用并了解這個(gè)領(lǐng)域后,會(huì)加深大家對(duì)AI設(shè)計(jì)蛋白質(zhì)的認(rèn)知,興趣會(huì)不斷增加,也能幫我們開啟更多合作?!?/p>
AI大分子藥物研發(fā)何時(shí)迎“春天”?
AlphaFold 取得突破性進(jìn)展后,整個(gè)蛋白質(zhì)計(jì)算領(lǐng)域十分火熱。盡管熱度已持續(xù)一段時(shí)間,但針對(duì)蛋白質(zhì)計(jì)算領(lǐng)域的探索其實(shí)才剛剛開始。
在苗洪江看來,目前這個(gè)領(lǐng)域還遠(yuǎn)遠(yuǎn)算不上競爭激烈。
“這是因?yàn)橹暗鞍踪|(zhì)計(jì)算領(lǐng)域,特別是在國內(nèi),是很冷門的領(lǐng)域,在這個(gè)領(lǐng)域有足夠積累、了解需要做什么、應(yīng)該怎么做、對(duì)如何將技術(shù)落地應(yīng)用有足夠思考和布局的團(tuán)隊(duì)其實(shí)非常的少?!?/p>
比如,最近國內(nèi)一些高校才逐漸增設(shè)計(jì)算機(jī)加生物學(xué)的專業(yè)來培養(yǎng)復(fù)合型人才,作為根基的人才儲(chǔ)備都跟不上,這個(gè)領(lǐng)域很難談得上競爭激烈。
目前,雖然國內(nèi)外都有不少公司圍繞著AlphaFold 算法做商業(yè)化,但苗洪江認(rèn)為,真正屬于前沿的探索并不多。
苗洪江介紹,在這些商業(yè)化路徑中,“有用AlphaFold 做預(yù)測服務(wù)收費(fèi)、售賣算力的,也有用AlphaFold 預(yù)測結(jié)果來做大范圍靶點(diǎn)搜索的,像美國的Cyclica,還有借助AlphaFold 輔助小分子藥物研發(fā)的,像英矽智能今年的一個(gè)試驗(yàn)性管線就是借助了AlphaFold?!?/p>
而更前沿的探索,如蛋白質(zhì)的從頭設(shè)計(jì),以及把設(shè)計(jì)蛋白開發(fā)成大分子候選藥物,即發(fā)明(create)而不是現(xiàn)在AIDD更集中賦能的發(fā)現(xiàn)(screen)藥物,所面臨的技術(shù)難度和商業(yè)周期都要更困難、更漫長。
一個(gè)明顯的信號(hào)是,近年來AI制藥賽道狂奔,但更多的應(yīng)用與賦能都是集中在小分子藥物研發(fā)中。
相較之下,大分子藥物數(shù)據(jù)稀缺,且技術(shù)壁壘更高,參與大分子藥物研發(fā)的AI制藥公司寥寥可數(shù)。
苗洪江表示,蛋白質(zhì)從頭設(shè)計(jì)的關(guān)注熱度在國內(nèi)要冷清不少,但在全球范圍,美國頭部的biotech,如Amgen、Genetech已經(jīng)有所布局,來自這些美國公司的成功經(jīng)驗(yàn),能夠給予國內(nèi)創(chuàng)業(yè)者信心。
天壤XLab初期也以新藥研發(fā)為切入場景。
苗洪江提到,在蛋白質(zhì)計(jì)算領(lǐng)域,學(xué)術(shù)和業(yè)界都非常關(guān)注的技術(shù)方向包括,如何以計(jì)算賦能藥物的靶點(diǎn)發(fā)現(xiàn)、如何設(shè)計(jì)優(yōu)化特定功能蛋白質(zhì)、如何計(jì)算檢測蛋白質(zhì)的各項(xiàng)理化特性等,CREATOR 工作臺(tái)將逐步上線相關(guān)的算法和能力支持。
“我們希望蛋白質(zhì)設(shè)計(jì)在國內(nèi)也能得到大范圍應(yīng)用,但這項(xiàng)技術(shù)推廣的難度很大,所以我們開發(fā)了CREATOR 工作臺(tái),希望能降低技術(shù)門檻,讓更多人進(jìn)入這個(gè)領(lǐng)域做研究,從而更快地推動(dòng)應(yīng)用落地。”
審核編輯 :李倩
-
AI
+關(guān)注
關(guān)注
87文章
30947瀏覽量
269209 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3807瀏覽量
64427 -
蛋白質(zhì)
+關(guān)注
關(guān)注
0文章
25瀏覽量
7991
原文標(biāo)題:對(duì)話天壤XLab負(fù)責(zé)人苗洪江:如何做一款A(yù)I蛋白質(zhì)設(shè)計(jì)領(lǐng)域的「EDA軟件」?
文章出處:【微信號(hào):IoT_talk,微信公眾號(hào):醫(yī)健AI掘金志】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論