鑒于許多疾病機(jī)理不明確或者發(fā)病機(jī)制涉及多條信號(hào)通路,基于靶點(diǎn)的藥物開發(fā)策略存在一定的局限性。因此,開發(fā)一種不依賴于靶點(diǎn),可以直接預(yù)測(cè)藥效的計(jì)算模型似乎是一種解決方案,以往的研究人員已經(jīng)進(jìn)行了嘗試,但是建立的模型往往針對(duì)一種疾病有效,缺乏普適性。
由于大部分疾病都會(huì)表現(xiàn)出基因表達(dá)譜的變化,研究人員利用化合物誘導(dǎo)的基因表達(dá)譜變化作為中間指標(biāo)進(jìn)行藥效預(yù)測(cè),開發(fā)出了一種基于基因表達(dá)譜變化直接預(yù)測(cè)藥效的計(jì)算模型,這種模型適用于多種疾病研究和相關(guān)藥物研發(fā)。
6 月 17 日,北京大學(xué)謝正偉團(tuán)隊(duì)在 Nature Biotechnology 在線發(fā)表了這項(xiàng)研究。在這項(xiàng)研究中,他們?cè)敿?xì)介紹了這種基于基因指紋和深度學(xué)習(xí)的藥效預(yù)測(cè)系統(tǒng)(DLEPS,中文名靈素系統(tǒng)),并證明了 DLEPS 是一種藥物發(fā)現(xiàn)和重定位的有效工具。在論文中,他們針對(duì) 3 種代謝性疾病開發(fā)了重定位和全新化合物分子。
有審稿人稱,靈素系統(tǒng)是一個(gè)高度原創(chuàng)的解決方案,也是第一個(gè)被報(bào)道用神經(jīng)網(wǎng)絡(luò)連接化合物結(jié)構(gòu)和基因表達(dá)譜的研究。
“這項(xiàng)工作初步完成了我的期望和設(shè)想”,謝正偉告訴生輝。
借此,生輝獨(dú)家專訪了該研究的共同通訊作者謝正偉博士。
今年是謝正偉獨(dú)立開展科研活動(dòng)的第五個(gè)年頭。他現(xiàn)在是北京大學(xué)醫(yī)學(xué)部的副研究員以及獨(dú)立實(shí)驗(yàn)室負(fù)責(zé)人,長(zhǎng)期從事基于多學(xué)科交叉和人工智能的創(chuàng)新藥物算法開發(fā),以及細(xì)胞衰老機(jī)制的研究。此前,他從事純計(jì)算的研究工作,開發(fā)過(guò)微流芯片,并與諾獎(jiǎng)得主 Elizabeth H.Blackburn 共同合作在 Cell 發(fā)表過(guò)論文。
2018 年,他創(chuàng)立了億藥科技,利用 AI 和深度學(xué)習(xí)加速藥物研發(fā)。據(jù)謝正偉透露,億藥科技擁有一支多學(xué)科交叉創(chuàng)始團(tuán)隊(duì),具有從頭開發(fā)算法的能力,同時(shí)也有分子細(xì)胞生物學(xué)、結(jié)構(gòu)生物學(xué)研究能力。目前團(tuán)隊(duì)規(guī)模 20 人左右,專業(yè)涵蓋藥理學(xué)、人工智能、藥物化學(xué)、藥理驗(yàn)證等。
利用 “基因指紋” 預(yù)測(cè)分子性能
多種疾病特別是年齡、代謝相關(guān)疾病的發(fā)生和發(fā)展都是由于系統(tǒng)失衡造成的基因表達(dá)紊亂,通過(guò)檢測(cè) “基因指紋” 即基因表達(dá)譜可以觀察和研究疾病變化。
一方面,基因表達(dá)譜的檢測(cè)可以應(yīng)用于疾病生物標(biāo)記物的篩選;另一方面,基因表達(dá)譜的檢測(cè)也可以為基因功能研究提供線索,揭示疾病發(fā)生發(fā)展的分子機(jī)制。
在論文中,科研人員開發(fā)的靈素系統(tǒng)正是利用基因表達(dá)變化譜為中間指標(biāo)建立了預(yù)測(cè)藥效的計(jì)算模型,與傳統(tǒng)連接圖方法相比,這種模型適用于沒(méi)有實(shí)驗(yàn)數(shù)據(jù)或者未發(fā)現(xiàn)的藥物分子。而連接圖方法雖然采用基因表達(dá)譜變化為指標(biāo),但是這種方法往往只適用于已有實(shí)驗(yàn)數(shù)據(jù)的分子,對(duì)于新分子束手無(wú)策。
在該研究中,他們首先構(gòu)建了神經(jīng)網(wǎng)絡(luò),使用 SMILES 化學(xué)編碼輸入,將小分子在高維空間進(jìn)行編碼,高維空間的坐標(biāo)向量進(jìn)一步預(yù)測(cè) 1000 個(gè)標(biāo)記基因,然后對(duì)超過(guò) 1 萬(wàn)個(gè)基因進(jìn)行預(yù)測(cè);緊接著,他們用疾病相關(guān)基因指紋來(lái)反映特定疾病的 “內(nèi)在痕跡”,并且使用基因集合富集分析 (GSEA) 來(lái)評(píng)估化合物對(duì)疾病的潛在療效。
SMILES 即簡(jiǎn)化分子線性輸入規(guī)范,這是一種用 ASCII 字符串明確描述分子結(jié)構(gòu)的規(guī)范。GSEA:是一種分析基因表達(dá)信息的方法。
謝正偉團(tuán)隊(duì)將這種方法和模型稱為基于深度學(xué)習(xí)的藥效預(yù)測(cè)系統(tǒng) —— 靈素系統(tǒng)。在預(yù)測(cè)基因表達(dá)變化部分,系統(tǒng)可以準(zhǔn)確預(yù)測(cè)新分子對(duì)轉(zhuǎn)錄組造成的影響,訓(xùn)練集和測(cè)試集中預(yù)測(cè)的和真實(shí)的基因表達(dá)譜變化的平均相關(guān)性為 0.90 和 0.74,分布峰值分別在為 0.93 和 0.90。
這些指標(biāo)說(shuō)明系統(tǒng)成功地從已有數(shù)據(jù)中學(xué)習(xí)到深層次的分子結(jié)構(gòu) - 基因表達(dá)譜變化之間的關(guān)聯(lián),達(dá)到了外推到虛擬分子的效果。
“靈素系統(tǒng)在測(cè)試集上的優(yōu)異表現(xiàn),使我們相信靈素系統(tǒng)對(duì)于新結(jié)構(gòu)分子,也可以取得準(zhǔn)確的預(yù)測(cè)結(jié)果”,謝正偉說(shuō)。
接下來(lái),研究人員深入探索了測(cè)試集的一部分分子,這些分子在訓(xùn)練集中沒(méi)有非常相似的分子。
“我們發(fā)現(xiàn),靈素系統(tǒng)可以精確預(yù)測(cè)新結(jié)構(gòu)小分子誘導(dǎo)的基因表達(dá)譜變化(平均相關(guān)性 0.6)。同時(shí),系統(tǒng)還可以準(zhǔn)確區(qū)分結(jié)構(gòu)非常相似的小分子(只差一個(gè)基團(tuán))誘導(dǎo)的基因表達(dá)譜差異”,謝正偉補(bǔ)充道。
研究人員還分析出了哪些基團(tuán)傾向于保持表達(dá)譜不變或者更傾向于改變,這些分析對(duì)于后續(xù)的藥物設(shè)計(jì)至關(guān)重要。
謝正偉告訴生輝,與傳統(tǒng)基于靶點(diǎn)的方法或者單基因標(biāo)記篩選方法相比,靈素系統(tǒng)具有三大優(yōu)勢(shì):
一是,靈素系統(tǒng)同時(shí)考慮多個(gè)基因指標(biāo),精度更高。靈素系統(tǒng)更加靈活,僅基于基因指紋就可預(yù)測(cè)候選分子,可以在復(fù)雜疾病上得到更好藥效的化合物,更快的找到工具分子。
二是,靈素系統(tǒng)不需要預(yù)先合成實(shí)體分子庫(kù),大大的降低了成本和工作量,效率更高。
三是,找到小分子以后可以進(jìn)一步發(fā)現(xiàn)疾病的新靶點(diǎn),從而實(shí)現(xiàn)在藥效預(yù)測(cè)和靶點(diǎn)上開發(fā)雙管齊下、同步進(jìn)行。
具有通用性,可預(yù)測(cè)多種疾病藥物分子
“第一次看到這么好的擬合效果,我驚訝得半天說(shuō)不出話來(lái)。不過(guò),系統(tǒng)是否真正有用還得在實(shí)踐中驗(yàn)證。由于動(dòng)物實(shí)驗(yàn)周期長(zhǎng),驗(yàn)證的病種多,我們光驗(yàn)證就花了兩年的時(shí)間”,謝正偉說(shuō)。
在實(shí)驗(yàn)驗(yàn)證方面,謝正偉遇到了北京大學(xué)基礎(chǔ)醫(yī)學(xué)部鄭瑞茂研究員,鄭瑞茂當(dāng)時(shí)正在測(cè)試?yán)坠偎兀@是一個(gè)和連接圖方法有淵源的分子。
兩人一拍即合, 一番交流之后,鄭瑞茂很快理解了靈素系統(tǒng)的潛在價(jià)值,并在促進(jìn)脂肪褐變和減肥領(lǐng)域進(jìn)行了嘗試。
他們利用靈素系統(tǒng)預(yù)測(cè)了四個(gè)化合物,其中三個(gè)化合物可降低小鼠的脂肪含量,并且誘導(dǎo)數(shù)十個(gè)褐變基因表達(dá)上調(diào),使白色脂肪組織變成棕色脂肪組織,減輕了小鼠的體重,達(dá)到了減肥目的。
“這大大增強(qiáng)了我們的信心,然后我們繼續(xù)嘗試擴(kuò)展到其他的領(lǐng)域”,謝正偉說(shuō)。
據(jù)謝正偉透露,針對(duì)高尿酸血癥,靈素系統(tǒng)成功預(yù)測(cè)了天然產(chǎn)物紫蘇烯,其可降低血清尿酸,效果上優(yōu)于四種陽(yáng)性藥物,還具有抗炎和抗纖維化的優(yōu)勢(shì)。
針對(duì)非酒精性脂肪性肝炎(NASH),他們發(fā)現(xiàn)三種可緩解 NASH 進(jìn)展的 MEK-ERK 信號(hào)通路抑制劑,并首次揭示了 MEK-ERK 通路在 NASH 中的重要作用。NASH 是一種在全球范圍內(nèi)十分普遍的慢性肝病,NASH 患者 10 年內(nèi)肝硬化發(fā)生率高達(dá) 25%,市場(chǎng)需求巨大。吉利德、武田等制藥大廠紛紛重金布局該領(lǐng)域,然而目前全球尚無(wú)一款藥物獲批上市。
“針對(duì) NASH 適應(yīng)癥,我們發(fā)現(xiàn)至少需要調(diào)節(jié)七個(gè)通路才能取得良好的治療效果,而這正是靈素系統(tǒng)所擅長(zhǎng)的”,謝正偉說(shuō)。
SaaS 服務(wù)基礎(chǔ)上做自研
2016 年,謝正偉在北京大學(xué)醫(yī)學(xué)院建立獨(dú)立實(shí)驗(yàn)室,立志研發(fā)抗衰老藥物。
“當(dāng)時(shí)我們已經(jīng)建立了一套高通量篩選系統(tǒng),但是篩選效率低,無(wú)法滿足針對(duì)多種疾病篩選藥物分子的需求。我希望通過(guò) AI 和深度學(xué)習(xí)預(yù)測(cè)化合物性能,尋找一些可以抗衰老的化合物,于是開發(fā)了這套靈素系統(tǒng)”,謝正偉說(shuō)。
2018 年,謝正偉正式落地億藥科技,將自己的科研成果轉(zhuǎn)化為 “藥”。同年,億藥科技完成了種子輪融資。
據(jù)謝正偉介紹,論文中只提到了 3 種代謝性疾病,實(shí)際上,他們還在探索肌腱愈合、骨質(zhì)疏松、長(zhǎng)壽等領(lǐng)域的潛力,現(xiàn)在已經(jīng)找到了長(zhǎng)壽的化合物。借助于研發(fā)優(yōu)勢(shì),億藥科技還開發(fā)了一條替代 GLP-1 的 “爆款” 管線。GLP-1 是 2 型糖尿病藥物的主要作用靶點(diǎn),GLP-1 類藥物是糖尿病和減肥領(lǐng)域最閃耀的藥物之一。
基于一系列的研究成果,億藥科技已經(jīng)搭建了多條創(chuàng)新管線和 “老藥新用” 管線,并且申請(qǐng)了十幾個(gè)相關(guān)的專利。
藥物發(fā)現(xiàn)處于整個(gè)生物醫(yī)藥產(chǎn)業(yè)鏈最前端,也是產(chǎn)生核心專利階段。據(jù)了解,論文中涉及的小分子 - 神經(jīng)網(wǎng)絡(luò) - 基因表達(dá)變化 - 藥效的算法框架已經(jīng)申請(qǐng)國(guó)內(nèi)外專利。
“對(duì)我們來(lái)說(shuō),這個(gè)專利的優(yōu)先權(quán)具有非常重大的意義和保護(hù)作用。因?yàn)樗某霭l(fā)點(diǎn)是一個(gè)原始創(chuàng)新的框架,所以保護(hù)范圍非常大,能夠幫助億藥科技建立專利壁壘和保持競(jìng)爭(zhēng)優(yōu)勢(shì)”,謝正偉說(shuō)。
謝正偉告訴生輝,一家 AI 制藥公司的核心競(jìng)爭(zhēng)力,主要體現(xiàn)在商業(yè)發(fā)展上,可以簡(jiǎn)單歸結(jié)為兩個(gè)指標(biāo)。第一個(gè)指標(biāo)是做技術(shù)服務(wù)的能力,是否能拿到大公司的訂單;另一個(gè)指標(biāo)是自研管線,是否有成為創(chuàng)新型研發(fā)中心以及未來(lái)成為藥企的潛力。
基于靈素系統(tǒng)以及搭建的人工智能平臺(tái)、藥物化學(xué)平臺(tái)、藥理驗(yàn)證平臺(tái),億藥科技最近拿到中國(guó)科學(xué)院以及一家頭部藥企的訂單合同。
“我們的商業(yè)模式可以簡(jiǎn)單歸結(jié)為 3 種,一是提供 SaaS 平臺(tái)付費(fèi)計(jì)算服務(wù),二是提供化合物篩選等技術(shù)服務(wù),三是自有管線的研發(fā)”,謝正偉說(shuō)。
目前,億藥科技正在進(jìn)行 Pre-A 輪融資,本輪融資將會(huì)用于自有管線研發(fā)、平臺(tái)建設(shè)、隊(duì)伍擴(kuò)充和管線的 IND 推進(jìn)。
“做藥一直是我們的初衷,我希望億藥科技成為一家 AI + 大數(shù)據(jù)驅(qū)動(dòng)的科研型制藥公司。未來(lái),我們會(huì)在提供 SaaS 服務(wù)和技術(shù)服務(wù)的基礎(chǔ)上,注重推動(dòng)自研管線,并將這些管線推向臨床、推向市場(chǎng),最終使患者受益”,謝正偉這樣描述億藥科技未來(lái)的發(fā)展規(guī)劃。
編輯:jq
-
AI
+關(guān)注
關(guān)注
87文章
31054瀏覽量
269407 -
人工智能
+關(guān)注
關(guān)注
1792文章
47387瀏覽量
238900 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5506瀏覽量
121265
原文標(biāo)題:基于基因指紋的藥效預(yù)測(cè)新模型登頂刊,這家AI制藥初創(chuàng)瞄準(zhǔn)衰老代謝疾病丨專訪億藥科技
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論