科學家和醫(yī)療研究人員曾受濕式實驗室中的研究樣本數(shù)量以及在觀察細胞時被顯微鏡質(zhì)量所限制?,F(xiàn)在,他們正在使用強大的計算工具從不斷擴展的生物數(shù)據(jù)庫中獲取洞見。
支持這場數(shù)字生物學革命的正是高性能計算系統(tǒng)與特定領(lǐng)域軟件框架這對組合。
在近期公布的TOP500全球性能最強大的系統(tǒng)榜單上,我們看到了兩臺超級計算機的身影:專注于醫(yī)療行業(yè)的NVIDIA Cambridge-1和生物技術(shù)公司Recursion的BioHive-1。這兩臺超級計算機均基于NVIDIA DGX SuperPOD參考架構(gòu)。
全球各醫(yī)學研究機構(gòu)、制藥公司和生物技術(shù)初創(chuàng)企業(yè)都在使用NVIDIA Clara Parabricks(一套基因組學庫和參考應(yīng)用)來推動新一代測序工作。
位于上海的明碼生物技術(shù)公司成為中國第一家啟用Clara Parabricks Pipelines支持精準醫(yī)療工作的研究實驗室。這是繼今年在泰國和日本啟動的大型基因組學舉措之后的又一項舉措。而基因治療初創(chuàng)企業(yè)Greffex最近使用Parabricks Pipelines來加速其通用流感疫苗項目的開發(fā)。
能夠用于人口研究的基因組學洞見
Parabricks Pipelines在NVIDIA GPU上將DNA和RNA類項目的速度提高了50倍,這使科學家能夠從每天生成的數(shù)百兆字節(jié)儀器數(shù)據(jù)中提取盡可能多的有用信息。開展人口研究的公共衛(wèi)生機構(gòu)和研究實驗室由于需要分析數(shù)以萬計的基因組,因此尤其需要這種加速。
明碼生物技術(shù)公司采用Parabricks Pipelines和NVIDIA T4 Tensor Core GPU來加速其測序和多組學數(shù)據(jù)分析工作。該公司為醫(yī)療機構(gòu)、制藥公司和研究人員提供用于疾病研究和藥物開發(fā)的基因組洞見。
泰國國家生物庫中的NVIDIA DGX A100 系統(tǒng)正在驅(qū)動泰國基因組學研究。這項舉措旨在將基因組醫(yī)學作為該國的一項常規(guī)醫(yī)療服務(wù)。該研究機構(gòu)正在使用Parabricks Pipelines分析5萬名泰國志愿者全基因組測序數(shù)據(jù)中的基因變異。
通過組合DGX系統(tǒng)與Parabricks Pipelines,該項目的全基因組數(shù)據(jù)處理時間縮短了四個月。這項工作的成果將幫助研究人員更好地分析泰國人口特有的基因變異。
而日本東京大學人類基因組中心最近啟用了目前日本生命科學領(lǐng)域最快的超級計算機——SHIROKANE。這臺由DGX A100驅(qū)動的超級計算機正在運行Parabricks Pipelines對92000名患者的全基因組進行測序,創(chuàng)建了一個為癌癥和難治性疾病的精準醫(yī)療奠定基礎(chǔ)的數(shù)據(jù)庫。
推動臨床測序和新藥研發(fā)
Parabricks Pipelines 遺傳工具套件可通過配置來滿足每個實驗室的具體需求。研究人員可在各種NVIDIA GPU系統(tǒng)上運行Parabricks Pipelines工作負載,包括臺式工作站、GPU加速云和一些全球最快的超級計算機。
位于休斯頓的Greffex開始使用NVIDIA RTX數(shù)據(jù)科學工作站,現(xiàn)在該公司正在使用Parabricks Pipelines和NVIDIA Clara Discovery來推進其通用流感疫苗的開發(fā)工作。
這家初創(chuàng)企業(yè)結(jié)合基因組測序、分子動力學工具和濕式實驗室研究,對流感菌株如何隨時間演變以及這些變異如何影響疫苗的效力開展了研究。
為了監(jiān)測流感變化,Greffex收集了來自世界各地的數(shù)萬個流感基因組并使用NVIDIA RTX 8000 GPU運行大規(guī)模的序列比對,確定了病毒遺傳密碼的變化之處。通過使用GPU運行基因組工作負載,該公司在每個樣本上節(jié)省了多達13小時的時間,同時也使其團隊能夠以不同的參數(shù)重新運行樣本,從而對排列結(jié)果進行微調(diào)。
Greffex科學家對流感病毒表面的蛋白質(zhì)——血凝素進行了計算密集型分子動力學模擬,以了解它在自然環(huán)境中的表現(xiàn)。
一旦確定基因變異,Greffex科學家就會使用分子動力學來觀察這些基因變化如何改變流感病毒的物理形狀。他們現(xiàn)在正在密切觀察流感病毒的多態(tài)變異,這種變異可能使流感病毒變形成一種無法與疫苗抗體有效結(jié)合的形狀。
Greffex生物信息學科學家Daniel Preston表示:“如果一種疫苗不僅需要能夠與當前的流感病毒株結(jié)合,還要能夠與多種其他病毒株結(jié)合,那么其蛋白質(zhì)結(jié)構(gòu)的優(yōu)化將是一個非常漫長且昂貴的過程?,F(xiàn)在,我們可以通過計算方法在實際的實驗室測試之前了解什么可能會起到作用,這與過去的方法有著天壤之別?!?/p>
關(guān)于NVIDIA Clara Parabricks
NVIDIA Clara Parabricks為博德研究所的行業(yè)標準基因組分析工具包以及谷歌的DeepVariant基因調(diào)用器等流行工具帶來了GPU加速。Parabricks在NVIDIA A100 Tensor Core GPU上運行時,能夠?qū)⒄麄€人類基因組的二次分析時間縮短到23分鐘,從而實現(xiàn)DNA生殖系變異識別。而如果在CPU系統(tǒng)上運行,則需要20多個小時。
除了DNA測序解讀之外,Clara Parabricks Pipelines還能夠?qū)ι诚岛腕w細胞變異檢測進行對齊、分類、篩選和變異識別,并且支持RNA類應(yīng)用。生殖系變異是通過個體祖先遺傳的變異,而體細胞變異會在人的一生中發(fā)生并且可能引發(fā)癌癥。
Parabricks Pipelines 3.6版本將提供更多用于體細胞變異識別和新生殖系變異識別的工具,前者將為研究人員提供適用于精準腫瘤學的洞見,而后者將為自閉癥等復(fù)雜疾病的研究提供信息。
新生殖系變異識別管道(de novo germline variant calling pipeline)是與華盛頓大學醫(yī)學院研究人員合作開發(fā)的一項技術(shù)。該技術(shù)將基因組數(shù)據(jù)的解析時間縮短至一小時以下并能夠識別家族史或父母-子女三人組中的新變異。
可在NGC 或 AWS Marketplace 上獲得用于加速基因組分析的NVIDIA Clara Parabricks Pipelines。
責任編輯:haq
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4989瀏覽量
103074 -
計算機
+關(guān)注
關(guān)注
19文章
7494瀏覽量
87976 -
AI
+關(guān)注
關(guān)注
87文章
30898瀏覽量
269128
原文標題:從基因組到蛋白質(zhì)再到細胞,數(shù)字生物學革命在HPC和AI的推動下不斷前進
文章出處:【微信號:murata-eetrend,微信公眾號:murata-eetrend】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論