NVIDIA Clara Parabricks v3.6 的發(fā)布為其強(qiáng)大的基因組分析工具套件帶來(lái)了新的變體調(diào)用、注釋、篩選和質(zhì)量控制應(yīng)用?,F(xiàn)在,在基因組分析的每個(gè)階段都有超過(guò) 33 個(gè)加速工具, NVIDIA Clara Parabricks 提供 GPU 加速的生物信息管道,可以擴(kuò)展到任何工作負(fù)載。
由于基因組和外顯子的測(cè)序速度比以往任何時(shí)候都快,必須對(duì)越來(lái)越多的原始儀器數(shù)據(jù)進(jìn)行映射、對(duì)齊和解釋,以破譯變異及其對(duì)疾病的意義。生物信息管道需要跟上基因組分析工具的步伐?;?CPU 的分析管道通常需要數(shù)周或數(shù)月的時(shí)間收集結(jié)果,而基于 GPU 的管道可以在 22 分鐘內(nèi)分析 30 倍全人類基因組,在 4 分鐘內(nèi)分析全人類外顯子。
這些快速的周轉(zhuǎn)時(shí)間對(duì)于跟上下一代測(cè)序( NGS )基因組儀器的輸出是必要的。這對(duì)于大規(guī)模人口、癌癥中心、 ph ARM 藥物開(kāi)發(fā)和基因組研究項(xiàng)目來(lái)說(shuō)是必不可少的,因?yàn)檫@些項(xiàng)目需要出版物的快速結(jié)果。
NVIDIA Clara Parabricks v3.6 包含:
新 GPU – 加速變體調(diào)用者
一個(gè)易于使用的基于投票的 VCF 合并工具( VBVM )
數(shù)據(jù)庫(kù)注釋工具( VCFANNO )
通過(guò)等位基因頻率快速過(guò)濾 VCF 的新工具( FrequencyFilter )
用于體細(xì)胞和種系管道的 VCF 質(zhì)量控制工具( VCFQC 和 VCFQCbyBAM )。
圖 1 :與 GPU – 加速 GPU Clara Clara 相比,基于開(kāi)源 Parabricks 的體細(xì)胞變體調(diào)用工具的分析運(yùn)行時(shí)。相對(duì)于社區(qū)版本, NVIDIA Clara Parabricks 使 LoFreq 加速 6 倍, SomaticSniper 加速 16 倍, Mutect2 加速 42 倍。這些基準(zhǔn)測(cè)試是在 4x V100s 上設(shè)置的 SEQC-II 基準(zhǔn)測(cè)試的 50 倍 WGS 匹配腫瘤正常數(shù)據(jù)上運(yùn)行的。
加速 LoFreq 和其他軀體來(lái)電者
隨著 LoFreq 與 Strelka2 、 Mutect2 和 SomaticSniper 一起加入, Clara Parabricks 現(xiàn)在包括 4 個(gè)癌癥工作流程的軀體細(xì)胞呼叫者。 LoFreq 是一個(gè)快速而敏感的變量調(diào)用程序,用于從 NGS 數(shù)據(jù)推斷 SNV 和 INDEL 。它可以自動(dòng)適應(yīng)覆蓋率和測(cè)序質(zhì)量的變化,并可應(yīng)用于體細(xì)胞、病毒/準(zhǔn)種、宏基因組和細(xì)菌數(shù)據(jù)集。
Clara Parabricks 中的 Lofreq 體細(xì)胞調(diào)用程序比其本地實(shí)例快 10 倍,非常適合調(diào)用低頻突變。使用基本調(diào)用質(zhì)量和 NGS 數(shù)據(jù)中固有的其他錯(cuò)誤源, Lofreq 提高了調(diào)用低于 10% 等位基因頻率閾值的體細(xì)胞突變的準(zhǔn)確性。
在 v3 .6 中, 經(jīng)過(guò)加速的 LoFreq 僅支持 SNV 調(diào)用,而 Indel 調(diào)用將在后續(xù)版本中提供。
圖 2 :開(kāi)源 DeepVariant (藍(lán)色)和 GPU – 加速 NVIDIA Clara Parabricks (綠色)的運(yùn)行時(shí)。 30 倍 Illumina 短讀數(shù)據(jù)的運(yùn)行時(shí)位于左側(cè); PacBio 35X 長(zhǎng)讀取數(shù)據(jù)的運(yùn)行時(shí)位于右側(cè)。 NVIDIA Clara Parabricks “ DeepVariant 比開(kāi)源版本快 10-15 倍(藍(lán)色的“ DeepVariant ”條與綠色的“ DeepVariant ”條相比)。
使用新的加速工具從數(shù)月到數(shù)小時(shí)
NVIDIA Clara Parabricks v3 。 6 還包括一個(gè) bam2fastq 工具,添加了 smoove 變體調(diào)用程序,支持從頭突變,以及用于 VCF 處理的新工具(例如注釋、篩選和合并)。對(duì) 30 倍人類基因組的標(biāo)準(zhǔn) WGS 分析在DGX A100上完成,耗時(shí) 22 分鐘,比同一服務(wù)器上基于 CPU 的工作流快 80 多倍。通過(guò)這種加速,耗時(shí)數(shù)月的項(xiàng)目現(xiàn)在可以在數(shù)小時(shí)內(nèi)完成。
Bam2Fastq 是 GATK Sam2fastq 的加速版本。它將 BAM 或 CRAM 文件轉(zhuǎn)換為 FASTQ 。這對(duì)于需要將樣本重新對(duì)齊到新引用,但刪除原始 FASTQ 以節(jié)省存儲(chǔ)空間的場(chǎng)景非常有用?,F(xiàn)在,它們可以從 BAM 中重新生成,并比以前更快地與新引用對(duì)齊
在比較后代與其父母的序列數(shù)據(jù)時(shí),檢測(cè)生殖系基因組中發(fā)生的從頭變異( DNV )(也稱為三重分析)對(duì)于疾病相關(guān)變異的研究以及建立世代突變率的基線至關(guān)重要。
Parabricks Clara Clara v3.6 中包含了一個(gè)基于 GPU 的調(diào)用 DNV 的工作流,該工作流利用了谷歌的 DeepVariant ,它已經(jīng)在 trio 分析和其他譜系測(cè)序項(xiàng)目中進(jìn)行了測(cè)試。
對(duì)于結(jié)構(gòu)變體調(diào)用, NVIDIA Clara Parabricks 已經(jīng)包括 Manta ,現(xiàn)在添加了 smoove 。 Smoove 簡(jiǎn)化并加快了短讀結(jié)構(gòu)變體的調(diào)用和基因分型。它還通過(guò)去除指示低電平噪聲的對(duì)準(zhǔn)信號(hào)來(lái)提高特異性,并且常常導(dǎo)致虛假呼叫。
圖 3 : GPU – NVIDIA Clara Parabricks v3.6 中的加速基因組學(xué)分析工具。
NVIDIA Clara Parabricks v3.6 還關(guān)注了變異調(diào)用后基因組管道的步驟。 BamBasedVCFQC 是一個(gè) NVIDIA 生成的工具,通過(guò)使用原始 BAM 的 SamTools mPileUp 結(jié)果來(lái)幫助 QC VCF 輸出。 Vcfanno 允許用戶使用第三方數(shù)據(jù)源(如 dbSNP )注釋 VCF 輸出,向 VCF 添加等位基因頻率。
FrequencyFiltering 允許根據(jù)包含等位基因頻率和讀取計(jì)數(shù)信息的數(shù)字字段過(guò)濾 VCF 中的變量。最后,基于投票的體細(xì)胞呼叫者合并( vbvm )用于合并兩個(gè)或多個(gè) VCF 文件,然后基于簡(jiǎn)單的基于投票的機(jī)制過(guò)濾變體,其中變體可以基于已識(shí)別特定變體的體細(xì)胞呼叫者的數(shù)量進(jìn)行過(guò)濾。
關(guān)于作者
Vanessa Braunstein 在 NVIDIA 的醫(yī)療團(tuán)隊(duì)從事產(chǎn)品營(yíng)銷工作。此前,她在基因組學(xué)、醫(yī)學(xué)成像、制藥、化學(xué)和診斷公司從事產(chǎn)品開(kāi)發(fā)和營(yíng)銷。她學(xué)習(xí)分子和細(xì)胞生物學(xué)、公共衛(wèi)生和商業(yè)。
Gary Burnett 是 NVIDIA 的解決方案架構(gòu)師,在媒體和娛樂(lè)領(lǐng)域的專業(yè)可視化團(tuán)隊(duì)中工作。 2017 年,他從麻省理工學(xué)院計(jì)算機(jī)科學(xué)和神經(jīng)科學(xué)專業(yè)畢業(yè)后加入 NVIDIA 。 Gary 的角色包括直接與客戶合作,以創(chuàng)建利用深度學(xué)習(xí)實(shí)現(xiàn)視覺(jué)效果的應(yīng)用程序,包括圖像處理、角色移動(dòng)和姿勢(shì)估計(jì)。
審核編輯:郭婷
-
cpu
+關(guān)注
關(guān)注
68文章
10901瀏覽量
212794 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5075瀏覽量
103589 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9295瀏覽量
85935
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論