0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

aligners在Arm架構(gòu)AWS Graviton3上的性能

jf_9aVl32Dp ? 來源:Arm軟件開發(fā)者 ? 作者:Arm軟件開發(fā)者 ? 2022-10-10 10:48 ? 次閱讀

基因組學(xué)已經(jīng)徹底改變了公共衛(wèi)生,并繼續(xù)為我們所有人帶來好處。為了實現(xiàn)其眾多成果,需要在云計算、on-prem數(shù)據(jù)中心、研究中心、醫(yī)院和更廣泛的生命科學(xué)行業(yè)中進(jìn)行大量且不斷增長的計算投入。

Reference-guided assembly是該領(lǐng)域許多工作流中的一個重要階段。對于一個典型的患者,拭子會導(dǎo)致樣本在測序機中測序。這臺機器的輸出是千兆字節(jié)的片段(A、C、G和T DNA堿基的子串)。這些讀數(shù)與來自(標(biāo)準(zhǔn))參考個體的完整人類基因組“對齊”,以確定讀數(shù)“適合”的位置,并組成患者基因組的大部分。

完成reference-guided assembly的三個最著名的應(yīng)用程序是BWA(https://github.com/lh3/bwa)、BWA-mem2(https://github.com/bwa-mem2/bwa-mem2)和minimap2(https://github.com/lh3/minimap2)。由于應(yīng)用如此廣泛,這些應(yīng)用程序的價格和性能對行業(yè)至關(guān)重要。

在之前的博客(優(yōu)化Arm服務(wù)器的BWA aligner:https://community.arm.com/arm-community-blogs/b/high-performance-computing-blog/posts/optimizing-genomics-and-the-bwa-aligner-for-arm-servers)中,我們展示了如何在AWS Graviton2上運行BWA及其性能,以對比2021早期流行的x86_64服務(wù)器。

在本博客中,我們現(xiàn)在可以展示三種主要aligners在Arm架構(gòu)AWS Graviton3上的性能。AWS Gravaton3是AWS 服務(wù)器系列中最新的基于Arm的服務(wù)器,也是AWS Gratiton2的后續(xù)型號。

我們證明,與AWS Graviton2相比,AWS Gravaton3的性能提高了12%到31%。與目前最好的x86_64系統(tǒng)相比,Graviton3的績效提高了10%和23%。與同類x86_64系統(tǒng)相比,此結(jié)果可節(jié)省20-30%的成本。

應(yīng)用程序和測試用例

我們使用1000 Genomes項目中的human_g1k_v37引用和NIST檔案中的NA12878引用。這些測試用例都反映在AWS S3上,并使用以下方法獲?。?/p>

aws s3 cp –no-sign-request s3://1000genomes/technical/reference/human_g1k_v37.fasta.gz .


aws s3 cp –no-sign-request s3://giab/data/NA12878/Garvan_NA12878_HG001_HiSeq_Exome/NIST7035_TAAGGCGA_L001_R1_001.fastq.gz .

在每種測試案例下,我們都使用gcc-10編譯器進(jìn)行平臺比較。這些測試用例中的每一個都可以通過普通的構(gòu)建腳本在Arm上輕松構(gòu)建,要么在主存儲庫中,要么在等待合并的公共分支中。

https://github.com/lh3/bwa


https://github.com/dslarm/bwa-mem2


https://github.com/dslarm/minimap2

這些應(yīng)用程序都是多線程的,具有可配置數(shù)量的工作線程。我們使用32個工作線程演示了8xlarge實例上的基準(zhǔn)測試,這些實例有32個vCPU。

在運行時,我們使用Cloudflare zlib包替換系統(tǒng)zlib,這有助于aligners 更快地解壓縮輸入數(shù)據(jù)文件。在進(jìn)一步的優(yōu)化中,對于bwa,我們預(yù)加載了jemalloc庫,這對于多線程代碼中的標(biāo)準(zhǔn)內(nèi)存分配函數(shù)來說更加有效。

我們的Github上提供了每個應(yīng)用程序的構(gòu)建腳本和獲取數(shù)據(jù)集的腳本,網(wǎng)址是https://github.com/arm-hpc/genomics-blog

AWS Graviton2到AWS Graviton3 --能力的飛躍

AWS Graviton3使用Arm Neoverse V1內(nèi)核,相比之下,AWS Gravaton2使用Arm Nioverse N1內(nèi)核。

799babaa-47ae-11ed-a3b6-dac502259ad0.jpg

79c6436a-47ae-11ed-a3b6-dac502259ad0.jpg

Neoverse V1帶來了顯著的變化,尤其是它的內(nèi)核更寬了許多,能夠在每個周期執(zhí)行更多指令,比其前一代處理器能提升更多指令級并行性。

使用perf-stat,我們可以獲取兩個平臺的每周期指令數(shù)(IPC)。

79f4d482-47ae-11ed-a3b6-dac502259ad0.jpg

可以看出,IPC的改進(jìn)在每個應(yīng)用程序中都有所不同,minimap2 最多可在每個周期多增加26%的指令。此結(jié)果適用于整個工作負(fù)載,還包括I/O所花費的時間。

AWS Graviton3也是AWS系列中的第一個DDR5系統(tǒng),其DDR帶寬比其前一代處理器多50%。

此外,AWS Graviton3的執(zhí)行頻率為2.6GHz,而Graviton2為2.5GHz。

較高的IPC和頻率的綜合影響直接轉(zhuǎn)化為運行時效率,我們將在下面進(jìn)一步討論。

哪種體系結(jié)構(gòu)提供了最高的性能和最低的成本?

7a1ea28a-47ae-11ed-a3b6-dac502259ad0.jpg

與上一代AWS Graviton2(c6g.8xlarge)相比,性能提高了12%至31%。

同時,AWS Graviton3的性能也比Intel Icelake(c6i.8xlarge)高出10%至23%,比AMD Milan(c6a.8xlage)高出11%至21%。

7a4f4c32-47ae-11ed-a3b6-dac502259ad0.jpg

總結(jié)

AWS Graviton3為所有三個基因組學(xué)應(yīng)用程序提供了性價比最高的平臺。在AMD Milan上運行相同的應(yīng)用,每個樣本集的成本高出27%,在Intel Ice Lake上高出45%。這一結(jié)果意味著AWS Graviton3比AMD Milan節(jié)省了20%,比Intel Ice Lake節(jié)省了30%。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9143

    瀏覽量

    368379
  • 云計算
    +關(guān)注

    關(guān)注

    39

    文章

    7848

    瀏覽量

    137648
  • 數(shù)據(jù)中心

    關(guān)注

    16

    文章

    4836

    瀏覽量

    72272

原文標(biāo)題:使用Arm服務(wù)器減少基因組學(xué)的時間和成本

文章出處:【微信號:Arm軟件開發(fā)者,微信公眾號:Arm軟件開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    強悍的AWS Graviton4處理器及其背后的Arm Neoverse

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)今年的亞馬遜re:Invent 2024大會上,該公司正式對外發(fā)布了旗下第四代自研Arm芯片——Graviton4。作為目前最強大的Graviton處理
    的頭像 發(fā)表于 12-19 00:04 ?1607次閱讀

    ARM Neoverse IP的AWS實例etcd分布式鍵對值存儲性能提升

    是在給定時間段內(nèi)完成的總操作數(shù)。本文中,我們比較了AWS M6g實例(基于 Arm Neoverse IP的 Graviton2)與M5實例(基于 Xeon Platinum 800
    發(fā)表于 07-06 17:37

    Arm Neoverse V1的AWS Graviton3深度學(xué)習(xí)推理工作負(fù)載方面的作用

    ) 與 AWS Graviton2 (c6g) 的性能特點AWS Graviton3 (c7g) 引入了
    發(fā)表于 08-31 15:03

    AWS云中使用Arm處理器設(shè)計Arm處理器

    1、AWS云中使用Arm處理器設(shè)計Arm處理器  Amazon Web Services (AWS) 宣布推出基于
    發(fā)表于 09-02 15:55

    比較AWS M6g實例與M5實例的etcd吞吐量和延遲性能

    M6g實例(基于 Arm Neoverse IP的 Graviton2)與M5實例(基于 Xeon Platinum 8000系列)的etcd吞吐量和延遲,以展示Graviton2
    發(fā)表于 09-13 15:06

    討論使用TerraformAWS上部署Arm EC2實例

    概括Arm A1 實例可以為您的工作負(fù)載節(jié)省大量資金。如果您已經(jīng)熟悉如何將 Terraform 與 A??WS 結(jié)合使用,并且您的軟件與架構(gòu)無關(guān),那么您的工作負(fù)載可以輕松部署 A1 實例
    發(fā)表于 09-16 14:53

    使用Arm服務(wù)器減少基因組學(xué)的時間和成本

    1、使用Arm服務(wù)器減少基因組學(xué)的時間和成本  我們現(xiàn)在可以展示三種主要alignersArm架構(gòu)AW
    發(fā)表于 10-09 16:32

    基于亞馬遜自研的 Arm 處理器 Graviton2

    據(jù)悉,AWS C6g 所用的 Graviton2 處理器是亞馬遜第二代自研 Arm 芯片。對于高性能計算領(lǐng)域,x86 架構(gòu)處理器雖然
    發(fā)表于 08-10 14:30 ?867次閱讀

    Arm將利用AWS為其云計算使用

    近日,AWS宣布,Arm將利用AWS為其云計算使用,包括絕大部分電子設(shè)計自動化(EDA)工作負(fù)載。Arm正在利用基于AWS
    的頭像 發(fā)表于 12-11 09:38 ?1831次閱讀

    AWS Arm 架構(gòu)處理器首次落地中國區(qū)域:比同配置 X86 實例性價比提高 40%

    中國區(qū)域。Graviton 2 作為 AWS 的第二代基于 Arm 架構(gòu)的處理器,基于 64 位 Arm Neoverse N1 微
    的頭像 發(fā)表于 01-28 16:22 ?2518次閱讀

    AWS基于Arm架構(gòu)Graviton 2處理器落地中國

    Graviton 2處理器提供支持的Amazon Elastic Compute Cloud(Amazon EC2)M6g、C6g和R6g實例已在由光環(huán)新網(wǎng)運營的AWS中國(北京)地區(qū)和由西云數(shù)據(jù)運營
    的頭像 發(fā)表于 02-01 11:46 ?3107次閱讀

    專用處理能力驅(qū)動基于Arm架構(gòu)的云計算時代并支持AWS Graviton不斷創(chuàng)新

    AWS也同時展示了基于Graviton3處理器的C7g云實例,現(xiàn)已開放預(yù)覽。C7g是由Arm? Neoverse?驅(qū)動、首個支持DDR5的云實例,可提供更多的內(nèi)存帶寬,帶來更高的性能
    發(fā)表于 12-06 16:25 ?1083次閱讀
    專用處理能力驅(qū)動基于<b class='flag-5'>Arm</b><b class='flag-5'>架構(gòu)</b>的云計算時代并支持<b class='flag-5'>AWS</b> <b class='flag-5'>Graviton</b>不斷創(chuàng)新

    AWS Graviton處理器為嵌入式Linux開發(fā)人員擴(kuò)展選擇

    Docker Desktop和QEMU可用于x86機器構(gòu)建和運行針對ARM架構(gòu)的Linux應(yīng)用程序,但開發(fā)人員體驗與
    發(fā)表于 01-26 17:58 ?1次下載
    <b class='flag-5'>AWS</b> <b class='flag-5'>Graviton</b>處理器為嵌入式Linux開發(fā)人員擴(kuò)展選擇

    Arm Neoverse CSS V3 助力云計算實現(xiàn) TCO 優(yōu)化的機密計算

    (HPC) 和人工智能 (AI) 領(lǐng)域。亞馬遜云科技 (AWS) re:Invent 2023 宣布推出 AWS Graviton4
    發(fā)表于 03-26 16:37 ?394次閱讀
    <b class='flag-5'>Arm</b> Neoverse CSS V<b class='flag-5'>3</b> 助力云計算實現(xiàn) TCO 優(yōu)化的機密計算

    ArmAWS合作深化,AWS Graviton4展現(xiàn)顯著進(jìn)展

    Arm與亞馬遜云科技(AWS)的長期合作關(guān)系,一直致力于為云計算領(lǐng)域帶來性能更強勁、更高效和可持續(xù)的解決方案。雙方通過專用芯片和計算技術(shù)的結(jié)合,不斷推動云計算的發(fā)展。 近期舉行的
    的頭像 發(fā)表于 12-18 14:17 ?213次閱讀