0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

日本百億億次超算曝光:性能提升100倍,2021年爭第一

章鷹觀察 ? 來源:新智元 ? 作者:新智元 ? 2018-07-11 11:19 ? 次閱讀

日本欲重奪超算第一的行動初見端倪,近日,富士通等研究機構已經開始對下一代超算Post-K進行原型CPU的實地測試,研究者稱,這臺超算的應用性能將是前一代的100倍,達到百億億次級,計劃在2021年推出。

日本計算機巨頭富士通(Fujitsu)和日本最大的研究機構理化學研究所(RIKEN,簡稱理研)已經開始對下一代超級計算機的原型CPU進行實地測試,他們任務這款CPU將使日本在超級計算機的全球排名中重回領先地位。

這臺下一代超級計算機被稱為“Post-K超級計算機”(Post-K supercomputer),是繼兩家合作機構開發(fā)出8 petaflops的“京”超級計算機(K Computer)之后開發(fā)的?!熬弊?012年開始在理化學研究所內運行,并已經升級到11 petaflops的峰值性能。2014年11月,全部組裝完成后的京LINPACK性能達到10 PFLOPS(即每秒1京),創(chuàng)下了10.51 PFLOPS的紀錄。京是首個達到10 PFLOPS性能的超算。

富士通在最近的一份新聞稿中稱,他們目標是“創(chuàng)造出世界上最高性能的超級計算機”,“其應用執(zhí)行性能是京超級計算機的100倍”。他們計劃在2021年前后在屬于政府的理研中心安裝這臺加強型機器。

如果他們實現(xiàn)了這一執(zhí)行速度,那么Post-K超算將進入百億億次級別(exascale),1 exaflops表示每秒一佰京/一億億億(1018)次浮點運算。

Post-K超級計算機的原型單元包含2個Arm8A-SVE水冷CPU

為此,他們用Arm8A-SVE(可伸縮矢量擴展)512-bit架構取代了京超算的SPARC64 VIIIfx CPU,該架構已被增強為超級計算機使用,富士通和理研都參與了開發(fā)。

Post-K超算原型機的CPU package和CPU內存單元

新的設計在CPU上運行,計算節(jié)點具有48個核心和2個輔助核心,I/O及計算節(jié)點有48個核心外加4個輔助核心。系統(tǒng)結構每個節(jié)點使用1個CPU, 384個節(jié)點組成一個機架。

出于戰(zhàn)略原因,富士通和理研都沒有透露Post-K超算的節(jié)點總數(shù)。但是,位于神戶的理研計算科學中心主任松岡聰(Satoshi Matsuoka)說,“這將是世界上最大的Arm系統(tǒng),事實上,它可能是世界上最大的超級計算機?!?/p>

在系統(tǒng)互連方面,富士通采用了最初為京超算設計的Tofu 6D Mesh/Torus 拓撲結構。

松岡聰表示,除了采用新的CPU之外,Post-K在執(zhí)行速度上的提升還來源于其他幾個關鍵技術。內存帶寬增加了“超過一個數(shù)量級”,網絡帶寬也顯著增加。

此外,富士通還提高了京超算的雙精度運算性能。富士通商業(yè)策略和開發(fā)部門的Koji Uchikawa解釋說,為了提高應用程序的通用性,它還增加了對半精度浮點運算的支持,這種運算可以減少AI等應用程序的內存負載,在這些應用程序中,低精度是可以接受的。

除了采用Arm指令集架構外,富士通還與英國劍橋的Arm控股公司合作,該公司開發(fā)并授權Arm技術,以允許可伸縮矢量擴展實現(xiàn)新的指令。

此外,富士通還為這款芯片開發(fā)了自己的微架構。雖然處理器的指令集架構在硬件和軟件之間進行接口以向處理器提供指令,但是它沒有定義芯片的內部結構。相反,這是微架構的工作,因為它直接影響處理器的性能,富士通認為這將是一個對它有利的重要差異化因素。

理研和富士通在采用新架構時看到了其他一些優(yōu)勢,尤其是設計本身的節(jié)能特性,比如電源開關,可以在不需要CPU的時候降低某些元件的功率。富士通聲稱其耗電量僅為30到40兆瓦,而京超算的耗電量為12.7兆瓦,盡管Post-K的目標是在應用程序處理速度上相比京超算提高100倍。

富士通和理研都表示,它們也打算利用Arm的大型軟件生態(tài)系統(tǒng)?!拔覀?、富士通和其他合作伙伴將在高端服務器領域推動Arm生態(tài)系統(tǒng),”理研的松岡聰說。他補充說,這將有助于富士通的商業(yè)成功,因為“不僅可以向外部公司出售他們的系統(tǒng),還可以出售芯片”。

與此同時,富士通“將為京超算提供兼容的性能平衡,以便在重新編譯后可以遷移當前的應用程序?!?/p>

最近,在美國橡樹嶺國家實驗室新安裝的超級計算機Summit,使美國重獲超級計算機全球排名的榜首位置,這是六年來的首次。根據(jù)6月份的Top500榜單,Summit取得了122.3 petaflops的性能,中國的神威·太湖之光以93 petaflops的性能位居第二。勞倫斯利弗莫爾國家實驗室的Sierra以71.6 petaflops排名第三。

因此,假如Post-K在2021年前后上線,不過到時,它將發(fā)現(xiàn),爭奪領先地位的競爭對手比比皆是。比如,中國的新一代百億億次超級計算機“天河三號”有望在2020年研制成功,并且其原型機早已亮相。不過,松岡對這種比較不屑一顧?!暗巧习袷撞皇俏覀冴P心的問題。對于大多數(shù)應用程序來說,Post-K可能表現(xiàn)出最快的解決時間和最大的可擴展性,因為它擁有出色的內存和網絡帶寬,以及出色的節(jié)能設計?!?/p>

毫無疑問,不久之后超算領域的競爭對手將會煥然一新。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    134

    文章

    9211

    瀏覽量

    371135
  • 超級計算機
    +關注

    關注

    2

    文章

    464

    瀏覽量

    42132
  • 浮點運算
    +關注

    關注

    0

    文章

    19

    瀏覽量

    11241
  • 富士通
    +關注

    關注

    2

    文章

    199

    瀏覽量

    54781
收藏 人收藏

    評論

    相關推薦

    DeepSeek最新論文:訓練速度提升9,推理速度快11!

    是上代Grok2的15左右。在Benchmarks中,Grok3毫無懸念成功地領先Deepseek R1、o3 mini等對手。 ? 不過用如此大規(guī)模的力集群,花費上代15
    的頭像 發(fā)表于 02-20 11:25 ?1041次閱讀
    DeepSeek最新論文:訓練速度<b class='flag-5'>提升</b>9<b class='flag-5'>倍</b>,推理速度快11<b class='flag-5'>倍</b>!

    訊通信簽訂8.5元智集成服務大單

    訊通信近日發(fā)布公告,宣布公司成功與中特新聯(lián)科技產業(yè)發(fā)展(北京)有限公司簽署了采購合同及相應的采購訂單。根據(jù)合同內容,中特新聯(lián)將向訊通信采購智集成服務,此次合同的總金額(含稅)高達約8.5
    的頭像 發(fā)表于 02-08 09:34 ?488次閱讀

    泰芯半導體出貨1

    銷量創(chuàng)新高,再創(chuàng)新佳績!程碑,新起航!泰芯半導體出貨1顆!
    的頭像 發(fā)表于 12-12 15:16 ?448次閱讀

    日本住友精密工業(yè)全面進軍MEMS代工業(yè)務,目標2030實現(xiàn)百億日元營收

    企業(yè)共同運營的合資公司相關業(yè)務。通過整合MEMS設備及制造技術的專業(yè)知識,以及母公司住友商事的銷售網絡等資源, 公司計劃切入預計增長迅速的MEMS市場,目標瞄準汽車高性能傳感器(LiDAR)及高性能揚聲器等領域,到2030實現(xiàn)
    的頭像 發(fā)表于 11-29 16:27 ?757次閱讀
    <b class='flag-5'>日本</b>住友精密工業(yè)全面進軍MEMS代工業(yè)務,目標2030<b class='flag-5'>年</b>實現(xiàn)<b class='flag-5'>百億</b>日元營收

    軟銀升級人工智能計算平臺,安裝4000顆英偉達Hopper GPU

    達Ampere GPU。通過新增的4000顆Hopper GPU,該平臺的總計算性能已躍升至每秒約4.7百億億。
    的頭像 發(fā)表于 11-04 16:18 ?574次閱讀

    名單公布!【書籍評測活動NO.43】 力芯片 | 高性能 CPU/GPU/NPU 微架構分析

    紙質媒體的高質量和專業(yè)網絡媒體的信息更新速度。 力芯片在最近15有著巨大性能突破,這些Intel的CPU芯片從雙核128位SIMD到眾核512位SIMD;NVIDIA的GPU產品
    發(fā)表于 09-02 10:09

    預定下代第一?富士通144核Arm處理器公開

    電子發(fā)燒友網報道(文/周凱揚)相信對市場有過定了解的朋友,都對曾經的第一名富岳不陌生。
    的頭像 發(fā)表于 06-24 00:26 ?3000次閱讀
    預定下代<b class='flag-5'>超</b><b class='flag-5'>算</b><b class='flag-5'>第一</b>?富士通144核Arm處理器公開

    Flow Computing引領CPU性能革命:PPU技術實現(xiàn)百性能提升

    在科技日新月異的今天,芬蘭的家科技初創(chuàng)公司Flow Computing以其革命性的技術突破,再次讓全球科技界為之震撼。近日,該公司宣布其研發(fā)的并行處理單元(PPU)成功實現(xiàn)了對任何CPU架構性能高達100
    的頭像 發(fā)表于 06-14 14:34 ?1459次閱讀

    AMD披露高效數(shù)據(jù)中心策略,預計至2027能效提升

    會議期間,蘇姿豐談論了AMD如何通過實施30x25戰(zhàn)略推動2025計算節(jié)點能效提升30的目標。她進步透露,AMD已找到2026至20
    的頭像 發(fā)表于 05-24 17:37 ?1129次閱讀

    最新Top500榜單公布:Frontier再奪魁首,Aurora破百億大關

    此次Top500排行榜中只有個顯著變動:瑞士國家超級計算機中心的Alps憑借270 PFlop/s的Rmax LINPACK FP64力排名上升至第六,超過了IBM POWER
    的頭像 發(fā)表于 05-14 09:36 ?946次閱讀

    在被60美元收購后,日本光刻膠巨頭JSR尋求擴大規(guī)模

    在被60美元收購后,日本光刻膠巨頭JSR積極尋求擴大規(guī)模,以適應全球芯片制造行業(yè)的快速發(fā)展。
    的頭像 發(fā)表于 04-29 14:37 ?859次閱讀

    龍芯:自主研發(fā)CPU提升性能,單核通用性能提高20

    張戈強調,龍芯CPU的主要IP核均為自主研發(fā),這使得其性價比得到顯著提升。他指出,國產CPU與主流CPU的差距主要體現(xiàn)在單核性能上,而非多核性能。近年來,龍芯CPU的單核通用性能
    的頭像 發(fā)表于 04-25 15:26 ?939次閱讀

    云助力西云力騰飛,榮膺2024全國“人工智能+”創(chuàng)新案例百強

    近日,云憑借其在人工智能領域的深厚積淀和技術實力,成功入選2024度全國“人工智能+”行動創(chuàng)新案例100強榜單,此殊榮不僅是對云在AI技術創(chuàng)新和應用實踐層面卓越表現(xiàn)的認可,更是對
    的頭像 發(fā)表于 04-19 17:09 ?434次閱讀
    <b class='flag-5'>超</b>云助力西云<b class='flag-5'>算</b>力騰飛,榮膺2024全國“人工智能+”創(chuàng)新案例百強

    “捷智”正式入駐國家互聯(lián)網平臺

    ABSTRACT摘要20244月2日,本公司旗下力服務品牌“捷智”正式入駐國家互聯(lián)網平臺,開設云gpu旗艦店。我們將借助國家
    的頭像 發(fā)表于 04-12 08:26 ?911次閱讀
    “捷智<b class='flag-5'>算</b>”正式入駐國家<b class='flag-5'>超</b><b class='flag-5'>算</b>互聯(lián)網平臺

    千億美元打造個系統(tǒng),成本越來越高的AI

    電子發(fā)燒友網報道(文/周凱揚)從近年來新發(fā)布的算機器和新的HPC AI性能榜單可以看出,AI力已經在中成了不可忽視的
    的頭像 發(fā)表于 04-09 00:19 ?3253次閱讀