0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國內(nèi)公司自主研發(fā)GPU+:兼容CUDA、性能及能效超競品

硬件世界 ? 來源:硬件世界 ? 2023-07-17 16:12 ? 次閱讀

近日,自稱為國內(nèi)自主創(chuàng)新的通用GPU領(lǐng)軍企業(yè)的登臨科技獲得中國互聯(lián)網(wǎng)投資基金(簡稱“中網(wǎng)投”)獨家投資。

公司稱,這將為登臨新一代Goldwasser(高凜)規(guī)模化量產(chǎn)及商業(yè)化落地提供重要保障。

高凜是一款AI加速卡,首款產(chǎn)品2021年量產(chǎn)投入市場,2022年銷售過萬片。

第二代產(chǎn)品2022年流片,2023年實現(xiàn)量產(chǎn)。根據(jù)現(xiàn)有客戶測試結(jié)果,二代產(chǎn)品針對基于transformer類型的模型提供3-5倍的性能提升,大幅降低類ChatGPT及生成式AI應(yīng)用的硬件成本。

在官網(wǎng),登臨介紹自己是國內(nèi)首家完全憑借自主創(chuàng)新,實現(xiàn)規(guī)模化商業(yè)落地的通用GPU企業(yè),登臨科技核心IP完全自主研發(fā),其自主創(chuàng)新的GPU+(基于GPGPU的軟件定義的片內(nèi)異構(gòu)計算架構(gòu)),在兼容 CUDA/OpenCL 在內(nèi)的編程模型和軟件生態(tài)的基礎(chǔ)上,通過架構(gòu)創(chuàng)新,解決了客戶核心關(guān)注的通用性和高效率的雙重難題。

其表示,經(jīng)過大量客戶產(chǎn)品化驗證,針對AI計算,GPU+相比現(xiàn)有主流GPU在性能及能效上有顯著提升。

ba101482-23ef-11ee-962d-dac502259ad0.jpg

在AI市場上,NVIDIA現(xiàn)在是沒有對手的階段,AI顯卡份額估計在90%以上,AMD都很難競爭,現(xiàn)在Intel也加入這個市場了,而且找到了NVIDIA的一個痛點,那就是性價比。

NVIDIA目前受追捧的AI顯卡主要是A100、H100,國內(nèi)有特供的閹割版A800、H800,性能比原版弱20%左右,但即便如此依然供不應(yīng)求,A800一周時間就從9萬元漲到11萬元以上,H100價格在25萬元以上,H800也要20萬出頭,而且不同經(jīng)銷商的價格差異很大。

Intel自然也不會放過這個市場,日前在國內(nèi)舉行發(fā)布會,也推出了AI顯卡Habana Gaudi2,這是去年底發(fā)布的AI推理加速芯片,從第一代的16nm工藝升級到7nm工藝,Tensor 處理器核心數(shù)量增至 24 個,同時集成了多媒體處理引擎,內(nèi)存升級至 96GB HBM2E。

國內(nèi)版的Gaudi2主要是閹割了部分網(wǎng)絡(luò)接口,但也集成了21路100Gbps網(wǎng)絡(luò)接口,總體來說性能依然很可觀。

ba385da2-23ef-11ee-962d-dac502259ad0.jpg

Intel還公布了Gaudi2跟H100的AI性能對比,面對要求極為苛刻的、1750億參數(shù)的GPT-3模型,384個Gaudi2加速器上的訓(xùn)練時間僅為311.9分鐘,而且從256個加速器到384個加速器,性能擴展幅度達95%。

NVIDIA這邊在512塊 H100 GPU上的訓(xùn)練時間則為64分鐘,論單卡性能的話是Gaudi2的3.6倍多,但是Intel不會跟H100拼極限性能,而是強調(diào)性價比。

Habana Labs 首席運營官 Eitan Medina 表示,性價比是影響H100和Gaudi2相對價值的重要考量因素,Gaudi2 服務(wù)器的成本要比H100低得多。

更重要的是,目前Gaudi2還沒有支持AI常用的FP8運算格式,這種情況下Gaudi2 在性價比上也勝過了H100,今年3季度會升級支持FP8運算,Gaudi2的性能將有明顯飛躍,性價比要比H100更高了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4743

    瀏覽量

    128995
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30998

    瀏覽量

    269303
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1563

    瀏覽量

    7766

原文標題:國內(nèi)公司自主研發(fā)GPU+:兼容CUDA、性能及能效超競品

文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    天璣8400 搭載G720 GPU性能雙飆,打造驚艷越級游戲體驗

    一貫的強項方面,天璣8400更是帶來越級旗艦的體驗,尤其是游戲場景,直接越級8系芯片,功耗更低、溫控更出色,這顆冰封之芯太強了。除了碾壓同級的全大核CPU,
    的頭像 發(fā)表于 12-24 13:55 ?159次閱讀
    天璣8400 搭載G720 <b class='flag-5'>GPU</b><b class='flag-5'>性能</b><b class='flag-5'>能</b><b class='flag-5'>效</b>雙飆,打造驚艷越級游戲體驗

    IO模塊助力PLC,全面提升中水處理設(shè)備

    隨著我國環(huán)保事業(yè)的不斷發(fā)展,中水處理技術(shù)在工業(yè)、生活等領(lǐng)域發(fā)揮著越來越重要的作用。如何提高中水處理設(shè)備的,成為行業(yè)關(guān)注的焦點。本文將為您介紹明達技術(shù)高效解決方案——利用自主研發(fā)的分
    的頭像 發(fā)表于 12-16 14:57 ?107次閱讀
    IO模塊助力PLC,全面提升中水處理設(shè)備<b class='flag-5'>能</b><b class='flag-5'>效</b>

    迅為3A6000_7A2000開發(fā)板龍芯全國產(chǎn)處理器與龍芯 3A5000完全兼容

    龍芯 3A6000 處理器完全自主設(shè)計、性能優(yōu)異,代表了我國自主桌面 CPU 設(shè)計領(lǐng)域的最新里程碑成果。龍芯 3A6000 處理器的推出,說明國產(chǎn) CPU 在自主可控程度和產(chǎn)品
    發(fā)表于 11-19 11:15

    上海貝嶺小封裝物聯(lián)網(wǎng)監(jiān)測芯片BL0971介紹

    為實現(xiàn)這些監(jiān)測及應(yīng)用需求,上海貝嶺在之前的物聯(lián)網(wǎng)監(jiān)測芯片BL0972的基礎(chǔ)上,針對直流充電樁的應(yīng)用需求,推出了小封裝的BL0971交直流
    的頭像 發(fā)表于 11-15 11:27 ?390次閱讀
    上海貝嶺<b class='flag-5'>超</b>小封裝物聯(lián)網(wǎng)<b class='flag-5'>能</b><b class='flag-5'>效</b>監(jiān)測芯片BL0971介紹

    天璣9400技術(shù)詳解:如何蟬聯(lián)GPU性能、雙冠軍

    全新高度,引發(fā)了廣泛好評。 天璣9400搭載全新頂級12核GPU G925,相較上代擁有超過41%的峰值性能飛躍,在保持與上一代相同的峰值性能下功耗節(jié)省接近一半。在媒體測評中,無論是極限性能
    的頭像 發(fā)表于 11-07 14:00 ?267次閱讀
    天璣9400技術(shù)詳解:如何蟬聯(lián)<b class='flag-5'>GPU</b><b class='flag-5'>性能</b>、<b class='flag-5'>能</b><b class='flag-5'>效</b>雙冠軍

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--了解算力芯片GPU

    每個CUDA單元在 OpenCL 編程框架中都有對應(yīng)的單元。 倒金字塔結(jié)構(gòu)GPU存儲體系 共享內(nèi)存是開發(fā)者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計算架構(gòu)中,線程
    發(fā)表于 11-03 12:55

    有沒有大佬知道NI vision 有沒有辦法通過gpucuda來加速圖像處理

    有沒有大佬知道NI vision 有沒有辦法通過gpucuda來加速圖像處理
    發(fā)表于 10-20 09:14

    國內(nèi)首款自主研發(fā)28nm顯示芯片量產(chǎn)

    近日,國內(nèi)半導(dǎo)體行業(yè)迎來重要里程碑,北京顯芯科技有限公司成功實現(xiàn)全球首款28納米內(nèi)嵌RRAM(阻變存儲器)畫質(zhì)調(diào)節(jié)芯片的量產(chǎn)。這款芯片不僅標志著我國在顯示類芯片領(lǐng)域達到了新的半導(dǎo)體工藝高度,更是國內(nèi)首款
    的頭像 發(fā)表于 09-11 17:17 ?2557次閱讀

    新芯”賦水表行業(yè),國產(chǎn)替代與計量升級 ——龍芯1D超聲波流量測計量芯片介紹

    。(2)迭代更新芯片迭代更新可以帶來性能提升、優(yōu)化、成本降低、集成度提高、軟件兼容性增強、市場適應(yīng)性提高等多方面的優(yōu)勢。(3)品牌優(yōu)勢國產(chǎn)CPU第一股;始終秉持為人民做龍芯的理念,
    發(fā)表于 08-14 10:46

    打破英偉達CUDA壁壘?AMD顯卡現(xiàn)在也無縫適配CUDA

    、英特爾等廠商雖然在努力追趕,但目前還未能看到有威脅英偉達地位的可能。 ? 最近一家英國公司Spectral Compute推出了一款方案,可以為AMD的GPU原生編譯CUDA源代碼,目前正在RNDA2、RDNA3上進行規(guī)模測試
    的頭像 發(fā)表于 07-19 00:16 ?4737次閱讀

    英國公司實現(xiàn)英偉達CUDA軟件在AMD GPU上的無縫運行

    7月18日最新資訊,英國創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實現(xiàn)了英偉達CUDA軟件在AMD GPU上的無縫遷移與運行,標志著在GPU計算領(lǐng)域,NVIDI
    的頭像 發(fā)表于 07-18 14:40 ?668次閱讀

    淺談建筑樓宇電氣安全與管理的應(yīng)用與選型

    程瑜 江蘇安科瑞電器制造有限公司 江蘇江陰 214405 摘要: 本文從電氣安全監(jiān)控系統(tǒng)應(yīng)用現(xiàn)狀,分析電氣安全事故隱患難以根除的原因入手,導(dǎo)出電氣安全與管理理念,通過探析電氣安全與
    的頭像 發(fā)表于 07-10 08:53 ?473次閱讀
    淺談建筑樓宇電氣安全與<b class='flag-5'>能</b><b class='flag-5'>效</b>管理的應(yīng)用與選型

    軟件生態(tài)上超越CUDA,究竟有多難?

    電子發(fā)燒友網(wǎng)報道(文/周凱揚)近日,英偉達憑借持續(xù)上漲的股價,正式超過了微軟成為全球市值最高的公司,這固然離不開GPU這一AI硬件的火熱,但之所以一舉做到世界第一,也離不開軟件的加持,真正將其推向
    的頭像 發(fā)表于 06-20 00:09 ?3668次閱讀

    GPU技術(shù)、生態(tài)及算力分析

    對比AMD從2013年開始建設(shè)GPU生態(tài),近10年時間后用于通用計算的ROCm開放式軟件平臺才逐步有影響力,且還是在兼容CUDA的基礎(chǔ)上。因此我們認為國內(nèi)廠商在軟件和生態(tài)層面與英偉達
    的頭像 發(fā)表于 01-14 10:06 ?1271次閱讀
    <b class='flag-5'>GPU</b>技術(shù)、生態(tài)及算力分析

    gpu服務(wù)器評測

    隨著科技的不斷發(fā)展和進步,GPU服務(wù)器在大數(shù)據(jù)分析、深度學(xué)習(xí)、人工智能等領(lǐng)域正變得越來越重要。而GPU服務(wù)器因其出色的性能和高度定制化的優(yōu)勢,成為了眾多企業(yè)和研究機構(gòu)的首選。本文將
    的頭像 發(fā)表于 01-10 10:37 ?1411次閱讀