0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Ampere架構(gòu)標(biāo)志著NVIDIA的重要轉(zhuǎn)折點(diǎn)

我快閉嘴 ? 來源: 半導(dǎo)體行業(yè)觀察 ? 作者: 半導(dǎo)體行業(yè)觀察 ? 2020-09-07 12:22 ? 次閱讀

Ampere架構(gòu)將為GeForce RTX 3090,GeForce RTX 3080,GeForce RTX 3070和其他即將推出的Nvidia GPU提供動(dòng)力。它代表了Team Green的下一次重大升級(jí),因?yàn)檫@次在性能上它有可能實(shí)現(xiàn)巨大飛躍。該顯卡將于本月晚些時(shí)候上市,而3070要等到10月份。根據(jù)當(dāng)前消息,這些GPU可以輕松遷移至我們的GPU層次結(jié)構(gòu)的頂部,并將一些最好的顯卡淘汰一兩個(gè)。下文將詳細(xì)介紹Ampere架構(gòu),主要內(nèi)容包括規(guī)格,功能和其他性能增強(qiáng)。

Ampere架構(gòu)標(biāo)志著NVIDIA的重要轉(zhuǎn)折點(diǎn)。這是該公司的首款7納米GPU,或用于消費(fèi)類零件的8納米GPU。無論以何種方式,制程減小都能使其在比以前更小的面積內(nèi)封裝更多的晶體管。它也是第二代消費(fèi)者光線追蹤和第三代深度學(xué)習(xí)硬件。較雄昂的制程為Nvidia極大程度上改進(jìn)以前的RTX 20系列硬件和技術(shù)創(chuàng)造了條件。

我們知道Ampere架構(gòu)將在即將到來的GeForce RTX 3090,RTX 3080和RTX 3070顯卡中得到應(yīng)用(預(yù)計(jì)明年RTX 3060和RTX 3050發(fā)布)。它也是Nvidia A100數(shù)據(jù)中心GPUs的一部分,該GPUs是完全獨(dú)立的硬件。在這里,我們將逐步分析Ampere體系結(jié)構(gòu)的消費(fèi)者和數(shù)據(jù)中心的變體,然后深入探討其中的一些差異。

Nvidia的Ampere GPU發(fā)布感覺就像是2016年的Pascal和2018年的Turing GPus的融合。Nvidia首席執(zhí)行官黃仁勛(Jensen Huang)于5月14日發(fā)布了用于數(shù)據(jù)中心的A100,讓我們了解到即將推出的產(chǎn)品的官方消息,但A100不是為GeForce卡設(shè)計(jì)的。A100替代了Volta GV100,而GV100替代了GP100。消費(fèi)類模型具有不同的功能集,并由單獨(dú)的GPU(如GA102,GA103等)提供支持。消費(fèi)類顯卡還使用GDDR6X / GDDR6,而A100使用HBM2。

除了底層的GPU架構(gòu),Nvidia還改進(jìn)了核心圖形卡設(shè)計(jì),重點(diǎn)放在散熱和功耗上。正如Nvidia在視頻中所描述,“每當(dāng)我們談?wù)揋PU性能時(shí),其實(shí)就是在講我們可以賦予和散去的功率,這種功率越大,性能就越好?!苯?jīng)過改進(jìn)的散熱解決方案,風(fēng)扇和PCB(印刷電路板)都是改善Nvidia Ampere GPU整體性能計(jì)劃的一部分。當(dāng)然,第三方設(shè)計(jì)可以自由調(diào)整Nvidia的設(shè)計(jì)。

隨著臺(tái)積電從12nm FinFET節(jié)點(diǎn)轉(zhuǎn)移到臺(tái)積電N7和三星N8,許多人期望Ampere在更低的功耗水平下提供更好的性能。與之相反的是,Nvidia以多多益善的方式采取了所有額外的晶體管并且提升功率(至少在產(chǎn)品堆棧的頂部是如此)。例如,GA100擁有540億個(gè)晶體管,其方形芯片尺寸是826mm。與GV100相比,晶體管數(shù)量增加了156%,而die尺寸僅增加了1.3%。我們預(yù)計(jì)消費(fèi)類GPU也會(huì)有類似的變化。

雖然7nm / 8nm在相同性能下確實(shí)可以有更高的功率,但其在相同功率下也可以表現(xiàn)出更好的性能。Nvidia邁出了一步,并在更高的功率水平下提供了更高的性能。V100數(shù)據(jù)中心模型的功率是300W,而新發(fā)布的Nvidia A100則將其提高到400W。我們在消費(fèi)者模型上得到了相同的結(jié)果。GeForce RTX 2080 Ti的功率為250 / 260W,Titan RTX的功率為280W。有傳言稱RTX 3090超越了它,并配備有歷史最高的TDP,可用于350W功率的單個(gè)GPU(顯然不包括A100)。

這對(duì)終端用戶意味著什么?除了可能需要升級(jí)電源以及在Nvidia自己的型號(hào)上使用12針電源連接器之外,還意味著性能的度量標(biāo)準(zhǔn)會(huì)做出相應(yīng)改變。在我的印象中,這次是Nvidia性能上最大的單代提升。Nvidia表示,結(jié)合即將進(jìn)行的體系結(jié)構(gòu)更新,RTX 3080的性能是RTX 2080的兩倍。如果這些工作負(fù)載包括光線跟蹤和/或DLSS,那么差距可能會(huì)更大。

值得慶幸的是,最終價(jià)格不會(huì)比上一代GPU差很多(這取決于定價(jià)的比較方式)。GeForce RTX 3090的首發(fā)價(jià)為1,499美元,創(chuàng)下了單GPU的 GeForce顯卡的記錄,有效取代了Titan系列。RTX 3080的價(jià)格為699美元,RTX 3070的價(jià)格為499美元,與上一代RTX 2080 Super和RTX 2070 Super保持相同的價(jià)格。Ampere架構(gòu)是否價(jià)格公道?我們需要再作等待才能實(shí)際測試硬件,但是這些規(guī)格至少看起來非常有吸引力。

Ampere GA100使Nvidia以前的GPU相形見絀,其晶體管的數(shù)量是GV100的2.5倍。

Nvidia Ampere體系結(jié)構(gòu)規(guī)格

除了用于數(shù)據(jù)中心的GA100之外,Nvidia還計(jì)劃在2020年至少再推出三個(gè)Ampere GPU。來年,可能還會(huì)有多達(dá)三個(gè)額外的Ampere解決方案,盡管這些解決方案尚未得到證實(shí)。

規(guī)格最大并且性能最差的GPU是A100。它具有多達(dá)128個(gè)SM和6個(gè)8GB的HBM2堆棧,其中Nvidia A100當(dāng)前僅啟用108個(gè)SM和五個(gè)HBM2堆棧。未來的版本可能具有完整的GPU和RAM配置。但是,GA100不會(huì)像普通的GP100和GV100那樣僅用作數(shù)據(jù)中心和工作站,而是成為消費(fèi)類產(chǎn)品。如果沒有光線追蹤硬件,GA100不會(huì)像GeForce卡那樣遙不可及(因?yàn)闊o需考慮大型裸片,HBM2和硅中介層的成本)。

在把方向下調(diào)至消費(fèi)者模型后,Nvidia進(jìn)行了一些重大更改。我們還沒有完整的外觀,但是Nvidia顯然使每個(gè)SM的CUDA內(nèi)核數(shù)量增加了一倍,從而在著色器性能上取得了巨大的進(jìn)步。有了GA102和RTX 3090,Nvidia可能會(huì)削減相對(duì)于GA100軸上兩個(gè)SM集群,從而保留96個(gè)SM的最大配置。其中,RTX 3090僅啟用了82個(gè)。HBM2和硅中介層也消失了,取而代之的是12個(gè)GDDR6X芯片。

每個(gè)SM的CUDA內(nèi)核增加一倍之后(相當(dāng)于10496個(gè)CUDA內(nèi)核),每個(gè)SM可能有兩個(gè)支持FP64的CUDA內(nèi)核。Nvidia去除了剩余的FP64功能,并在其位置添加了第二代RT內(nèi)核。至于四個(gè)第三代Tensor核心,其中每個(gè)核心的吞吐量是上一代Turing Tensor核心的每時(shí)鐘吞吐量的四倍。1700 MHz的boost頻率可提供FP32計(jì)算性能的35.7 TFLOPS,而19.5 Gbps GDDR6X可提供936 GBps的帶寬。大致來講,RTX 3090的性能可能會(huì)是RTX 2080 Ti的兩倍以上。

值得注意的是,目前有一大批SM被禁用。將來是否會(huì)完全啟用GA102的Titan卡?當(dāng)然如此。也許它還將配備21 Gbps內(nèi)存,并配上相應(yīng)的高價(jià)。(友情提示:即便你壕氣沖天,也不要為了游戲而購買Titan GPU。3-5%的性能提升絕對(duì)不值這個(gè)價(jià)。)

相對(duì)于GA102,GA103做出了進(jìn)一步修整。目前GA103有6個(gè)SM集群,最多72個(gè)SM。RTX 3080使用幾乎完整的GA103,其有68個(gè)SM和8704 CUDA內(nèi)核,而我們認(rèn)為RTX 3070使用僅具有46個(gè)active SM和5888 CUDA內(nèi)核的harvest芯片(可能是GA104,但這并不重要)。3080還具有10GB的GDDR6X內(nèi)存和320位總線,而3070禁用了兩個(gè)通道,最終在256位的總線上具有8GB的GDDR6內(nèi)存。

與前幾代產(chǎn)品不同,所有三個(gè)RTX 30系列GPU的工作頻率都較為相似:1700-1730MHz。從理論性能上講,RTX 3080可以完成29.8 TFLOPS,并具有760 GBps的帶寬,Nvidia表示它的速度是即將發(fā)布的RTX 2080的兩倍。

同時(shí),RTX 3070提供20.4 TFLOPS和512 GBps的帶寬。Nvidia表示RTX 3070的最終運(yùn)行速度也將比RTX 2080 Ti快,盡管在某些情況下11GB與8GB VRAM相比,會(huì)讓前重量級(jí)冠軍略勝一籌。同樣,架構(gòu)上的改進(jìn)肯定會(huì)有所幫助。

現(xiàn)在我們開始討論Ampere架構(gòu)。

A100是Nvidia有史以來規(guī)格最大的GPU,相比之下各種消費(fèi)類芯片要小得多

英偉達(dá)的GA100 Ampere架構(gòu)

隨著GA100和Nvidia A100的發(fā)布以及GeForce RTX 30系列的面世,我們現(xiàn)在對(duì)預(yù)期會(huì)有一個(gè)很好的了解。英偉達(dá)將繼續(xù)擁有兩條獨(dú)立的GPU系列,其中一條專注于數(shù)據(jù)中心和深度學(xué)習(xí),另一條專注于圖形和游戲。數(shù)據(jù)中心GA100所做的一些更改會(huì)延伸至消費(fèi)類產(chǎn)品線,但這并沒有擴(kuò)展到FP64的Tensor核心增強(qiáng)功能。這就是我們對(duì)Ampere架構(gòu)始于GA100的了解。

首先,GA100包含許多新內(nèi)容。從較高的角度來看,GPU已從GV100中的最多80個(gè)SMs / 5120 CUDA內(nèi)核增加到GA100中的128個(gè)SMs / 8192 CUDA內(nèi)核。雖然核心數(shù)量增加了60%,但GA100使用的晶體管數(shù)量是其2.56倍。所有這些額外的晶體管都用于增強(qiáng)架構(gòu)。如果您想深入了解所有細(xì)節(jié),請(qǐng)查看Nvidia的A100 Architecture白皮書,我們只對(duì)其進(jìn)行簡要總結(jié)。

GA100中的Tensor核心取得了最重要的升級(jí)。上一代GV100 Tensor內(nèi)核在兩個(gè)4x4 FP16矩陣上運(yùn)行,并且可以計(jì)算兩個(gè)矩陣的4x4x4融合乘加(FMA),每個(gè)周期具有第三個(gè)矩陣。每個(gè)Tensor內(nèi)核每個(gè)周期可以進(jìn)行128個(gè)浮點(diǎn)運(yùn)算,而Nvidia將GV100評(píng)為FP16的125 TFLOPS峰值吞吐量。相比之下,GA100 Tensor內(nèi)核每個(gè)工作頻率可以完成8x4x8 FMA矩陣運(yùn)算,每個(gè)Tensor內(nèi)核總共可以進(jìn)行256 FMA或512 FP(吞吐量是其四倍)。即使它每個(gè)SM的Tensor內(nèi)核數(shù)量只有上一代GV100 Tensor內(nèi)核的一半,但它仍然是上一代GV100 Tensor內(nèi)核每個(gè)SM的性能的兩倍。

GA100還增加了對(duì)Tensor內(nèi)核稀疏性的支持。該改進(jìn)考慮到許多深度學(xué)習(xí)操作最終會(huì)產(chǎn)生一堆不再重要的加權(quán)值,因此隨著訓(xùn)練的進(jìn)行,這些值基本上可以忽略。稀疏性將Tensor核心吞吐量提高了一倍。FP16的Nvidia A100的額定值為312 TFLOPS,而有稀疏性支持的Tensor 內(nèi)核則為624 TFLOPS。

除了大幅提高原始吞吐量外,GA100 Tensor內(nèi)核還增加了對(duì)更低精度的INT8,INT4和二進(jìn)制Tensor運(yùn)行的支持。INT8容許具有稀疏性的624 TOPS和 1248 TOPS,而INT4則將其翻倍,達(dá)到了1248/2496 TOPS。二進(jìn)制模式不支持稀疏性,可能用途有限,但是A100可以在該模式下進(jìn)行4992 TOPS。

另一方面,A100中的Tensor內(nèi)核也支持FP64指令。FP64的性能在19.5 TFLOPS時(shí)遠(yuǎn)低于FP16。但是,對(duì)于FP64工作負(fù)載,它仍然比GV100的最大FP64吞吐量快2.5倍。

最后一點(diǎn),A100添加了兩種新的浮點(diǎn)格式。BF16(Bfloat16)已被其他一些深度學(xué)習(xí)加速器(例如Google的TPUv4)使用。就像FP16一樣,BF16使用16位,但是使用8位指數(shù)和7位尾數(shù)進(jìn)行轉(zhuǎn)換,匹配FP32的8位指數(shù)范圍,同時(shí)降低了精度。事實(shí)已經(jīng)證明,這可以提供比普通FP16格式更好的訓(xùn)練和模型精度。第二種格式是Nvidia在Tensor Float 32(TF32)上的格式,該格式保留8位指數(shù),但將尾數(shù)擴(kuò)展到10位,使FP16的精度與FP32的范圍相匹配。TF32的性能也與FP16相同,因此深度學(xué)習(xí)仿真的額外精度基本上是“免費(fèi)”的。

哇,這是一個(gè)具有公制對(duì)接晶體管的大芯片!

Tensor的核心增強(qiáng)功能很多,這也表明了Nvidia在GA100上的重心。深度學(xué)習(xí)和超級(jí)計(jì)算工作負(fù)載的性能大大提高。GA100還具有其他一些體系結(jié)構(gòu)更新,我們將在此處作簡要介紹。SM晶體管的數(shù)量增加了50-60%,所有這些晶體管都必須放在某個(gè)地方。

多實(shí)例GPU(MIG)是一項(xiàng)新功能。這使得單個(gè)A100可以劃分為多達(dá)七個(gè)獨(dú)立的虛擬GPU。每個(gè)虛擬GPU(使用Tensor操作運(yùn)行推理工作負(fù)載)都可能與單個(gè)GV100的性能相匹配,從而極大地增加了云服務(wù)提供商的橫向擴(kuò)展機(jī)會(huì)。

每個(gè)SM的A100 L1高速緩存大了50%,與V100上的128KB相比為192KB。L2緩存的增加幅度更大,從V100的6MB增加到A100的40MB。它還具有新的分區(qū)交叉開關(guān)結(jié)構(gòu),可提供GV100 L2緩存的讀取帶寬的2.3倍。請(qǐng)注意,總的HBM2內(nèi)存“僅”從GV100的16GB或32GB增加到GA100的40GB,但是增加的L1和L2緩存有助于更好地優(yōu)化內(nèi)存性能。

NVLink性能也幾乎翻了一番,從GV100中的每個(gè)信號(hào)對(duì)25.78 Gbps到GA100中的50 Gbps。A100中的單個(gè)NVLink在每個(gè)方向上提供25 GBps的速率,類似于GV100,但每個(gè)鏈路具有一半的信號(hào)對(duì)。鏈接總數(shù)也增加了一倍,達(dá)到12條,從而使NVLink總帶寬在A100下為600 GBps,而在V100下為300 GBps。此外還提供了PCIe Gen4支持,幾乎使x16連接的帶寬增加了一倍(從15.76 GBps到31.5 GBps)。

最后,A100添加了新的異步副本,異步屏障和任務(wù)圖加速。異步副本可提高內(nèi)存帶寬效率并減少寄存器文件帶寬,并且可以在SM執(zhí)行其他工作時(shí)在后臺(tái)完成。硬件加速障礙為CUDA開發(fā)人員提供了更大的靈活性和性能,并且任務(wù)圖加速有助于優(yōu)化向GPU提交的工作。

還有其他體系結(jié)構(gòu)增強(qiáng),例如NVJPG解碼可加速JPG解碼,以用于基于圖像的算法的深度學(xué)習(xí)訓(xùn)練。A100包含5核硬件JPEG解碼引擎,該引擎可勝過基于CPU的JPEG解碼并減輕PCIe擁塞。同樣,A100添加了五個(gè)NVDEC(Nvidia解碼)單元,以加速常見視頻流格式的解碼,這有助于與視頻一起使用的深度學(xué)習(xí)和推理應(yīng)用的端到端吞吐量。

介紹完了GA100和Nvidia A100架構(gòu)之后,以下將介紹消費(fèi)類GeForce RTX卡的Ampere架構(gòu)變化。

Nvidia GA102 / GA103 Ampere架構(gòu)

與GV100相比,GA100進(jìn)行了大量更改,而在消費(fèi)類方面,更新同樣顯著。以上對(duì)Tensor核心的許多更改都直接帶入了消費(fèi)類模型(自然很可能會(huì)減去FP64)。除了支持Micron的新GDDR6X存儲(chǔ)器(而不是HBM2)之外,其他主要更改還包括光線跟蹤和CUDA內(nèi)核。

Nvidia在2018年使用Turing架構(gòu)和GeForce RTX 20系列GPU在光線追蹤方面引起了很多爭議。兩年過去了……好吧,說實(shí)話:游戲中的光線追蹤并沒有真正發(fā)揮其潛力?!稇?zhàn)地風(fēng)云5》具有更好的反射效果,《古墓麗影》和《使命召喚》的陰影得到了改善,《地鐵出埃及記》使用了RT全局照明,并且在每種情況下,性能的下降都使視覺效果有了相對(duì)較小的提高。迄今為止,關(guān)于光線追蹤可以做什么,最好的例子可以說是“控制游戲”,該游戲使用RT效果進(jìn)行反射,陰影和漫射照明。它看起來相當(dāng)不錯(cuò),盡管您可能抱有期望,但其對(duì)性能的影響仍然很大。

究竟有多大呢?對(duì)于RTX 2080 Ti和Core i9-9900K,在1440p和最高質(zhì)量下運(yùn)行Control且沒有光線追蹤的情況下,其性能為80 fps(這是我們在本文中剛剛完成的測試)。打開所有光線跟蹤功能之后,七性能降低到43 fps,慢47%,或基本上降低一半。盡管您可以通過啟用DLSS 2.0來緩解問題,但該功能在質(zhì)量模式下可渲染為1707x960,并可以放大到1440p。但這會(huì)帶來一個(gè)痛苦的代價(jià):性能降回72 fps。

還有“全路徑跟蹤”的演示,其中硬件進(jìn)一步推向了更高的位置。以Quake II或Minecraft之類的相對(duì)古老且低保真的游戲?yàn)槔?,再添加照明,陰影,反射,折射等全光線追蹤效果。而且,結(jié)果可能是60 fps,而不是每秒數(shù)百幀。這還是在以至少1080p的RTX 2070 Super啟用DLSS的情況(這已經(jīng)到達(dá)質(zhì)量水平)。

或許有人認(rèn)為光線跟蹤效果對(duì)性能造成的損失太大, Nvidia應(yīng)該反其道而行之。但是說這類話的人對(duì)Nvida不是很了解。據(jù)Nvidia稱,GeForce 256是第一個(gè)GPU,它還將硬件轉(zhuǎn)換和照明計(jì)算引入了消費(fèi)類硬件。大多數(shù)游戲要幾年后才能正確使用這些功能。第一批帶有著色器的GPU早在數(shù)年之前就已經(jīng)普遍使用該硬件,但是今天幾乎所有發(fā)行的游戲都廣泛使用了著色器技術(shù)。Nvidia認(rèn)為光線追蹤會(huì)有一個(gè)類似的演變過程。

好消息是,采用Ampere架構(gòu)的光線追蹤性能正在迅速崛起。Nvidia表示,與RTX 2080 Ti的34 TFLOPS相比,RTX 3080可以進(jìn)行58 TFLOPS的光線跟蹤計(jì)算。換句話說,光線追蹤的速度快了1.7倍。2080 Ti的光線三角相交計(jì)算速度達(dá)到每秒11千兆字節(jié),因此RTX 3080可以達(dá)到每秒19千兆字節(jié),而與以往的最佳紀(jì)錄相比,RTX 3090將翻倍甚至更躲。

這對(duì)光線追蹤游戲意味著什么?我們會(huì)很快找到答案,但是根據(jù)我們從Nvidia那里聽到的消息,我們將看到更多的游戲開發(fā)人員增加了光線跟蹤效果。賽博朋克2077將具有光線追蹤的反射,陰影,環(huán)境光遮擋等功能。像Control這樣的游戲可能在啟用所有光線跟蹤效果的情況下運(yùn)行,并且一旦啟用DLSS,相對(duì)于傳統(tǒng)渲染而言,其性能不會(huì)顯著下降,甚至有可能會(huì)表現(xiàn)出性能提升。

Nvidia還從其使用完整路徑跟蹤的Marbles技術(shù)演示中提供了上述指標(biāo)。一個(gè)未命名的Turing GPU(RTX 2080 Ti?)那能夠以720p和25 fps的速度運(yùn)行Marbles,沒有景深,只有一個(gè)圓頂燈和一個(gè)間接光。同時(shí),Ampere(RTX 3090?)可以以1440p和30 fps的速度運(yùn)行演示,并啟用了景深和130個(gè)區(qū)域照明燈。結(jié)果是無論使用什么實(shí)際的GPU,都有可能將光線追蹤提升到一個(gè)全新的水平。

當(dāng)然,這不僅與光線追蹤有關(guān)。英偉達(dá)還在DLSS上加倍努力,而且由于擁有更強(qiáng)大的Tensor內(nèi)核,所以質(zhì)量和性能應(yīng)該比以前更好。我們即將實(shí)現(xiàn)質(zhì)量模式下的DLSS 2.0看起來比使用TAA或SMAA的本機(jī)渲染效果更好。不難想象,許多游戲玩家選擇啟用DLSS來獲得健康的性能提升。

由于Ampere對(duì)8K顯示器具有本機(jī)支持,因此得益于HDMI 2.1,DLSS變得更加重要。什么樣的硬件能夠以絕佳的性能水平為8K提供動(dòng)力?這很容易:打開DLSS并使用RTX 3090或RTX 3080以4K渲染。這是8K渲染嗎?當(dāng)然不是。但這是個(gè)無關(guān)緊要的問題。

當(dāng)然,8K顯示器的價(jià)格仍然高得驚人,如果您坐在沙發(fā)上,幾乎不可能看到4K和8K之間的差異。另外,如果您像我一樣視力老化,那這種可能性為零。但是在家庭影院領(lǐng)域,營銷力量很強(qiáng)大,因此我們可以肯定將來8K電視會(huì)以更大的推動(dòng)力向前發(fā)展(這正是消費(fèi)電子公司試圖說服所有4K HDR電視所有者做出升級(jí)的方式)。

Nvidia Ampere架構(gòu):第二輪光線追蹤

毫無疑問,現(xiàn)在使用Nvidia的RTX 20系列GPU的人會(huì)有一種受到欺騙的感覺。如果幾個(gè)月前您沒有收到我們所提出的關(guān)于等待購買新GPU直到Ampere發(fā)布的建議,那么看到RTX 30系列規(guī)格和Ampere架構(gòu)可能會(huì)給您帶來更大的損失。問題在于,我們始終知道這一天會(huì)到來。就像Turing取代Pascal,Pascal取代Maxwell,Maxwell又取代Kepler一樣,GPU世界的迭代更新之路也在穩(wěn)定發(fā)展。

另一方面,如果您在過去幾年中一直對(duì)游戲中的光線追蹤持懷疑態(tài)度,Ampere可能最終會(huì)成功說服您嘗試一下。然后您又拖一個(gè)月左右,想看看AMD的Big Navi表現(xiàn)。現(xiàn)實(shí)情況是,我們將看到更多支持某種形式的光線追蹤的游戲,尤其是計(jì)劃于今年秋天推出的下一代PlayStation 5和Xbox Series X控制臺(tái)。我們有望在足夠的硬件實(shí)力的支持下,游戲的光線追蹤效果具有現(xiàn)實(shí)意義。

可以肯定的一件事是:光線追蹤不會(huì)消失。它幾乎已經(jīng)成為每部電影的重要組成部分,雖然目前還不是游戲與2020年好萊塢的電影競爭的時(shí)候,但他們也許可以追趕2000年代的好萊塢。目前,實(shí)時(shí)游戲通常希望每個(gè)像素僅使用幾條光線,以更好地貼近現(xiàn)實(shí)光線的表現(xiàn)方式。相比之下,好萊塢每個(gè)像素可能使用數(shù)千條光線(或路徑)。具有光線追蹤硬件的GPU仍處于早期階段,但是如果Nvidia(以及AMD和Intel)可以繼續(xù)升級(jí)我們的GPU,那么游戲和電影之間的差距將只會(huì)縮小。

Nvidia尚未透露所有關(guān)于Ampere架構(gòu)更改的消息,因此我們后續(xù)將在了解更多信息后做出更新。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 印刷電路板
    +關(guān)注

    關(guān)注

    4

    文章

    796

    瀏覽量

    35181
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4740

    瀏覽量

    128951
  • 帶寬
    +關(guān)注

    關(guān)注

    3

    文章

    929

    瀏覽量

    40926
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    蘋果可折疊iPhone或成市場轉(zhuǎn)折點(diǎn)

    或?qū)⒊蔀槭袌龅?b class='flag-5'>重要轉(zhuǎn)折點(diǎn)。 憑借蘋果在旗艦智能手機(jī)市場的強(qiáng)大影響力,Young認(rèn)為這款新產(chǎn)品將有力推動(dòng)可折疊手機(jī)市場在未來幾年內(nèi)實(shí)現(xiàn)顯著增長。特別是2026年,市場增長率有望超過30%,并在接下來兩年保持強(qiáng)勁勢頭。 隨著蘋果的加入,預(yù)計(jì)可折疊設(shè)備市場
    的頭像 發(fā)表于 12-04 11:07 ?296次閱讀

    英偉達(dá)被納入道指,標(biāo)志著AI新時(shí)代的到來

    近日,標(biāo)普道瓊斯指數(shù)公司宣布了一項(xiàng)重要決定:將英偉達(dá)納入道瓊斯工業(yè)平均指數(shù)(道指),取代目前的芯片業(yè)成分股英特爾。這一變動(dòng)不僅反映了英偉達(dá)在科技領(lǐng)域的崛起,也預(yù)示AI技術(shù)的發(fā)展進(jìn)入了一個(gè)新階段。
    的頭像 發(fā)表于 11-04 11:24 ?369次閱讀

    為什么測試波形與理論波形在轉(zhuǎn)折點(diǎn)電壓值出現(xiàn)偏差?

    以下是我在實(shí)際中遇到的問題請(qǐng)幫忙解決一下 在6測試點(diǎn)輸入的為50HZ交流的正弦波,以幅值電壓7.5V為例。放大200倍后在測試點(diǎn)8得到的波形為方波.方波上升沿、下降沿轉(zhuǎn)折點(diǎn)電壓理論上應(yīng)對(duì)輸入的交流
    發(fā)表于 09-25 07:24

    谷歌將于明年8月25日終止goo.gl短鏈服務(wù)

    谷歌公司近日宣布了一項(xiàng)重要決定,將于2025年8月25日正式停止對(duì)短鏈服務(wù)goo.gl的解析支持。這一變動(dòng)標(biāo)志著谷歌自2009年推出并廣受歡迎的URL Shortener短鏈服務(wù)的一個(gè)重要轉(zhuǎn)折
    的頭像 發(fā)表于 07-22 15:41 ?693次閱讀

    英偉達(dá)Blackwell架構(gòu),行業(yè)首選

    的半導(dǎo)體技術(shù)路徑圖,首度公開了即將面世的下一代芯片——Rubin平臺(tái),旨在接替現(xiàn)有的Blackwell。   回顧過往,NVIDIA始終保持每兩年發(fā)布一次全新架構(gòu)的傳統(tǒng),從2020年的
    的頭像 發(fā)表于 06-05 15:28 ?645次閱讀

    夏普與小米簽訂通信專利交叉許可協(xié)議并撤訴

    近日,夏普(Sharp)與小米正式宣布達(dá)成一項(xiàng)重要的交叉許可協(xié)議,該協(xié)議允許雙方相互使用無線通信技術(shù)相關(guān)的專利。此次協(xié)議的簽署標(biāo)志著夏普將撤回2022年對(duì)小米提起的訴訟,雙方關(guān)系迎來新的轉(zhuǎn)折點(diǎn)。
    的頭像 發(fā)表于 05-29 09:54 ?484次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    芯片標(biāo)志著 NVIDIA 在高性能計(jì)算、優(yōu)化連接性和可擴(kuò)展性領(lǐng)域的重大進(jìn)展。 7. 網(wǎng)絡(luò)技術(shù) GB200 集成了 NVIDIA 的最新網(wǎng)絡(luò)技術(shù),提出了連接性和帶寬方面的進(jìn)步。 **8.NVLink
    發(fā)表于 05-13 17:16

    NVIDIA推出兩款基于NVIDIA Ampere架構(gòu)的全新臺(tái)式機(jī)GPU

    兩款 NVIDIA Ampere 架構(gòu) GPU 為工作站帶來實(shí)時(shí)光線追蹤功能和生成式 AI 工具支持。
    的頭像 發(fā)表于 04-26 11:25 ?625次閱讀

    NVIDIA發(fā)布兩款新的專業(yè)顯卡RTX A1000、RTX A400

    NVIDIA今天發(fā)布了兩款新的專業(yè)顯卡RTX A1000、RTX A400,從編號(hào)就能看出來定位入門級(jí),而且架構(gòu)并非最新的Ada Lovelace,還是上一代的Ampere。
    的頭像 發(fā)表于 04-18 11:35 ?2246次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布兩款新的專業(yè)顯卡RTX A1000、RTX A400

    全新NVIDIA RTX A400和A1000 GPU全面加強(qiáng)AI設(shè)計(jì)與生產(chǎn)力工作流

    兩款 NVIDIA Ampere 架構(gòu) GPU 為工作站帶來實(shí)時(shí)光線追蹤功能和生成式 AI 工具支持。
    的頭像 發(fā)表于 04-18 10:29 ?533次閱讀

    傳統(tǒng)PC已過時(shí)?2024年AI PC領(lǐng)航未來!

    隨著科技的飛速發(fā)展,我們生活中的許多方面都在經(jīng)歷翻天覆地的變化。在這個(gè)信息爆炸的時(shí)代,個(gè)人電腦(PC)作為我們工作、學(xué)習(xí)和娛樂的重要工具,其形態(tài)和功能也在不斷演進(jìn)。2024年,被業(yè)界普遍認(rèn)為是傳統(tǒng)PC向AI PC轉(zhuǎn)變的重大轉(zhuǎn)折點(diǎn)
    的頭像 發(fā)表于 03-25 10:26 ?640次閱讀
    傳統(tǒng)PC已過時(shí)?2024年AI PC領(lǐng)航未來!

    新火種AI|OpenAI開年王炸!GPT商店本周上線,誰的AI第一桶金?

    OpenAI的GPT商店終于來了,普通人翻身的轉(zhuǎn)折點(diǎn)?
    的頭像 發(fā)表于 01-09 23:04 ?286次閱讀
    新火種AI|OpenAI開年王炸!GPT商店本周上線,誰的AI第一桶金?

    多家車企與NVIDIA DRIVE車載自動(dòng)駕駛平臺(tái)達(dá)成合作

    英偉達(dá)在CES 2024上宣布,理想汽車已決定采用NVIDIA DRIVE Thor中央車載計(jì)算機(jī),為其新一代車型提供動(dòng)力。這一決定標(biāo)志著理想汽車對(duì)NVIDIA技術(shù)的信任和認(rèn)可,也是對(duì)NVID
    的頭像 發(fā)表于 01-09 18:11 ?775次閱讀

    電動(dòng)汽車制造商選擇使用NVIDIA DRIVE實(shí)現(xiàn)自動(dòng)駕駛

    NVIDIA(英偉達(dá))近日宣布,理想汽車,作為增程式電動(dòng)汽車(EV)領(lǐng)域的先鋒,已決定采用NVIDIA DRIVE Thor?集中式車載計(jì)算平臺(tái)為其下一代車型提供支持。這一決策標(biāo)志著理想汽車對(duì)
    的頭像 發(fā)表于 01-09 14:57 ?711次閱讀

    請(qǐng)問下ADXL335溫度飄零是線性的嗎?

    請(qǐng)問下ADXL335溫度飄零是線性的么? 采集的時(shí)候發(fā)現(xiàn)X軸輸出 在 20°的時(shí)候有轉(zhuǎn)折點(diǎn)
    發(fā)表于 01-01 06:13