2022年10月上旬,代表著Ada Lovelace架構(gòu)頂級(jí)性能的GeForce RTX 4090 GPU登場(chǎng)亮相發(fā)售,宣告了RTX 40系GPU正式進(jìn)入消費(fèi)者的視野。不過正如我們測(cè)試之后的結(jié)論所說,雖然RTX 4090擁有遠(yuǎn)勝RTX 3090 Ti的強(qiáng)悍性能,而且還有DLSS 3這一神奇黑科技的護(hù)航,但萬元以上的價(jià)格確實(shí)不是大眾消費(fèi)者能輕易接受的。時(shí)隔一月之后,同樣代表了旗艦級(jí)性能,但價(jià)格卻要便宜不少的次旗艦產(chǎn)品GeForce RTX 4080登場(chǎng)了。同樣擁有勝過RTX 3090 Ti的性能表現(xiàn),但價(jià)格卻要相對(duì)親民一些,會(huì)不會(huì)讓你更加心動(dòng)?
和RTX 4090一樣,同出一脈的GeForce RTX 4080 GPU仍然繼承了來自Ada Lovelace架構(gòu)的全部特色與技術(shù)。在GeForce RTX 4090 Founders Edition首發(fā)評(píng)測(cè)時(shí),我們已經(jīng)對(duì)Ada Lovelace架構(gòu)的核心特色技術(shù)與主要特點(diǎn)進(jìn)行了非常細(xì)致的解析,在這里我們就不一一重復(fù)了。不過為了幫助大家更好地理解本測(cè)試文章,我們還是將Ada Lovelace架構(gòu)的核心技術(shù)要點(diǎn)做了個(gè)簡(jiǎn)單總結(jié),供大家參考。
來自Ada架構(gòu)的RTX 40系GPU技術(shù)創(chuàng)新
RTX 40 系列 GPU 具有一系列新的技術(shù)創(chuàng)新,包括TSMC 4N 制造工藝,整體實(shí)現(xiàn)高達(dá) 2 倍的性能功耗比飛躍。?
緩存暴增
?
Ada架構(gòu)的改革在緩存部分有了較大改變。每個(gè)SM擁有128KB L1緩存,AD102總計(jì)擁有18432KB L1緩存,相比GA102的10752KB緩存增加了大約70%。在L2緩存方面,AD102目前擁有98304KB的L2緩存,相比之前GA102所擁有的6144KB大約是后者的16倍。如此巨大的緩存,將為所有GPU相關(guān)操作都帶來巨大的收益,尤其是光線追蹤、路徑追蹤等復(fù)雜的操作收益最為明顯。
更強(qiáng)的SM
AAD102的每個(gè)SM單元包含128個(gè)CUDA內(nèi)核,1個(gè)ADA第三代RT核心以及4個(gè)ADA第四代張量(Tensor)核心、4個(gè)紋理單元、256KB寄存器、128KB的L1/共享內(nèi)存,和之前的產(chǎn)品一樣,L1/共享內(nèi)存也可以根據(jù)使用情況進(jìn)行配置。流式多處理器具有高達(dá) 83 TFLOPS 的著色能力,吞吐量超過上一代產(chǎn)品 2 倍。?
第三代光追核心
第三代 RT Cores 的有效光線追蹤計(jì)算能力達(dá)到 191 TFLOPS,是上一代產(chǎn)品 2.8 倍。?
第四代AI核心
新的 Tensor Cores 新增 FP8 引擎,具有高達(dá) 1.32 petaflops 的張量處理性能,超過上一代5倍。
Shader Execution Reordering著色器執(zhí)行重排序
SER可以重新調(diào)度著色器的工作排序,從而避免部分著色器在等待中浪費(fèi)算力和電能,以獲得更好的效率和性能。SER 為光線追蹤帶來最高可達(dá) 3 倍的性能提升,整體游戲性能提升可高達(dá) 25%。
DLSS 3與OFA光流加速器
基于Ada光流加速器的DLSS 3最高可帶來相對(duì)于DLSS 2達(dá)2 倍的性能提升,使 DLSS 3 能夠預(yù)測(cè)場(chǎng)景中幀和幀之間的運(yùn)動(dòng)變化,使神經(jīng)網(wǎng)絡(luò)能夠在保持圖像質(zhì)量的同時(shí)提高幀率。DLSS 3 技術(shù)支持 GeForce RTX 40 系列 GPU,它包括 3 個(gè)功能:光學(xué)幀生成技術(shù)、超級(jí)分辨率(DLSS 2 的關(guān)鍵創(chuàng)新)和 NVIDIA Reflex。開發(fā)者只需整合 DLSS 3,即可默認(rèn)支持 DLSS 2。
雙NVIDIA編碼器(NVENC)
基于 Ada 架構(gòu)的全新顯卡配備了支持 AV1 編碼的全新第八代 NVIDIA 編碼器 (NVENC),可為主播、廣播愛好者和視頻通話用戶帶來更多新的嘗試和體驗(yàn)。該技術(shù)的效率比 H.264 高 40%,這有助于主播在保持直播推流比特率不變的情況下,將畫面分辨率從 1080p 提高到 1440p,且畫質(zhì)依然穩(wěn)定。?
更強(qiáng)的Studio性能
除了游戲性能之外,RTX 40系GPU也是用于內(nèi)容創(chuàng)作的優(yōu)秀GPU,在加速3D設(shè)計(jì)創(chuàng)作、視頻剪輯處理和AI計(jì)算方面,都有非常不錯(cuò)的表現(xiàn)。
同時(shí)嗎,專用的NVIDIA Studio Driver在頂級(jí)創(chuàng)意應(yīng)用上經(jīng)過全面測(cè)試,能夠最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代編碼器來提高現(xiàn)場(chǎng)直播質(zhì)量,利用 NVIDIA Broadcast AI 特效改善麥克風(fēng)和網(wǎng)絡(luò)攝像頭,并進(jìn)入AI驅(qū)動(dòng)的 VTubing。?
●得益于RTX 40 系列的雙編碼器和高達(dá)2倍的AI工具性能,視頻編輯的輸出速度最高可提升 2倍。?
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 設(shè)計(jì)創(chuàng)作者可以在4K@60fps 下進(jìn)行創(chuàng)作。
●Modder可以重制經(jīng)典游戲,并通過RTX Remix開啟RTX。
GeForce RTX 4080 Founders Edition鑒賞
復(fù)習(xí)完理論,來看今天的主角GeForce RTX 4080 Founders Edition。
從核心架構(gòu)圖可以看出,相對(duì)于完整的AD-102核心配置的12個(gè)GPC模塊,代號(hào)為AD-103的GeForce RTX 4080 GPU只擁有7個(gè)GPC模塊,而且在GPC的配置上做了一些減法。全部7個(gè)GPC模塊中有4個(gè)配置了完整的12組SM模塊,有兩個(gè)GPC配置了10組SM,而最后一個(gè)GPC只配置了8組SM。這樣算下來,完整的AD-103核心總共配置了48+20+8即76組SM單元。Ada核心的每個(gè)SM單元配置的CUDA核心為128個(gè),因此RTX 4080 GPU具有9728個(gè)CUDA 核心, 可提供 49 TFLOPS的著色器傳統(tǒng)光柵渲染能力。同樣,這也意味著GeForce RTX 4080 GPU擁有76個(gè)第三代Tensor Cores光追核心和304個(gè)第四代Tensor Cores AI核心,能夠?yàn)楣庾酚螒蚧蜾秩竟ぷ魈峁?13RT-TFLOPS的計(jì)算能力,同時(shí)能夠?yàn)镈LSS或AI計(jì)算提供高達(dá)780Tensor-TFLOPS的計(jì)算性能。在核心頻率上,RTX 4080的GPU核心頻率為2205MHz~2505MHz,略低于RTX 4090,但相比RTX 30系旗艦不到2GHz的頻率設(shè)置,仍然是要高得多,也說明采用TSMC 4N工藝打造的Ada核心在能效比上確實(shí)比RTX 30系出色得多。
在顯存的配置上,由于NVIDIA最終撤銷了12GB顯存版的RTX 4080 GPU計(jì)劃,因此16GB GDDR6X顯存的版本就成為了目前RTX 4080的唯一配置。在顯存位寬上從RTX 4090的384bit降為256bit,不過頻率從RTX 4090的1313MHz提升到了1400MHz,因此帶寬雖然為768GB/s要低于RTX 4090,但總速率表現(xiàn)還是達(dá)到了22.4Gpbs,高于RTX 4090的21Gbps。
按照NVIDIA給出的官方參考數(shù)據(jù),在現(xiàn)代游戲中RTX 4080的性能最高可達(dá) GeForce RTX 3080 Ti 的2倍,而功耗則降低了近10%。具體是不是有這樣的性能表現(xiàn)呢?后文我們將進(jìn)行深度的詳細(xì)測(cè)試。
說個(gè)題外話,其實(shí)可以看出,RTX 4080和RTX 4090之間在硬件規(guī)格參數(shù)上相差很大,所以我們一點(diǎn)也不懷疑RTX 4080 Ti這個(gè)等級(jí)的GPU是一定存在的。而且不妨大膽猜測(cè)一下,104或110組SM單元配置的20GB GDDR6X顯存版RTX 4080 Ti是不是很有吸引力呢?(個(gè)人猜測(cè),僅供參考)。
從外觀上來看,RTX 4080 FE與RTX 4090 FE幾乎是一模一樣,而且在長(zhǎng)寬的尺寸上也幾乎保持一致。在散熱結(jié)構(gòu)上,RTX 4080 FE仍然是采用的雙軸流通設(shè)計(jì),加厚的散熱片也充分保證了散熱的性能需求。在風(fēng)扇部分,和RTX 4090 FE一樣,RTX 30系旗艦產(chǎn)品的9葉曲折扇改為了兩只大面積的7葉類鐮刀風(fēng)扇,但是在靜音效果上反而感覺更優(yōu)秀。較大扇葉面積的風(fēng)扇能夠提供更高的風(fēng)壓與風(fēng)量,而風(fēng)扇部分此次采用的流體動(dòng)力軸和反方向旋轉(zhuǎn)的設(shè)計(jì),則讓RTX 4080 FE和RTX 4090 FE一樣可以更安靜、涼爽地運(yùn)行。
▲和RTX 4090 FE一樣的7葉鐮刀風(fēng)扇,雙側(cè)反向旋轉(zhuǎn)帶來更高散熱效率。
▲主出風(fēng)口設(shè)置在擋板處,大量的鏤空設(shè)計(jì)可以充分保證散熱效果。在視頻輸出接口部分,仍然是傳統(tǒng)的1 HDMI+3 DP,支持HDMI 2.1和DP 1.4a。
▲RTX 40系GPU已經(jīng)全面進(jìn)化到600W供電的ATX 3.0電源PCIe 5 16Pin 12VHPWR接口,不過RTX 4080 FE的包裝盒內(nèi)也附帶了一根3×8pin轉(zhuǎn)16Pin的轉(zhuǎn)接線,方便用戶平滑升級(jí)。
▲和RTX 4090 FE一樣,支撐架安裝部位也采用了隱藏式磁吸設(shè)計(jì)。
▲從NVIDIA的官方PCB渲染圖來看(FE公版顯卡實(shí)在很難拆,而且我們擔(dān)心拆解容易損壞散熱結(jié)構(gòu),所以就沒拆解RTX 4080 FE,用NVIDIA官方資料進(jìn)行內(nèi)部設(shè)計(jì)解析),RTX 4080 FE仍然采用了燕尾PCB的設(shè)計(jì)模式,18相供電。中間的AD103核心因?yàn)槭枪俜戒秩緢D,因此打上了NVIDIA Logo。顯存部分則采用了來自美光的8顆GDDR6X顆粒,單顆容量2GB。
NVIDIA GeForce RTX 4080 Founders Edition參數(shù)規(guī)格
核心架構(gòu):Ada Lovelace
核心代號(hào):AD103-300
制程工藝:TSMC 4N(NVIDIA定制工藝)
SM單元:76
CUDA核心數(shù):9728
光追核心數(shù)(RT Cores):76
AI核心數(shù)(Tensor Cores):304
核心頻率:2205MHz~2505MHz
顯存容量:16GB GDDR6X
顯存速率:22.4Gbps
顯存位寬:256bit
顯存帶寬:716.8GB/s
支持DLSS版本:DLSS 3
TGP:320W
建議電源:700W
首發(fā)參考價(jià):9499元
性能實(shí)測(cè),比RTX 3090 Ti還強(qiáng)20%多!
步入大家最期待的實(shí)際應(yīng)用測(cè)試。想必所有玩家心里都有這樣一個(gè)疑問:作為首發(fā)價(jià)格達(dá)9499元的RTX 4080 FE,其實(shí)際性能表現(xiàn)能否匹配這樣的價(jià)格定位呢?
整體的測(cè)試我們大致分為三個(gè)部分:第一部分是游戲性能的體驗(yàn),包括傳統(tǒng)光追游戲+DLSS 2的性能表現(xiàn)檢測(cè)以及DLSS 3性能的專項(xiàng)測(cè)試,這是本次評(píng)測(cè)的最重要的核心部分;第二部分則是與設(shè)計(jì)創(chuàng)作相關(guān)的Studio性能評(píng)測(cè),考察RTX 4080在設(shè)計(jì)創(chuàng)作應(yīng)用方面的優(yōu)勢(shì);第三部分則是功耗相關(guān)的評(píng)測(cè),這部分我們不再用傳統(tǒng)的單一Furmark烤機(jī)來檢測(cè)RTX 4080 Founders Edition的能耗,而是分別在1440p游戲、4K游戲和8K游戲環(huán)境下考察RTX 4080的實(shí)際功耗表現(xiàn),并且根據(jù)這些成績(jī)和性能表現(xiàn)來簡(jiǎn)略計(jì)算RTX 4080的每瓦性能(僅供參考)。同時(shí),我們還將RTX 4090 FE、RTX 3090 Ti FE和RTX 3080 Ti FE納入了對(duì)比參考測(cè)試。
下面,就讓我們逐步深入解析RTX 4080 Founders Edition的性能世界吧!
測(cè)試平臺(tái)概覽
GPU:NVIDIA RTX 4080 FE、RTX 4090 FE、RTX 3090 Ti FE、RTX 3080 Ti FE
主板:技嘉AORUS Z790 MASTER
內(nèi)存:技嘉AORUS DDR5 6000 64GB
顯示器:戴爾UP3218K(7680×4320@60Hz)
電源:鑫谷昆侖KL-1250G冰山版ATX 3.0(額定1250W)
操作系統(tǒng):Windows 11 Pro 21H2
驅(qū)動(dòng)程序:Game Ready Driver 526.72
▲截至發(fā)稿時(shí),GPU-Z未更新,因此尚不能完全識(shí)別RTX 4080 GPU。
3DMark理論性能測(cè)試
在3DMark的理論性能測(cè)試部分,我們可以看到RTX 4080 FE與RTX 4090 FE的平均理論3D性能差距約在30%上下,PortRoyal光追性能測(cè)試部分的差距超過了40%。畢竟RTX 4080 FE與RTX 4090 FE在規(guī)格上確實(shí)相差了一大截,有這樣的性能差距也算正常,而且也為可能出現(xiàn)的RTX 4080 Ti埋下了伏筆。
在與上一代旗艦級(jí)和次旗艦產(chǎn)品的比較上,RTX 4080 FE的表現(xiàn)還是非常搶眼的。在與RTX 3080 Ti FE的較量上,RTX 4080 FE幾乎領(lǐng)先后者整整40%的性能,即使與RTX 3090 Ti這款前一代的頂級(jí)旗艦產(chǎn)品相比,所有測(cè)試項(xiàng)目的平均領(lǐng)先幅度也達(dá)到了25%左右,堪稱表現(xiàn)不俗。
游戲性能測(cè)試,輕松駕馭4K全特效光追
在游戲測(cè)試部分,出于對(duì)RTX 4080 FE的定位思考,我們將整體測(cè)試重點(diǎn)放在了4K分辨率下,但考慮到少部分玩家的特殊需求,我們也在部分游戲中加入了8K分辨率的體驗(yàn)評(píng)測(cè)。同時(shí),目前的實(shí)際情況是,絕大部分玩家都還在使用1440p甚至1080p顯示器,因此我們也將一部分1440p游戲的體驗(yàn)測(cè)試加入了本次的體驗(yàn)之旅中,以期望得到一個(gè)相對(duì)完整的體驗(yàn)測(cè)試報(bào)告。在所有游戲的測(cè)試中,我們都開啟了最高畫質(zhì)與最高光追效果設(shè)置(《刺客信條:英靈殿》設(shè)置為高畫質(zhì)),DLSS模式統(tǒng)一開啟為:8K超級(jí)性能、4K/1440p為平衡(《暗影火炬城》《生死輪回》《光明記憶:無限》三款游戲DLSS設(shè)置為自動(dòng),特此說明)。
傳統(tǒng)光追游戲+DLSS 2性能體驗(yàn)
在8K光追游戲測(cè)試部分,RTX 4080 FE的表現(xiàn)還是比較搶眼的。在DLSS開啟之后,基本都能夠在60fps左右或更高的幀率運(yùn)行8K游戲。與RTX 3090 Ti FE相比,RTX 4080 FE的8K游戲整體性能領(lǐng)先約30%,與RTX 3080 Ti FE相比,8K游戲性能更是達(dá)到了接近90%的領(lǐng)先程度。不過與RTX 4090 FE相比,仍然還有40%~45%的性能差距。
4K分辨率下的游戲性能表現(xiàn)是我們的測(cè)試重點(diǎn),這部分我們一共選擇26款當(dāng)下的熱點(diǎn)游戲進(jìn)行了詳細(xì)的測(cè)試(《Unity:Enemies》這款游戲RTX 40系GPU自動(dòng)開啟DLSS 3,RTX 30系及更老的GPU自動(dòng)開啟DLSS 2。)。從整體的測(cè)試情況來看,RTX 4080 FE在性能上的表現(xiàn)仍然不俗,相比RTX 3080 Ti而言,整體性能平均領(lǐng)先都達(dá)到了50%,在部分游戲中的領(lǐng)先幅度高達(dá)80%以上。相比RTX 3090 Ti,RTX 4080 FE的性能平均也達(dá)到了25%左右的領(lǐng)先幅度。不過相比RTX 4090 FE,RTX 4080 FE在4K分辨率下性能還是落后約35%。
1440p分辨率理論上不是RTX 4080的主戰(zhàn)場(chǎng),不過考慮到很多玩家目前都還在1440p顯示器上奮戰(zhàn),因此我們也將這部分成績(jī)納入了測(cè)試之中。在1440p分辨率下,隨著游戲?qū)PU性能需求的降低,RTX 4080 FE和RTX 4090 FE、RTX 3090 Ti FE和RTX 3080 Ti FE的正負(fù)性能差距都有縮小的趨勢(shì)。在這一分辨率下,RTX 4080 FE平均性能領(lǐng)先RTX 3080 Ti約40%,GPU負(fù)荷越高,RTX 4080 FE的優(yōu)勢(shì)越明顯。與RTX 3090 Ti FE相比,在1440p分辨率下RTX 4080 FE的性能領(lǐng)先幅度縮小到了20%左右,同時(shí)相比RTX 4090的性能落后也縮小到了20%左右。
DLSS 2/3對(duì)比測(cè)試
在這部分中,我們和當(dāng)初測(cè)試RTX 4090 FE時(shí)一樣,對(duì)DLSS 3進(jìn)行了專項(xiàng)的測(cè)試。我們分別對(duì)比了同一代產(chǎn)品(RTX 4080)在 DLSS 2和DLSS 3設(shè)置下的不同游戲性能表現(xiàn),同時(shí)也對(duì)比了不同代產(chǎn)品在兩代DLSS設(shè)置下的不同表現(xiàn)(RTX 30系+DLSS 2對(duì)比RTX 40系+DLSS 3),以觀察在新一代DLSS技術(shù)的支持下,RTX 40系GPU相對(duì)上一代產(chǎn)品的有怎樣的迅猛提升。
先來看3DMark的DLSS TEST測(cè)試項(xiàng)目。很明顯,DLSS 3同比DLSS 2在性能上有50%以上的性能提升,相比Native原生幀率,更是最高提升幅度達(dá)到了400%左右。
來看同代產(chǎn)品間DLSS 2/3在實(shí)際游戲表現(xiàn)中的性能差距。我們用RTX 4080在11款支持DLSS 3的游戲中測(cè)試了兩代DLSS技術(shù)的性能比較。從測(cè)試數(shù)據(jù)來看,RTX 4080在同等級(jí)設(shè)置的DLSS模式下,DLSS 3下的幀率相對(duì)DLSS 2要強(qiáng)40%~70%,平均領(lǐng)先程度約為哦45%左右。如果同比Native原生幀率,DLSS 3模式下大約能達(dá)到原生幀率的2.5~4.5倍,平均下來也達(dá)到了Native原生幀率的3倍左右。可見DLSS 3確實(shí)在幀率提升方面確實(shí)令人喜出望外。
再來看跨代GPU搭配跨代DLSS模式的性能比較。這部分測(cè)試中我們選擇了RTX 3080 Ti和RTX 3090 Ti在DLSS 2設(shè)置下的幀率表現(xiàn),對(duì)比RTX 4080在DLSS 3設(shè)置下的幀率表現(xiàn)。從測(cè)試結(jié)果來看,DLSS 3模式下的RTX 4080 FE相對(duì)于RTX 3090 Ti平均達(dá)到了1.6倍左右的性能,而相對(duì)于RTX 3080 Ti來說,RTX 4080 FE在DLSS 3模式下對(duì)比DLSS 2模式的RTX 3080 Ti更是達(dá)到了平均1.75倍左右的性能,最高甚至達(dá)到了2.2~2.5倍的性能。DLSS 3的加持下,進(jìn)一步鞏固了RTX 4080 FE的性能優(yōu)勢(shì)。
DLSS 3及PCL測(cè)試
NVIDIA在DLSS 3中囊括了NVIDIA Reflex低延遲技術(shù),能夠極大地改善游戲體驗(yàn)的流暢性,尤其是對(duì)FPS游戲來說更是意義重大,畢竟更低的延遲也就意味了更快速的反應(yīng)操作。另外隨著FrameView 1.4版本的更新,現(xiàn)在FrameView已經(jīng)能夠在支持的游戲中監(jiān)測(cè)、記錄游戲的PCL系統(tǒng)延遲時(shí)間與1%L fps低幀,這兩個(gè)指標(biāo)都是關(guān)系到游戲流暢與否的主要因素。因此,我們也選擇了包括《瘟疫傳說:安魂曲》《賽博朋克2077》《幻塔》等在內(nèi)的11款支持DLSS 3的游戲進(jìn)行了測(cè)試。
從測(cè)試結(jié)果來看,DLSS 3的幀率提升功能作用顯露無余。不只是在幀率表現(xiàn)上相對(duì)于Native原生幀率有100%~400%的提升,而且在1%L fps和PCL系統(tǒng)延遲上也有驚艷的表現(xiàn)。比如在4K分辨率設(shè)置的《生死輪回》游戲中,盡管在DLSS關(guān)閉的情況下能達(dá)到60fps以上的游戲幀率,但游戲的1%L fps僅為28fps左右,說明游戲仍然會(huì)時(shí)不時(shí)產(chǎn)生卡頓的情況,而且PCL系統(tǒng)延遲在DLSS關(guān)閉時(shí)也高達(dá)85ms。在開啟DLSS 3平衡模式之后,游戲幀率飆升到立刻150fps以上,達(dá)到了絕對(duì)流暢水準(zhǔn)。同時(shí)1%L fps也提升到了127fps,說明已經(jīng)不會(huì)在任何情況下影響到游戲的流暢運(yùn)行。另一方面系統(tǒng)延遲也在開啟DLSS 3之后從85ms下降到了27ms,讓游戲更加絲滑順暢。在其余幾款測(cè)試游戲中,DLSS 3也有著同樣的表現(xiàn),請(qǐng)大家自行閱覽分析。
在RTX 4090 FE的首發(fā)評(píng)測(cè)時(shí),我們已經(jīng)詳細(xì)地對(duì)比過DLSS 3、DLSS 2和Native原生之間的畫質(zhì)差異。即使在4K分辨率的DLSS性能模式的設(shè)置下,無論是DLSS 2還是DLSS 3,最終呈現(xiàn)的游戲畫面相對(duì)于原生畫質(zhì)幾乎看不出損失,與原生畫質(zhì)相差不大。對(duì)比DLSS 3和DLSS 2的性能模式,也可以看出二者基本沒有差別,甚至DLSS 3模式下的畫質(zhì)還略微清晰一些。這足以說明DLSS 3對(duì)游戲畫質(zhì)的影響幾乎可以忽略不計(jì),至少多絕大多數(shù)玩家來說,完全不用擔(dān)心開啟DLSS 3之后在游戲中看到明顯的畫質(zhì)損失。為了讓大家有更直觀的認(rèn)識(shí),我們又在本次測(cè)試過程中截取了不同DLSS 3設(shè)置下的游戲畫面,并與原生畫質(zhì)進(jìn)行對(duì)比,結(jié)果仍然是沒有太大差別,甚至更好。
▲4K分辨率,《賽博朋克2077》
▲1440p,《賽博朋克2077》
▲1440p,《F1 22》
我們?cè)趦煽畈煌螒蛑蟹謩e截取了同一場(chǎng)景下的原生(圖中)、DLSS 2平衡(圖左)和DLSS 3平衡(圖右)的游戲畫面。從三個(gè)不同場(chǎng)景的截圖可以明顯看出,在DLSS 3設(shè)置下的游戲畫面相比DLSS 2和原生畫質(zhì)沒有任何的損耗,甚至在放大到300%左右可以發(fā)現(xiàn),DLSS 3模式下的畫面鋸齒感相比原生畫質(zhì)更小,相比DLSS 2都還要更清晰一些。
2022年,11月15日,DLSS 3游戲庫新增如下:
《逆水寒》:已正式支持DLSS 3
《微軟模擬飛行》:已推出搶先體驗(yàn)版,已于 11 月 11 日與《微軟模擬飛行》(Microsoft Flight Simulator )Sim Update 11 和全新《微軟模擬飛行》40 周年紀(jì)念版(Microsoft Flight Simulator 40th Anniversary Edition)同時(shí)發(fā)布。
《WRC Generations》:FIA WRC 官方游戲,11月16日推出,支持DLSS 3。
《極品飛車:不羈》:11月29日推出,支持DLSS 3。
《戰(zhàn)錘40K:暗潮》:11月30日推出,支持DLSS 3和光線追蹤技術(shù)。
下列兩款游戲?qū)⒏轮С諨LSS 3:
《毀滅全人類 2:重新探測(cè)》:11 月 15 日推出,幀率最高可提升至 2 倍。
《漫威蜘蛛俠:邁爾斯?莫拉萊斯》:11月18日發(fā)布,支持DLSS 3。
因此,當(dāng)今天GeForce RTX 4080正式發(fā)布時(shí),將已有10款DLSS 3游戲發(fā)布上線,它們是《瘟疫傳說:安魂曲》《光明記憶:無限》《毀滅全人類2:重新探測(cè)》《暗影火炬城》《F1 22》《逆水寒》《生死輪回》《漫威蜘蛛俠:重制版》《微軟模擬飛行》和《超級(jí)人類》。
《WRC Generations》《極品飛車:不羈》和 《戰(zhàn)錘40K:暗潮》在RTX 4080推出后不久就會(huì)發(fā)布,圣誕節(jié)前玩家就可暢玩這些DLSS 3游戲。?
Studio性能測(cè)試
RTX 4080的設(shè)計(jì)創(chuàng)作性能如何?我們從視頻剪輯、3D建模渲染以及圖片處理三個(gè)方面對(duì)RTX 4080 FE進(jìn)行了考察。
在Davinci Resolve Studio 18的視頻剪輯轉(zhuǎn)碼處理測(cè)試中,相比RTX 3080 Ti,RTX 4080在各項(xiàng)測(cè)試中平均性能領(lǐng)先約30%,相比RTX 3090 Ti平均領(lǐng)先約20%。
在Blender模型渲染測(cè)試中,無論是Opendata benchmark還是Bledner 3.1模型渲染,RTX 4080相對(duì)于RTX 3080 Ti都有50%左右的性能提升,相對(duì)于RTX 3090 Ti,性能領(lǐng)先幅度也達(dá)到了35%或更高的程度。
在ON1 Resize AI 2022的圖片縮放處理測(cè)試中,RTX 4080和RTX 3090 Ti的性能差距極其有限,在5%左右,但相對(duì)于RTX 3080 Ti,還是有40%的性能領(lǐng)先幅度。
從整體測(cè)試結(jié)果來看,雖然RTX 4080在Studio設(shè)計(jì)創(chuàng)作性能上相比RTX 4090仍有一定差距,但確實(shí)已經(jīng)明顯勝過了RTX 3090 Ti和RTX 3080 Ti,尤其是相對(duì)于RTX 3080 Ti來說,RTX 4080的設(shè)計(jì)創(chuàng)作性能幾乎達(dá)到了后者的1.5倍甚至更高。
功耗測(cè)試
在RTX 4080 FE的功耗測(cè)試部分,我們想做點(diǎn)不一樣的。
一直以來我們都是用Furmark全滿載烤機(jī)的成績(jī)來作為顯卡功耗的基礎(chǔ)指標(biāo),其實(shí)這樣還是有一些不妥——因?yàn)樗鼪]有代表玩家使用顯卡的真實(shí)情況。我們通常用TGP來表示GPU運(yùn)行功耗的上限限制,對(duì)于高功耗的應(yīng)用,GPU的功耗可能會(huì)達(dá)到TGP的功耗上限,而GPU Boost的時(shí)鐘頻率將在功耗和散熱限制范圍內(nèi)被優(yōu)化。而在GPU受到CPU瓶頸限制的情況下,或GPU正在運(yùn)行輕度工作負(fù)載的情況下,GPU的功耗可能遠(yuǎn)遠(yuǎn)低于TGP。在這些情況下,GPU Boost頻率仍可能達(dá)到設(shè)定的最大值,因此GPU的執(zhí)行效率將達(dá)到最大化。在大多數(shù)工作條件下,包括許多游戲在內(nèi),都只能使RTX 40系列GPU的功耗大大低于TGP。那么在玩家平時(shí)進(jìn)行典型應(yīng)用時(shí),RTX 4080 FE的功耗會(huì)達(dá)到多少呢?在這樣的功耗條件下達(dá)到對(duì)應(yīng)的性能表現(xiàn),誰的能耗比更高?誰的每瓦性能表現(xiàn)更好呢?我們用NVIDIA PCAT功耗測(cè)試套件對(duì)典型應(yīng)用狀況進(jìn)行了測(cè)試。
在1440p分辨率、最高畫質(zhì)、最高光追特效、DLSS 平衡設(shè)置的《賽博朋克2077》游戲中,RTX 4080 FE的實(shí)際游戲運(yùn)行功耗約為250W左右,同比相同狀態(tài)下,RTX 4090的運(yùn)行功耗約為290W、RTX 3090 Ti接近400W,RTX 3080 Ti約為350W。在更低的功耗下,RTX 4080 FE實(shí)現(xiàn)了更高的性能,其能耗比明顯超越RTX 3090 Ti和RTX 3080 Ti許多。
4K分辨率下的情況大致相當(dāng),在4K分辨率下進(jìn)行《賽博朋克2077》游戲時(shí),RTX 4080 FE的功耗大約達(dá)到了280W左右,相比1440p游戲有一定上漲。
8K分辨率下的游戲?qū)PU帶來了較大的負(fù)荷。在這一分辨率下進(jìn)行《賽博朋克2077》游戲時(shí),RTX 4080 FE的功耗達(dá)到了290W以上,但平均功耗仍然低于300W。反觀RTX 3090 Ti,此時(shí)的功耗已經(jīng)達(dá)到了450W以上,即使RTX 3080 Ti的功耗也保持在380W左右。
Furmark烤機(jī)時(shí),各款顯卡基本都能達(dá)到TGP設(shè)定的上限甚至更高。
最后,我們把各個(gè)狀態(tài)下的功耗表現(xiàn)做了一個(gè)總結(jié),來一起看看。
如果我們把3DMark TimeSpy Extreme的測(cè)試分?jǐn)?shù),除以運(yùn)這一程序時(shí)的GPU平均功耗,是不是就能得到一個(gè)每瓦分?jǐn)?shù)的答案?這個(gè)可以近似地用來表示GPU在進(jìn)行DX12游戲時(shí)的每瓦性能。同樣,我們把3DMark PortRoyal的測(cè)試分?jǐn)?shù)除以運(yùn)行它時(shí)的平均功耗,是不是就能近似地得到光追游戲時(shí)的每瓦性能(非絕對(duì)正確的每瓦性能,但具有較大參考意義)?
非常直觀,在代表DX12游戲性能的3DMark TimeSpy Extreme測(cè)試中,RTX 4080 FE的每瓦性能參考指數(shù)約為123.38,是RTX 3080 Ti的1.7倍,是RTX 3090 Ti的2.1倍,換句話說,近似地可以看作RTX 4080 FE在DX 12非光追游戲中的每瓦性能相對(duì)于RTX 3090 Ti達(dá)到了翻倍,而相對(duì)于RTX 3080 Ti則在每瓦游戲性能上提升了70%以上。
再來看光追環(huán)境的情況。在3DMark PortRoyal的測(cè)試中,RTX 4080 FE相對(duì)于RTX 3080 Ti的每瓦光追游戲性能提升了75%,而相對(duì)于RTX 3090 Ti更是提升達(dá)到了90%以上。很明顯可以看出,得益于優(yōu)秀的Ada Lovelace架構(gòu)和TSMC 4N NVIDIA定制工藝的應(yīng)用,RTX 40系GPU的每瓦光追游戲性能有了迅猛的增長(zhǎng),增長(zhǎng)幅度也遠(yuǎn)超過了50%。
哦,最后還有GPU溫度控制。在室溫26℃的環(huán)境下,我們用Furmark對(duì)RTX 4080 FE進(jìn)行了持續(xù)25分鐘的烤機(jī)測(cè)試,最后RTX 4080 FE的核心溫度穩(wěn)定在了62℃上下,由此也足以說明RTX 4080 FE的散熱結(jié)構(gòu)設(shè)計(jì)非常優(yōu)秀,這樣的溫度控制也著實(shí)讓人驚喜。
高性能,低功耗,這才是高端游戲顯卡應(yīng)有的樣子
說實(shí)話,最開始的時(shí)候我們是有想過首發(fā)價(jià)格9499元的RTX 4080 FE應(yīng)該是能夠擁有匹敵RTX 3090 Ti這種前一代頂級(jí)旗艦的降維打擊能力的,不過最后測(cè)試中發(fā)現(xiàn)RTX 4080 FE在一般游戲中都有著超越RTX 3090 Ti 25%以上的性能表現(xiàn)還是多少有那么一丁點(diǎn)意外。所以在測(cè)試了RTX 3090 Ti對(duì)比之后,我們果斷放棄了原本的上一代對(duì)位對(duì)比顯卡RTX 3080,因?yàn)檫@就根本不是同一個(gè)層級(jí)的東西了,而且價(jià)格上也確實(shí)相差太遠(yuǎn)。所以最后選定了價(jià)格定位相對(duì)靠近的RTX 3080 Ti與旗艦頂級(jí)RTX 3090 Ti作為對(duì)比。
從整體的成績(jī)表現(xiàn)來看,我覺得RTX 4080 FE的定位還是比較清晰且準(zhǔn)確的。作為搭配了76組SM單元,9728個(gè)CUDA核心的AD103核心其定位顯然是RTX 40系GPU旗艦族群中的守門員,因此其價(jià)格也達(dá)到了9499元起的地步。從性能測(cè)試的成績(jī)來看,RTX 4080 FE的表現(xiàn)也是完全合格的,在各項(xiàng)測(cè)試中均表現(xiàn)出了超過RTX 3080 Ti 40%以上的性能,相對(duì)于RTX 3090 Ti的性能領(lǐng)先幅度也在25%左右,實(shí)現(xiàn)了大步伐的全面超越。特別要提的是,在DLSS 3的輔助下,RTX 4080 FE的性能甚至相對(duì)于RTX 3080 Ti達(dá)到了100%以上的提升,而且在每瓦性能表現(xiàn)上相對(duì)于RTX 3090 Ti和RTX 3080 Ti都有50%以上的提升。所以對(duì)目前還嫌RTX 4090的價(jià)格太高而難以接受的話,RTX 4080倒是一個(gè)比較合適的頂級(jí)性能選擇,至少它已經(jīng)將RTX 3090 Ti都甩得遠(yuǎn)遠(yuǎn)的,成為了這個(gè)性能段的高性價(jià)比選擇。當(dāng)然,還得希望上市之后不要溢價(jià)太多,如果能保持在萬元左右,那么RTX 4080對(duì)不差錢的玩家來說,毫無疑問將成為頂級(jí)旗艦性能顯卡市場(chǎng)上的最熱門選擇。當(dāng)然,如果預(yù)算還是受限只能眼饞RTX 4080,那就再等等吧!等明年的RTX 4070和RTX 4060,或許又能帶來一波新的驚喜。
編輯:黃飛
?
評(píng)論
查看更多