成人国产第一区在线观看,久久w5ww成w人免费

在當(dāng)前的顯卡市場(chǎng)上，占據(jù)80％的NVIDIA公司被玩家愛(ài)且恨著——他們帶來(lái)了最近十多年來(lái)最好的顯卡，同時(shí)也讓高端游戲卡的價(jià)格高企，發(fā)燒顯卡至少五位數(shù)起。

在RTX 30系列顯卡發(fā)布之后，玩家的不滿似乎釋然了，相比當(dāng)前的圖靈顯卡，安培架構(gòu)的RTX 3090／3080／3070顯卡一下子變得真香了，因?yàn)樗鼈冃阅芊恫徽f(shuō)，國(guó)內(nèi)價(jià)格反而下降了。

·GeForce RTX 3090：取代RTX Titan，相比于Titan RTX快了50％，性能是RTX 2080 Ti顯卡的2倍，配備24GB GDDR6X顯存，售價(jià)11999元，9月24日上市。

·GeForce RTX 3080：取代RTX 2080 Ti，相比于RTX 2080性能快2倍，搭配10GB GDDR6X顯存，海外699美元沒(méi)變，國(guó)內(nèi)從上代6499降至5499元，9月17日上市。

·GeForce RTX 3070：價(jià)格不到RTX 2080 Ti的一半，但是平均性能更高，同時(shí)比RTX 2070快足足60％，配備8GB GDDR6顯存，售價(jià)3899元，10月份上市。

RTX 30系列顯卡售價(jià)及上市時(shí)間

RTX 30系列顯卡性能變化

RTX 30系列顯卡規(guī)格

從這個(gè)規(guī)格表中可以看出，與RTX 2080 Ti顯卡相比，RTX 3090的標(biāo)志性FP32性能從13．4T提升到了35．7T，翻倍還多，光追及AI加速提升也同樣明顯。

與圖靈顯卡相比，安培GPU的變化之大讓人驚訝，在過(guò)去十多年的顯卡升級(jí)換代中，性能翻倍的提升很少見(jiàn)到了，NVIDA是怎么做到的？

今天我們就來(lái)從詳細(xì)解讀一下安培GPU的架構(gòu)，探究它到底帶來(lái)了哪些技術(shù)升級(jí)以致于讓NVIDIA創(chuàng)始人黃仁勛稱之為有史以來(lái)性能提升最大的一次。

先從工藝說(shuō)起：12nm干掉7nm之后 8nm如何再進(jìn)一步

對(duì)于半導(dǎo)體芯片來(lái)說(shuō)，很關(guān)鍵的一部分是制程工藝，先進(jìn)的架構(gòu)也要通過(guò)工藝來(lái)實(shí)現(xiàn)，這是影響芯片能效、性能甚至成本的一大因素。

對(duì)NVIDIA來(lái)說(shuō)，他們的Volta伏特、Turing圖靈兩代架構(gòu)都是臺(tái)積電12nm FFN工藝了，這是臺(tái)積電16nm工藝的改進(jìn)版，如果再算上16nm的Pascal架構(gòu)，實(shí)際上過(guò)去三代GPU都沒(méi)有重大工藝上的升級(jí)了。

在Ampere安培架構(gòu)上，NVIDIA終于升級(jí)工藝了，只不過(guò)這次有兩個(gè)意外——首先沒(méi)有選擇臺(tái)積電，其次沒(méi)有上7nm，而是三星定制的8nm工藝，雖然跟7nm看起來(lái)只差了1nm，但實(shí)際上是兩代工藝。

考慮到NVIDIA之前對(duì)工藝的表態(tài)，沒(méi)用7nm工藝而是三星8nm工藝又在意料之中，最關(guān)鍵的問(wèn)題在于NVIDIA能夠做到多好。

三星的8nm工藝是基于10nm工藝改良的，至少有LPP和LPU兩個(gè)版本，前者適合移動(dòng)SoC，后者適合高性能芯片，NVIDIA的定制大概是基于后者。

與臺(tái)積電的7nm工藝晶體管密度大約1億／mm2相比，8nm工藝大概是6000萬(wàn)晶體管／mm2，但這是單一的SRAM芯片的對(duì)比，實(shí)際上GPU芯片比較復(fù)雜，差距會(huì)縮小很多。

根據(jù)是NVIDIA公布的信息，臺(tái)積電7nm工藝制造的安培A100核心是540億晶體管，核心面積826mm2，而三星8nm工藝制造的GA102核心是280億晶體管，核心面積官方?jīng)]公布，據(jù)悉是628mm2，也是大核心了。

這么算下來(lái)，7nm A100核心的晶體管密度6560萬(wàn)晶體管／mm2，而三星8nm的GA102核心也有4460萬(wàn)晶體管／mm2——差距仍在，但似乎可以接受了。

三星8nm工藝的晶圓代工價(jià)格還是秘密，但是不論技術(shù)還是商業(yè)策略上，三星都會(huì)比臺(tái)積電便宜很多，預(yù)計(jì)代工價(jià)格能差30％或者更高，所以這也是RTX 30系列顯卡能夠不漲價(jià)甚至降價(jià)的關(guān)鍵。

那三星8nm工藝帶來(lái)了多大的性能及能效提升呢？首先大家可以看到RTX 30系列顯卡的頻率提升了，從RTX 20系列的1．5GHz＋提升到了1．7GHz＋，升級(jí)工藝還是有性能提升的。

不過(guò)RTX 20系列的加速頻率實(shí)際可以達(dá)到1．9GHz甚至接近2GHz，RTX 30系列預(yù)計(jì)也就這個(gè)水平。

但是能效還是有提升的，NVIDIA官方稱在60fps性能下，圖靈顯卡的功耗大約有240W，安培顯卡則是120W多點(diǎn)，算下來(lái)是1．9倍能效，提升了90％，同時(shí)溫度還低了3度，噪音減少2分貝。

總的來(lái)說(shuō)，在工藝這方面大家對(duì)安培GPU有驚喜有失望，失望的是沒(méi)有上預(yù)期中的7nm工藝（不管臺(tái)積電還是三星），工藝依然升級(jí)到了8nm。

但是NVIDIA工藝雖然并不算激進(jìn)，但性能、能效進(jìn)步還是挺大的，安培顯卡各方面指標(biāo)都是大幅勝過(guò)現(xiàn)在的圖靈卡，而且價(jià)格做到了不升反降，這也是不追求激進(jìn)工藝的好處，反正之前12nm都能贏，現(xiàn)在上8nm更加穩(wěn)妥了。

安培GPU架構(gòu)詳解之：FP32單元翻倍 CUDA核心改了什么？

發(fā)布安培的時(shí)候，NVIDIA CEO黃仁勛表示這是GPU有史以來(lái)最大的性能飛躍，而2018年推出圖靈GPU時(shí)，老黃也是類似的說(shuō)詞——GPU有史以來(lái)最大的變革，這兩個(gè)評(píng)價(jià)其實(shí)也沒(méi)錯(cuò)。

圖靈GPU架構(gòu)有很多第一次，首次支持RTX Core（光追加速單元），首次支持Tensor Core，同時(shí)還改進(jìn)了CUDA內(nèi)核，不過(guò)前兩個(gè)是重點(diǎn)。

在安培GPU上，RT Core、Tensor Core當(dāng)然繼續(xù)加強(qiáng)，不過(guò)最主要的亮點(diǎn)是CUDA架構(gòu)的改進(jìn)，性能翻倍的根源就在這里，我們先來(lái)看看這方面的變化。

GA102核心架構(gòu)示意圖

GA102核心總計(jì)7組GPC單元，每組有12組SM單元，總計(jì)84組，RTX 30系列顯卡視乎規(guī)格不同啟用的SM單元總數(shù)不同，RTX 3090是82組，RTX 3080是68組，RTX 3070是46組。

在之前的GA100大核心中，每組SM是64個(gè)INT32單元、64個(gè)FP32單元及32個(gè)FP64單元組成的，但在GA102核心中，F(xiàn)P64單元大幅減少，增加了RT Core，Tensor Core也略微減少。

GA102核心的SM單元

按照之前圖靈GPU的路線走，安培GPU的SM單元增加的并不多，但實(shí)際上FP32性能翻倍了還多，算上頻率，RTX 3080的理論性能差不多是RTX 2080的三倍了，這是怎么做到的？

答案就是CUDA核心的FP32翻倍，但翻倍的方式有點(diǎn)特殊，每個(gè)SM單元中有4個(gè)分區(qū)，每個(gè)分區(qū)除了第三代Tensor Core核心之外，還有一組是16個(gè)FP32單元及16個(gè)FP32、16個(gè)IN32組成的單元，后者可以同時(shí)執(zhí)行FP32或者INT32運(yùn)算。

16個(gè)FP32單元每周期可執(zhí)行16個(gè)FP32運(yùn)算，混合的那個(gè)單元可以執(zhí)行32個(gè)FP32或者16個(gè)FP32＋16個(gè)INT32。

如此一來(lái)，每個(gè)SM單元可以同時(shí)執(zhí)行4x（16FP32＋16FP32）＝128個(gè)FP32運(yùn)算，或者4x（16FP32＋16INT32）＝64個(gè)FP32＋64個(gè)INT32運(yùn)算。

只算FP32浮點(diǎn)的話，那么就是浮點(diǎn)翻倍了，因?yàn)閳D靈以及GA100都是每周期64個(gè)FP32浮點(diǎn)而已，現(xiàn)在可以做128個(gè)FP32運(yùn)算了。

提升FP32性能不論對(duì)游戲還是運(yùn)算都大有裨益，但也需要配套的提升，GA102的L1容量提升了33％，L1帶寬從116GB／s翻倍到219GB／s，共享內(nèi)存的性能也從每周期64B翻倍到128B。

審核編輯：符乾江

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

IC設(shè)計(jì)

IC設(shè)計(jì)

+關(guān)注

關(guān)注
38

文章
1297

瀏覽量
103994
NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4990

瀏覽量
103119
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4742

瀏覽量
128973

評(píng)論

相關(guān)推薦

芯片封裝工藝詳細(xì)講解

芯片封裝工藝詳細(xì)講解

發(fā)表于 11-29 14:02 ?1次下載

NVIDIA RTX AI Toolkit擁抱LoRA技術(shù)

在 RTX AI PC 和工作站上使用最新版 RTX AI Toolkit 微調(diào) LLM，最高可將性能提升至原來(lái)的 6 倍。

發(fā)表于 11-20 09:14 ?278次閱讀

<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> AI Toolkit擁抱LoRA技術(shù)

AMD與NVIDIA GPU優(yōu)缺點(diǎn)

，NVIDIA的RTX系列顯卡以其強(qiáng)大的光線追蹤和DLSS技術(shù)領(lǐng)先于市場(chǎng)。例如，NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲

發(fā)表于 10-27 11:15 ?734次閱讀

NVIDIA RTX AI套件簡(jiǎn)化AI驅(qū)動(dòng)的應(yīng)用開(kāi)發(fā)

NVIDIA 于近日發(fā)布 NVIDIA RTX AI套件，這一工具和 SDK 集合能夠幫助 Windows 應(yīng)用開(kāi)發(fā)者定制、優(yōu)化和部署適用于 Windows 應(yīng)用的 AI 模型。該套件免費(fèi)提供，不要求使用者具備 AI 框架和開(kāi)發(fā)

發(fā)表于 09-06 14:45 ?455次閱讀

《黑神話：悟空》潮流來(lái)了！Nvidia GPU 合作伙伴推出八款全新 RTX 40 Super 顯卡

ABSTRACT摘要Nvidia合作伙伴推出了八款采用“黑神話：悟空”品牌的全新RTX40Super顯卡。包括技嘉、MSI和Zotac在內(nèi)的AIB正在慶祝這款受中國(guó)神話影響的動(dòng)作角色扮演游戲的發(fā)布

發(fā)表于 08-30 12:50 ?363次閱讀

《黑神話：悟空》潮流來(lái)了！<b class='flag-5'>Nvidia</b> GPU 合作伙伴推出八款全新 <b class='flag-5'>RTX</b> 40 Super 顯卡

新款Nvidia Titan GPU正在開(kāi)發(fā)中？或?qū)魯∥窗l(fā)布的RTX 5090

ABSTRACT摘要最近有消息透露，NVIDIA正在開(kāi)發(fā)一款名為T(mén)ITANAI的新顯卡。該顯卡基于即將推出的BlackwellGPU。在Nvidia選擇不發(fā)布其RTX40系列

發(fā)表于 07-26 08:26 ?511次閱讀

新款<b class='flag-5'>Nvidia</b> Titan GPU正在開(kāi)發(fā)中？或?qū)魯∥窗l(fā)布的<b class='flag-5'>RTX</b> 5090

Nvidia 再推出特供版顯卡 GeForce RTX 5090D

ABSTRACT摘要NVIDIA正在準(zhǔn)備另一款“D”版本RTX5090D，這將成為國(guó)內(nèi)市場(chǎng)的旗艦GeForceRTX50系列顯卡。JAEALOT2024年7月4日NVIDIA正在準(zhǔn)備另

發(fā)表于 07-19 08:26 ?565次閱讀

<b class='flag-5'>Nvidia</b> 再推出特供版顯卡 GeForce <b class='flag-5'>RTX</b> 5090D

NVIDIA推出用于支持在全新GeForce RTX AI筆記本電腦上運(yùn)行的AI助手及數(shù)字人

NVIDIA 宣布推出全新 NVIDIA RTX?技術(shù)，用于支持在全新 GeForce RTX AI 筆記本電腦上運(yùn)行的 AI 助手及數(shù)字人。 ?

發(fā)表于 06-04 10:19 ?790次閱讀

RTX 5880 Ada Generation GPU與RTX? A6000 GPU對(duì)比

NVIDIA RTX? 5880 Ada Generation GPU 是目前國(guó)內(nèi)重量級(jí) GPU，基于全新 NVIDIA Ada Lovelace 架構(gòu)構(gòu)建，采用 4nm 制成工藝，擁

發(fā)表于 04-19 10:20 ?1848次閱讀

NVIDIA發(fā)布兩款新的專業(yè)顯卡RTX A1000、RTX A400

NVIDIA今天發(fā)布了兩款新的專業(yè)顯卡RTX A1000、RTX A400，從編號(hào)就能看出來(lái)定位入門(mén)級(jí)，而且架構(gòu)并非最新的Ada Lovelace，還是上一代的Ampere。

發(fā)表于 04-18 11:35 ?2261次閱讀

英偉達(dá)發(fā)布兩款A(yù)mpere架構(gòu)專業(yè)可視化GPU：RTX A400與RTX A10

RTX A400和RTX A1000旨在替代2021年發(fā)布的T1000和T400，以及T600，成為英偉達(dá)最后三款未納入NVIDIA RTX命名體系的專業(yè)可視化GPU產(chǎn)品。

發(fā)表于 04-17 16:27 ?1087次閱讀

NVIDIA RTX 5090痛失512位顯存！

NVIDIA有望在今年底或明年初發(fā)布下一代RTX 50系列顯卡，大概率首發(fā)配備新一代GDDR7顯存，但是顯存位寬和之前的說(shuō)法不太一樣。

發(fā)表于 03-11 16:02 ?862次閱讀

英偉達(dá)RTX 50系列顯卡將采用PCIe Gen 6 16-Pin供電技術(shù)

據(jù)報(bào)道，在Moore‘s Law is Dead播客節(jié)目最新的一期中，主持人Tom透露了NVIDIA GeForce RTX 50系列顯卡將會(huì)配置為原生PCIe Gen 6 16 Pin電源接口。

發(fā)表于 02-19 14:16 ?1416次閱讀

RTX 4070 Ti SUPER詳細(xì)評(píng)測(cè)

2024年1月9日，NVIDIA發(fā)布了GeForce RTX 40 SUPER系列顯卡，包括RTX 4070 SUPER、RTX 4070

發(fā)表于 01-29 10:31 ?3913次閱讀

英偉達(dá)發(fā)布RTX 40 SUPER系列顯卡

在剛剛結(jié)束的CES 2024上，GPU巨頭英偉達(dá)正式推出了全新的RTX 40 SUPER系列顯卡，包括RTX 4080 SUPER、RTX 4070 Ti SUPER和

發(fā)表于 01-22 16:09 ?927次閱讀