?? Apple在上月底宣布了新一代的M3系列處理器,同時(shí)也推出了新款MacBook Pro。而本次Apple選擇一次性推出幾乎所有產(chǎn)品系列,同時(shí)推出了基于標(biāo)準(zhǔn)M3以及更強(qiáng)大的M3 Pro和M3 Max SoC的產(chǎn)品。這些產(chǎn)品是基于TSMC的N3B工藝制造的,Apple旨在再次提高CPU和GPU的性能,并在單個(gè)筆記本SoC中使用的晶體管數(shù)量上創(chuàng)下了新紀(jì)錄。
? M3系列搭載于新款MacBook Pro以及24英寸iMac。但這些設(shè)備沒有任何外部設(shè)計(jì)或功能更改(尺寸、端口和部件都與之前相同),因此內(nèi)部更新就跟顯得直接。因此,這些新產(chǎn)品發(fā)布的亮點(diǎn)是新的M3系列SoC及其帶來的功能和性能。 ? Apple利用其最新一代用于Mac(毫無疑問,也用于高端iPad)的高性能芯片,似乎正在充分利用TSMC N3B工藝提供的密度和功率提升。但同時(shí),他們也在改變SoC的配置方式。尤其是M3 Pro,在某些方面與其前代產(chǎn)品有顯著的不同。所以,盡管M3芯片本身并不算“開創(chuàng)性”,但這里有一些重要的變化值得我們關(guān)注。 ?
首先,讓我們來看看三款M3芯片的規(guī)格。這三款芯片在一個(gè)月內(nèi)相繼發(fā)布(嚴(yán)格來說M3 Max設(shè)備要到11月中旬才上市),這是迄今為止最雄心勃勃的一次M系列芯片的發(fā)布。通常,Apple會(huì)從小型設(shè)備開始,逐步升級(jí)(比如先發(fā)布M2,然后再推出Pro和Max型號(hào)),但這次我們一次性得到了所有配置的芯片。 ?
不過,Apple在產(chǎn)量方面也開始縮小規(guī)模。Apple使用這些新款芯片來更新MacBook Pro系列和一款iMac,這些是Apple產(chǎn)品中較昂貴的產(chǎn)品(普遍被認(rèn)為是低產(chǎn)量的)。這與先從MacBook Air和其他更便宜的設(shè)備開始完全不同,后者需要大量的入門級(jí)芯片。這很可能是因?yàn)橄馧3B這樣的前沿節(jié)點(diǎn)(Apple是為數(shù)不多的客戶之一),初期可能會(huì)有些產(chǎn)量和產(chǎn)能瓶頸。當(dāng)然,Apple永遠(yuǎn)不會(huì)承認(rèn)這一點(diǎn)。無論如何,他們在這一代產(chǎn)品的芯片發(fā)布策略上采取了從更昂貴設(shè)備開始的方式。 ?
這三款芯片共享一個(gè)通用架構(gòu),并且從廣義上講,是該架構(gòu)的升級(jí)版本,具有更多的內(nèi)核、更多的I/O和更多的內(nèi)存通道。最小的芯片M3,以250億個(gè)晶體管開始(比M2多出50億個(gè)),而最高端的M3 Max則擁有高達(dá)920億個(gè)晶體管。雖然Apple提供了芯片照片(在當(dāng)今行業(yè)中這是非常罕見的),但他們并未提供芯片尺寸,因此我們需要等到設(shè)備發(fā)貨后才能看到這些芯片尺寸的實(shí)際大小。 ? 除了3nm工藝之外,Apple官方?jīng)]有公開其它的具體工藝,但鑒于TSMC唯一可用于這類高產(chǎn)量生產(chǎn)的3nm生產(chǎn)線是N3B,所以我們可以非常確定M3系列使用的是N3B,A17也采用了這一工藝。根據(jù)TSMC的官方數(shù)據(jù),N3B提供了極高的晶體管密度,特征尺寸減少了42%,等效功率減少了大約25%。即便如此,尤其是M3 Max,也是一個(gè)非常龐大的芯片。
? 在其他方面,Apple似乎沒有對(duì)其支持的內(nèi)存類型進(jìn)行任何更改。Apple的帶寬數(shù)據(jù)在幾個(gè)案例中與M2系列數(shù)據(jù)相同,這表明他們?nèi)栽谑褂肔PDDR5-6400內(nèi)存。這有點(diǎn)令人驚訝,因?yàn)楦斓腖PDDR5X內(nèi)存已經(jīng)隨處可得,而且Apple以GPU為重的設(shè)計(jì)通常會(huì)從額外的內(nèi)存帶寬中受益匪淺。此時(shí)的大問題是,這是否是因?yàn)榧夹g(shù)限制(例如Apple的內(nèi)存控制器不支持LPDDR5X?),或者Apple有意決定堅(jiān)持使用常規(guī)LPDDR5。 ?
M3 CPU架構(gòu):速度更快?
在架構(gòu)方面,遺憾的是,Apple對(duì)于M3系列SoC中使用的CPU和GPU架構(gòu)的表述相當(dāng)含糊。事實(shí)上,Apple一整年對(duì)相關(guān)信息進(jìn)行了更嚴(yán)密的控制。即使到現(xiàn)在,我們也不知道用于A17 SoC的CPU內(nèi)核的代號(hào)。 ? 無論如何,鑒于Apple在A系列和M系列芯片之間共享CPU架構(gòu),我們無疑之前已經(jīng)見過這些CPU內(nèi)核。問題是我們是在看A17 SoC最近推出的CPU內(nèi)核,還是A16的CPU內(nèi)核(Everest和Sawtooth)。A17更有可能,尤其是因?yàn)锳pple已經(jīng)擁有了N3B的工作IP。但嚴(yán)格來說,我們目前沒有足夠的信息來排除是否是A16 CPU內(nèi)核;特別是因?yàn)锳pple沒有提供關(guān)于M3系列CPU內(nèi)核相較于M2架構(gòu)的改進(jìn)的任何指導(dǎo)。 ?
我們目前所知的是,與M2系列相比,Apple宣稱其性能核的性能提升了約15%,與M1相比提升了30%。Apple沒有公開用于做出這一判斷的benchmark或設(shè)置,因此我們無法對(duì)這個(gè)估計(jì)的現(xiàn)實(shí)性做出太多評(píng)論?;蛘哒f,這種提升多少是來自于IPC提升還是時(shí)鐘頻率提升。 ?
與此同時(shí),能效核也得到了改進(jìn),據(jù)Apple稱,其提升幅度超過了性能核。M3系列的能效核比M2快30%,比M1快50%。 ? Apple在其網(wǎng)站上發(fā)布了特定應(yīng)用的benchmark,盡管這些是系統(tǒng)級(jí)別的測試。其中許多混合了CPU和GPU的性能提升。這些測試對(duì)于那些應(yīng)用的用戶來說肯定是相關(guān)的,但它們并沒有告訴我們太多關(guān)于CPU內(nèi)核本身的信息。 ?
Apple同樣模糊的性能/功耗曲線也在很大程度上重申了這些聲明,同時(shí)確認(rèn)了性能/功耗曲線變得更加平緩的長期趨勢正在持續(xù)。例如,Apple聲稱M3能以M1一半的功耗提供相同的CPU性能;但在等效功耗下,峰值性能只提高了約40%。 ? 連續(xù)幾代的工藝持續(xù)降低了從等效性能的角度來看的功耗,但它們在提高時(shí)鐘速度方面做得相對(duì)較少。這使得通過提高時(shí)鐘速度獲得持續(xù)性能增益在功耗方面相對(duì)昂貴,這反過來又促使芯片供應(yīng)商整體增加了功耗。即使是M3也無法避免這一點(diǎn),根據(jù)蘋果的圖表,其峰值功耗高于M1。
? M3 GPU架構(gòu):Mesh Shading和Ray Tracing
在GPU方面,M3系列包含了更實(shí)質(zhì)性的GPU架構(gòu)更新。雖然Apple對(duì)GPU架構(gòu)的基本組織沒有透露太多,但從功能角度來看,新架構(gòu)為Apple平臺(tái)帶來了一些重大的新功能:Mesh Shading和Ray Tracing。 ? 這些功能也是隨Apple A17 SoC一同為iPhone 15 Pro系列引入的,幾乎可以肯定這是該架構(gòu)更大規(guī)模的實(shí)現(xiàn),就像在之前的幾代產(chǎn)品中一樣。由于我們在這里討論的是筆記本和臺(tái)式機(jī),這些功能將使M3 GPU在功能上大致與Nvidia/AMD/Intel最新的獨(dú)立GPU設(shè)計(jì)相當(dāng),后者在幾年前就已經(jīng)提供類似功能了。在Windows術(shù)語中,M3 GPU架構(gòu)將是一個(gè)DirectX 12 Ultimate級(jí)別(feature level 12_2)的設(shè)計(jì),使Apple成為第二個(gè)在筆記本SoC中提供如此高功能集成GPU的廠商。 ? Ray Tracing幾乎不需要介紹,因?yàn)檎麄€(gè)GPU/圖形行業(yè)在過去五年里一直在大力推廣這種更加物理準(zhǔn)確的渲染形式。另一方面,Mesh Shading不太為人所知,因?yàn)樗岣吡虽秩?a href="http://wenjunhu.com/tags/pi/" target="_blank">pipeline的效率,而不是解鎖新的圖形效果。然而,它的重要性不應(yīng)被低估。Mesh Shading徹底顛覆了整個(gè)幾何渲染pipeline,允許在可用的幀率下實(shí)現(xiàn)更多的幾何細(xì)節(jié)。這是一個(gè)“基線”功能(開發(fā)者需要圍繞它設(shè)計(jì)他們引擎的內(nèi)核),所以最初的采用不會(huì)太多,但最終它將成為一個(gè)決定性的功能,作為與M3之前GPU兼容性的分水嶺。這是我們今天已經(jīng)可以在PC上看到的,比如最近發(fā)布的《Alan Wake II》等游戲。 ?
這一代GPU還引入了一種新的內(nèi)存管理功能/策略,蘋果稱之為“動(dòng)態(tài)緩存”。根據(jù)Apple產(chǎn)品展示中的有限描述,看來Apple已經(jīng)開始更好地控制和分配GPU使用的內(nèi)存,防止其分配的內(nèi)存超出實(shí)際需求。GPU過度分配內(nèi)存是常見的,但這是非常浪費(fèi)的,尤其是在統(tǒng)一內(nèi)存平臺(tái)上。因此,正如Apple所說,“每項(xiàng)任務(wù)只使用所需的確切內(nèi)存量”。 ?
值得注意的是,這項(xiàng)功能對(duì)開發(fā)者是透明的,并且完全在硬件層面上操作。因此,無論Apple在底層做了什么,它都被從開發(fā)者和用戶那里抽象出來。盡管如此,用戶最終將從更多的可用RAM中受益,這對(duì)于M3版Macbook Pro的最低配8GB RAM來說,無疑是好消息。
? 然而,更令人好奇的是,Apple聲稱這還將提高GPU性能。具體來說,動(dòng)態(tài)緩存將“顯著”提高GPU的平均利用率。目前還不清楚內(nèi)存分配和GPU利用率之間的關(guān)系,除非Apple是針對(duì)由于缺乏RAM而不得不不斷交換到存儲(chǔ)的邊緣案例。無論如何,Apple認(rèn)為這個(gè)功能是新GPU架構(gòu)的基石,并在未來值得更仔細(xì)的觀察。
? 然而,在性能方面,Apple提供的指導(dǎo)非常有限。在過去的幾代產(chǎn)品中,至少為其GPU提供了一個(gè)通用的計(jì)算吞吐量數(shù)字,比如M2 GPU的5.6 TFLOPS。但對(duì)于M3 GPU,我們并沒有得到這樣的吞吐量數(shù)據(jù)。因此,至少可以說,目前還不清楚這些GPU在現(xiàn)有應(yīng)用/游戲中可能會(huì)多快。Apple在其產(chǎn)品頁面上引用了2.5倍的數(shù)據(jù),但查看注釋,這是Redshift使用硬件RT(M3)與軟件RT(其他所有)的比較。 ?
在最佳情況下,Apple在其演示中展示了一張GPU性能/功耗曲線圖,將M3與M1進(jìn)行了比較。Apple再次聲稱,在等效性能下,M3的功耗是M1的一半。同時(shí),在等效功耗下(峰值M1,約12.5W),性能提高了約50%。但M3的GPU功耗限制也顯著提高,達(dá)到大約17W。這確實(shí)解鎖了更高的性能,但同樣需要更多功耗,且沒告訴我們M3 GPU與M2相比如何。 ?
M3 NPU:速度略快,但架構(gòu)未更新?
最后,讓我們快速了解一下M3的NPU。從高層次來看,這次仍是一個(gè)16核設(shè)計(jì)。Apple聲稱它提供18 TOPS的性能,比M2的NPU快約14%(Apple的官方數(shù)據(jù)顯示為15%,很可能是四舍五入)。所有三款M3芯片似乎都有相同的16核的NPU設(shè)計(jì),因此應(yīng)該都具有類似的性能。
這個(gè)18 TOPS的數(shù)據(jù)引起了一些疑問。正如Ian Cutress博士指出的,18 TOPS實(shí)際上比A17 SoC中的NPU慢,Apple給出的A17的NPU性能是35 TOPS。
那么,究竟發(fā)生了什么?
在A17 SoC發(fā)布時(shí),Apple開始引用INT8性能數(shù)據(jù),與我們認(rèn)為之前NPU版本(A系列和M系列)使用的INT16/FP16數(shù)據(jù)相比。該格式的較低精度允許以更高速率處理(以精度換取吞吐量),因此得出了更高的數(shù)據(jù)。
這里的18 TOPS數(shù)據(jù)顯然是INT16/FP16性能,因?yàn)檫@與過去M系列的說法以及Apple自己的圖表一致。然后,留下的問題是,鑒于INT8是最近才為A17添加的,M3中的NPU是否支持INT8。要么它確實(shí)支持INT8,這種情況下Apple在這里的信息傳遞存在困難;要么它是一個(gè)較老的NPU架構(gòu)版本,不支持INT8。
這種差異總體上更像是一個(gè)好奇點(diǎn)而非一個(gè)問題。但看看Apple是否保持了其A系列和M系列NPU架構(gòu)的一致性,或者我們在這一代產(chǎn)品中是否看到了分歧,肯定是挺有意思的。
M3?vs M2 vs M1
回到速度和性能規(guī)格上,看每一級(jí)別M系列處理器的規(guī)格表,與它們的直接前代產(chǎn)品進(jìn)行下比較。這有助于更好地說明M系列芯片隨著時(shí)間的推移在內(nèi)核數(shù)量、性能、內(nèi)存支持和I/O方面是如何發(fā)展的。
標(biāo)版M系列是該系列中最直接的。作為M系列芯片中的首款產(chǎn)品,Apple不斷提升芯片的能力和性能。但他們并沒有在功能模塊/內(nèi)核方面增加太多。現(xiàn)在進(jìn)入了第三代,我們看到的仍然是4P+4E的CPU設(shè)計(jì),而GPU從第一代的8核增長到了M2和M3的10核。
為這個(gè)小野獸提供動(dòng)力的是一個(gè)持續(xù)的128位內(nèi)存總線。由于Apple在這一代M系列中沒有采用LPDDR5X,內(nèi)存帶寬與M2保持不變,最多可達(dá)24GB的LPDDR5-6400,允許100GB/秒的總內(nèi)存帶寬。
芯片的I/O也在各代產(chǎn)品中保持不變。M3能夠驅(qū)動(dòng)兩個(gè)40Gbps的USB4/Thunderbolt端口,與M2和M1相同。此外,它仍然只支持兩個(gè)顯示器,內(nèi)部顯示器和一個(gè)外部顯示器。
盡管內(nèi)核數(shù)量沒有增加,但跨代產(chǎn)品的晶體管數(shù)量繼續(xù)增長,因?yàn)樾鹿δ芎透鼜?fù)雜的內(nèi)核設(shè)計(jì)占用了更多的晶體管預(yù)算。M3擁有250億個(gè)晶體管,比M2多出25%,或比M1多出56%。
然而,M3 Pro的發(fā)展路徑更加有趣。與M2 Pro相比,M3 Pro在配置上有一些顯著的不同,而且在晶體管數(shù)量上并沒有像其他芯片那樣增長。
從CPU內(nèi)核開始,盡管M3 Pro像M2 Pro一樣共有12個(gè)CPU核,但性能核和能效核之間的平衡已經(jīng)發(fā)生了變化。具體來說,它從8P+4E設(shè)計(jì)變成了6P+6E設(shè)計(jì)。雖然所有CPU核的總體性能都比M2的內(nèi)核更高,但這就是為什么Apple官方的性能數(shù)據(jù)顯示,配備M2 Pro的MacBook Pro在CPU性能上只有微弱提升的原因。對(duì)于重度多線程工作負(fù)載,計(jì)算硬件實(shí)際上并沒有增加。
GPU內(nèi)核數(shù)量也有所下降。M3架構(gòu)GPU提供18個(gè)內(nèi)核,而M2 Pro提供19個(gè)內(nèi)核。這與普通的M3或M3 Max相反,后者要么保持不變,要么分別略微增加了GPU內(nèi)核數(shù)量。
最后,這一切的原因是一個(gè)明顯較小的內(nèi)存總線。M1 Pro和M2 Pro都配備了256位的LPDDR5內(nèi)存總線,當(dāng)使用LPDDR5-6400時(shí),為SoC提供了200GB的總內(nèi)存帶寬。然而,在M3 Pro上,Apple顯然將內(nèi)存總線削減到了192位寬(減少了四分之一的內(nèi)存總線),這反過來又將內(nèi)存帶寬減少了25%,降至150GB/秒。
這些變化的組合意味著,從高層次來看,M3 Pro更像是一個(gè)比普通M3更強(qiáng)大的版本,而不是一個(gè)縮減版的M3 Max。但總體而言,性能核與能效核的平衡比例更接近M3的設(shè)計(jì),內(nèi)存帶寬也是如此。M3 Pro應(yīng)該仍然比M3快很多,但在某些領(lǐng)域,它可能在性能上與M2 Pro相比只是一種側(cè)面升級(jí)。
Apple在M3 Pro上采取的更為保守的立場也反映在其晶體管數(shù)量上。M3 Pro的晶體管數(shù)量實(shí)際上比M2代降低了,從400億降至370億。因此,不論使用的是哪種工藝節(jié)點(diǎn),這總體上是一個(gè)更簡單的芯片。與M1 Pro相比,兩代產(chǎn)品中晶體管數(shù)量的增長僅約10%。
至于為什么Apple沒有像其他M3 SoC那樣增加M3 Pro的規(guī)模,目前任何說法都是猜測。但從根本上來說,由于晶體管數(shù)量較少和芯片尺寸較小,M3 Pro應(yīng)該比M2 Pro更生產(chǎn)成本更低。N3B的產(chǎn)量可能在這里有一定影響因素(產(chǎn)量較低等于芯片的實(shí)際成本更高),但只有TSMC和Apple知道這是否確實(shí)如此。
功耗也可能是一個(gè)因素,特別是在CPU內(nèi)核重新平衡的情況下。8個(gè)性能核確實(shí)可以提供出色的性能,但它們肯定會(huì)增加功耗。Max SoC在某種程度上可以擺脫這個(gè)問題,因?yàn)樗鼈兪琼斉湫酒?,也用于高端臺(tái)式機(jī),并且主要面向臺(tái)式機(jī)替代類筆記本電腦的用戶。但對(duì)于更多Mac用戶來說,Apple可能在通過限制性能增長來控制功耗方面做出了努力。
出于這些原因,看看評(píng)測benchmark會(huì)如何展開將會(huì)很有趣。雖然這不太可能是Apple會(huì)講述的故事,但他們筆記本的性能和功耗應(yīng)該能夠替他們說出很多故事。
最后,我們來看看M系列產(chǎn)品線中最大、最強(qiáng)的產(chǎn)品,Max系列。Max一直在內(nèi)核數(shù)量和晶體管數(shù)量上推動(dòng)極限,M3 Max延續(xù)了這一傳統(tǒng)。
與其M2前代相比,Apple在這里增加了另外4個(gè)性能核,總數(shù)達(dá)到12個(gè)性能核和4個(gè)能效核。這使它成為唯一一個(gè)性能核數(shù)量增加的M3系產(chǎn)品。因此,至少在良好的熱條件下,它應(yīng)該是唯一一個(gè)在多線程CPU性能上看到顯著提升的M3芯片。盡管“良好的熱條件”確實(shí)是關(guān)鍵,因?yàn)檫@是一個(gè)非常強(qiáng)大的、需要冷卻的芯片。
在GPU方面,GPU核數(shù)量略有增加,從M2 Max的38核增加到M3 Max的40核。由于Apple沒有提供的可參考的相關(guān)性能數(shù)據(jù),很難估計(jì)這在實(shí)踐中會(huì)快多少。
驅(qū)動(dòng)M3 Max的是與前兩代芯片相同的512位LPDDR5內(nèi)存總線。值得注意的是,這意味著Apple可用的內(nèi)存帶寬在過去兩代產(chǎn)品中沒有增加,以跟上CPU和GPU內(nèi)核數(shù)量的增加,因此Apple需要從其芯片架構(gòu)中提取更多的效率(和緩存hits中)來保證SoC得到充分供應(yīng)。
從Apple官方提供的芯片照片來看,我們可以看到Apple再次使用了他們定制的x128組織LPDDR5內(nèi)存芯片,使他們能夠僅通過4個(gè)芯片連接一個(gè)512位的內(nèi)存總線。這一代產(chǎn)品的最大內(nèi)存容量已經(jīng)增加到128GB,這對(duì)這些內(nèi)存芯片中使用的die有著有趣的影響。除非Apple正在進(jìn)行一些真正瘋狂的事情,否則獲得128GB LPDDR5的唯一方法是使用32Gbit LPDDR5芯片(總共32個(gè))。我不知道目前有誰在提供這樣容量的芯片,因此看來Apple已經(jīng)獲得了該內(nèi)存供應(yīng)商的首發(fā)權(quán)。對(duì)于其他公司來說,我們應(yīng)該看到明年晚些時(shí)候在Windows筆記本上提供128GB LPDDR5(X)配置。
隨著CPU內(nèi)核、GPU內(nèi)核的增加,以及芯片各種構(gòu)建模塊復(fù)雜性的普遍增加,M3 Max的總晶體管數(shù)量已經(jīng)增加到920億個(gè)。這比M2 Max多出了37%,甚至比Nvidia基于TSMC N4工藝的GH100服務(wù)器GPU多出15%(120億個(gè))?;贜3B構(gòu)建的M3 Max應(yīng)該明顯更小(低于400mm2?),但按照筆記本SoC標(biāo)準(zhǔn),這仍然是一個(gè)巨大的芯片,更不用說如果Apple把兩個(gè)這樣的芯片放在一起形成Ultra配置會(huì)發(fā)生什么。Apple支付給TSMC的費(fèi)用肯定價(jià)格不菲,但又有多少其他公司在筆記本的SoC上設(shè)計(jì)比服務(wù)器芯片還要多的晶體管呢?
M3 Macbook Pro???????????
總結(jié)一下,我們將很快看到M3芯片實(shí)際運(yùn)行的情況。目前M3和M3 Pro已經(jīng)開始交付。
與此同時(shí),M3 Max的交付時(shí)間稍晚一些,Apple表示預(yù)計(jì)會(huì)在11月稍晚時(shí)候到貨。
此時(shí),M2 Pro和M2 Max的筆記本,以及基于M2的13英寸MacBook Pro已經(jīng)停產(chǎn),因此這看起來將是筆記本方面非常迅速的過渡。Apple仍在其臺(tái)式機(jī)部件中使用M2 Pro/Max芯片,例如Mac Studio,但由于所有M3芯片已經(jīng)上市,Apple升級(jí)其臺(tái)式機(jī)產(chǎn)品線只是時(shí)間問題。
編輯:黃飛
?
評(píng)論
查看更多