在學校上課的時候一般習慣帶著電腦去教室,選用輕薄的辦公本或者 Mac整天帶著到處跑。但從校園跨入社會后突然發(fā)現(xiàn)辦公場景慢慢從移動辦公轉為固定場所的辦公,公司因為保密等原因不能帶私人電腦進公司,在家用辦公本性能又不夠用,甚至由于寫代碼的原因,電腦性能需要同時支持4K屏游戲+2K屏視頻工作,直播,于是對于新機器性能的高要求促使我要在現(xiàn)存市場找到一款高性能的主機設備。
思考再三,顧及到辦公桌被兩個顯示器占滿的空間,開始尋找輕量級高性能的主機設備,最后將視線落到了英特爾NUC12蝰蛇峽谷(Serpent Canyon)上來。NUC全稱為Next Unit of Computing,是英特爾2013年推出的迷你主機,寓意下一世代主機。特點是外形小巧,在超迷你電腦這一塊,Intel NUC一直都是業(yè)界標桿。
機器的CPU選的是i7-12700H,采用了6大核8小核的設計,實現(xiàn)了14核20線程的超高規(guī)格。這是一款采用了intel 10nm工藝的最新處理器,采用 BGA1744的 Alder Lake-H 架構,基準頻率為2.69GHz,最大睿頻可達4.7GHz,而小核的最大睿頻可達3.5GHz,TDP為45W,最大可配置為115W,三級緩存高達24MB。
顯卡方面的Arc A770M采用的ACM-G10核心,基于臺積電N6 6nm制程工藝,集成32個Xe核心,擁有4096個流處理器,256個紋理單元、128個ROP單元。
NUC12蝰蛇峽谷在極其有限的空間內,集成了i7-12000H處理器和Arc A770M 16GB獨顯這樣的高性能硬件。此外,該 NUC 提供兩個 DDR4-3200 SO-DIMM 內存插槽,最大容量 64GB,可選傲騰內存加速。兩個 M.2 2280 PCIe 4.0 x4 SSD 插槽,一個 M.2 2280 PCIe 3.0 x4/SATA SSD 插槽,提供的這些擴展接口能夠大大滿足日常使用的辦公與游戲需求。從外觀上看,NUC12蝰蛇峽谷的寬度與茶杯一致,拋棄掉厚重的機箱,將整臺主機濃縮到短小精悍的設備中。主機的側面與頂部提供整片的散熱孔,在運行過程中沒有散熱產(chǎn)生的噪聲,而且設備溫度也保持在比較穩(wěn)定的水平。
此外,最讓我看中的是英特爾 Arc A770M GPU 擁有 16 GB GDDR6 顯存,通過針對游戲和最新視覺技術優(yōu)化的新微架構提升游戲性能,包括 AI 增強升級、實時光線追蹤和對 DirectX 12 Ultimate 的全面支持。
由于職業(yè)習慣,在了解到機器擁有的大顯存后開始思考能不能在機器上部署跑深度學習相關的任務。事實上,目前A卡雖然不能使用cuda,但是也提供了一整套開源的ROCm(Radeon Open Compute)框架,相比于CUDA,ROCm擁有比更強的包容性和開放性。和CUDA只能在特定型號的NVIDIA GPU上運行不同,ROCm希望能在各種不同的硬件上運行。
首先安裝好 Ubuntu的操作系統(tǒng)和 AMD ROCm 平臺,配置好GPU訪問權與PATH環(huán)境變量,再通過 Docker 部署好 ROCm 版的 PyTorch 后就可以運行 PyTorch 代碼進行使用了,由于ROCm的PyTorch并沒有完全在每種GPU上支持PyTorch的全部CUDA函數(shù),小部分很有可能通過不了。
在部署完環(huán)境后就開始測試,我們選用 OpenVINO 用來部署訓練模型做推理。OpenVINO是一個Pipeline工具集,同時可以兼容各種開源框架訓練好的模型,擁有算法模型上線部署的各種能力,只要掌握了該工具,你可以輕松的將預訓練模型在Intel上快速部署起來。
選擇部署 YOLO v5來測試深度學習環(huán)境,把訓練好的模型文件可視化看看,通過Netron,查看yolov5s.onnx模型的輸入和輸出。
通過 OpenVISO 加載 YOLO v5 的模型后進行性能測試:
Inference 的速度大概在8-10 ms 左右,證明在該設備上能穩(wěn)定、高效的運行模型,等再體驗一段時間后試試對最近大火的 stable diffusion 進行嘗試。接下來還是先通過3DMark測試來確認其性能表現(xiàn)。測試模式為CPU Profile、Speed Way以及3DMark新增的Intel XeSS。CPU Profile 涉及的是一個名為“Boids”,也就是類鳥群體的計算框架,這個框架很容易被并行化計算,因此較為適合考察單線程到多線程的性能變化情況。Speed Way GPU 基準測試程序,使用光線追蹤和實時全局照明來渲染逼真的照明和反射,支持 DirectX 12 Ultimate 功能來優(yōu)化性能和視覺質量,而XeSS則是針對英特爾XeSS超采樣技術的專項測試。
3DMark CPU Profile的最大線程成績,代表了CPU在使用所有可用的線程時的全部性能潛能。對應的實際使用情況是在游戲之外的極其繁重的多線程工作負載中,例如電影質量的渲染、模擬和科學分析這些應用場景。而16線程成績,代表了需要密集計算的任務下處理器的能力,例如數(shù)碼內容創(chuàng)建和3D渲染都得益于多線程,可以看到該項得分也達到了相當優(yōu)秀的得分。
Speed Way GPU 在帶動4K主屏+2K副屏的前提下也能達到比較不錯的得分水平。
3DMark XeSS測試兩次生成基于3DMarkPortRoyal基準的場景,第一次運行通過使用時間抗鋸齒(TAA)渲染場景以獲得所需的輸出分辨率來計算基線性能。第二遍以較低的分辨率渲染舞臺,然后利用指定的XeSS模式放大幀。結果顯示每次運行的平均每秒幀數(shù)以及定義為百分比的性能差異。在XeSS 打開后,畫面表現(xiàn)效果在4K分辨率下直接提升了45%。
隨后也對一些主流游戲進行了簡單的體驗,在原神的4K高配60幀的環(huán)境下測試發(fā)現(xiàn)跑圖過程非常流暢,對于一些場景切換與密集建模的地方也有比較穩(wěn)定的幀率。
總結:
作為一臺兼顧辦公工作與娛樂游戲的高性能的主機,英特爾NUC消費迷你主機在一本專業(yè)書的厚度下提供了如此強勁的性能體驗,而且包括CPU的多線程性能以及顯卡的16G顯存,能同時支撐深度學習場景以及游戲場景的兼顧,而且主機酷炫的外表,性能強悍,擴展豐富等優(yōu)點也擴展了應用場景和需求??偟目聪聛韺儆趲缀鯖]有短板、而且優(yōu)勢明顯的迷你計算機,適合輕度和中度的辦公人群日常使用。另外蝰蛇峽谷從開始發(fā)售9999元到現(xiàn)在已降至7000元左右,還在等待的朋友可以沖了。
審核編輯 黃宇
-
電腦主機
+關注
關注
0文章
28瀏覽量
10780 -
Nuc
+關注
關注
0文章
63瀏覽量
12881
發(fā)布評論請先 登錄
相關推薦
評論