0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

顯存也能疊疊樂,雙 Intel Arc A770 顯卡低成本部署 DeepSeek R1 32B 蒸餾模型體驗(yàn)

looger123 ? 來源:looger123 ? 作者:looger123 ? 2025-03-18 12:06 ? 次閱讀

今年春節(jié)后,DeepSeek R1 風(fēng)暴般地席卷全國(guó),小到手機(jī) App,大到新能源汽車,似乎一夜間所有產(chǎn)品都接入了 DeepSeek R1。不得不說 DeepSeek R1 確實(shí)好用,對(duì)筆者這種編輯來說,從大綱到審閱,效率有著極大的提升。不過,官方滿血版的 DeepSeek R1 雖然好用,但會(huì)經(jīng)常“掉線”,平均一個(gè)小時(shí)只能使用一次。第三方的滿血 DeepSeek R1 很少掉線,但涉及隱私或保密數(shù)據(jù)時(shí),大家并不放心上傳云端。

于是,很多人萌生自己搭建 DeepSeek R1 的想法。然而滿血版的 DeepSeek R1 模型體積足足有 404GB,遠(yuǎn)超一般消費(fèi)級(jí)顯卡的顯存。即使 32B 的蒸餾模型體積也有 20GB。這就對(duì)顯卡的性能提出了較高的要求。例如,32GB 顯存的英偉達(dá) RTX 5090 D 公版官方售價(jià)為 16999 元,但實(shí)際上要多花一萬多元才能買到。

一、配置與部署

那么,有沒有什么經(jīng)濟(jì)實(shí)惠且效果不錯(cuò)的方案呢?聰明的你想到讓多張顯卡協(xié)同工作,不過 AMD 目前的新顯卡已經(jīng)不支持交火了,英偉達(dá)的 SLI 技術(shù)也不支持顯存疊加,而 Intel 的 Arc 顯卡不僅支持交火,并且顯存也可以疊加,價(jià)格也很實(shí)惠,兩張 Arc A770 16GB 價(jià)格 3600 元左右,就可獲得 32GB 的大現(xiàn)存。IT之家這次嘗試使用兩張藍(lán)戟 Intel Arc A770 Photon 16G OC 進(jìn)行交火,來配置 DeepSeek R1 32B 的蒸餾模型。其具體配置如下圖:

wKgZPGfY8SqASvLfAABwDQSsQ1c41.jpeg

Intel Arc A770 有 8G 和 16GB 兩個(gè)版本,我們選擇的藍(lán)戟 Intel Arc A770 Photon 16G OC 配備 16GB GDDR6 顯存,顯存帶寬可達(dá) 512GB/s,其擁有 32 個(gè) Xe 核心,最高頻率 2400Mhz。

wKgZO2fY8SqAdRY8AABqVPLigOo29.jpeg

因?yàn)槭请p卡方案,所以需要留意主板與電源的配置,主板至少需要有兩個(gè) PCIe 顯卡插槽,并且每個(gè)插槽必須支持 PCIe 4.0 x8 的傳輸速率。電源方面,單張藍(lán)戟 Intel Arc A770 Photon 16G OC 的 TBP 為 285W,兩張顯卡的功耗就要接近 600W。為了保證系統(tǒng)的穩(wěn)定,我們選擇了海韻的 1300W 電源進(jìn)行測(cè)試,這款電源不僅能滿足功率需求,還能滿足兩張顯卡所需的 4 個(gè) PCIe 8Pin 接口。模型我們選擇通過使用 IPEX-LLM 部署在 Linux 上,相比 Window 系統(tǒng)效率會(huì)更高一些。

wKgZPGfY8SqAWrdgAABdO7eJe3E40.jpeg

搭建結(jié)束后,我們用另一臺(tái)電腦局域網(wǎng)訪問后端,在操作時(shí)盡量不使用測(cè)試電腦進(jìn)行截圖錄屏,避免無關(guān)操作對(duì) GPU 的占用。

wKgZO2fY8SuAXfFPAABFDw2JMvQ10.jpeg

二、性能與效果

因?yàn)槭?32B 的模型,所以我們直接上強(qiáng)度,讓模型幫我們寫一個(gè) HTML 小游戲。我們首先對(duì)模型進(jìn)行提問:

請(qǐng)用 html 寫個(gè)貪吃蛇游戲的代碼,需要包含以下功能:

?使用鍵盤上的上下左右箭頭鍵控制蛇的移動(dòng)方向。

?蛇會(huì)自動(dòng)向前移動(dòng),并在吃到紅色的食物時(shí)增長(zhǎng)并增加得分。

?當(dāng)蛇碰到墻壁或自己時(shí),游戲結(jié)束并顯示得分。

?點(diǎn)擊“重新開始”按鈕可以重置游戲并重新開始。

游戲規(guī)則:

?蛇不能碰到墻壁或自己,否則游戲結(jié)束。

?每吃一個(gè)食物,得分增加 10 分。

?食物不會(huì)出現(xiàn)在蛇的身體上。

DeepSeek R1 開始分析問題并生成代碼,此時(shí)兩張 Arc A770 顯卡的風(fēng)扇全力運(yùn)轉(zhuǎn),后端顯示 Avg Generation Throughput 可以穩(wěn)定在 26 tokens / s 以上。對(duì)比之下,單張 RTX 5090 D 運(yùn)行 32B 模型的性能大約為 46 tokens / s,而官方不到兩成的價(jià)格卻得到了五成以上的性能,這個(gè)表現(xiàn)還是很讓人驚喜的。

wKgZPGfY8SuAKM97AADOEl3IYJo88.jpeg

生成后的 HTML 小游戲可以直接預(yù)覽運(yùn)行,我發(fā)現(xiàn)操作有沖突,按上下方向鍵會(huì)滾動(dòng)網(wǎng)頁(yè)。

wKgZO2fY8SuAHQrhAAN5HM-_qI8714.gif

于是我提出對(duì)代碼進(jìn)行修改,要求用 A、S、D、W 來代替方向鍵。DeepSeek R1 很精準(zhǔn)的理解了我的需求,并完成了修改。

wKgZPGfY8SyAOvnbAABPpDqY6DA41.jpeg

隨后,我要求生成更為復(fù)雜的俄羅斯方塊 HTML 代碼,雖說參數(shù)量只有 32B,但 DeepSeek R1 所生成的游戲同樣很完善,幾乎沒有什么 Bug。

wKgZO2fY8SyAYhfxAASrughOLYg746.gif

說到 AI 大模型的邏輯能力測(cè)試,那肯定繞不開弱智吧經(jīng)典問答。我們選擇了兩個(gè)問題對(duì)雙 A770 搭建的 DeepSeek R1 進(jìn)行測(cè)試:

1、神父去世是離職還是升職?

這種讓人一愣的問題 32B 的 DeepSeek R1 也能從現(xiàn)實(shí)與信仰兩種角度出發(fā)給出分析與解釋??梢钥闯?32B 模型的邏輯能力還是很強(qiáng)的,有著極高的可用性。

wKgZPGfY8SyALvFxAABxxNwJIBo96.jpeg

2、變形金剛應(yīng)該交車險(xiǎn)還是人險(xiǎn)?

面對(duì)二選一的提問,32B 的 DeepSeek R1 并沒有死板的做出選擇,其理解了變形金剛不同形態(tài)的特征給出了兩種保險(xiǎn)都買的絕佳選擇。

wKgZO2fY8S2APLXAAAB7QebVhAY92.jpeg

總結(jié):

從測(cè)試結(jié)果來看,兩張 Intel Arc A770 16GB 顯卡(總計(jì) 3600 元)組成的雙卡部署 DeepSeek R1 蒸餾模型的方案確實(shí)經(jīng)濟(jì)實(shí)惠。通過 IPEX-LLM 工具在 Linux 系統(tǒng)上部署,測(cè)試顯示雙 A770 顯卡能穩(wěn)定運(yùn)行 32B 模型,生成 HTML 小游戲和處理復(fù)雜問題時(shí)表現(xiàn)優(yōu)異,平均吞吐量達(dá) 26 tokens / s,有著不錯(cuò)的性價(jià)比??傮w而言,A770 雙卡低成本部署 DeepSeek 32B 兼具成本、性能和數(shù)據(jù)隱私優(yōu)勢(shì),適合中小企業(yè)和個(gè)人開發(fā)者。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10094

    瀏覽量

    173107
  • 顯卡
    +關(guān)注

    關(guān)注

    16

    文章

    2490

    瀏覽量

    68714
  • 顯存
    +關(guān)注

    關(guān)注

    0

    文章

    111

    瀏覽量

    13772
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    690

    瀏覽量

    544
收藏 0人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA RTX 5880 Ada顯卡部署DeepSeek-R1模型實(shí)測(cè)報(bào)告

    DeepSeek-R1 模型在 4 張 NVIDIA RTX 5880 Ada 顯卡配置下,面對(duì)短文本生成、長(zhǎng)文本生成、總結(jié)概括三大實(shí)戰(zhàn)場(chǎng)景,會(huì)碰撞出怎樣的性能火花?參數(shù)規(guī)模差異懸殊的 70B
    的頭像 發(fā)表于 03-17 11:12 ?336次閱讀
    NVIDIA RTX 5880 Ada<b class='flag-5'>顯卡</b><b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b><b class='flag-5'>模型</b>實(shí)測(cè)報(bào)告

    RK3588開發(fā)板上部署DeepSeek-R1模型的完整指南

    下載DeepSeek-R1-Distill-Qwen-1.5B權(quán)重文件。 (2)安裝轉(zhuǎn)換工具 在Ubuntu創(chuàng)建虛擬環(huán)境并安裝RKLLM-Toolkit,以便將DeepSeek-R1大語(yǔ)言模型轉(zhuǎn)換
    發(fā)表于 02-27 16:45

    兆芯全面部署DeepSeek R1模型

    近日,基于兆芯高性能通用處理器的PC終端、工作站以及服務(wù)器成功實(shí)現(xiàn)DeepSeek-R1-Distill模型(1.5B/7B/32B/70
    的頭像 發(fā)表于 02-25 13:45 ?263次閱讀

    摩爾線程圖形顯卡MTT S80實(shí)現(xiàn)DeepSeek模型部署

    摩爾線程“全功能”圖形顯卡MTT S80,不僅游戲渲染性能強(qiáng)大,能玩《黑神話:悟空》,現(xiàn)在還能本地部署DeepSeek R1蒸餾
    的頭像 發(fā)表于 02-21 15:46 ?900次閱讀
    摩爾線程圖形<b class='flag-5'>顯卡</b>MTT S80實(shí)現(xiàn)<b class='flag-5'>DeepSeek</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    研華邊緣AI Box MIC-ATL3S部署Deepseek R1模型

    隨著深度求索(DeepSeek)大模型的發(fā)布引發(fā)行業(yè)熱議,研華科技基于昇騰Atlas平臺(tái)邊緣AI Box MIC-ATL3S正式發(fā)布與Deepseek R1
    的頭像 發(fā)表于 02-14 16:08 ?697次閱讀
    研華邊緣AI Box MIC-ATL3S<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b><b class='flag-5'>模型</b>

    IBM在watsonx.ai平臺(tái)推出DeepSeek R1蒸餾模型

    ,進(jìn)一步增強(qiáng)企業(yè)在安全、治理以及規(guī)?;?b class='flag-5'>部署方面的能力。 DeepSeek R1是IBM在AI領(lǐng)域的一項(xiàng)重要?jiǎng)?chuàng)新,它采用了蒸餾模型技術(shù),能夠在
    的頭像 發(fā)表于 02-14 10:21 ?295次閱讀

    了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇

    -V3 DeepSeek-R1 勝出方 電路方程求解 處理簡(jiǎn)單方程,但對(duì)矩陣運(yùn)算、微分方程等支持有限 通過符號(hào)蒸餾技術(shù)優(yōu)化,可解析復(fù)雜電路網(wǎng)絡(luò)方程(如節(jié)點(diǎn)分析法) R1 SPICE代
    發(fā)表于 02-14 02:08

    DeepSeek模型成功部署,物通博聯(lián)在 AI 賦工業(yè)上持續(xù)探索、不斷前行

    和二次開發(fā),DeepSeek R1模型的發(fā)布迅速點(diǎn)燃了AI產(chǎn)業(yè)的革命之火。 DeepSeek R1 通過
    的頭像 發(fā)表于 02-12 11:15 ?284次閱讀

    Deepseek R1模型離線部署教程

    。作為國(guó)產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域引發(fā)廣泛關(guān)注。 本文主要說明DeepSeek-R1如何離線運(yùn)行在EASY-EAI-Orin-Nano(RK3576)硬件上, RK3576 具有優(yōu)異的端側(cè)AI
    的頭像 發(fā)表于 02-12 09:37 ?1137次閱讀
    <b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>離線<b class='flag-5'>部署</b>教程

    Gitee AI 聯(lián)合沐曦首發(fā)全套 DeepSeek R1 千問蒸餾模型,全免費(fèi)體驗(yàn)!

    模型相比,較小尺寸的 DeepSeek 蒸餾版本模型 更適合企業(yè)內(nèi)部實(shí)施部署,可以極大的降低落地成本
    的頭像 發(fā)表于 02-10 09:56 ?291次閱讀
    Gitee AI 聯(lián)合沐曦首發(fā)全套 <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> 千問<b class='flag-5'>蒸餾</b><b class='flag-5'>模型</b>,全免費(fèi)體驗(yàn)!

    部署DeepSeek R1于AX650N與AX630C平臺(tái)

    背景 春節(jié)前,國(guó)產(chǎn)大模型 DeepSeek 橫空出世,迅速成為AI領(lǐng)域的焦點(diǎn)。作為端側(cè)AI效比優(yōu)異的 AX650N、AX630C 芯片平臺(tái)早已在節(jié)前完成 DeepSeek
    的頭像 發(fā)表于 02-09 09:32 ?570次閱讀
    <b class='flag-5'>部署</b><b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>于AX650N與AX630C平臺(tái)

    壁仞科技順利部署DeepSeek R1千問蒸餾模型

    DeepSeek 的國(guó)內(nèi)算力支持隊(duì)伍進(jìn)一步壯大:來自上海的壁仞科技順利部署DeepSeek-R1-Distill千問蒸餾模型(1.5
    的頭像 發(fā)表于 02-08 16:56 ?984次閱讀

    鯤云科技AI芯片CAISA 430成功適配DeepSeek R1模型

    鯤云科技全新一代的可重構(gòu)數(shù)據(jù)流 AI 芯片 CAISA 430 成功適配 DeepSeek R1 蒸餾模型推理,這一創(chuàng)新舉措為大模型應(yīng)用的高
    的頭像 發(fā)表于 02-07 09:57 ?756次閱讀
    鯤云科技AI芯片CAISA 430成功適配<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b><b class='flag-5'>模型</b>

    摩爾線程宣布成功部署DeepSeek蒸餾模型推理服務(wù)

    。 據(jù)悉,DeepSeek開源模型在多語(yǔ)言理解與復(fù)雜推理任務(wù)中一直表現(xiàn)出卓越的性能,其V3、R1等系列模型更是備受業(yè)界關(guān)注。而此次摩爾線程所實(shí)現(xiàn)的D
    的頭像 發(fā)表于 02-06 13:49 ?548次閱讀

    云天勵(lì)飛上線DeepSeek R1系列模型

    模型、DeepSeek V3/R1 671B MoE大模型在有序適配中。適配完成后,Deep
    的頭像 發(fā)表于 02-06 10:39 ?432次閱讀
    云天勵(lì)飛上線<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>系列<b class='flag-5'>模型</b>

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品