0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

實(shí)戰(zhàn)案例 | 眺望RK3588 RKLLM部署DeepSeek-R1全流程

眺望電子 ? 2025-02-12 08:31 ? 次閱讀


前言:

在RK3588上部署Deepseek有兩種方法,分別是使用Ollama工具部署和使用瑞芯微官方的 RKLLM量化部署。Ollama 是一個(gè)開源的大模型服務(wù)工具,調(diào)用的是CPU進(jìn)行的運(yùn)算,如果要將RK3588強(qiáng)悍的NPU性能發(fā)揮出來,可以重點(diǎn)了解一下RKLLM量化部署。

一、RKLLM介紹

為了使用RK NPU,用戶需要先在計(jì)算機(jī)上安裝RKLLM-Toolkit工具。RKLLM-Toolkit 是為用戶提供在計(jì)算機(jī)上進(jìn)行大語言模型的量化、轉(zhuǎn)換的開發(fā)套件。通過該 工具提供的接口可以便捷地完成模型轉(zhuǎn)換和模型量化。

b42466e0-e8d8-11ef-9434-92fbcf53809c.png

RKLLM的整體開發(fā)步驟主要分為:模型轉(zhuǎn)換和板端部署運(yùn)行。

模型轉(zhuǎn)換是使用RKLLM-Toolkit將預(yù)訓(xùn)練的大語言模型轉(zhuǎn)換為RKLLM格式。

板端部署運(yùn)行是調(diào)用RKLLM Runtime庫加載RKLLM模型到Rockchip NPU平臺(tái),然后進(jìn)行推理等操作。


二、DeepSeek-R1介紹

`DeepSeek-R1是深度求索(DeepSeek)公司推出的開源多模態(tài)大語言模型,專為長(zhǎng)上下文理解和多模態(tài)交互優(yōu)化。DeepSeek-R1基于開源模型進(jìn)行了微調(diào),提供了1.5B、7B等參數(shù)版本的DeepSeek-R1-Distill模型,適合部署到邊緣設(shè)備。


b42fade8-e8d8-11ef-9434-92fbcf53809c.png

三、部署過程

3.1獲取模型

從 deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B 獲取模型文件;

# 獲取DeepSeek-R1-Distill-Qwen-1.5Bgitclonehttps://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B


3.2安裝轉(zhuǎn)換工具

在Ubuntu虛擬機(jī)安裝RKLLM-Toolkit,以便將DeepSeek-R1大語言模型轉(zhuǎn)換為RKLLM模型格式和編譯板端推理的可執(zhí)行程序,具體RKLLM-Toolkit環(huán)境安裝步驟不在此詳述;

3.3安裝轉(zhuǎn)換工具

使用RKLLM-Toolkit對(duì)模型進(jìn)行轉(zhuǎn)換。運(yùn)行模型轉(zhuǎn)換腳本;

cd rknn-llm/examples/rkllm_api_demo/bash build-linux.sh

生成的可執(zhí)行文件在:

build/build_linux_aarch64_Release/llm_demo

3.4板端部署

將轉(zhuǎn)換成功后的 DeepSeek-R1-Distill-Qwen-1.5B.rkllm 模型與編譯后的二進(jìn)制文件 llm_demo 復(fù)制到板端,并導(dǎo)入環(huán)境變量

exportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:rknn-llm/rkllm-runtime/Linux/librkllm_api/aarch64

3.5運(yùn)行測(cè)試

運(yùn)行 llm_demo

./demo_Linux_aarch64/llm_demo./Deepseek-R1-Disti11-Qwen-1.5B.rkllm1000010000

b439e5b0-e8d8-11ef-9434-92fbcf53809c.png

四、測(cè)試效果

4.1環(huán)境說明

b4452d58-e8d8-11ef-9434-92fbcf53809c.png

使用眺望電子EVM-RK3588開發(fā)套件,搭載8GB內(nèi)存配置,板載運(yùn)行Ubuntu20.04系統(tǒng)。通過SSH登入主板運(yùn)行模型,Debug調(diào)試口用于監(jiān)測(cè)運(yùn)行器件資源消耗。

b45691a6-e8d8-11ef-9434-92fbcf53809c.png

b461901a-e8d8-11ef-9434-92fbcf53809c.png

4.2推理過程

Connecting to 192.168.0.37:22...Connection established.To escape to local shell, press 'Ctrl+Alt+]'.WARNING! The remote SSH server rejected X11 forwarding request._____ _ |_ _| __ _ | | ___ __ __ ___| | / _` | | | / _ \ \ \ /\ / / / _ \| | | (_| | | | | (_) | \ V V / | __/|_| \__,_| |_| \___/ \_/\_/ \___|
Welcome to Ubuntu 20.04.6 LTS (GNU/Linux 6.1.84 aarch64)* Documentation: https://help.ubuntu.com* Management: https://landscape.canonical.com* Support: https://ubuntu.com/proLast login: Tue Feb 11 1425 2025-bash: /opt/ros/noetic/setup.bash: No such file or directory-bash: /opt/ros/noetic/setup.bash: No such file or directoryroot@talowe-rk3588:~#root@talowe-rk3588:~# lsDeepseek-R1-Disti11-Qwen-1.5B.rkllm demo_Linux_aarch64root@talowe-rk3588:~# ./demo_Linux_aarch64/llm_demo ./Deepseek-R1-Disti11-Qwen-1.5B.rkllm 10000 10000rkllm init startI rkllm: rkllm-runtime version: 1.1.4, rknpu driver version: 0.9.8, platform: RK3588rkllm init success**********************可輸入以下問題對(duì)應(yīng)序號(hào)獲取回答/或自定義輸入********************[0] 現(xiàn)有一籠子,里面有雞和兔子若干只,數(shù)一數(shù),共有頭14個(gè),腿38條,求雞和兔子各有多少只?[1] 有28位小朋友排成一行,從左邊開始數(shù)第10位是學(xué)豆,從右邊開始數(shù)他是第幾位?*************************************************************************user: 0現(xiàn)有一籠子,里面有雞和兔子若干只,數(shù)一數(shù),共有頭14個(gè),腿38條,求雞和兔子各有多少只?robot: 首先,設(shè)雞的數(shù)量為x只,兔子的數(shù)量為y只。根據(jù)題意,我們知道每只雞有1個(gè)頭和2條腿,每只兔子也有1個(gè)頭但有4條腿。因此,總共有14個(gè)頭,可以列出方程:x + y = 14同時(shí),總腿數(shù)是38條,所以:2x + 4y = 38接下來,可以通過解這個(gè)方程組來找到x和y的值。首先,從第一個(gè)方程中解出x:x = 14 - y然后將x代入第二個(gè)方程:2(14 - y) + 4y = 38展開并簡(jiǎn)化:28 - 2y + 4y = 38合并同類項(xiàng):2y = 10解得:y = 5最后,代入x = 14 - y:x = 14 - 5 = 9因此,雞有9只,兔子有5只。think>要解決這個(gè)問題,我們可以設(shè)雞的數(shù)量為 \( x \) 只,兔子的數(shù)量為 \( y \) 只。根據(jù)題意,我們知道:- 每只雞和兔子都有1個(gè)頭,所以總共有14個(gè)頭,可以列出方程:\[x + y = 14\]- 雞有2條腿,兔子有4條腿,總腿數(shù)為38條,可以列出另一個(gè)方程:\[2x + 4y = 38\]接下來,我們可以通過解這個(gè)方程組來找到 \( x \) 和 \( y \) 的值。**步驟一:從第一個(gè)方程中解出 \( x \)**\[x = 14 - y\]**步驟二:將 \( x \) 代入第二個(gè)方程**\[2(14 - y) + 4y = 38\]展開并簡(jiǎn)化:\[28 - 2y + 4y = 38 \\2y = 10 \\y = 5\]**步驟三:代入 \( y \) 的值求出 \( x \)**\[x = 14 - 5 = 9\]因此,雞有 \(\boxed{9}\) 只,兔子有 \(\boxed{5}\) 只。

4.3資源消耗

DeepSeek-R1模型輸出的回答結(jié)果清晰流暢,內(nèi)存資源占用797MB,NPU負(fù)載約為64%,在無風(fēng)扇環(huán)境下,溫升約10℃。

b46f8300-e8d8-11ef-9434-92fbcf53809c.png

總而言之,DeepSeek-R1模型的強(qiáng)力有目共睹,同時(shí)也驗(yàn)證了眺望電子對(duì)RK3588系列處理器的深度優(yōu)化與強(qiáng)大可靠。如果您對(duì)部署過程感興趣,歡迎隨時(shí)與我們聯(lián)系,我們可以為您提供專業(yè)的技術(shù)支持,期待與您合作!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • RK3588
    +關(guān)注

    關(guān)注

    7

    文章

    385

    瀏覽量

    5245
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    316

    瀏覽量

    616
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    730

    瀏覽量

    834
收藏 0人收藏

    評(píng)論

    相關(guān)推薦

    DeepSeek到Qwen,AI大模型的移植與交互實(shí)戰(zhàn)指南-飛凌嵌入式

    在不久前發(fā)布的《技術(shù)實(shí)戰(zhàn)|OK3588-C開發(fā)板上部署DeepSeek-R1大模型的完整指南》一文中,小編為大家介紹了DeepSeek-R1
    的頭像 發(fā)表于 03-28 08:06 ?1097次閱讀
    從<b class='flag-5'>DeepSeek</b>到Qwen,AI大模型的移植與交互<b class='flag-5'>實(shí)戰(zhàn)</b>指南-飛凌嵌入式

    【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】DeepSeek 部署及測(cè)試

    /DeepSeek-R1-Distill-Qwen-1.5B_Demo/Readme.md 文檔)即可實(shí)現(xiàn) DeepSeek 部署。 這里使用瑞芯微轉(zhuǎn)換好的 rkllm 進(jìn)行推演。 倉
    發(fā)表于 03-21 19:31

    實(shí)戰(zhàn)案例 | 299元國(guó)產(chǎn)工業(yè)級(jí)AI核心板部署DeepSeek-R1

    前言:在AIoT領(lǐng)域,搭載Ubuntu系統(tǒng)的眺望T527開發(fā)板,僅憑2GB內(nèi)存便成功運(yùn)行15億參數(shù)的DeepSeek-R1輕量級(jí)大模型!在邊緣端上演一場(chǎng)算力革命,這一突破性進(jìn)展不僅刷新了邊緣AI設(shè)備
    的頭像 發(fā)表于 03-06 08:30 ?422次閱讀
    <b class='flag-5'>實(shí)戰(zhàn)</b>案例 | 299元國(guó)產(chǎn)工業(yè)級(jí)AI核心板<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b>

    RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南

    擴(kuò)展規(guī)劃、嵌入式適配等技術(shù)維度的突破。 RK3588作為瑞芯微推出的旗艦級(jí)芯片,憑借多核異構(gòu)計(jì)算能力以及強(qiáng)大的CPU、GPU和NPU性能,成為嵌入式AI應(yīng)用的理想平臺(tái)。DeepSeek-R1
    發(fā)表于 02-27 16:45

    米爾RK3576開發(fā)板評(píng)測(cè)】+ RKLLM-Toolkit 環(huán)境安裝

    模型,在安裝Ollama工具之后,使用以下命令即可一鍵部署15億參數(shù)的deepseek-r1模型,ollama其實(shí)就是AI屆的Docker,所以使用起來也非常方便。 5.2、自動(dòng)安裝 同樣受網(wǎng)絡(luò)音響
    發(fā)表于 02-22 09:41

    案例分享 ▏【瑞芯微RK3588】HZHY-AI300G智能盒部署DeepSeek-R1模型實(shí)戰(zhàn)指南

    地和我們交流,我們可以在HZHY-AI300G智能盒上部署DeepSeek-R1模型。接下來,我們將一步步帶你完成DeepSeek-R1模型的部署,這一過程不僅能
    的頭像 發(fā)表于 02-21 18:25 ?522次閱讀
    案例分享 ▏【瑞芯微<b class='flag-5'>RK3588</b>】HZHY-AI300G智能盒<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b>模型<b class='flag-5'>實(shí)戰(zhàn)</b>指南

    Banana Pi開源社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)利器

    Banana Pi開源社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)利器
    的頭像 發(fā)表于 02-19 18:25 ?1003次閱讀
    Banana Pi開源社區(qū)基于瑞芯微<b class='flag-5'>RK3588</b>開發(fā)板,<b class='flag-5'>DeepSeek</b>開發(fā)利器

    香橙派發(fā)布OrangePi 5Plus本地部署Deepseek-R1蒸餾模型指南

    派官方發(fā)布OrangePi5Plus運(yùn)行Deepseek-R1蒸餾模型實(shí)操指南,趕緊收藏起來吧!OrangePi5Plus采用了瑞芯微RK3588八核64位處理器
    的頭像 發(fā)表于 02-19 16:14 ?734次閱讀
    香橙派發(fā)布OrangePi 5Plus本地<b class='flag-5'>部署</b><b class='flag-5'>Deepseek-R1</b>蒸餾模型指南

    RK3588+DeepSeek有沒有“搞頭”?

    最近的當(dāng)紅炸子雞DeepSeek,無論是行業(yè)內(nèi)還是行業(yè)外都在研究。畢竟現(xiàn)在各行各業(yè)都想利用AI為自己服務(wù),圖像處理領(lǐng)域也不例外。于是便有很多人向我們咨詢RK3588+DeepSeek有沒有“搞頭
    的頭像 發(fā)表于 02-18 17:52 ?870次閱讀
    <b class='flag-5'>RK3588+DeepSeek</b>有沒有“搞頭”?

    分享 |迅為基于RK3588開發(fā)板部署測(cè)試DeepSeek模型

    分享 |迅為基于RK3588開發(fā)板部署測(cè)試DeepSeek模型
    的頭像 發(fā)表于 02-18 14:26 ?1226次閱讀
    分享 |迅為基于<b class='flag-5'>RK3588</b>開發(fā)板<b class='flag-5'>部署</b>測(cè)試<b class='flag-5'>DeepSeek</b>模型

    宇芯基于T527成功部署DeepSeek-R1

    近日,宇芯成功在志T527 Linux系統(tǒng)上本地部署并運(yùn)行了DeepSeek-R1 1.5B模型。
    的頭像 發(fā)表于 02-15 09:06 ?730次閱讀
    宇芯基于T527成功<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b>

    添越智創(chuàng)基于 RK3588 開發(fā)板部署測(cè)試 DeepSeek 模型全攻略

    DeepSeek 模型的部署與測(cè)試,開啟這場(chǎng)充滿挑戰(zhàn)與驚喜的技術(shù)探索之旅。 RK3588 開發(fā)板:AI 性能擔(dān)當(dāng) RK3588 開發(fā)板基于先進(jìn)的 8nm LP 制程工藝精心打造,其硬
    發(fā)表于 02-14 17:42

    ATK-DLRK3588開發(fā)板deepseek-r1-1.5b/7b部署指南

    _demo rkllm_model/deepseek-1.5b-w8a8-rk3588.rkllm 5000 5000 運(yùn)行deepseek-R1-7b程序 ./atk_deepseek
    發(fā)表于 02-14 16:33

    了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的兩個(gè)不同定位的大模型,其核心差異主要體現(xiàn)在目標(biāo)場(chǎng)景、能力側(cè)重和技術(shù)優(yōu)化方向上。以下是二者的實(shí)質(zhì)性
    發(fā)表于 02-14 02:08

    RK3588開發(fā)板上部署并測(cè)試DeepSeek模型

    DeepSeek免費(fèi)向全球開發(fā)者開放,加速了AI技術(shù)普及。 ? RK3588性能優(yōu)勢(shì) RK3588作為一款高性能AI芯片,采用了8nm LP 制程,搭載八核處理器,四核GPU以及6TOPS算力的NPU,依靠
    的頭像 發(fā)表于 02-09 09:36 ?2327次閱讀
    在<b class='flag-5'>RK3588</b>開發(fā)板上<b class='flag-5'>部署</b>并測(cè)試<b class='flag-5'>DeepSeek</b>模型

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品