0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SL1680 SoC本地運(yùn)行DeepSeek R1 1.5B大模型

jf_59991523 ? 來源:jf_59991523 ? 作者:jf_59991523 ? 2025-04-17 17:09 ? 次閱讀

SL1680 SoC本地運(yùn)行DeepSeek R1 1.5B大模型

自DeepSeek大模型發(fā)布以來,深蕾半導(dǎo)體SoC團(tuán)隊(duì)針對(duì)在端側(cè)運(yùn)行DeepSeek大模型不斷進(jìn)行研究,探索將DeepSeek大模型與SoC系列產(chǎn)品相結(jié)合的模式。目前已經(jīng)實(shí)現(xiàn)利用深蕾半導(dǎo)體的ASTRA SL1680 SoC本地運(yùn)行DeepSeek R1 Distill Qwen2.5 1.5B大模型。

DeepSeek R1 Distill Qwen2.5 1.5B是DeepSeek R1發(fā)布中最小的模型 - 它可以在ASTRA SL1680上舒適地運(yùn)行。

一、SL1680本地運(yùn)行Deepseek-R1-1.5B大模型展示

wKgZO2gAntaAO81xAAeYe0My_Lo217.png

SL1680本地運(yùn)行Deepseek-R1-1.5B大模型視頻效果

執(zhí)行過程

要在ASTRA開發(fā)板上運(yùn)行Qwen,我們將使用llama-cpp-python包,它為Georgi Gerganov的llamacpp提供了便捷的Python綁定。

wKgZO2gAnxWAWZV6AAS9_ylq1gM966.png

wKgZO2gAnzCAE_4rAANlmcMqdrY486.png

除了在SL1680本地運(yùn)行Deepseek-R1-1.5B大模型,還實(shí)現(xiàn)了運(yùn)行Llama 3.2 1B大模型。

運(yùn)行環(huán)境

系統(tǒng):Linux(yocto)

硬件:SL1680 RDK開發(fā)板


產(chǎn)品化路徑

對(duì)于SL1680產(chǎn)品如何與大模型結(jié)合的問題,建議采用端側(cè)大模型與云端大模型相結(jié)合的工程化方式處理,本地能處理的用戶任務(wù)使用端側(cè)大模型快速解決和輸出,而較復(fù)雜的邏輯以及聯(lián)網(wǎng)功能則通過請(qǐng)求云端大模型API的方式實(shí)現(xiàn)。

如視頻所展示的,將Deepseek-R1-1.5B大模型部署到SoC本地,能夠?qū)崿F(xiàn)知識(shí)問答、FuntionCall等AI能力。通過將云端的大模型與端側(cè)的語音識(shí)別機(jī)器視覺功能、端側(cè)小參數(shù)大模型相結(jié)合,從而讓AI賦能我們的產(chǎn)品,提升產(chǎn)品的智能化程度。

二、本地小參數(shù)大模型與端云大模型結(jié)合的應(yīng)用場(chǎng)景

1,多媒體終端:本地小參數(shù)大模型可在端側(cè)如智能大屏,快速處理一些常見的簡(jiǎn)單任務(wù),如語音助手對(duì)常見指令的快速響應(yīng)、文本的簡(jiǎn)單摘要生成、數(shù)據(jù)加工整理、設(shè)備操控、產(chǎn)品說明、產(chǎn)品售后問題自助解決等。當(dāng)遇到復(fù)雜任務(wù),如深度文本分析、多模態(tài)內(nèi)容生成時(shí),可將任務(wù)發(fā)送到云側(cè)大模型進(jìn)行處理,利用云側(cè)大模型強(qiáng)大的計(jì)算能力和豐富的知識(shí)儲(chǔ)備來完成。

2,智能辦公設(shè)備(MINI PC):本地小參數(shù)大模型可以實(shí)時(shí)處理用戶的語音交互、文字輸入信息處理、智能控制等任務(wù),作為用戶AI助手。而對(duì)于一些復(fù)雜的邏輯理解、內(nèi)容生成設(shè)計(jì)和決策任務(wù)等,則借助云側(cè)大模型的強(qiáng)大算力和更全面的數(shù)據(jù)分析能力來完成。

3,零售電商:在商品展示平臺(tái)的搜索推薦場(chǎng)景中,本地小參數(shù)大模型可以根據(jù)用戶在本地設(shè)備上的瀏覽歷史、購買行為、環(huán)境感知等數(shù)據(jù),快速生成初步的推薦結(jié)果。當(dāng)用戶有更復(fù)雜的搜索需求,如對(duì)比不同商品的詳細(xì)參數(shù)、詢問商品的使用場(chǎng)景等問題時(shí),云側(cè)大模型可以利用其龐大的商品知識(shí)庫和強(qiáng)大的語言理解能力,給出更準(zhǔn)確、詳細(xì)的回答和推薦。

三、ASTRA SL1680 SoC介紹

ASTRA SL1680是一款專為智能應(yīng)用設(shè)計(jì)的高性能系統(tǒng)級(jí)芯片(SoC),它擁有

1,4*Cortex A73 CPU處理器

Cortex A73是ARM公司設(shè)計(jì)的一款高性能CPU核心,適用于需要高性能計(jì)算的應(yīng)用場(chǎng)景,能夠提供強(qiáng)大的處理能力和多任務(wù)處理能力,為Deepseek-R1-1.5B大模型的運(yùn)行提供堅(jiān)實(shí)保障。


2,高達(dá)7.9 Top NPU算力:

NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)是專門用于加速神經(jīng)網(wǎng)絡(luò)計(jì)算的硬件單元。7.9 Top的算力使SL1680在神經(jīng)網(wǎng)絡(luò)計(jì)算方面有著極高的性能,為端云結(jié)合的應(yīng)用模式創(chuàng)造了有利條件。


3,64-bit高速內(nèi)存:

64位內(nèi)存架構(gòu)支持更大的內(nèi)存尋址空間,使得SL1680能夠同時(shí)處理更多的數(shù)據(jù)和運(yùn)行更復(fù)雜的應(yīng)用程序。高速內(nèi)存則保證了數(shù)據(jù)訪問的迅速性,提升了整體性能。

wKgZPGgAn4uAM23GAAvynChu45w281.png




審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • soc
    soc
    +關(guān)注

    關(guān)注

    38

    文章

    4356

    瀏覽量

    221852
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3046

    瀏覽量

    3863
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    783

    瀏覽量

    1429
收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】CPU部署DeekSeek-R1模型1B和7B

    ,使用如下命令: ollama pull deepseek-r1:1.5b 拉取deepseek-r1 1.5b模型,過程中會(huì)下載速度和進(jìn)
    發(fā)表于 04-21 00:39

    DeepSeek R1模型本地部署與產(chǎn)品接入實(shí)操

    針對(duì)VS680/SL1680系列大算力芯片,我們的研發(fā)團(tuán)隊(duì)正在研究將蒸餾后的輕量級(jí)DeepSeek模型DeepSeek-R1-Distill-Qwen-1.5B)部署到
    的頭像 發(fā)表于 04-19 16:32 ?200次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b><b class='flag-5'>模型</b><b class='flag-5'>本地</b>部署與產(chǎn)品接入實(shí)操

    ORinNano離線部署Deepseek R1模型教程

    ORinNano離線部署Deepseek R1模型教程
    的頭像 發(fā)表于 04-10 15:32 ?338次閱讀
    ORinNano離線部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>教程

    如何基于Android 14在i.MX95 EVK上運(yùn)行Deepseek-R1-1.5B和性能

    Internet,或者您可以手動(dòng)下載模型。按“ ”并選擇 “從Hugging Face添加” 并搜索1.5B,找到deepseek-R1-1.5B模型,下載
    發(fā)表于 04-04 06:59

    RK3588開發(fā)板上部署DeepSeek-R1模型的完整指南

    下載DeepSeek-R1-Distill-Qwen-1.5B權(quán)重文件。 (2)安裝轉(zhuǎn)換工具 在Ubuntu創(chuàng)建虛擬環(huán)境并安裝RKLLM-Toolkit,以便將DeepSeek-R1大語言模型轉(zhuǎn)換
    發(fā)表于 02-27 16:45

    兆芯全面部署DeepSeek R1模型

    近日,基于兆芯高性能通用處理器的PC終端、工作站以及服務(wù)器成功實(shí)現(xiàn)DeepSeek-R1-Distill模型1.5B/7B/32B/70
    的頭像 發(fā)表于 02-25 13:45 ?456次閱讀

    9.9萬元用上“滿血”DeepSeek R1一體機(jī),本地部署成新商機(jī)?

    電子發(fā)燒友綜合報(bào)道? 最近DeepSeek R1的火爆,引起了本地部署的熱潮,但大部分個(gè)人用戶,受到設(shè)備的限制,一般只能在個(gè)人電腦上部署小尺寸的1.5B或7
    發(fā)表于 02-18 01:16 ?5203次閱讀

    宇芯基于T527成功部署DeepSeek-R1

    近日,宇芯成功在全志T527 Linux系統(tǒng)上本地部署并運(yùn)行DeepSeek-R1 1.5B模型
    的頭像 發(fā)表于 02-15 09:06 ?976次閱讀
    宇芯基于T527成功部署<b class='flag-5'>DeepSeek-R1</b>

    景嘉微JM11 GPU已流片,JM、景宏系列完成DeepSeek R1系列模型適配

    DeepSeek-R1-Distill-Qwen-1.5B模型DeepSeek-R1-Distill-Qwen-7B模型的適配。 ? ? 同時(shí),景宏系列已全面兼容并適配
    發(fā)表于 02-15 00:01 ?2067次閱讀
    景嘉微JM11 GPU已流片,JM、景宏系列完成<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>系列<b class='flag-5'>模型</b>適配

    了解DeepSeek-V3 和 DeepSeek-R1兩個(gè)大模型的不同定位和應(yīng)用選擇

    : 輕量級(jí)任務(wù) DeepSeek-R1獨(dú)立運(yùn)行,用于: 電路參數(shù)計(jì)算(如濾波器截止頻率公式推導(dǎo)) 基礎(chǔ)SPICE仿真腳本生成 技術(shù)文檔QA(如查找某ADC的SNR指標(biāo)) 復(fù)雜任務(wù)R1 + 領(lǐng)域插件
    發(fā)表于 02-14 02:08

    部署DeepSeek R1于AX650N與AX630C平臺(tái)

    背景 春節(jié)前,國(guó)產(chǎn)大模型 DeepSeek 橫空出世,迅速成為AI領(lǐng)域的焦點(diǎn)。作為端側(cè)AI能效比優(yōu)異的 AX650N、AX630C 芯片平臺(tái)早已在節(jié)前完成 DeepSeek R1 蒸餾
    的頭像 發(fā)表于 02-09 09:32 ?944次閱讀
    部署<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>于AX650N與AX630C平臺(tái)

    壁仞科技順利部署DeepSeek R1千問蒸餾模型

    DeepSeek 的國(guó)內(nèi)算力支持隊(duì)伍進(jìn)一步壯大:來自上海的壁仞科技順利部署DeepSeek-R1-Distill千問蒸餾模型(1.5B/7B
    的頭像 發(fā)表于 02-08 16:56 ?1624次閱讀

    在龍芯3a6000上部署DeepSeek 和 Gemma2大模型

    run deepseek-r1:1.5b 3.運(yùn)行Gemma 2大模型 如果想體驗(yàn) Google Gemma 2 可以到下面的網(wǎng)站選擇不同參數(shù)的大
    發(fā)表于 02-07 19:35

    云天勵(lì)飛上線DeepSeek R1系列模型

    模型、DeepSeek V3/R1 671B MoE大模型也在有序適配中。適配完成后,DeepEdge10芯片平臺(tái)將在端、邊、云全面支持
    的頭像 發(fā)表于 02-06 10:39 ?595次閱讀
    云天勵(lì)飛上線<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>系列<b class='flag-5'>模型</b>

    AI賦能駕駛安全:Synaptics SL1680疲勞駕駛檢測(cè)方案

    Synaptics SL1680 作為一款高性能、低功耗的 AI 原生 SoC,為駕駛安全解決方案提供了穩(wěn)定的硬件基礎(chǔ),加上先進(jìn)的 AI 模型,可以實(shí)現(xiàn)實(shí)時(shí)、精準(zhǔn)的疲勞駕駛檢測(cè)。
    的頭像 發(fā)表于 12-31 16:31 ?495次閱讀
    AI賦能駕駛安全:Synaptics <b class='flag-5'>SL1680</b>疲勞駕駛檢測(cè)方案

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品