0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Banana Pi BPI-AIM7 RK3588 AI模組樣品體驗

Banana Pi開源硬件 ? 來源:Banana Pi開源硬件 ? 作者:Banana Pi開源硬件 ? 2025-03-20 18:31 ? 次閱讀

這將是一個略有不同的評論,因為它不是關于成品的——我已經收到了 ArmSom/BananaPi 即將推出的 AI 模塊 7(將很快在 CrowdSupply 上推出)的早期樣品,我想分享我對它的早期印象。

免責聲明: ArmSom免費為我提供了一塊AIM7和一塊 AIM-IO 載板(對此我表示感謝),此外這篇文章遵循我的審核政策,我應該強調一下,這是一個眾籌項目,所以不能保證最終產品與我收到的產品完全相同。

硬件

AIM7本身是一個仿照 NVIDIA Jetson 的簡單模塊,具有相同的 DIMM 類連接器和板載 RAM 和 eMMC 存儲:

wKgZO2faNViAL1LeAANeqoYWsfk378.jpg

組件布局

如果您不熟悉該芯片組,這些是基本規(guī)格:

4xARM Cortex-A76 + 4xCortex-A55 CPU 核心

Mali-G610 MP4 GPU

3 核 NPU,每秒處理能力達 6 TOPS

高達 32GB 的 LPDDR4 RAM

高達 128GB 的 eMMC 存儲空間

我買了一個 8GB RAM/32GB EMMC 板,說實話,無論是 RAM 還是存儲空間都非常緊張——對于我嘗試過的大多數 AI 工作負載來說,這個 RAM 肯定太少了,而且考慮到沒有其他方式連接高速存儲,這對于開發(fā)來說相當有限。

但正如我們稍后會看到的,它可能非常適合工業(yè)應用,而不是 GenAI 的幻想。

散熱和功耗

該模塊沒有配備散熱解決方案,因此我使用我常用的一組銅墊片來保持其(安靜地)冷卻。在這方面(和功耗),它與我測試過的許多 RK3588 設備沒有太大區(qū)別,范圍從 4 到 11W(典型使用與滿 CPU 負載)。

輸入/輸出

載板是所有 I/O 操作發(fā)生的地方 - 除了通過 12V 筒式插孔或 USB-C 供電(這次我選擇了前者)之外,它還有 4 個 USB-A 端口、HDMI、DisplayPort、一個千兆以太網端口,以及一組常用的硬件端口 - 40 針 GPIO 接頭、MIPI-CSI/DSI、microSD 讀卡器,以及用于 Wi-Fi 的 M.2 E-key 插槽:

wKgZPGfaNViAQoQ3AAfgff0F0DE235.jpg

它幾乎都是 I/O 端口,所以,您無法獲得任何高速存儲擴展。

除了單個載板之外,BananaPi 維基頁面還暗示了一個 4 模塊 AI 邊緣網關,因此這里顯然有構建 ARM 集群的潛力。

認識杰森一家

將 AIM7 與 Jetson Nano 進行比較,相似之處顯而易見:

wKgZO2faNVmAa-syAAcGJ60lXlU766.jpg

外形尺寸相同,熱特性卻截然不同。

ArmSom 的Crowdsupply 頁面與 Jetson Nano 進行了快速比較并提供了一些基準信息,因此我不會在這里花費太多時間,只會說這些模塊實際上是引腳兼容的。

話雖如此,由于以下幾個原因,我無法運行一組比較基準測試:我為 Jetson Nano 獲得的 5V 電源在去年年底的某個時候耗盡了,所以我現在無法為其供電 - 但即使我嘗試更換載板,我擁有的 Nano 運行的是相當舊版本的 Ubuntu 和 CUDA,因此實際上很難進行有意義的比較。

事實上,除非你自己編寫代碼,否則能夠在 Nano 上運行的現代代碼實在太少了。

那么,AIM7會 取代NVIDIA Jetson 嗎?好吧,僅從軟件角度考慮,簡短的答案是“如果你真的需要使用 CUDA,那就不會”,但我將在下文中討論這個問題。

簡而言之,如果您有興趣了解 Rockchip 的各種 NPU 庫,它提供了一個有趣的選擇——這些庫在過去幾個月中實際上已經有了很大的改進。

基礎操作系統

該主板附帶 Debian Bullseye (11) 和內核 5.10.160,雖然感覺有點過時,但在 Rockchip 世界中卻是正?,F象。

由于該主板尚未支持 Armbian,我只是將語言環(huán)境設置重置為en_US.UTF-8(它帶有通常的中文語言環(huán)境)并使用它:

uname -a
Linux armsom-aim7 5.10.160 #98 SMP Thu Jan 2 15:14:22 CST 2025 aarch64 GNU/Linux

locale
sudo vi /etc/locale.gen
sudo locale-gen
sudo vi /etc/default/locale

GENAI、法學碩士 (LLM) 和 RKLLM

是的,我一拿到它就立即運行了 DeepSeek。這是一個很棒的派對技巧,但除了展示 NPU 的功能外,它并沒有做太多事情。

我發(fā)現更有趣的是直接在 NPU 上運行一些其他模型,例如marco-o1和gemma-2:

wKgZPGfaNVqAbLNjAAU4jziD8NQ313.jpg

NPU 上的gemma-2講解電視

但是,它們中的任何一個都非常緊湊 - 8GB 的 RAM 是主要的限制,我gemma-3:4b根本無法運行 - 盡管我能夠gemma-3:1b在下面運行ollama(因為我無法轉換它 - 更多信息見下文)。

因此,簡而言之,如果您打算使用 LLM,請選擇具有更多 eMMC 存儲和 RAM 的更大 SKU——8GB/32GB 版本對于除了幾個小型號之外的任何東西來說都太緊張了,即使這樣一次也只能使用一個。

工具說明

我對 Rockchip 工具鏈的抱怨之一是,很多rkllm代碼不完整且難以使用。不過,一些勇敢的人已經努力了,現在rkllm-1.1.4它實際上相當好用。

RK3588 的 NPU 還有一些其他工具可供使用,可能有助于那些想要嘗試 LLM 的人更輕松地完成任務,其中包括我在上面的屏幕截圖中使用的兩個工具:

rkllama為您提供ollama類似的體驗(甚至可以從云端下載預先轉換的模型,在本例中直接從 Huggingface 下載)

rknputop最接近nvtopNPU 使用情況的視圖(盡管仍然有點問題,并且包括 CPU、RAM 和溫度)

還有(最終)記錄的和可重復的方法來將模型轉換為格式,并且(甚至更好的是)Huggingface 上有.rkllm令人驚訝的數量的預先轉換的模型。

LLM 注意事項

轉換模型實際上變得有些簡單,只要你使用相對較舊的模型系列即可。例如,我無法轉換或格式化phi4最新的模型,因為:gemma3.rkllm

我遇到了很多與phi4標記器有關的問題,因此,盡管我可以轉換,但phi3相同的轉換代碼卻不適用于phi4。

gemma3在我完成這篇文章時剛剛發(fā)布,rkllm但該模型實際上宣稱自己是不同的“家族”,因此根本不受支持。

現在,還要過一段時間rkllm才會更新,但是現在我沒有時間或耐心去修改模型樹,所以我還沒能想出一個合適的解決方法。torchtransformers

但總體方法非常簡單:

from rkllm.api import RKLLM
from os.path import basename
import torch

# tried to use these to convert the tokenizer
from transformers import AutoTokenizer, AutoModel, PreTrainedTokenizerFast
#...

modelpath = './Phi-3-mini'
llm = RKLLM()

# options ['cpu', 'cuda']
ret = llm.load_huggingface(model=modelpath, model_lora = None, device='cuda')
# ret = llm.load_gguf(model = modelpath)
if ret != 0:
    print('Load model failed!')
    exit(ret)

# break out the parameters for quicker tweaking
ret = llm.build(do_quantization=True, 
                optimization_level=1,
                quantized_dtype="W8A8",
                quantized_algorithm="normal",
                target_platform="RK3588", 
                num_npu_core=3, 
                extra_qparams=None, 
                dataset=None)
if ret != 0:
    print('Build model failed!')
    exit(ret)

# Export rkllm model
ret = llm.export_rkllm(f"./{basename(modelpath)}_{quantized_dtype}_{target_platform}.rkllm")
if ret != 0:
    print('Export model failed!')
    exit(ret)

您還可以調整其他一些選項,但使用我的 3060 轉換幾個小模型僅花了幾分鐘。

視覺、語音和 RKNN

但是,我認為AIM7不會用于在現實生活中攻讀 LLM。

對于大多數人來說rknn-toolkit2可能會更感興趣,因為它允許您使用whisper各種版本的 YOLO(您可以從模型庫中獲取)進行語音和圖像識別。

我確實知道 Jetson Nano 被廣泛應用于生產線上的圖像處理和缺陷檢測,雖然我還沒有時間在這個板上實際測試 YOLO,但我知道AIM7是一個合適的替代品,因為許多其他 RK3588 板已經在使用它。

這就是為什么用 RK3588 主板直接替代 Jetson(順便說一句,Jetson 對功率要求很挑剔,而且更熱、更吵)是非常有意義的。

我不確定視頻幀速率,因為這總是嚴重依賴于模型,但早期帶有原始rknn工具包的 RK3588 主板能夠超過 25fps,而且我懷疑通過一些仔細的優(yōu)化,這個速率至少會翻倍。

但最重要的是,找到用于對象檢測的示例代碼并不難rknn,現在甚至還有來自Frigate等工具的官方支持,所以它肯定不再是一條未知的道路。

結論

我喜歡AIM7 – 我無法將它與我評測過的其他 RK3588 SBC在功能方面(芯片組和基本 I/O 除外)直接進行比較,因為它是專門為替代或與 Jetson 競爭而設計的,但具有諷刺意味的是,在所有這些產品中,它最適合工業(yè)應用——在這些應用中,你并不真正需要 NVMe 存儲,即使是 32GB 也足以擁有 YOLO 等視覺模型的多個副本。

我只是希望它能配備更多 RAM……

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    33025

    瀏覽量

    272870
  • banana pi
    +關注

    關注

    1

    文章

    120

    瀏覽量

    3264
收藏 0人收藏

    評論

    相關推薦

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    []() 2025年3月19日——Banana Pi 今日正式發(fā)布 BPI-AI2N & BPI-AI2N Carrier,基于瑞薩電子(Renesas)同步發(fā)布的最新的高性能
    發(fā)表于 03-19 17:54

    Banana Pi 與瑞薩電子攜手共同推動開源創(chuàng)新:BPI-AI2N

    創(chuàng)新應用。 ** 核心產品介紹** Banana Pi BPI-AI2N 核心板基于瑞薩最新的 RZ/V2N 處理器,搭載 4 核 Arm? Cortex?-A55(1.8GHz)與 Cortex
    發(fā)表于 03-12 09:43

    RK3588 EVB開發(fā)板原理圖講解【八】 RK3588 power Tree

    本帖最后由 瑞芯微方案開發(fā)老王 于 2025-3-1 11:41 編輯 一、RK3588電源架構核心特點 ?多電源域設計? 芯片通常劃分為多個獨立電源域(Power Domain),例如
    發(fā)表于 03-01 11:38

    rk3588硬件原理圖

    RK3588的硬件參考設計
    發(fā)表于 02-25 17:44 ?4次下載

    RK3588原理圖

    RK3588開發(fā)板原理圖文件
    發(fā)表于 02-24 15:57 ?7次下載

    Banana Pi開源社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)利器

    BPI-AIM7采用瑞芯微 RK3588,新一代旗艦八核64位處理器,主頻高達2.4GHz,6TOPS算力NPU,最高可配備32GB大內存。雖然該接口與Jetson Nano完全兼容,但PCIe接口
    發(fā)表于 02-19 18:27

    Banana Pi開源社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)利器

    Banana Pi開源社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)利器
    的頭像 發(fā)表于 02-19 18:25 ?919次閱讀
    <b class='flag-5'>Banana</b> <b class='flag-5'>Pi</b>開源社區(qū)基于瑞芯微<b class='flag-5'>RK3588</b>開發(fā)板,DeepSeek開發(fā)利器

    重新定義智能邊緣:明遠智睿RK3588核心板的無限可能

    明遠智?;?b class='flag-5'>RK二次開發(fā)的RK3588核心模組
    的頭像 發(fā)表于 02-11 17:19 ?321次閱讀
    重新定義智能邊緣:明遠智睿<b class='flag-5'>RK3588</b>核心板的無限可能

    米爾RK3576和RK3588怎么選?-看這篇就夠了

    4通道、DP v1.4和USB 3.0組合(Type - C)接口等多種接口。 RK3588最高可以支持7屏異顯和支持8K,具有雙HDMI2.1/eDP V1.4組合接口、雙MIPI - DSI TX
    發(fā)表于 12-27 11:44

    RK3588!黑神話悟空,啟動?-迅為電子RK3588開發(fā)板

    RK3588!黑神話悟空,啟動?-迅為電子RK3588開發(fā)板
    的頭像 發(fā)表于 08-30 14:13 ?961次閱讀
    <b class='flag-5'>RK3588</b>!黑神話悟空,啟動?-迅為電子<b class='flag-5'>RK3588</b>開發(fā)板

    基于迅為RK3568/RK3588開發(fā)板的AI圖像識別方案

    https://www.bilibili.com/video/BV1G54y1A7nf/?spm_id_from=333.999.0.0 迅為RK3568/RK3588開發(fā)板AI識別演
    發(fā)表于 08-28 09:50

    迅為電子RK3588S與RK3588硬件性能區(qū)別及板卡選型

    迅為電子RK3588S與RK3588硬件性能區(qū)別及板卡選型
    的頭像 發(fā)表于 06-25 15:30 ?4245次閱讀
    迅為電子<b class='flag-5'>RK3588</b>S與<b class='flag-5'>RK3588</b>硬件性能區(qū)別及板卡選型

    Banana Pi BPI-M7 RK3588開源硬件開發(fā)板評測試

    過去幾周,我對高性能 ARM 開發(fā)板的追求進展有些不順,但經過近三個月的測試,以下是我對Banana Pi BPI-M7的筆記。
    的頭像 發(fā)表于 06-18 15:21 ?896次閱讀
    <b class='flag-5'>Banana</b> <b class='flag-5'>Pi</b> <b class='flag-5'>BPI-M7</b> <b class='flag-5'>RK3588</b>開源硬件開發(fā)板評測試

    基于RK3588核心板的AI邊緣計算網關設計方案

    隨著物聯網和人工智能技術的飛速發(fā)展,邊緣計算逐漸成為數據處理和分析的重要趨勢。RK3588作為一款高性能的處理器,具備強大的計算能力和豐富的接口,為構建AI邊緣計算網關提供了有力的支持。本文將介紹
    的頭像 發(fā)表于 05-30 17:32 ?1708次閱讀
    基于<b class='flag-5'>RK3588</b>核心板的<b class='flag-5'>AI</b>邊緣計算網關設計方案

    Banana Pi BPI-M7 RK3588開發(fā)板運行RKLLM軟件堆AI大模型部署

    Banana Pi BPI-M7開源硬件開發(fā)板 RKLLM 軟件堆??梢詭椭脩艨焖賹?AI 模型部署到 Rockchip 芯片上。 整體框架如下:
    的頭像 發(fā)表于 04-11 17:12 ?2757次閱讀
    <b class='flag-5'>Banana</b> <b class='flag-5'>Pi</b> <b class='flag-5'>BPI-M7</b> <b class='flag-5'>RK3588</b>開發(fā)板運行RKLLM軟件堆<b class='flag-5'>AI</b>大模型部署

    電子發(fā)燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品