0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓生成式AI觸手可及 ——AirBox 正式開放預(yù)定

算能開發(fā)者社區(qū) ? 2024-04-26 08:34 ? 次閱讀

小型化、私有化, 大廠競逐端側(cè)生成式AI

2024年,端側(cè)運(yùn)行生成式AI,幾乎成了IntelAMD、高通廠商下一代芯片的標(biāo)配。

在CES上大火的Rabbit R1,可以利用ChatGPT來操作很多手機(jī)端的app,完全自然語言控制,演示視頻讓很多自媒體鼓吹可以拋棄手機(jī)了,但是有拿到產(chǎn)品的網(wǎng)友實(shí)測后發(fā)現(xiàn),單任務(wù)響應(yīng)時(shí)間超過20s,用戶體驗(yàn)不友好。

網(wǎng)絡(luò)訪問不暢通的情況下,如何才能獲得實(shí)時(shí)、低延遲的響應(yīng)?答案是,把生成式AI服務(wù)放在端側(cè),而不是在云、數(shù)據(jù)中心和端側(cè)節(jié)點(diǎn)之間頻繁傳輸?;赟G2300x打造的端側(cè)生成式AI盒子Airbox,Llama-7B的速度可以達(dá)到12 tokens/s,StableDiffusion 1s 出圖,讓生成式AI觸手可及。

b9c6aa40-0364-11ef-9118-92fbcf53809c.png

SG2300X:令人驚喜的端側(cè)生成式AI處理能力

產(chǎn)品規(guī)格SG2300X
處理器ARMA538核2.3GHz
內(nèi)存LPDDR4x 4.266 Gbps 128bit 68.256 GB/s;最大容量支持16GB
智能算力24 TOPS INT8;12 TFLOPS FP16/BF16;2 TFLOPS FP32;支持混合精度計(jì)算
視頻解碼H.264 & H.265: 32路 1080P @25fps;最大分辨率支持7680* 4320
視頻編碼H.264 & H.265: 12路 1080P @25fps;最大分辨率支持7680* 4320
圖片編解碼JPEG:解碼750張/秒@1080P;編碼250張/秒@1080P;最大分辨率支持 32768 * 32768
視頻后處理

支持圖像的CSC(RGB/YUV/HSV),resize(1/128~128),crop

支持padding,border,font,contrastandbrightnessadjustment

最大分辨率支持8192*8192,分辨率超過的圖片支持切割處理后拼接

支持8bits輸入格式:Y only,YUV420/YUV422/YUV444 Planar,NV12/NV21/NV16/NV61 Semi-planar,RGB planar and packed,YUV444 packed,YUV422 packed

支持8/16/32bits輸出格式:YUV444/RGB planar

支持8bits輸出格式:Y only planar,YUV420/I420 planar,NV12/NV21 semi planar,RGBY/BGRY planar,RGB/BGR packed

高速接口

PCIeGen3X16EP,可配置成X8RC+X8EP,支持級(jí)聯(lián)

2個(gè)以太網(wǎng)RGMII接口,支持速率10/100/1000Mbps;1個(gè)SD/SDIO controller;1個(gè)eMMC 5.1,總線位寬4-bit

低速接口1個(gè)SPI Flash接口;3個(gè)UART接口,3個(gè)I2C接口;2個(gè)PWM接口,2個(gè)風(fēng)扇轉(zhuǎn)速檢測接口;32個(gè)通用IO
安全性支持AES/DES/SM4/SHA/RSA/ECC 加速;支持真隨機(jī)數(shù)產(chǎn)生;支持安全密鑰存儲(chǔ)機(jī)制,支持安全啟動(dòng),支持Trustzone
典型功耗20W
工作溫度-40℃~+105℃
工具鏈支持TensorFlow / Pytorch / Paddle / Caffe / MxNet / DarkNet / ONNX;支持TensorFlow / Pytorch / Paddle / TensorRT 以及客戶定制的INT8、FP16、BF16量化算法

SG2300X處理器擁有24T的算力,能夠流暢運(yùn)行像LLAMA-2 7B這樣的生成式AI。

SG2300X驚人的算力使其可以在更短的時(shí)間內(nèi)處理更多的數(shù)據(jù),實(shí)現(xiàn)更快的響應(yīng)速度,為用戶帶來更加流暢和智能的體驗(yàn)。

b9f20d52-0364-11ef-9118-92fbcf53809c.png

瑞莎 AirBox:國產(chǎn)化邊緣智算設(shè)備

b9fdb60c-0364-11ef-9118-92fbcf53809c.png

瑞莎 Fogwise AirBox是瑞莎計(jì)算機(jī)團(tuán)隊(duì)研發(fā)的搭載SG2300X的邊緣智算盒子,算力高達(dá) 24TOPS@INT8,支持多精度(INT8、FP16/BF16、FP32),支持私有 GPT、文本到圖像等主流智能模型部署,配備鋁合金外殼,可在惡劣環(huán)境中部署。


AirBox 的核心元器件皆采用國產(chǎn)元器件,且瑞莎計(jì)算機(jī)擁有AirBox的完全知識(shí)產(chǎn)權(quán),無懼“卡脖子”。

Radxa Fogwise AirBox
形態(tài)尺寸104mm x 84mm x 52mm
處理器SOPHON SG2300X SoC,八核 Arm Cortex-A53(ARMv8)@ 2.3GHz
TPU張量處理單元,計(jì)算能力:最高達(dá)24TOPS(INT8),12TFLOPS(FP16/BF16)和2TFLOPS(FP32)
支持領(lǐng)先的深度學(xué)習(xí)框架,包括 TensorFlow、Caffe、PyTorch、Paddle、ONNX、MXNet、Tengine 和 DarkNet
內(nèi)存16GB LPDDR4X
存儲(chǔ)工業(yè)級(jí) 64GB eMMC
16MB SPI 閃存
提供高速SD卡的SD卡插槽
多媒體支持解碼32路H.265/H.264 1080p@25fps視頻
完全處理32路高清1080P@25fps視頻,涉及解碼和AI分析
支持編碼12路H.265/H.264 1080p@25fps視頻
JPEG:1080P@600fps,支持最大32768 x 32768
支持視頻后處理,包括圖像CSC、調(diào)整大小、裁剪、填充、邊框、字體、對(duì)比度和亮度調(diào)整。
連接?2x 千兆以太網(wǎng)端口RJ45
1x M.2 M Key(2230/2242)用于NVMe SSD
1x M.2 E Key用于WI-FI/BT
工作溫度0°C 到 45°C
外殼耐腐蝕的鋁合金外殼
散熱器PWM調(diào)速風(fēng)扇與定制散熱片

大算力+大內(nèi)存,AirBox打開智能本地化潘多拉魔盒

SG2300X中運(yùn)行的 Llama-7B 模型,權(quán)重量化為 INT4,計(jì)算采用 FP16,在計(jì)算第一個(gè) token 的時(shí)候算力利用率最高達(dá)到了80%,后續(xù)的推理有kvcache 加持,算力需求有所下降,數(shù)據(jù)搬運(yùn)的時(shí)間完全覆蓋了計(jì)算的時(shí)間,瓶頸從計(jì)算來到了帶寬上。


而 StableDiffusion 類的模型,全程都會(huì)有密集的算力需求,所以如果想要同時(shí)高效運(yùn)行 LLM 和 Stable Diffusion 類模型,大算力和大內(nèi)存都是需要的,Airbox 采用的主控 SG2300x 擁有 24TOPS 的 INT8、12TFLOPS 的 FP16 以及 16G 的內(nèi)存、128bit帶寬,恰逢其時(shí)。


本地運(yùn)行并且把響應(yīng)時(shí)間控制到 1s 以內(nèi),將極大地提升用戶體驗(yàn)。以 qwen-7b 模型為例,跑在 Airbox 上的 latency 為 0.6s,后續(xù)推理的速度達(dá)到 12 token/s,能夠滿足自然語言問答、語音交互等場景的實(shí)時(shí)性需求。


Airbox 同時(shí)也是一個(gè)完整的運(yùn)行 Ubuntu Linux 的服務(wù)器,它可以支持 CASAOS,獨(dú)立提供服務(wù),只要聯(lián)網(wǎng)的設(shè)備,就能共享它的算力,古董PC機(jī)、平板、手機(jī)、NAS、音箱、故事機(jī)、電視等設(shè)備都能擁有生成式AI的能力,”一機(jī)多用“ 已成為現(xiàn)實(shí)。

¥2699!極致性價(jià)比,讓每個(gè)人都擁有端側(cè)智能設(shè)備

對(duì)比目前主流的端側(cè)算力產(chǎn)品,AirBox本地運(yùn)行生成式AI的效率如何呢?

以Nvidia Jetson 系列多款支持生成式AI的設(shè)備為例,京東商城上 Jetson Orin 32G版本售價(jià) 8015 元,64G 版本 15600 元。ba19ea5c-0364-11ef-9118-92fbcf53809c.png

AGX Orin 通過 MLC 加速之后 Llama-7B 47tokens/s,Llama-2-13B 25 tokens/s:airbox 上 Llama2-7B 性能是 12 tokens/s, Llama2-13B 性能是 6 tokens/s,可以支持int4、int8、fp16精度,llama2 及其各種變種模型性能相似;單芯最大可以跑20B-int4的模型。

ba24cbfc-0364-11ef-9118-92fbcf53809c.png

(注:Orin數(shù)據(jù)來源英偉達(dá)官網(wǎng);此處數(shù)據(jù)越高越好)

經(jīng)測試發(fā)現(xiàn):AGX Orin和AirBox的每人民幣(產(chǎn)品售價(jià))可獲得的每秒token數(shù)(實(shí)際性能),AirBox有著顯著的優(yōu)勢。

Llama-7B:

AGX Orin(64G)≈0.00301 每秒token數(shù)/每人民幣

AirBox≈0.00445 每秒token數(shù)/每人民幣

Llama-13B:

AGX Orin(32G)≈0.00160 每秒token數(shù)/每人民幣

AirBox≈0.00222 每秒token數(shù)/每人民幣

AGX Orin上 Stable Diffusion 每張圖耗時(shí) 2.2s,SDXL 耗時(shí) 23.1s;Airbox使用LCM加速之后,SD1.5 耗時(shí) 1.1s,SDXL耗時(shí) 7.4s。ba365516-0364-11ef-9118-92fbcf53809c.png

(注:Orin數(shù)據(jù)來源英偉達(dá)官網(wǎng);Orin未標(biāo)明步數(shù),此處假設(shè)都是20步;此處數(shù)據(jù)越低越好)

豐富的生態(tài)應(yīng)用

瑞莎 Fogwise AirBox 可提供卓越的智能性能,滿足您對(duì)強(qiáng)大計(jì)算能力的需求。這款小巧但功能強(qiáng)大的設(shè)備可與 Tensorflow、Pytorch 和 Caffe 等領(lǐng)先的深度學(xué)習(xí)框架無縫兼容,為用戶提供便攜、高效的智能體驗(yàn)。無論您是制造商、智算愛好者、業(yè)余愛好者還是專業(yè)人士,F(xiàn)ogwise AirBox都是您的最佳選擇。

ba3e270a-0364-11ef-9118-92fbcf53809c.png

支持LLama 3:Meta 最新開源生成式AI

Meta 表示,Llama 3 在多個(gè)關(guān)鍵基準(zhǔn)測試中展現(xiàn)出卓越性能,超越了業(yè)內(nèi)先進(jìn)的同類模型。無論是在代碼生成、復(fù)雜推理,還是在遵循指令和可視化想法方面,Llama 3 都實(shí)現(xiàn)了全面領(lǐng)先。該模型在以下五個(gè)基準(zhǔn)測試中均表現(xiàn)出色:

MMLU(學(xué)科知識(shí)理解)

GPQA(一般問題解答)

HumanEval(代碼能力)

GSM-8K(數(shù)學(xué)能力)

MATH(高難度數(shù)學(xué)問題)

面對(duì) Llama 3 如此激動(dòng)人心的性能,Airbox 團(tuán)隊(duì)積極響應(yīng),快速將 Llama 3 8B 移植并成功在 Airbox 上運(yùn)行。以下視頻展示了 Llama 3 8B 在 Airbox 上的運(yùn)行情況:


(注:Llama 3 8B 知識(shí)更新到 2023 年 3 月)

可以看到,Llama 3 8B 在 Airbox 上的運(yùn)行表現(xiàn)極為流暢,達(dá)到了 9.6 token/s 的處理速度,已充分展現(xiàn)出其實(shí)用價(jià)值。

AirBox 團(tuán)隊(duì)率先推出基于AirBox的Llama 3 8B 的在線體驗(yàn),歡迎各位切身感受來自 Llama 3 的高超性能與 AirBox所提供的澎湃算力。

關(guān)注瑞莎公眾號(hào)回復(fù)【airbox】即可快速體驗(yàn)

(注:服務(wù)基于單個(gè) AirBox 部署,如同時(shí)體驗(yàn)人數(shù)較多,可能會(huì)出現(xiàn)排隊(duì)情況,如需深度體驗(yàn),建議您在流量低峰時(shí)進(jìn)行)

支持CASA OS:輕量且功能豐富的開源面板系統(tǒng)


通過CASA OS 一鍵安裝 AirBox 生成式AI應(yīng)用

目前已支持 Stable Diffusion、Whisper、ImageSearch、ChatDoc等熱門模型,一鍵輕松安裝,免去繁瑣環(huán)境配置。

文生圖、圖生圖:為您的靈感增添翅膀

AirBox 團(tuán)隊(duì)針對(duì) StableDiffusion 進(jìn)行深度優(yōu)化和適配,極速出圖。支持在線模型更換。

ChatDoc:讓AI讀懂你的文件

讓 AirBox 成為你的私人數(shù)據(jù)管家。

ba708d1c-0364-11ef-9118-92fbcf53809c.png

Whisper:上百種語言實(shí)時(shí)轉(zhuǎn)文本

Whisper 這個(gè)高效的語音識(shí)別模型能夠?qū)崟r(shí)將語音轉(zhuǎn)換為文本,支持近百種語言,極大地提升了信息獲取的便捷性和準(zhǔn)確性。無論是會(huì)議記錄、實(shí)時(shí)多語翻譯還是為視聽障人士提供實(shí)時(shí)字幕,Whisper 都能提供強(qiáng)大的支持,教育、醫(yī)療、法律等多個(gè)領(lǐng)域都將受益于其精準(zhǔn)和快速的語音轉(zhuǎn)錄服務(wù)。

未來,以LLaMa、Stable Diffusion、Whisper 等生成式AI模型為基座,將誕生更多模態(tài)的交叉應(yīng)用,催生出前所未見的智算能力,覆蓋語音、圖像和文本等多個(gè)領(lǐng)域。設(shè)想這樣一個(gè)場景:一個(gè)全能的智能個(gè)人助理,Whisper加TTS模型提供真實(shí)的多語種能力,實(shí)時(shí)翻譯和轉(zhuǎn)寫全球任何一種語言的對(duì)話,同時(shí)利用Stable Diffusion創(chuàng)造出視覺內(nèi)容來輔助溝通,這將徹底改變國際會(huì)議、遠(yuǎn)程教育和全球合作的方式,加速數(shù)字世界的到來!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    455

    文章

    50816

    瀏覽量

    423615
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7494

    瀏覽量

    87954
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30896

    瀏覽量

    269086
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    德州儀器成功舉辦2024嵌入技術(shù)創(chuàng)新發(fā)展研討會(huì)

    嵌入技術(shù)正改變著我們所熟知的世界。從車載儀表盤到家用電器,從工業(yè)自動(dòng)化到家庭娛樂,嵌入系統(tǒng)以其高效、穩(wěn)定、智能的特點(diǎn),默默改變著我們的生活方式,科技更加貼近生活,未來
    的頭像 發(fā)表于 11-04 13:37 ?235次閱讀

    生成AI工具作用

    生成AI工具是指那些能夠自動(dòng)生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.ai小編為您整理
    的頭像 發(fā)表于 10-28 11:19 ?236次閱讀

    谷歌Vertex AI助力企業(yè)生成AI應(yīng)用

    過去的一段時(shí)間,我們看到了許多 Google Cloud 客戶對(duì)生成 AI 和 agent 的精彩應(yīng)用,令我們拍案叫絕。為了企業(yè)能夠更快推出功能強(qiáng)大的
    的頭像 發(fā)表于 09-09 15:59 ?508次閱讀

    智慧交通,科技觸手可及!

    智慧交通 系統(tǒng)是一種利用現(xiàn)代科技手段,包括物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)分析等技術(shù),對(duì)城市交通運(yùn)行進(jìn)行實(shí)時(shí)監(jiān)測、數(shù)據(jù)分析和智能調(diào)控的系統(tǒng)。這一系統(tǒng)的應(yīng)用領(lǐng)域和范圍十分廣泛,涉及到城市交通管理、公共安全、環(huán)境保護(hù)、資源節(jié)約等多個(gè)方面,對(duì)提升城市的可持續(xù)發(fā)展和居民生活質(zhì)量具有重要意義。 智慧交通系統(tǒng)的應(yīng)用領(lǐng)域 1.交通管理 智慧交通系統(tǒng)可以通過實(shí)時(shí)監(jiān)測車流密度、道路狀況等信息,優(yōu)化信號(hào)燈設(shè)置,提高道路通行效率,減少交
    的頭像 發(fā)表于 08-01 11:39 ?360次閱讀
    智慧交通,<b class='flag-5'>讓</b>科技<b class='flag-5'>觸手可及</b>!

    亞馬遜云科技推出生成AI服務(wù)Amazon App Studio

    在近期于紐約盛大召開的亞馬遜云科技峰會(huì)上,一場關(guān)于未來應(yīng)用開發(fā)的革命性變革悄然拉開序幕。亞馬遜云科技正式推出了其顛覆性產(chǎn)品——Amazon App Studio,一個(gè)由前沿生成AI技術(shù)驅(qū)動(dòng)的創(chuàng)新平臺(tái),旨在以前所未有的便捷方式,
    的頭像 發(fā)表于 07-11 17:07 ?705次閱讀

    如何用C++創(chuàng)建簡單的生成AI模型

    生成AI(Generative AI)是一種人工智能技術(shù),它通過機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)技術(shù),從大量歷史數(shù)據(jù)中學(xué)習(xí)對(duì)象的特征和規(guī)律,從而能夠生成
    的頭像 發(fā)表于 07-05 17:53 ?863次閱讀

    生成AI的基本原理和應(yīng)用領(lǐng)域

    生成人工智能(Generative Artificial Intelligence,簡稱Generative AI)是一種利用機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)技術(shù),通過模擬人類的創(chuàng)造性思維過程,生成
    的頭像 發(fā)表于 07-04 11:50 ?1481次閱讀

    芯原AI技術(shù)研討會(huì):引領(lǐng)嵌入AI新潮流

    在2024年上海國際嵌入展的熱烈氛圍中,芯原股份以其前瞻性的技術(shù)視角和豐富的產(chǎn)品線布局,吸引了眾多業(yè)界目光。此次展會(huì)期間,芯原股份舉辦了一場以“從云到端,AI觸手可及”為主題的AI
    的頭像 發(fā)表于 06-15 14:53 ?757次閱讀

    原來這才是【生成AI】!!

    隨著ChatGPT、文心一言等AI產(chǎn)品的火爆,生成AI已經(jīng)成為了大家茶余飯后熱議的話題??墒牵瑸槭裁匆?b class='flag-5'>AI前面加上“
    的頭像 發(fā)表于 06-05 08:04 ?290次閱讀
    原來這才是【<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>】??!

    飛騰云——高端音質(zhì)觸手可及

    飛騰云科技的解決方案現(xiàn)在已經(jīng)廣泛應(yīng)用于桌面USB高清多功能音響和桌面USB高清音頻解碼器。真正實(shí)現(xiàn)每一個(gè)音質(zhì)追求者都能以親民的價(jià)格,享受到頂級(jí)的音質(zhì)體驗(yàn),高端音質(zhì)
    的頭像 發(fā)表于 05-28 15:35 ?372次閱讀
    飛騰云——<b class='flag-5'>讓</b>高端音質(zhì)<b class='flag-5'>觸手可及</b>

    生成AI的「七宗罪」!

    面對(duì)生成AI日漸增長的「罪惡」,我們該如何解決問題?
    的頭像 發(fā)表于 05-07 16:34 ?1768次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的「七宗罪」!

    天馬鼎力支持ThinkPad T14p AI元啟版實(shí)現(xiàn)全球首發(fā)

    4月18日,第十屆聯(lián)想創(chuàng)新科技大會(huì)Tech World在上海舉行,天馬鼎力支持ThinkPad T14p AI元啟版實(shí)現(xiàn)全球首發(fā)。作為商務(wù)PC引領(lǐng)者,ThinkPad將推動(dòng)AI PC步入一個(gè)更加智能化、個(gè)性化的新紀(jì)元,
    的頭像 發(fā)表于 04-19 09:56 ?517次閱讀

    生成 AI 進(jìn)入模型驅(qū)動(dòng)時(shí)代

    隨著ChatGPT和大型語言模型(LLM)呈現(xiàn)爆炸增長,生成人工智能(GenerativeAI)成為近來的一大熱詞。由此引發(fā)了一場爭論:哪種AI模型使用的訓(xùn)練參數(shù)最多?與此同時(shí),更
    的頭像 發(fā)表于 04-13 08:12 ?533次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 進(jìn)入模型驅(qū)動(dòng)時(shí)代

    分布系統(tǒng)打造智慧城市展廳亮點(diǎn),未來城市生活觸手可及

    和創(chuàng)新的解決方案,正在為智慧城市展廳打造亮點(diǎn),未來城市生活觸手可及。 首先,訊維分布系統(tǒng)通過集成高清大屏、觸摸屏、AR/VR等先進(jìn)技術(shù),為智慧城市展廳帶來了身臨其境的展示效果。觀眾可以仿佛置身于未來的城市之中
    的頭像 發(fā)表于 03-04 15:42 ?318次閱讀

    生成AI對(duì)智能家居的影響

    電子發(fā)燒友網(wǎng)站提供《生成AI對(duì)智能家居的影響.pdf》資料免費(fèi)下載
    發(fā)表于 01-02 14:50 ?17次下載