0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

把大模型裝進(jìn)小盒子:這個(gè)小魔盒直擊端側(cè)AIGC的痛點(diǎn)!

算能開發(fā)者社區(qū) ? 2024-05-10 08:33 ? 次閱讀

私有本地化部署:智能硬件的未來

隨著當(dāng)下數(shù)字化的高速發(fā)展,今年將會(huì)迎來“大模型應(yīng)用爆發(fā)元年”。市面上不少大模型產(chǎn)品應(yīng)運(yùn)而生,在大模型普惠應(yīng)用井噴的時(shí)代,這類產(chǎn)品的使用存在許多門檻和風(fēng)險(xiǎn),比如高昂的服務(wù)器部署成本、在運(yùn)行過程中會(huì)過度依賴網(wǎng)絡(luò)狀態(tài)、以及難以保障數(shù)據(jù)的安全性等問題。

為了解決大模型產(chǎn)品使用期間所產(chǎn)生的算力成本高、網(wǎng)絡(luò)波動(dòng)、數(shù)據(jù)隱私等問題,F(xiàn)irefly開源團(tuán)隊(duì)推出可本地化部署的智能盒子:AIBOX-1684X

Firefly智能新品:智能算力小魔盒

AIBOX-1684X支持主流大模型私有化部署,僅掌心大小的體積就能把智算能力私有化,能夠滿足個(gè)性化的智能部署!其算力高達(dá)32Tops,擁有八核2.3GHz處理器,兼具穩(wěn)定性、私密性、精致小巧等特性。

支持主流大模型

AIBOX-1684X幾乎支持目前主流大模型的本地化運(yùn)行,包括LLaMa3,ChatGLM3,Qwen等語(yǔ)言大模型,SAM等視覺大模型,以及Stable Diffusion 智能繪圖。

私有化部署

本地化部署,無懼?jǐn)嗑W(wǎng)

無需網(wǎng)絡(luò)即可使用智算的能力,不受網(wǎng)絡(luò)狀態(tài)影響,任務(wù)運(yùn)行更穩(wěn)定。

支持主流

開源透明,安全無風(fēng)險(xiǎn)

使用全開源智能模型部署工具鏈,透明可信任,做到零安全隱患。

f98d6aa0-0e64-11ef-9118-92fbcf53809c.jpg

精致小巧,隨處部署

僅掌心大小,10cm內(nèi)的小方盒,表面柔潤(rùn)精致的鋁合金切割工藝,在哪部署都合適。

f9a0fd72-0e64-11ef-9118-92fbcf53809c.jpg

極致性能:快速響應(yīng),無需多等

千字文本生成僅需10.2秒

AIBOX在本地運(yùn)行時(shí),擁有極快的響應(yīng)時(shí)間,能夠更好地提升用戶體驗(yàn)。例如在Qwen1.5-1.8B模型中,推理性能可達(dá)到32.5 token/s,相當(dāng)于其生成一篇1000字的文章僅需約10.2秒,可實(shí)現(xiàn)自然語(yǔ)言的快速問答。

f9b256f8-0e64-11ef-9118-92fbcf53809c.png

標(biāo)準(zhǔn)圖像生成僅需7秒

支持 AIGC 領(lǐng)域的 Stable DiffusionV1.5 圖像生成模型,在Stable Diffusion V1.5模型中,生成512* 512尺寸的圖片僅需約7秒。

開箱即用:已適配主流大模型

Meta旗下最新開源大模型Llama3運(yùn)行演示:


清華與智譜合作研發(fā)的ChatGLM3-6B演示:


阿里通義千問開源大模型Qwen1.5-1.8B演示:


支持多種深度學(xué)習(xí)框架

AIBOX支持所有主流大模型深度學(xué)習(xí)框架,包括TensorFlow、PyTorch、MXNet、PaddlePaddle、ONNX和Darknet,并支持自定義算子開發(fā)。

高配硬件性能,運(yùn)行暢通無阻

搭載SOPHON算能智算處理器BM1684X,最高主頻2.3GHz,最高支持32路1080P H.264/H.265的視頻解碼,32路1080P高清視頻全流程處理(解碼+智能分析)

f9e80906-0e64-11ef-9118-92fbcf53809c.jpg

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30998

    瀏覽量

    269312
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    363

    瀏覽量

    1557
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2476

    瀏覽量

    2803
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    廣和通開啟側(cè)AI新時(shí)代

    AI發(fā)展正酣,隨著終端芯片算力越來越高、側(cè)模型能力越來越強(qiáng)、實(shí)時(shí)響應(yīng)及隱私保護(hù)的側(cè)應(yīng)用需求增加,
    的頭像 發(fā)表于 12-12 10:35 ?207次閱讀

    訊飛星火側(cè)模型發(fā)布

    參數(shù)量小、內(nèi)存占比小的側(cè)模型,正成為“兵家必爭(zhēng)之地”。
    的頭像 發(fā)表于 12-04 16:07 ?793次閱讀

    智譜推出四個(gè)全新側(cè)模型 攜英特爾按下AI普及加速鍵

    隨著AI的發(fā)展,側(cè)AI模型越來越受到廣大客戶及廠商的關(guān)注,業(yè)界領(lǐng)先的大模型公司智譜于近日推出了四個(gè)全新的
    的頭像 發(fā)表于 12-02 17:13 ?215次閱讀
    智譜推出四個(gè)全新<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>模型</b> 攜英特爾按下AI普及加速鍵

    AIGC系統(tǒng)中多個(gè)模型的切換調(diào)用方案探索

    作者:京東科技 賈玉龍 1 背景 1.1 現(xiàn)狀 AIGC系統(tǒng)中多個(gè)模型的切換調(diào)用通常指的是在同一個(gè)AIGC系統(tǒng)或應(yīng)用中,可以根據(jù)不同的輸入條件或任務(wù)需求,動(dòng)態(tài)地選擇并調(diào)用不同的機(jī)器學(xué)習(xí)模型
    的頭像 發(fā)表于 11-27 11:43 ?186次閱讀
    <b class='flag-5'>AIGC</b>系統(tǒng)中多個(gè)<b class='flag-5'>模型</b>的切換調(diào)用方案探索

    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動(dòng)側(cè)AI規(guī)?;卣?/a>

    當(dāng)前,AI大模型走向側(cè)已經(jīng)是大勢(shì)所趨,側(cè)AI的發(fā)展將推動(dòng)人工智能成為影響世界的第四次工業(yè)革命。與傳統(tǒng)的云端大
    的頭像 發(fā)表于 11-26 01:00 ?162次閱讀
    把握關(guān)鍵節(jié)點(diǎn),美格智能持續(xù)推動(dòng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI規(guī)?;卣? />    </a>
</div>                            <div   id=

    2024德國(guó)慕展現(xiàn)場(chǎng)

    2024德國(guó)慕展現(xiàn)場(chǎng)
    的頭像 發(fā)表于 11-16 01:00 ?222次閱讀
    2024德國(guó)慕展現(xiàn)場(chǎng)<b class='flag-5'>直</b><b class='flag-5'>擊</b>

    側(cè)AI應(yīng)用趨熱:NPU如何解決其關(guān)鍵點(diǎn)

    當(dāng)前,AI大模型正逐步從云端遷移至邊緣,甚至深入至日常生活中的手機(jī)、個(gè)人電腦(PC)、汽車等終端。在這場(chǎng)變革中,側(cè)智能正逐漸嶄露頭角,預(yù)示著未來的智能設(shè)備將能夠更實(shí)時(shí)、高效地理解和服務(wù)用戶。在E維
    的頭像 發(fā)表于 10-31 15:00 ?556次閱讀

    蔡司工業(yè)CT掃描電鏡等醫(yī)療質(zhì)量點(diǎn)

    中高端醫(yī)療器械往往面臨技術(shù)復(fù)雜度更高、元器件及材料繁多、研發(fā)生產(chǎn)及質(zhì)量保障難度大等挑戰(zhàn)。快速、精準(zhǔn)、全面、靈活的質(zhì)量方案已經(jīng)成為客戶廣泛關(guān)注的熱點(diǎn)。+五大應(yīng)用展區(qū)直醫(yī)療行業(yè)質(zhì)量點(diǎn)活動(dòng)現(xiàn)場(chǎng),我們5
    的頭像 發(fā)表于 09-26 14:35 ?896次閱讀
    蔡司工業(yè)CT掃描電鏡等<b class='flag-5'>直</b><b class='flag-5'>擊</b>醫(yī)療質(zhì)量<b class='flag-5'>痛</b><b class='flag-5'>點(diǎn)</b>

    基于AX650N/AX630C部署側(cè)大語(yǔ)言模型Qwen2

    本文將分享如何將最新的側(cè)大語(yǔ)言模型部署到超高性價(jià)比SoC上,向業(yè)界對(duì)側(cè)模型部署的開發(fā)者提供
    的頭像 發(fā)表于 07-06 17:43 ?3594次閱讀
    基于AX650N/AX630C部署<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>大語(yǔ)言<b class='flag-5'>模型</b>Qwen2

    產(chǎn)品應(yīng)用 | 小盒子跑大模型!英碼科技基于算能BM1684X平臺(tái)實(shí)現(xiàn)大模型私有化部署

    應(yīng)對(duì)這些挑戰(zhàn),在邊緣側(cè)私有化部署大模型成為了一個(gè)有效的解決方案。 將大模型部署到邊緣側(cè),不僅能夠減少延遲和帶寬消耗,使得大模型能夠在邊緣節(jié)點(diǎn)
    的頭像 發(fā)表于 06-14 16:29 ?721次閱讀
    產(chǎn)品應(yīng)用 | <b class='flag-5'>小盒子</b>跑大<b class='flag-5'>模型</b>!英碼科技基于算能BM1684X平臺(tái)實(shí)現(xiàn)大<b class='flag-5'>模型</b>私有化部署

    【AIBOX】裝在小盒子的AI足夠強(qiáng)嗎?

    Firefly推出大語(yǔ)言模型本地部署的產(chǎn)品:AIBOX-1684X,目前已適配主流的大語(yǔ)言模型,包括ChatGLM3-6B,以下是ChatGLM3在AIBOX-1684X上的實(shí)機(jī)演示
    的頭像 發(fā)表于 05-15 08:02 ?453次閱讀
    【AIBOX】裝在<b class='flag-5'>小盒子</b>的AI足夠強(qiáng)嗎?

    AI硬件大爆發(fā),這個(gè)魔盒側(cè)AIGC點(diǎn)

    私有本地化部署:AI硬件的未來隨著當(dāng)下AI的高速發(fā)展,今年將會(huì)迎來“大模型應(yīng)用爆發(fā)元年”。市面上不少大模型產(chǎn)品應(yīng)運(yùn)而生,在大模型普惠應(yīng)用井噴的時(shí)代,這類產(chǎn)品的使用存在許多門檻和風(fēng)險(xiǎn),比如高昂的服務(wù)器
    的頭像 發(fā)表于 05-07 08:02 ?427次閱讀
    AI硬件大爆發(fā),<b class='flag-5'>這個(gè)</b>小<b class='flag-5'>魔盒</b><b class='flag-5'>直</b><b class='flag-5'>擊</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>AIGC</b>的<b class='flag-5'>痛</b><b class='flag-5'>點(diǎn)</b>

    商湯發(fā)布業(yè)內(nèi)最快推理速度「日日新 5.0 側(cè)模型

    現(xiàn)在,就是AI大模型側(cè)應(yīng)用的春天!
    的頭像 發(fā)表于 04-29 10:32 ?592次閱讀
    商湯發(fā)布業(yè)內(nèi)最快推理速度「日日新 5.0 <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>大<b class='flag-5'>模型</b>」

    AIBOX-1684X:大語(yǔ)言模型“裝”進(jìn)小盒子

    AIBOX-1684X支持主流大模型私有化部署,算力高達(dá)32TOPS,同時(shí)也支持CNN、RNN、LSTM等傳統(tǒng)網(wǎng)絡(luò)架構(gòu),支持TensorFNNX和Darknet等深度學(xué)習(xí)架構(gòu),并支持自定義算子開發(fā)
    的頭像 發(fā)表于 04-20 08:02 ?1297次閱讀
    AIBOX-1684X:<b class='flag-5'>把</b>大語(yǔ)言<b class='flag-5'>模型</b>“裝”進(jìn)<b class='flag-5'>小盒子</b>

    榮耀引領(lǐng)側(cè)AI新時(shí)代

    在今年的MWC盛會(huì)上,榮耀宣布與高通、Meta攜手,將70億參數(shù)大模型引入側(cè),這一創(chuàng)新舉措預(yù)示著側(cè)AI新時(shí)代的到來。榮耀終端CEO趙明在
    的頭像 發(fā)表于 03-01 10:28 ?650次閱讀