0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Llama 3 王者歸來,Airbox 率先支持部署

算能開發(fā)者社區(qū) ? 2024-04-22 08:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前天,智算領(lǐng)域迎來一則令人振奮的消息:Meta 正式發(fā)布了備受期待的開源大模型——Llama 3。

ed9ee800-003f-11ef-9118-92fbcf53809c.png

Llama 3 的卓越性能

Meta 表示,Llama 3 在多個關(guān)鍵基準測試中展現(xiàn)出卓越性能,超越了業(yè)內(nèi)先進的同類模型。無論是在代碼生成、復(fù)雜推理,還是在遵循指令和可視化想法方面,Llama 3 都實現(xiàn)了全面領(lǐng)先。該模型在以下五個基準測試中均表現(xiàn)出色:

MMLU(學(xué)科知識理解)

GPQA(一般問題解答)

HumanEval(代碼能力)

GSM-8K(數(shù)學(xué)能力)

MATH(高難度數(shù)學(xué)問題)

無論是 8B 規(guī)格的 Llama3 還是 70B 規(guī)格,它們都較市場上其他優(yōu)秀大模型表現(xiàn)更佳。

edb0b3c8-003f-11ef-9118-92fbcf53809c.png

縱向?qū)Ρ蕊@示,Llama 3 的性能大幅領(lǐng)先于前代產(chǎn)品 Llama 2,尤其是在 8B 規(guī)格上,遠超過 Llama 2 時代的 13B 和 70B 規(guī)格;新的 70B 規(guī)格更是展現(xiàn)出與 GPT-4 早期版本相媲美的能力。

指令調(diào)優(yōu)模型

Benchmark

Llama 3

8B

Llama 2

7B

Llama 2

13B

Llama 3

70B

Llama 2

70B

MMLU

(5-shot)

68.434.147.88252.9

GPQA

(0-shot)

34.221.722.339.521

HumanEval

(0-shot)

62.27.91481.725.6

GSM-8K

(8-shot, CoT)

79.625.777.49357.5

MATH

(4-shot, CoT)

303.86.750.411.6

瑞莎 Airbox 快速支持 Llama 3

面對 Llama 3 如此激動人心的性能,Airbox 團隊積極響應(yīng),快速將 Llama 8B 移植并成功在 Airbox 上運行。以下視頻展示了 Llama 8B 在 Airbox 上的運行情況:


(注:Llama 3 8B 知識更新到 2023 年 3 月)

可以看到,Llama 3 8B 在 Airbox 上的運行表現(xiàn)極為流暢,達到了 9.6 token/s 的處理速度,已充分展現(xiàn)出其實用價值。與其他應(yīng)用結(jié)合使用時,更開辟了廣闊的應(yīng)用前景和創(chuàng)新可能性。Airbox 團隊后續(xù)會對 Llama 3 8B 做更多測試并公布結(jié)果。

關(guān)于瑞莎 Fogwise Airbox

瑞莎智算盒子 Fogwise Airbox 是一款面向側(cè)端生成式智算的邊緣計算微型服務(wù)器,基于算能最新專為生成式智算打造的 SG2300X 處理器設(shè)計,具有開箱即用,本地離線部署,注重數(shù)據(jù)隱私,多精度支持,高能效比,高性價比,系統(tǒng)/文檔/工具鏈開源等特點,是當前為數(shù)不多甚至是唯一的低成本在邊緣側(cè)部署生成式智算的方案。

瑞莎 Fogwise Airbox 現(xiàn)已準備就緒,即將在近期發(fā)售,敬請期待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 基準測試
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    7698
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3662

    瀏覽量

    43758
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3116

    瀏覽量

    4027
收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    用Ollama輕松搞定Llama 3.2 Vision模型本地部署

    Ollama 是一個開源的大語言模型服務(wù)工具,它的核心目的是簡化大語言模型(LLMs)的本地部署和運行過程,請參考《Gemma 2+Ollama在算力魔方上幫你在LeetCode解題》,一條命令完成
    的頭像 發(fā)表于 11-23 17:22 ?3724次閱讀
    用Ollama輕松搞定<b class='flag-5'>Llama</b> 3.2 Vision模型本地<b class='flag-5'>部署</b>

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集擴展了 Meta Llama 開源模型集的模型陣容,包含視覺語言模型(VLM)、小語言模型(SLM)和支持視覺的更新版 Llama Guard 模型。與 NV
    的頭像 發(fā)表于 11-20 09:59 ?772次閱讀

    Llama 3 的未來發(fā)展趨勢

    在科技迅猛發(fā)展的今天,人工智能和機器學(xué)習已經(jīng)成為推動社會進步的重要力量。Llama 3,作為一個劃時代的產(chǎn)品,正以其獨特的設(shè)計理念和卓越的性能,預(yù)示著未來科技的新方向。 一、Llama 3
    的頭像 發(fā)表于 10-27 14:44 ?763次閱讀

    Llama 3 與開源AI模型的關(guān)系

    在人工智能(AI)的快速發(fā)展中,開源AI模型扮演著越來越重要的角色。它們不僅推動了技術(shù)的創(chuàng)新,還促進了全球開發(fā)者社區(qū)的合作。Llama 3,作為一個新興的AI項目,與開源AI模型的關(guān)系密切,這種關(guān)系
    的頭像 發(fā)表于 10-27 14:42 ?759次閱讀

    深入理解 Llama 3 的架構(gòu)設(shè)計

    在人工智能領(lǐng)域,對話系統(tǒng)的發(fā)展一直是研究的熱點之一。隨著技術(shù)的進步,我們見證了從簡單的基于規(guī)則的系統(tǒng)到復(fù)雜的基于機器學(xué)習的模型的轉(zhuǎn)變。Llama 3,作為一個假設(shè)的先進對話系統(tǒng),其架構(gòu)設(shè)計融合了
    的頭像 發(fā)表于 10-27 14:41 ?1193次閱讀

    Llama 3 模型與其他AI工具對比

    Llama 3模型與其他AI工具的對比可以從多個維度進行,包括但不限于技術(shù)架構(gòu)、性能表現(xiàn)、應(yīng)用場景、定制化能力、開源與成本等方面。以下是對Llama 3模型與其他一些主流AI工具的對比
    的頭像 發(fā)表于 10-27 14:37 ?1044次閱讀

    Llama 3 性能評測與分析

    1. 設(shè)計與構(gòu)建質(zhì)量 Llama 3的設(shè)計延續(xù)了其前代產(chǎn)品的簡潔風格,同時在細節(jié)上進行了優(yōu)化。機身采用了輕質(zhì)材料,使得整體重量得到了有效控制,便于攜帶。此外,Llama 3的表面處理工
    的頭像 發(fā)表于 10-27 14:30 ?820次閱讀

    Llama 3 適合的行業(yè)應(yīng)用

    在當今快速發(fā)展的技術(shù)時代,各行各業(yè)都在尋求通過人工智能(AI)來提高效率、降低成本并增強用戶體驗。Llama 3,作為一個先進的AI平臺,以其強大的數(shù)據(jù)處理能力和用戶友好的界面,成為了眾多行業(yè)的新寵
    的頭像 發(fā)表于 10-27 14:28 ?767次閱讀

    如何使用 Llama 3 進行文本生成

    使用LLaMA 3(Large Language Model Family of AI Alignment)進行文本生成,可以通過以下幾種方式實現(xiàn),取決于你是否愿意在本地運行模型或者使用現(xiàn)成的API
    的頭像 發(fā)表于 10-27 14:21 ?1058次閱讀

    Llama 3 與 GPT-4 比較

    隨著人工智能技術(shù)的飛速發(fā)展,我們見證了一代又一代的AI模型不斷突破界限,為各行各業(yè)帶來革命性的變化。在這場技術(shù)競賽中,Llama 3和GPT-4作為兩個備受矚目的模型,它們代表了當前AI領(lǐng)域的最前
    的頭像 發(fā)表于 10-27 14:17 ?1126次閱讀

    Llama 3 語言模型應(yīng)用

    理解復(fù)雜的上下文信息,包括對話歷史、用戶偏好和文化差異。這使得它在對話系統(tǒng)和個性化推薦中表現(xiàn)出色。 情感分析 :通過深度學(xué)習技術(shù),Llama 3 能夠識別和理解文本中的情感傾向,無論是正面的、負面的還是中性的。 多語言支持
    的頭像 發(fā)表于 10-27 14:15 ?718次閱讀

    使用OpenVINO 2024.4在算力魔方上部署Llama-3.2-1B-Instruct模型

    前面我們分享了《三步完成Llama3在算力魔方的本地量化和部署》。2024年9月25日,Meta又發(fā)布了Llama3.2:一個多語言大型語言模型(LLMs)的集合。
    的頭像 發(fā)表于 10-12 09:39 ?1433次閱讀
    使用OpenVINO 2024.4在算力魔方上<b class='flag-5'>部署</b><b class='flag-5'>Llama</b>-3.2-1B-Instruct模型

    [技術(shù)] 【飛凌嵌入式OK3576-C開發(fā)板體驗】llama2.c部署

    MCU 上部署。以下是 llama2.c 在 OK3576 開發(fā)板上的部署步驟。 工程克隆 首先我們將源碼克隆下來:https://github.com/karpathy/llama
    發(fā)表于 09-18 23:58

    如何將Llama3.1模型部署在英特爾酷睿Ultra處理器

    本文從搭建環(huán)境開始,一步一步幫助讀者實現(xiàn)只用五行代碼便可將Llama3.1模型部署在英特爾 酷睿 Ultra 處理器上。
    的頭像 發(fā)表于 07-26 09:51 ?3080次閱讀
    如何將<b class='flag-5'>Llama</b>3.1模型<b class='flag-5'>部署</b>在英特爾酷睿Ultra處理器

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護到評估的全方位生成式 AI 模型服務(wù),以便部署自定義 Llama 3.1 NVIDIA NIM 微服務(wù)和新的 NVIDIA NeMo
    發(fā)表于 07-24 09:39 ?911次閱讀
    NVIDIA AI Foundry 為全球企業(yè)打造自定義 <b class='flag-5'>Llama</b> 3.1 生成式 AI 模型

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品