0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

智譜推出四個全新端側(cè)模型 攜英特爾按下AI普及加速鍵

looger123 ? 來源:looger123 ? 作者:looger123 ? 2024-12-02 17:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著AI的發(fā)展,端側(cè)AI模型越來越受到廣大客戶及廠商的關注,業(yè)界領先的大模型公司智譜于近日推出了四個全新的端側(cè)模型,加速AI前沿技術(shù)路徑與創(chuàng)新應用場景探索,推動AI大模型普惠化發(fā)展。

四個模型中,GLM-Edge-4B-chat、GLM-Edge-1.5B-chat為端側(cè)大語言模型,GLM-Edge-V-5B、GLM-Edge-V-2B為端側(cè)多模態(tài)模型,這四個模型分別具有4.3B/1.5B/4.8B/2B參數(shù)量。兩個端側(cè)的大語言模型適合意圖理解、智能對話、文本創(chuàng)作、知識庫問答等,兩個端側(cè)的多模態(tài)模型適用于視覺理解、創(chuàng)意描述、本地搜索、圖片問答等。這四個模型即將在Github、Huggingface、模搭等多個開源社區(qū)上發(fā)布。

為了確保這些新模型能夠在實際應用中發(fā)揮卓越性能,英特爾與智譜緊密合作,利用最新的英特爾酷睿Ultra處理器(第二代)硬件平臺和OpenVINOTMAI推理加速軟件對模型的性能進行優(yōu)化。通過與英特爾的緊密合作,智譜的新模型在計算效率、推理速度和能效比等方面得到了顯著提升。

英特爾酷睿Ultra處理器集成了專門的AI加速器,顯著提升AI和機器學習任務的處理能力。OpenVINOTM是由英特爾發(fā)起的AI推理優(yōu)化部署軟件框架,旨在優(yōu)化和加速深度學習模型在各種英特爾硬件上的推理性能,提供高效的模型優(yōu)化和跨平臺部署能力,使得開發(fā)者能夠在CPU、GPU、NPU 等多種硬件上實現(xiàn)卓越的AI推理性能。

在強大的硬件基礎上,OpenVINO采用多種優(yōu)化策略對智譜模型進行優(yōu)化。INT4低精度模型量化;基于kvcache的stateful模型優(yōu)化;基于模型圖融合優(yōu)化,包括SDPA GQA,RoPE fusion等等。

通過這些優(yōu)化,英特爾在基于酷睿Ultra第二代處理器的AIPC上做到了對相關模型的Day 0(第零日)支持并取得了很好的性能(如下圖):

wKgZPGdNekqAGlFgAADawgzfCAM457.png

在AI PC領域,英特爾正在引領市場前行。英特爾目前已出貨了超過2,000萬臺AIPC設備,構(gòu)建了擁有超過100家ISV、300多項AI應用、500多個AI模型的龐大生態(tài)系統(tǒng)。

在產(chǎn)品層面,英特爾也在與OEM廠商密切合作,推出以酷睿Ultra處理器為核心的AIPC。酷睿Ultra同時實現(xiàn)了出色的性能和續(xù)航能力,基于強大的x86架構(gòu),通過CPU、GPU算力,酷睿Ultra能夠充分發(fā)揮AI技術(shù)的優(yōu)勢。

未來英特爾會與智譜進一步加強在端側(cè)模型上的合作,并利用酷睿Ultra處理器上不斷提升的AI能力,充分賦能更多AIPC上的應用,讓用戶在基于英特爾酷睿Ultra的AIPC上有更好的體驗。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10190

    瀏覽量

    174442
  • AI
    AI
    +關注

    關注

    88

    文章

    34917

    瀏覽量

    277948
收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    B60和英特爾銳炫Pro B50 GPU,AI加速器產(chǎn)品—英特爾Gaudi 3 AI加速器。
    的頭像 發(fā)表于 05-21 00:57 ?5764次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新
    的頭像 發(fā)表于 05-20 12:27 ?4374次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI
    發(fā)表于 05-20 11:03 ?1499次閱讀

    英特爾與面壁智能宣布建立戰(zhàn)略合作伙伴關系,共同研發(fā)端側(cè)原生智能座艙,定義下一代車載AI

    今日,英特爾與面壁智能簽署合作備忘錄。雙方宣布達成戰(zhàn)略級合作伙伴關系,旨在打造端側(cè)原生智能座艙,定義下一代車載AI。目前,雙方已合作推出英特爾
    的頭像 發(fā)表于 04-23 21:46 ?517次閱讀
    <b class='flag-5'>英特爾</b>與面壁智能宣布建立戰(zhàn)略合作伙伴關系,共同研發(fā)端<b class='flag-5'>側(cè)</b>原生智能座艙,定義下一代車載<b class='flag-5'>AI</b>

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓側(cè)AI模型接入得心應手

    AI巨頭強強聯(lián)手,勢必為智能體化AI體驗時代超級加速
    發(fā)表于 04-13 19:52

    英特爾與扣子云平臺合作推出AI PC Bot專區(qū)和側(cè)插件商店

    通過創(chuàng)新的云協(xié)同技術(shù),為開發(fā)者提供更為便捷、高效的智能應用開發(fā)環(huán)境。 通過扣子的“插件”機制,英特爾AI PC的PC操控、本地知識庫、本地推理以及本地生成等核心功能被巧妙地嵌入到扣
    的頭像 發(fā)表于 12-31 10:24 ?976次閱讀

    英特爾與扣子云平臺共推AI PC Bot專區(qū)和側(cè)插件商店

    ,將英特爾AI PC的PC操控、本地知識庫、本地推理及本地生成等核心功能無縫嵌入扣子大模型與工作流中。這一創(chuàng)新性的融合,為開發(fā)者提供了前所未有的便利。 通過“Coze-AIPC”平臺的“
    的頭像 發(fā)表于 12-30 10:09 ?671次閱讀

    英特爾與扣子云平臺合作推出AI PC Bot專區(qū)與側(cè)插件商店

    。 Coze-AIPC是扣子云平臺與英特爾聯(lián)合發(fā)布的增強版智能體開發(fā)平臺,它深度整合了英特爾AI PC的側(cè)能力與扣子云平臺的優(yōu)勢。通過扣子
    的頭像 發(fā)表于 12-27 14:11 ?964次閱讀

    發(fā)布清言英特爾酷睿Ultra專享版

    近日,國內(nèi)知名大模型廠商智譜在其官方網(wǎng)站——智清言上,正式推出了針對英特爾酷睿Ultra處理器的專享版應用。這一版本充分利用了英特爾酷睿U
    的頭像 發(fā)表于 12-24 10:49 ?757次閱讀

    發(fā)布智清言英特爾酷睿Ultra專享版

    近日,國內(nèi)頂尖的大模型廠商智譜在官方網(wǎng)站智清言上,正式推出了智清言英特爾酷睿Ultra專享版。這一版本充分利用了
    的頭像 發(fā)表于 12-19 11:37 ?683次閱讀

    清言英特爾酷睿Ultra專享版發(fā)布,離線模型玩轉(zhuǎn)AIPC

    近日,國內(nèi)領先的大模型廠商智譜在智清言的官網(wǎng)發(fā)布了智清言英特爾酷睿Ultra專享版,這個版本可以利用英特爾酷睿Ultra處理器提供的澎湃
    的頭像 發(fā)表于 12-18 11:52 ?613次閱讀

    英特爾推出全新英特爾銳炫B系列顯卡

    備受玩家青睞的價格提供卓越的性能與價值1,很好地滿足現(xiàn)代游戲需求,并為AI工作負載提供加速。其配備的英特爾Xe矩陣計算引擎(XMX),為新推出的XeSS 2提供強大支持。XeSS 2的
    的頭像 發(fā)表于 12-07 10:16 ?1405次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>推出</b><b class='flag-5'>全新</b><b class='flag-5'>英特爾</b>銳炫B系列顯卡

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出全新的企業(yè)AI一體化方案。該方案以英特爾至強處理器和英特爾Gaudi 2D
    的頭像 發(fā)表于 12-03 11:20 ?571次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化解決方案

    近日,英特爾正式推出了其全新的企業(yè)AI一體化解決方案,這一方案旨在為企業(yè)提供更加開放、可擴展且高效的
    的頭像 發(fā)表于 12-02 10:48 ?900次閱讀

    英特爾聚焦AI座艙

    英特爾推出首款銳炫車載獨立顯卡(dGPU)和第一代英特爾軟件定義車載SoC系列,滿足當前消費者對汽車內(nèi)部配備更多屏幕、獲得更高清晰度等AI座艙體驗需求。
    的頭像 發(fā)表于 10-30 16:26 ?427次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品