0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI眼鏡大模型激戰(zhàn):多大模型協(xié)同、交互時延低至1.3S

Monika觀察 ? 來源:電子發(fā)燒友 ? 作者:莫婷婷 ? 2025-03-20 08:59 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/莫婷婷)“百鏡大戰(zhàn)”開始時,也是AI大模型在智能眼鏡端加速落地的開始,一場關(guān)于智能眼鏡的“百模大戰(zhàn)”也同步進(jìn)行。幾乎今年剛推出的AI智能眼鏡都搭載了AI大模型。隨著AI智能眼鏡與AI大模型的深度融合,一場技術(shù)演進(jìn)與場景革命正在悄然進(jìn)行。


一款眼鏡搭載多個大模型:AI智能眼鏡下的“百模大戰(zhàn)”

AI大模型指的是具有大量參數(shù)(通常超過數(shù)十億)的深度學(xué)習(xí)模型。這些模型有著復(fù)雜計算結(jié)構(gòu)、經(jīng)過大規(guī)模數(shù)據(jù)集訓(xùn)練后,能夠在自然語言處理、計算機視覺等多個領(lǐng)域表現(xiàn)出色。例如,GPT-4在文本生成方面有著更強的表現(xiàn);而DALL·E 2能在圖像生成領(lǐng)域帶來技術(shù)突破。這類模型不僅能夠理解復(fù)雜的語義信息,還能根據(jù)上下文生成相應(yīng)的響應(yīng)或內(nèi)容,極大地提升了人機交互的質(zhì)量。

一般來說,AI大模型具備泛化性、通用性、實用性三大特點。AI大模型包括云側(cè)大模型和端側(cè)大模型,云側(cè)AI大模型在云端部署,具備參數(shù)多,且算力和數(shù)據(jù)存儲需求大的特點,例如通用大模型和行業(yè)大模型;端側(cè)大模型主要應(yīng)用在手機、汽車等產(chǎn)品上,具備參數(shù)小、本地運行等特點。

與傳統(tǒng)眼鏡相比,AI智能眼鏡最大的特點就是增加了AI功能,且目前來看,智能音頻眼鏡、AI智能眼鏡、AR智能眼鏡這三大類AI智能眼鏡都搭載了AI大模型。

例如Ray-Ban Meta新型號搭載的是Meta Llama3大模型,李未可Meta Lens Chat AI眼鏡搭載了自研大模型WAKE-AI大模型等。同時,我們也看到了一款智能眼鏡會搭載多個AI大模型,例如Rokid Glasses搭載了通義千問、DeepSeek、豆包、智譜清言、納米搜索等多個大模型,蜂巢科技界環(huán)AI音頻眼鏡搭載了包括通義、百川等在內(nèi)的14 個大模型。

wKgZPGfbaLCAMspNAACO1MgdZ4Y352.png
圖:AI智能眼鏡的功能介紹(電子發(fā)燒友網(wǎng)制圖)


搭載多個大模型將帶來多個優(yōu)勢,一是增強的功能多樣性,這些大模型專注于不同的任務(wù),有的擅長自然語言處理,有的則在圖像識別領(lǐng)域有著出色的表現(xiàn)。通過集成多種模型,智能眼鏡可以提供更加豐富和全面的服務(wù)。

二是提高性能與準(zhǔn)確度,每個大模型都有其獨特的算法和訓(xùn)練數(shù)據(jù)集,因此在特定任務(wù)上可能具有獨特的優(yōu)勢。當(dāng)用戶的需求不同時,系統(tǒng)會根據(jù)實際應(yīng)用場景選擇最適合的模型進(jìn)行處理。

三是快速響應(yīng)與高效處理。Rokid Glasses 將產(chǎn)品搭載的大模型分為基礎(chǔ)模型、視覺模型、搜索模型等類型。基礎(chǔ)大模型負(fù)責(zé)對話,問答和調(diào)用產(chǎn)品功能等整體 AI 能力;視覺大模型負(fù)責(zé)識別物體等需要處理視覺信息的任務(wù);信息大模型負(fù)責(zé)搜索當(dāng)下最新信息對所回答的問題進(jìn)行信息整合與歸納。

那么,這么多的大模型,在接收到任務(wù)時會不會“打架”?Rokid在Rokid Glasses端側(cè)集成自研的意圖分類模型,做到2 毫秒內(nèi)完成對意圖的分類,再將請求分發(fā)給不同的模型。由此帶來快速的AI 響應(yīng)速度快、更高的處理效率。

Rokid認(rèn)為“目前還沒有一款能力覆蓋全面的大模型,更多的是某大模型在特定領(lǐng)域內(nèi)表現(xiàn)出色。因此多模型的協(xié)同使用或許是更優(yōu)解?!?br />

AI智能眼鏡的“大腦革命”:端側(cè)推理與交互時延重塑

智能眼鏡的進(jìn)化史,本質(zhì)是端側(cè)算力與交互時延的博弈,隨著Llama、盤古、通義等大模型的升級,更強大的端側(cè)推理能力和極低的交互時延,將提供更流暢且即時的用戶體驗。具體來看主流AI智能眼鏡的AI大模型的特點。

Ray-Ban Meta搭載了Llama系列多模態(tài)模型,實現(xiàn)了實時視覺-語言協(xié)同(VLM),支持實時同聲傳譯,支持動態(tài)物體追蹤和環(huán)境語義分割,能夠識別超過1000類物體,環(huán)境感知準(zhǔn)確率提升至92%。

華為的智能眼鏡產(chǎn)品已經(jīng)搭載了盤古多模態(tài)大模型。從2021年發(fā)布盤古大模型1.0版本至今,盤古大模型就一直在更新升級,盤古大模型5.0能夠更精準(zhǔn)地理解物理世界,融合了語言和視覺跨模態(tài)信息,支持圖像理解等功能。在接入華為智能眼鏡后,喚醒小藝助手,能夠進(jìn)行對話和其他交互功能。據(jù)了解,盤古大模型5.0的推理速度提升了300%。如若搭載在華為智能眼鏡上,將帶來更快速的交互體驗。

李未可科技的Meta Lens Chat AI智能眼鏡基于WAKE-AI大模型平臺,用戶在AI智能眼鏡上調(diào)用大模型能在500毫秒內(nèi)快速精準(zhǔn)地識別用戶指令,一般對話時延在1.8秒左右、2秒以內(nèi)。

2025年1月,雷鳥V3宣布接入阿里云通義大模型,還定制了全新意圖識別模型,AI 平均響應(yīng)速度為 1.3s,識別準(zhǔn)確率高達(dá)98%。

也是在2025年1月,百度智能云發(fā)布了AI眼鏡大模型互動方案,針對智能眼鏡場景,提供語音交互、視覺理解、復(fù)雜任務(wù)等端到端解決方案。在交互響應(yīng)速度方面,多模態(tài)實時互動方案能做到端到端音頻延時低至1.4s,語音打斷延時小于0.8s,端到端視覺延時低至2.5s。

通過上述各產(chǎn)品技術(shù)參數(shù)對比來看,AI智能眼鏡大模型的端側(cè)推理速度、交互時延將是AI大模型迭代的兩大關(guān)鍵。

端側(cè)推理速度持續(xù)提升,處理延遲會隨著技術(shù)迭代持續(xù)下降。在時延方面,1.8s是一個分水嶺,此前,大多數(shù)應(yīng)用在智能眼鏡的交互時延都在5s左右,通過上述最新產(chǎn)品來看,視覺延時在2.5s左右,語音交互時延的要求則更低,普遍要求在1.3s左右。

XREAL創(chuàng)始人兼CEO徐馳在接受媒體采訪時曾表示AI眼鏡的核心壁壘在大模型,他認(rèn)為在AI智能眼鏡中,大模型占70%的決定性作用,硬件研發(fā)投入占30%,兩者需要深度融合。就在2025年2月,XREAL宣布將與海信視像科技展開合作,合作內(nèi)容包括光學(xué)顯示、AI大模型應(yīng)用等領(lǐng)域。


小結(jié):

隨著AI技術(shù)的不斷進(jìn)步,智能眼鏡正在經(jīng)歷一場前所未有的“大腦革命”。從Ray-Ban Meta到華為智能眼鏡,再到李未可科技的Meta Lens Chat,這些產(chǎn)品展示了各自在AI大模型應(yīng)用上的獨特優(yōu)勢。通過搭載Llama、盤古、通義等先進(jìn)大模型,智能眼鏡現(xiàn)在能夠?qū)崿F(xiàn)更快的端側(cè)推理速度和更低的交互時延,為用戶提供更加流暢且即時的體驗。此外,越來越多的產(chǎn)品開始采用多大模型協(xié)同工作的模式。這一切都預(yù)示著,在不久的將來,智能眼鏡將不僅僅是一個簡單的穿戴設(shè)備,而是一個集成了最先進(jìn)AI技術(shù)的多功能平臺。

另一個值得關(guān)注的是,“百鏡大戰(zhàn)”不僅僅是硬件的競爭,更是背后AI大模型技術(shù)和應(yīng)用場景的較量。各大廠商紛紛探索如何更好地應(yīng)用大模型,以期在保持設(shè)備輕量化的同時提供強大的計算能力。未來會如何發(fā)展,我們也將持續(xù)關(guān)注。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 0人收藏

    評論

    相關(guān)推薦

    訓(xùn)練好的ai模型導(dǎo)入cubemx不成功怎么處理?

    訓(xùn)練好的ai模型導(dǎo)入cubemx不成功咋辦,試了好幾個模型壓縮了也不行,ram占用過大,有無解決方案?
    發(fā)表于 03-11 07:18

    智能語音交互的突破與應(yīng)用,啟明云端AI模型方案應(yīng)用

    熱潮,到文心一言、豆包、deepseek等眾多國內(nèi)大模型的崛起,AI模型正以前所未有的速度改變著我們的生活和工作方式。在這股浪潮中,智能語音交互技術(shù)作為
    的頭像 發(fā)表于 03-10 18:11 ?247次閱讀
    智能語音<b class='flag-5'>交互</b>的突破與應(yīng)用,啟明云端<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>方案應(yīng)用

    行業(yè)集結(jié):共同定制 RK3566 集成 AI 眼鏡的前沿 AR 方案

    正在研發(fā)的由 RK3566 集成的 AI 眼鏡,將科技與時尚完美融合,將開啟全新的視覺體驗。產(chǎn)品優(yōu)勢產(chǎn)品擁有六大優(yōu)勢:集成度高、功耗、安全性強、音視頻強、計算資源豐富、外設(shè)接口豐富,是待機功耗最低
    發(fā)表于 02-20 18:44

    AI眼鏡新品炸場!雷鳥V3接入阿里云通義大模型,未來雙方合作更進(jìn)一步

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)1月2日,消費級AR領(lǐng)先品牌雷鳥創(chuàng)新RayNeo與阿里云舉行戰(zhàn)略簽約儀式,雙方宣布在AI眼鏡領(lǐng)域達(dá)成獨家戰(zhàn)略合作,通義系列大模型將為雷鳥創(chuàng)新的AI
    的頭像 發(fā)表于 01-07 16:29 ?1852次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>眼鏡</b>新品炸場!雷鳥V3接入阿里云通義大<b class='flag-5'>模型</b>,未來雙方合作更進(jìn)一步

    雷鳥創(chuàng)新與阿里云達(dá)成戰(zhàn)略合作,引領(lǐng) AI模型與AR眼鏡融合新紀(jì)元

    1月2日,消費級AR領(lǐng)先品牌雷鳥創(chuàng)新RayNeo與阿里云舉行戰(zhàn)略簽約儀式,雙方宣布在AI眼鏡領(lǐng)域達(dá)成獨家戰(zhàn)略合作,通義系列大模型將為雷鳥創(chuàng)新的AI
    發(fā)表于 01-03 13:45 ?194次閱讀
    雷鳥創(chuàng)新與阿里云達(dá)成戰(zhàn)略合作,引領(lǐng) <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>與AR<b class='flag-5'>眼鏡</b>融合新紀(jì)元

    新的人機交互入口?大模型加持、AI眼鏡賽道開啟百鏡大戰(zhàn)

    Chat AI眼鏡、蜂巢科技推出的界環(huán)AI音頻眼鏡等,不同品牌推出的新品都有其各自的定位。與此同時,在市場需求的帶動下,越來越多企業(yè)進(jìn)入AI
    的頭像 發(fā)表于 11-21 00:57 ?3480次閱讀
    新的人機<b class='flag-5'>交互</b>入口?大<b class='flag-5'>模型</b>加持、<b class='flag-5'>AI</b><b class='flag-5'>眼鏡</b>賽道開啟百鏡大戰(zhàn)

    AI模型的最新研究進(jìn)展

    。例如,在醫(yī)療領(lǐng)域,生成式AI可以幫助醫(yī)生生成診斷報告、治療方案等;在教育領(lǐng)域,AI模型可以生成個性化的學(xué)習(xí)資源和建議。 多模態(tài)融合與交互A
    的頭像 發(fā)表于 10-23 15:19 ?940次閱讀

    ai模型ai框架的關(guān)系是什么

    AI模型AI框架是人工智能領(lǐng)域中兩個重要的概念,它們之間的關(guān)系密切且復(fù)雜。 AI模型的定義和特點
    的頭像 發(fā)表于 07-16 10:07 ?5.9w次閱讀

    AI模型與小模型的優(yōu)缺點

    在人工智能(AI)的廣闊領(lǐng)域中,模型作為算法與數(shù)據(jù)之間的橋梁,扮演著至關(guān)重要的角色。根據(jù)模型的大小和復(fù)雜度,我們可以將其大致分為AI模型
    的頭像 發(fā)表于 07-10 10:39 ?5376次閱讀

    Al大模型機器人

    和迭代來不斷改進(jìn)自身性能。它們可以從用戶交互中學(xué)習(xí)并根據(jù)反饋進(jìn)行調(diào)整,以提高對話質(zhì)量和準(zhǔn)確性??啥ㄖ菩耘c整合性: AI模型機器人可以根據(jù)特定需求進(jìn)行定制和整合,以滿足不同場景和應(yīng)用的要求。它們可以與其
    發(fā)表于 07-05 08:52

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集)

    技還提供了模型訓(xùn)練推理工具將自己的算法模型部署芯片上,也可以配合這個工具構(gòu)建自己的 AI 應(yīng)用。 使用聆思 CSK6011A 芯片作為主控,板載 16MB Flash 集成攝像頭、麥
    發(fā)表于 06-18 17:33

    STM CUBE AI錯誤導(dǎo)入onnx模型報錯的原因?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉(zhuǎn)化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 05-27 07:15

    智能眼鏡“重生”:AR芯片、AI模型、聲效處理單元進(jìn)入迭代新周期

    ?電子發(fā)燒友網(wǎng)報道(文/莫婷婷)得益于與智能手機等智能設(shè)備連接、AI模型技術(shù)加持以及用于聽障等特殊人群的功能增強,豐富了智能眼鏡的應(yīng)用體驗,智能眼鏡市場正在經(jīng)歷顯著的增長。其中,AR
    的頭像 發(fā)表于 05-07 00:18 ?5290次閱讀
     智能<b class='flag-5'>眼鏡</b>“重生”:AR芯片、<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>、聲效處理單元進(jìn)入迭代新周期

    李未可科技發(fā)布全新首款AI眼鏡Chat,搭載自研AI模型

    AI語音助手,為用戶開啟超擬人的AI語音交互新體驗。用戶可使用語音交互AI幫助解決工作&日程安排,或開啟百科問答、學(xué)習(xí)輔助、英文翻譯、語音
    發(fā)表于 04-26 10:45 ?2127次閱讀
    李未可科技發(fā)布全新首款<b class='flag-5'>AI</b><b class='flag-5'>眼鏡</b>Chat,搭載自研<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>

    李未可科技正式推出WAKE-AI多模態(tài)AI模型

    李未可科技多模態(tài) AI模型正式發(fā)布,積極推進(jìn) AI 在終端的場景應(yīng)用 ? 4月18日,2024中國生成式AI大會上李未可科技正式發(fā)布為眼鏡
    發(fā)表于 04-18 17:01 ?713次閱讀
    李未可科技正式推出WAKE-<b class='flag-5'>AI</b>多模態(tài)<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品