性能拼不動(dòng)了,必須上AI競(jìng)爭(zhēng)
掌握智能入口的一方,就能成為應(yīng)用的真正入口。
硬件進(jìn)化了好多年,現(xiàn)在到了軟件定義手機(jī)的新節(jié)點(diǎn)。
大模型會(huì)和手機(jī)廠商自研的操作系統(tǒng)深度結(jié)合,提供更好的系統(tǒng)級(jí)體驗(yàn),這很關(guān)鍵。
手機(jī)軟件體驗(yàn)上的差異,可以解決現(xiàn)在手機(jī)廠商們硬件差不多、只能靠外觀來區(qū)分的問題。
大模型的競(jìng)爭(zhēng),會(huì)讓手機(jī)產(chǎn)品的[智力水平]表現(xiàn)出來,這也是為什么手機(jī)廠商們現(xiàn)在熱衷于大模型的原因之一。
從AI定義汽車到AI定義手機(jī)、PC,大模型的注入會(huì)改變手機(jī)市場(chǎng)的銷量格局。
以前因?yàn)橛布渲眠^剩,有人一部手機(jī)用5年都不換,大模型的升級(jí)體驗(yàn)可能會(huì)讓人有換機(jī)的理由,從而帶動(dòng)手機(jī)行業(yè)的銷售增長(zhǎng)。
?
手機(jī)大廠無不例外,加入新一輪競(jìng)賽
在7月,榮耀手機(jī)推出了一款名為Magic V2的折疊屏手機(jī),該手機(jī)自稱是全球首款原生的集成AI大模型的國(guó)產(chǎn)手機(jī)。
在10月,榮耀CEO趙明宣布,榮耀Magic6系列將搭載第三代驍龍8移動(dòng)平臺(tái),并支持70億參數(shù)的端側(cè)AI大模型。
在8月的華為開發(fā)者大會(huì)上,華為終端BG CEO余承東宣布,盤古大模型已經(jīng)接入華為HarmonyOS 4及華為小藝智慧助手。
這意味著華為P60和Mate 60用戶可以通過小藝智能助手體驗(yàn)這一大模型的功能。
?
同一個(gè)月,小米創(chuàng)始人、董事長(zhǎng)兼CEO雷軍發(fā)布了小米自研的兩個(gè)輕量級(jí)大模型MiLM,參數(shù)分別為64億和13億。
在10月底,小米正式推出了將AI大模型植入澎湃OS系統(tǒng)的小米14手機(jī)。
OPPO在10月宣布了自主訓(xùn)練的AI大模型——安第斯大模型(AndesGPT),該模型已經(jīng)接入新小布助手AndesGPT。
預(yù)計(jì)在12月前,AndesGPT的能力將被正式接入ColorOS 14新系統(tǒng)。
在11月,vivo發(fā)布了旗艦新品X100系列,聲稱這是全球首個(gè)百億大模型在終端調(diào)通的大模型手機(jī)。
而三星則在11月展示了其AI大模型[高斯]。預(yù)計(jì)搭載這一AI大模型的Galaxy S24系列手機(jī)要到明年上半年才會(huì)發(fā)售。
至于蘋果,目前還沒有官宣其AI大模型的消息。但據(jù)分析,蘋果計(jì)劃最早在2024年年底將生成式AI技術(shù)整合到iPhone和iPad中。
選擇端側(cè)部署,看上去最劃算
當(dāng)前,AI大模型接入手機(jī)存在兩種選擇:云端部署和端側(cè)部署。
目前,大多數(shù)廠商選擇在端側(cè)部署輕量級(jí)大模型,而在云端部署的則是千億級(jí)AI大模型。
為了平衡內(nèi)存、執(zhí)行速度、功耗和成本等問題,現(xiàn)階段的[端云協(xié)同]是手機(jī)廠商部署大模型時(shí)的普遍選擇。
手機(jī)廠商想要實(shí)現(xiàn)大野心,端側(cè)大模型可是個(gè)好工具。
要知道,手機(jī)廠商不提供云服務(wù),也就沒法拿到便宜的云服務(wù)。
而要滿足億萬用戶的需求,背后得有強(qiáng)大算力支持,這可不好辦。
好在端側(cè)大模型可以讓手機(jī)廠商省下這筆錢,讓商業(yè)計(jì)劃更靠譜。
另外,手機(jī)廠商在用端側(cè)AI上可是有優(yōu)勢(shì)的。
像華為、小米、VIVO 這些廠家,都是自研的大模型。
在出廠前,手機(jī)和芯片公司就得跟它調(diào)整好多次,讓它跟硬件更匹配。
現(xiàn)在端側(cè)大模型很依賴內(nèi)存,手機(jī)廠商也能優(yōu)先給自己的終端大模型用內(nèi)存。
如果需要調(diào)用云端大模型的話成本非常高,但如果在手機(jī)端側(cè)運(yùn)行大模型,則不會(huì)產(chǎn)生推理成本。
云端部署用于解決復(fù)雜的需要大算力、大參數(shù)模型的問題;
而端側(cè)部署則主要用于運(yùn)行數(shù)據(jù)安全性高、需要實(shí)時(shí)反饋、網(wǎng)絡(luò)條件較差的輕量化問題。
綜上所述,手機(jī)廠商在布局AI大模型時(shí)通常會(huì)選擇云端和端側(cè)的協(xié)同部署方式。
?
芯片廠商懂客戶訴求,盡可能滿足AI需求
就像手機(jī)鏡頭一樣,生成式模型的支持能力可能會(huì)成為核心硬件賣點(diǎn)。
生成式模型的最終解決方案需要軟硬件結(jié)合設(shè)計(jì),這對(duì)于有自研芯片能力的手機(jī)廠商非常有利。
因?yàn)檫@些手機(jī)廠商可以同時(shí)掌握模型和硬件的設(shè)計(jì),實(shí)現(xiàn)最高效率的解決方案。
給手機(jī)系統(tǒng)做芯片的公司,像高通和聯(lián)發(fā)科,得提供完整的參考設(shè)計(jì)。
說到高通,他們把手機(jī)端的生成式模型搞到了核心位置。
例如,高通發(fā)布的驍龍8 gen3支持包括Meta Llama2、Chat GPT等在內(nèi)的多模型生成式AI。
其可處理的大模型參數(shù)超過100億,推理速度達(dá)到了每秒20個(gè)token。
此外,聯(lián)發(fā)科發(fā)布生成式AI移動(dòng)芯片天璣9300,集成第七代AI處理器APU 790,支持在終端運(yùn)行10億、70億、130億參數(shù)的AI大模型。
結(jié)合內(nèi)存硬件壓縮技術(shù)NeuroPilot Compression來減少AI大模型對(duì)終端內(nèi)存的占用;
聯(lián)發(fā)科的AI開發(fā)平臺(tái)NeuroPilot支持Android、Meta Llama 2、百度文心一言大模型、百川智能百川大模型等主流AI大模型。
英偉達(dá)在手機(jī)芯片方面的嘗試,自從十多年前的Tegra系列之后,好像就沒什么動(dòng)靜了。
但是,今年聽說英偉達(dá)要跟聯(lián)發(fā)科合作,聯(lián)發(fā)科的下一代旗艦手機(jī)芯片可能會(huì)用英偉達(dá)的GPU。
看來,英偉達(dá)在手機(jī)生成式模型領(lǐng)域還是有機(jī)會(huì)的。
?
? 廠商口中的“大”,現(xiàn)階段有待商榷
為了讓大型AI模型適應(yīng)手機(jī),制造商不得不采取一些策略對(duì)其進(jìn)行大幅壓縮,例如通過剪枝、蒸餾和量化等技術(shù)手段。
以vivo為例,他們可能通過連續(xù)的模型裁剪和蒸餾,將參數(shù)從1750億降低到僅10億,這種操作是否過于牽強(qiáng)。
我們應(yīng)該認(rèn)識(shí)到,大型AI模型并不僅僅是參數(shù)數(shù)量的簡(jiǎn)單疊加,它的真正價(jià)值在于深度學(xué)習(xí)中的[深度]。
因此,當(dāng)把一款千億參數(shù)的模型剪裁到幾十億參數(shù)時(shí),勢(shì)必會(huì)失去一些原有的學(xué)習(xí)深度。
對(duì)于AI的日常應(yīng)用來說,可能影響不大,但對(duì)于那些期望從AI獲得深度見解和理解的高端用戶來說,這種損失是無法接受的。
即便小米宣稱其端側(cè)模型能與云端模型相提并論,但這其中的細(xì)節(jié)仍不容忽視。
擁有13億參數(shù)的端側(cè)模型自然難以與擁有千億參數(shù)的云端模型相比。
從這些層面出發(fā),當(dāng)前手機(jī)上的大型AI模型實(shí)現(xiàn)方式似乎有點(diǎn)[矯枉過正]。
對(duì)于普通用戶而言,他們并不真正關(guān)心模型的參數(shù)數(shù)量,而更關(guān)心能為他們帶來什么價(jià)值。
vivo和小米的這些嘗試固然值得鼓勵(lì),但也應(yīng)該反思其真正的目的和意義。
?
結(jié)尾:
當(dāng)然,自研大模型是個(gè)[無限燒錢]的競(jìng)爭(zhēng),投入動(dòng)輒數(shù)十億元起。
投入大模型需要強(qiáng)大資金儲(chǔ)備做后盾,以大模型驅(qū)動(dòng)手機(jī)軟、硬件的每一次進(jìn)化背后都是[鈔能力]。
但無可否認(rèn),在智能手機(jī)出貨量持續(xù)下滑的行業(yè)態(tài)勢(shì)下,大模型或許會(huì)成為手機(jī)行業(yè)突破自身創(chuàng)新窘境和模式局限性的一個(gè)機(jī)遇。
審核編輯:黃飛
?
評(píng)論
查看更多