2023年初AI大模型火爆全球,當時就有人說,這項技術(shù)走向大眾的最佳方式就是手機。
不管消費者怎么想這句話,苦于銷量連年下降的手機廠商們肯定是把它聽進去了。
于是,從2023年下半年開始,所有手機新品都在標榜AI能力,都宣稱自己是AI手機。這場盛宴持續(xù)上演到今天,即使是相對保守的蘋果也發(fā)布了“Apple Intelligence”,而那些原本被認為已經(jīng)被擠壓到缺少生存空間的二線手機品牌,也頑強地依靠“All in AI”留在了牌桌上。
一時間,AI在手機市場是鑼鼓喧天,紅旗招展,人山人?!粚?,人山人??赡苓€不一定。
對于用戶來說,面對鋪天蓋地的AI手機,華美無比的發(fā)布會PPT,可能有點小迷惑:AI到底能給我?guī)硎裁??這么多AI手機之間有什么不同?我設(shè)想的AI是科幻電影里那種,手機能給我嗎?
事實上,從2017年深度學習火熱起來之后,手機與AI的結(jié)合一直都在持續(xù)。幾年來,我們經(jīng)歷了端側(cè)AI算力、AI攝影、端側(cè)大模型,到系統(tǒng)級AI能力的變遷。假如手機是一片果園,AI這棵果樹在里面已經(jīng)長了很多年。
那么,到2024年,AI手機無限風光之時,這顆果子它保熟了嗎?
讓我們穿越紛繁復雜的概念,看看AI手機究竟帶來了什么。
提起AI手機,我們總會有一種很空洞的感覺,甚至不知道廠商和專家到底在激動個什么。
這種虛妄感來源于業(yè)界并不存在對AI手機的標準化認定。于是每個廠商,甚至每個人都可以對其進行獨立闡釋。這些闡釋有共識,有差異,還有大量似是而非與文字游戲。這些聲音交織在一起,就變成了一種概念游戲。
因此,想要了解AI手機,首先要避免被概念游戲干擾。就像要摘果子,首先要把枝葉撥開。如何實現(xiàn)這種免打擾呢?一個簡單的方法,叫作“AI手機,我有三不看”。
首先,廠商的“AI大帽子”不用看。
不久之前,AI手機領(lǐng)域姍姍來遲地發(fā)布了此前承諾的Apple Intelligence。但這個“蘋果智能”卻沒有激起多大的市場水花。原因在于,蘋果智能更像是眾多AI功能的升級打包,而非某種新能力、新思路。
這種給眾多AI小功能起個大名字的玩法,在今天的手機界比較普遍。用戶以為得到了新東西,其實不過是新瓶裝舊酒,散裝改零售。類似的說法,經(jīng)常還包括某某智能、某某GPT、某某原生,大差不差都是一個意思。甚至很多時候這根本不是一個研發(fā)系統(tǒng)主導的項目,而是市場部歸攏收集一下各個部門都有哪些AI能力,最后編個名字給寫進PPT里而已。
其次,是缺乏標準的技術(shù)名詞不用看。
任何技術(shù)在受到重視之后,都會經(jīng)歷一個造詞階段。這些新造的詞有些會最終留下來,變成約定俗成、相對標準化的說法。但絕大部分都會悄然流逝在歷史記憶里。在AI手機領(lǐng)域,我們經(jīng)常會看見大量類似的新詞。它們或多或少都有所指,但作為普通消費者大可不必去探尋每個詞的來龍去脈,也不用被它們迷惑了判斷。
諸如智能框架、意圖識別、主動服務(wù)、全局智能等高大上的AI手機詞匯,在今天都沒有統(tǒng)一標準,愛好者可以研究研究,大多數(shù)消費者不妨敬而遠之。
再次,大模型參數(shù)以及其他AI參數(shù)不用看。
從2018年預訓練大模型開始出現(xiàn),就產(chǎn)生了一種頭部廠商說效果,其他廠商拼參數(shù)的現(xiàn)象。在核心能力上很難構(gòu)建差異化的廠商,往往會宣傳自己模型參數(shù)更大,跑分效果更好。這一點來到AI手機階段,就變成了宣傳端側(cè)大模型的參數(shù)大、數(shù)量多。但AI模型不是CPU等硬件,參數(shù)高并不意味著性能好。模型效果還取決于壓縮方案、調(diào)優(yōu)效果等一系列條件,所以不必將廠商宣傳的模型參數(shù)等同于產(chǎn)品價值。
蒸餾掉這些之后還能留下的東西,才是AI在手機里結(jié)出的果。
很多人都在說,AI沒有應用可怎么辦。但問題是,ChatGPT本身就是一種應用。在應用端再誕生更強的超級應用固然前景美好,但大模型本身的應用價值本身就有跟手機結(jié)合的空間。
AI手機的第一步,就是要把類ChatGPT的大模型能力帶到手機的第一方功能里。比如iOS18.1,重點引入的AI功能,就包括AI寫作、郵件推薦與回復、消息摘要等。換個角度想想,我們會發(fā)現(xiàn)這些都是ChatGPT就能做到的事。
這種思路并沒有什么不好,而且也必須由手機廠商第一方來主導。因為如今智能手機提供的第一方功能非常多,而其中又有大量可以加入語義理解、內(nèi)容生成等大模型能力的地方。因此,大語言模型與手機第一方功能的點對點結(jié)合,是AI在手機里結(jié)出最多的果。
對于類似功能的選擇,建議是根據(jù)自身需求來挑選實用的功能,或者功能群組。比如去年11月,OPPO就發(fā)布了一鍵生成AI通話摘要。這個功能可以在通話結(jié)束后,智能識別通話內(nèi)容并生成重點信息摘要。再比如Find X8 Pro可以長按電源鍵呼出問屏功能,AI根據(jù)屏幕顯示來回答文章內(nèi)容、圖片信息等。小米在澎湃OS 2當中,也推出了一系列諸如AI寫作、AI識音、AI妙畫的智能功能。
但對于手機廠商來說,大模型功能的加入顯然只是敲門磚。這種單點升級并不能滿足廠商對AI的野心。
于是,智能體來了。
AI Agent又被稱為智能體,被廣泛認可是真正體現(xiàn)了AI思維的新應用形態(tài)。智能體可以跨越不同的軟件工作流程,來實現(xiàn)目標主導的自主判斷。這種運行邏輯放在手機里有兩方面的好處。
對于用戶來說,智能體可以被視作獨立于點滑交互的新交互形式。用戶可以命令智能體來完成指令,并且其理解能力、生成能力與應用范疇都遠大于此前的語音助手,更加貼近用戶對個人助理的基本想象。
對于手機廠商來說,智能體不僅是一個全新賣點,還可以繞過APP的藩籬,讓第一方的應用權(quán)限更大,體驗更加重要。把智能體做起來,有概率讓用戶習慣、第三方應用服務(wù)都與廠商綁定更加緊密。
在這樣的驅(qū)動力下,幾個月以來手機廠商紛紛在智能體陣地上秣馬厲兵,誓有一種在2025年展開智能體決戰(zhàn)的架勢。而從AI手機的發(fā)展線上看,手機+AI Agent是一個脫離了ChatGPT基本應用框架,同時蘋果為代表的歐美終端廠商沒有跟進的領(lǐng)域。中國AI手機的未來成就,或許就系在智能體的機遇上。
在智能體方面,目前最為用力地就是榮耀。不久之前的榮耀Magic7發(fā)布會上,榮耀CEO趙明用YOYO智能體自動下單了2000杯咖啡,一下讓智能體手機的概念大為出圈。目前,榮耀主推的智能體體驗包括“一句話關(guān)閉自動續(xù)費”“一句話點咖啡”“一句話發(fā)送文件”“一句話關(guān)閉應用權(quán)限”等。在手機行業(yè)里相對完整且具體地展現(xiàn)了智能體價值。
在2024 vivo開發(fā)者大會上,vivo也亮出了自己的智能體方案Phone GPT,其不僅具有對屏幕界面的識別和操作功能,還可以接管音頻,通過電話實現(xiàn)預訂餐廳等功能。把智能體延伸到音頻領(lǐng)域,也成為接下來一個值得關(guān)注的方向。
在OPPO這邊,則有可以連續(xù)多輪自然對話,并可以跨應用操作的OPPO AI。除了提供識物、導航、問答等AI能力外,OPPO AI還可以與影像能力、AIGC能力結(jié)合,幫助用戶完成圖片識別、圖片處理、排版潤色等功能。
在華為這里,HarmonyOS NEXT版本具有搭載了盤古大模型的鴻蒙智能助手小藝。其感知和推理能力較此前版本有極大提升,可以實現(xiàn)23類主要場景的交互。
這些嘗試,都可以看作是向手機+AI Agent方向的前進,只是各個廠商的具體技術(shù)實現(xiàn)方式、能力側(cè)重以及宣傳話術(shù)不同。
對于消費者來說,如果你是深度手機用戶,今天可能已經(jīng)到了嘗鮮智能體的時機,但如果并沒有被傳統(tǒng)交互方式困擾等問題,或許還可以讓智能體手機再成熟一些。
至少AI Agent這顆果子,目前看來有著碩大無朋的潛力。
AI大模型與手機的結(jié)合方案有很多,但個人認為,二者的最佳結(jié)合點其實是很明確的,那就是無障礙能力。
AI大模型的核心功能之一,就是在圖像、音頻、文字幾種不同的媒介間進行轉(zhuǎn)換,而這恰好也是視障、聽障人群最為需要的。因此,當有人認為AI大模型與手機結(jié)合并不必要時,我會說看看無障礙能力的長足進展就能知道,AI手機必有未來。
通過與很多聽障、視障朋友的交流,以及對相關(guān)機構(gòu)的采訪,發(fā)現(xiàn)大家都希望實名表揚華為和vivo。早些年普遍認為蘋果的無障礙能力很好,但現(xiàn)在已經(jīng)是華為和vivo在引領(lǐng)端側(cè)無障礙能力的發(fā)展,尤其是AI時代的無障礙升級。
比如說,vivo通過AI技術(shù)為聽障、視障人群和老年人提供了一系列幫助。去年,vivo的“手語翻譯官”軟件獲得了CCL2024手語數(shù)字人翻譯質(zhì)量評測第一名。今年,vivo還升級了“手語學習”功能,推動手語的教育普及。
鴻蒙系統(tǒng)的發(fā)展,每一步都伴隨著對端側(cè)無障礙事業(yè)的大力投入。比如HarmonyOS 4就推出了助聽器直連功能。在華為開發(fā)者大會2023期間,推出了能幫助視障人群識別具體場景與物品的小藝看世界。而在今年,HarmonyOS NEXT則在業(yè)界率先推出了小藝聲音修復功能,它利用AI技術(shù)對語言障礙者的聲音進行實時分析、修復和優(yōu)化,不僅能夠發(fā)出可懂音,還能盡可能保留用戶音色。這個功能專為四級和三級言語障礙人群設(shè)計,可以實現(xiàn)無需文本輸入的聲音修復,極大拓展了端側(cè)無障礙能力的邊界。
對于很多用戶來說,手機里的AI能力或許是錦上添花,但對于有障礙群體來說,AI手機或許就是改變生活乃至生命的鑰匙。
僅為此,AI也必須在手機中存在,壯大,盛放。
回顧一下手機廠商推進的AI能力,會發(fā)現(xiàn)其實每一步都還有很青澀的地方。如果我們愿意承認二者結(jié)合的復雜性,那么AI手機的果子可能還真不太保熟。
如果手機只提供AI能力,那么廠商會面臨與應用開發(fā)者的直接競爭。而應用開發(fā)者包括互聯(lián)網(wǎng)巨頭與專業(yè)的AI廠商,手機廠商的技術(shù)能力與用戶號召力可能并不具有說服力。
于是,手機廠商希望押注智能體這樣的突破性體驗,但目前階段這類體驗還有待打磨和升級。很多時候,用戶給智能體下達的指令需要反復確認,效率還不如直接點滑,而AI接管音頻等能力則不確定性更大。面對經(jīng)常出錯的,且應用范圍不廣的智能體,用戶的耐心與信任或許會快速枯竭。
更為重要的是,這類前沿能力還不足以影響消費者的核心決策。AI手機大概率會導致手機市場短期向好,但還沒到能夠逆轉(zhuǎn)持續(xù)走低趨勢的程度。
再向上一層則比較務(wù)虛。意圖識別、主動服務(wù)、服務(wù)找人等口號,眾多手機廠商都喊了很多年。但真實情況是,最先進的大模型也無法預測人的想法。消費者對AI手機的期待是科幻電影里全能的個人助理。廠商為了促銷,也會在話術(shù)中將AI手機進行包裝和夸大,但最終在可見的范圍內(nèi),手機行業(yè)只能一次次與消費者的預期違背。
頂著這些壓力,AI手機還在趕路的途中。從技術(shù)體驗的角度,它確實還不足以帶來顛覆,但從產(chǎn)業(yè)發(fā)展的角度,AI大模型與手機結(jié)合是一個絕佳的戰(zhàn)略機遇。海外大模型進不來,谷歌另辟蹊徑,蘋果龜速發(fā)展。AI之于中國手機,多少有了點天命在身的意味。
這是一個前所未有的局面,即使果子還沒熟透。對于大多數(shù)消費者,也不妨像《鄉(xiāng)村愛情》里謝永強經(jīng)常說的那樣——“我得去果園看看”。
審核編輯 黃宇
-
手機
+關(guān)注
關(guān)注
35文章
6879瀏覽量
157584 -
AI
+關(guān)注
關(guān)注
87文章
30851瀏覽量
269028
發(fā)布評論請先 登錄
相關(guān)推薦
評論