電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)大模型廠商徹底瘋狂!電商618大促剛剛開(kāi)始,大模型廠商就開(kāi)始輪番瘋狂降價(jià)。每千Tokens的價(jià)格,從過(guò)去幾分錢(qián),再下降一個(gè)數(shù)量級(jí)至幾厘,甚至還有直接開(kāi)放大模型全面免費(fèi)試用。
大模型進(jìn)入免費(fèi)時(shí)代
5月21日,阿里云宣布通義千問(wèn)4款商業(yè)化模型和5款開(kāi)源模型大降價(jià),其中GPT-4級(jí)別的主力模型Qwen-Long價(jià)格直降97%,從此前API輸入0.02元/千Tokens,降價(jià)至0.0005元/千Tokens;API輸出從0.02元/千Tokens,也降了90%到0.002元/千Tokens。
Token在自然語(yǔ)言處理中是指文本被分割成的最小單元或標(biāo)記,通常1個(gè)中文詞語(yǔ)、英文單詞、數(shù)字、符號(hào)計(jì)為 1 個(gè)Token,由于不同模型采用的分詞器不同,同一段文字可能分成不同數(shù)量的Tokens,比如在某個(gè)模型中,“使用者”被分為一個(gè)Tokens,但“大模型”就被分為“大”和“模型”兩個(gè)Tokens。粗略估算,1Tokens可以理解為相當(dāng)于1.5個(gè)中文漢字。
然而就在上午通義千問(wèn)降價(jià)之后,下午百度言簡(jiǎn)意賅,在公眾號(hào)上發(fā)文宣布:文心大模型兩大主力模型全面免費(fèi),立即生效!
這次免費(fèi)的兩大主力模型分別是ERNIE Speed和ERNIE Lite,上下文長(zhǎng)度均支持8K、128K,均為輕量級(jí)大模型。其中ERNIE Speed適用于自然語(yǔ)言處理任務(wù)中的多種場(chǎng)景,如文本分類、命名實(shí)體識(shí)別、語(yǔ)義匹配等,在智能客服、搜索引擎、智能推薦等領(lǐng)域的應(yīng)用表現(xiàn)突出,在閱讀理解、close-book問(wèn)答、創(chuàng)作與續(xù)寫(xiě)等復(fù)雜任務(wù)上,也能達(dá)到甚至超越千億大模型的效果。
而ERNIE Lite則適合搭載在低算力的AI加速卡上處理推理任務(wù),應(yīng)用于檢索、推薦、意圖識(shí)別等高并發(fā)、低延時(shí)等場(chǎng)景。
在文心大模型之后,5月22日,科大訊飛也宣布旗下訊飛星火Lite API永久免費(fèi)開(kāi)放,此前該模型版本價(jià)格為0.018元/千Tokens。Spark Lite同樣是輕量級(jí)大語(yǔ)言模型,支持在線聯(lián)網(wǎng)搜索功能,適用于低算力推理與模型精調(diào)等定制化場(chǎng)景。
除了輕量級(jí)大模型之外,在頂配的Spark 3.5 Max版本上,價(jià)格也降到0.21-0.3元/萬(wàn)Tokens,即0.021-0.03元/千Tokens,這個(gè)價(jià)格相比文心一言和通義千問(wèn)同級(jí)別大模型也要更低。比如文心一言的ERNIE-4.0輸入、輸出均為0.12元/千Tokens;通義千問(wèn)Qwen-Max輸入0.04元/千Tokens,輸出0.12元/千Tokens。
這一輪大模型降價(jià),可以追溯到5月初?;梅搅炕煜律疃惹笏鳎―eepSeek)在5月6日正式開(kāi)源第二代MoE模型DeepSeek-V2,而其API的定價(jià)為輸入1元/百萬(wàn)Tokens,輸出2元/百萬(wàn)Tokens,算下來(lái)大概是0.001-0.002元/千Tokens,價(jià)格幾乎是GPT-4-Turbo的百分之一。
5月11日,智譜大模型官宣降價(jià),其中個(gè)人版 GLM-3Turbo模型產(chǎn)品的API調(diào)用價(jià)格從0.005元/千Tokens,降至0.001元/千Tokens;最頂配的GLM-4和GLM-4V價(jià)格也來(lái)到0.1元/千Tokens。
字節(jié)跳動(dòng)旗下的云服務(wù)平臺(tái)火山引擎,在5月15日推出了豆包大模型家族,其中豆包主力模型的推理輸入定價(jià)僅為0.0008元/千Tokens,當(dāng)時(shí)火山引擎表示,這個(gè)價(jià)格要比行業(yè)便宜99.3%。
但大模型內(nèi)卷的趨勢(shì),并不是“中國(guó)特色”,5月13日,OpenAI推出了新一代的大模型GPT-4o,除了性能上的大幅提升之外,更重磅的消息是該新模型將全部功能免費(fèi)使用。
此前OpenAI僅免費(fèi)開(kāi)放GPT-3.5供用戶使用,而GPT-4是要付費(fèi)使用的。但在GPT-4o發(fā)布后,不僅性能上超越GPT-4,而且還免注冊(cè)開(kāi)放使用。當(dāng)然,免費(fèi)用戶使用GPT-4o只能每三小時(shí)使用十次,超過(guò)10次將自動(dòng)降級(jí)至GPT-3.5。
與此同時(shí),商業(yè)用戶方面,GPT-4o的API調(diào)用價(jià)格也相比GPT-4 Turbo全面下降50%。
所以,大模型的全面降價(jià),甚至是免費(fèi),已經(jīng)成為目前全球AI行業(yè)的趨勢(shì)。
價(jià)格戰(zhàn)是“良藥”還是“雙輸”?
在互聯(lián)網(wǎng)行業(yè),瘋狂燒錢(qián)的零和博弈打法已經(jīng)司空見(jiàn)慣,從電商到外賣(mài)、再到共享單車(chē),在行業(yè)發(fā)展初期都依靠低價(jià)打開(kāi)市場(chǎng)規(guī)模。
零一萬(wàn)物創(chuàng)始人兼CEO李開(kāi)復(fù)認(rèn)為,大模型降價(jià)對(duì)整個(gè)行業(yè)來(lái)說(shuō)是好消息,行業(yè)每年降低10倍推理成本是可以期待的,而且也應(yīng)該是必然發(fā)生的,但同時(shí)他也表示價(jià)格戰(zhàn)是一個(gè)“雙輸”的打法,大模型公司不會(huì)這樣不理智。
“當(dāng)其團(tuán)隊(duì)認(rèn)定自己的技術(shù)值得的時(shí)候,就會(huì)堅(jiān)持一個(gè)合適的價(jià)格,而絕不會(huì)靠貼錢(qián)、賠錢(qián)去做生意?!?br />
AI大模型的商業(yè)化,一直以來(lái)都是行業(yè)的頭號(hào)難題。首先是大模型訓(xùn)練成本居高不下,比如李飛飛團(tuán)隊(duì)分析報(bào)告顯示,Google此前發(fā)布的Gemini Ultra訓(xùn)練成本高達(dá)近2億美元,OpenAI 的 GPT-4訓(xùn)練成本也預(yù)計(jì)高達(dá)7800萬(wàn)美元,并且隨著時(shí)間的推移,新推出的大模型訓(xùn)練成本還在不斷提高。
而在C端應(yīng)用中,用戶留存和活躍度也正在面臨很大挑戰(zhàn),即使是ChatGPT, 自從去年六月開(kāi)始流量就開(kāi)始出現(xiàn)下降,大多數(shù)用戶使用ChatGPT還是基于嘗鮮的性質(zhì),而無(wú)法成為一個(gè)日常應(yīng)用。
根據(jù)QuestMobile的數(shù)據(jù),AICG的運(yùn)營(yíng)數(shù)據(jù)活躍率均在20%以下,3日留存均在50%以下,卸載率更是在50%以上。
所以,這也反映出目前類ChatGPT的大模型應(yīng)用,并不是目前大模型的最終表現(xiàn)形式。
而面向B端的API降價(jià),則能夠推動(dòng)AI應(yīng)用的開(kāi)發(fā)。近一年里,大模型的技術(shù)能力提升速度極快,尤其是國(guó)內(nèi)的眾多玩家入局后,大模型的能力突飛猛進(jìn)。
5月21日李開(kāi)復(fù)公布了零一萬(wàn)物團(tuán)隊(duì)在國(guó)際測(cè)評(píng)榜單中的新成績(jī), Yi-Large在 LMSYS 盲測(cè)競(jìng)技場(chǎng)總榜排名世界第七,中國(guó)大模型中第一;其中在中文分榜中與GPT-4o并列世界第一。
他也表示在近一年時(shí)間里,中美大模型的差距從7到10年,已經(jīng)縮短到6個(gè)月左右。
因此,在當(dāng)前大模型技術(shù)發(fā)展迅速的時(shí)間節(jié)點(diǎn),在投入大量資本去創(chuàng)造大模型的同時(shí),如何讓大模型商業(yè)落地是整個(gè)行業(yè)共同希望解決的難題。畢竟只有將大模型商業(yè)化變現(xiàn),才能回收訓(xùn)練支出的高昂成本。
所以大模型降價(jià),一定程度上能夠吸引更多的企業(yè)嘗試使用大模型開(kāi)發(fā)AI應(yīng)用,通過(guò)AI應(yīng)用去創(chuàng)造更廣泛的使用場(chǎng)景,以實(shí)現(xiàn)“AI普及”。
當(dāng)然,大模型降價(jià)也不是盲目的?;鹕揭嬖诎l(fā)布會(huì)上表示,其在技術(shù)上有很多優(yōu)化手段可以降低大模型訓(xùn)練成本,而在工程上可通過(guò)分布式推理的形式提高算力利用率等。
另一方面,大模型價(jià)格戰(zhàn),對(duì)于背靠互聯(lián)網(wǎng)業(yè)務(wù)的大廠來(lái)說(shuō),由于資金壓力較小,在市場(chǎng)推廣上更有優(yōu)勢(shì)。但對(duì)于一些大模型初創(chuàng)公司,市場(chǎng)的價(jià)格戰(zhàn)毫無(wú)疑問(wèn)是加速了優(yōu)勝劣汰的節(jié)奏。
小結(jié):
對(duì)于當(dāng)前商業(yè)模式還未走通的大模型行業(yè)來(lái)說(shuō),嘗試總是好事。但重走互聯(lián)網(wǎng)時(shí)代的“零和博弈”路線,到底能否復(fù)現(xiàn)過(guò)去的成功,還要看后續(xù)的發(fā)展。
-
AI
+關(guān)注
關(guān)注
87文章
30887瀏覽量
269062 -
大模型
+關(guān)注
關(guān)注
2文章
2448瀏覽量
2700
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論