在中國(guó),面對(duì)美國(guó)實(shí)施的芯片限制以及相較于西方企業(yè)更為有限的預(yù)算,人工智能(AI)公司正積極尋求降低成本的方法,以開發(fā)出具有市場(chǎng)競(jìng)爭(zhēng)力的模型。初創(chuàng)公司如01.ai(零一萬(wàn)物)和DeepSeek(深度求索)等,通過(guò)聚焦小數(shù)據(jù)集進(jìn)行AI模型訓(xùn)練,并聘請(qǐng)價(jià)格適中但技術(shù)熟練的計(jì)算機(jī)工程師,成功降低了成本。
與此同時(shí),阿里巴巴、百度和字節(jié)跳動(dòng)等大型科技集團(tuán)也加入了價(jià)格戰(zhàn),大幅降低“推理”成本,即調(diào)用大型語(yǔ)言模型生成響應(yīng)的價(jià)格。這些大模型的價(jià)格已經(jīng)下降了90%以上,遠(yuǎn)低于美國(guó)同行的水平。
總部位于北京的01.ai,由前谷歌中國(guó)區(qū)總裁李開復(fù)領(lǐng)導(dǎo),通過(guò)構(gòu)建以較少數(shù)據(jù)量進(jìn)行訓(xùn)練、需要較少計(jì)算能力的模型,并優(yōu)化硬件,成功降低了推理成本。李開復(fù)表示,中國(guó)的優(yōu)勢(shì)在于制造出價(jià)格實(shí)惠的推理引擎,并廣泛推廣其應(yīng)用。
在加州大學(xué)伯克利分校SkyLab和LMSYS研究人員發(fā)布的排名中,01.ai的Yi-Lightning模型與馬斯克名下公司x.AI的Grok-2在大型語(yǔ)言模型(LLM)公司中并列第三,僅次于OpenAI和谷歌。其他中國(guó)公司如字節(jié)跳動(dòng)、阿里巴巴和DeepSeek也在大模型排名榜上名列前茅。
Yi-Lightning的推理成本為每百萬(wàn)token 14美分,遠(yuǎn)低于OpenAI的GPT-4等模型。李開復(fù)表示,其目標(biāo)不是擁有最佳模型,而是開發(fā)出一個(gè)具有競(jìng)爭(zhēng)力的模型,開發(fā)人員使用它來(lái)構(gòu)建應(yīng)用程序的成本要低5到10倍。
為了降低成本,許多中國(guó)AI企業(yè)采用了所謂的“混合專家模型(MoE)”方法,這一策略最初由美國(guó)研究人員提出。該方法結(jié)合了多個(gè)針對(duì)行業(yè)特定數(shù)據(jù)進(jìn)行訓(xùn)練的神經(jīng)網(wǎng)絡(luò),而不是在龐大的數(shù)據(jù)庫(kù)上一次性訓(xùn)練一個(gè)“密集模型”。研究人員認(rèn)為,這是實(shí)現(xiàn)與密集模型相同智能水平但計(jì)算能力較低的關(guān)鍵方法。
然而,混合專家模型方法更容易失敗,因?yàn)楣こ處煴仨殔f(xié)調(diào)多個(gè)“專家”的訓(xùn)練過(guò)程。因此,中國(guó)AI企業(yè)在過(guò)去一年中一直在競(jìng)相開發(fā)最高質(zhì)量的數(shù)據(jù)集,以訓(xùn)練這些“專家”,從而在競(jìng)爭(zhēng)中脫穎而出。
李開復(fù)強(qiáng)調(diào),中國(guó)的優(yōu)勢(shì)不在于進(jìn)行前所未有的突破性研究,而在于建設(shè)得好、快、可靠且便宜。這一理念正引領(lǐng)著中國(guó)AI企業(yè)在降低成本、提高模型競(jìng)爭(zhēng)力的道路上不斷前行。
-
AI
+關(guān)注
關(guān)注
87文章
30887瀏覽量
269060 -
人工智能
+關(guān)注
關(guān)注
1791文章
47274瀏覽量
238462 -
LLM
+關(guān)注
關(guān)注
0文章
288瀏覽量
334
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論