在中國,面對美國實施的芯片限制以及相較于西方企業(yè)更為有限的預算,人工智能(AI)公司正積極尋求降低成本的方法,以開發(fā)出具有市場競爭力的模型。初創(chuàng)公司如01.ai(零一萬物)和DeepSeek(深度求索)等,通過聚焦小數(shù)據(jù)集進行AI模型訓練,并聘請價格適中但技術(shù)熟練的計算機工程師,成功降低了成本。
與此同時,阿里巴巴、百度和字節(jié)跳動等大型科技集團也加入了價格戰(zhàn),大幅降低“推理”成本,即調(diào)用大型語言模型生成響應的價格。這些大模型的價格已經(jīng)下降了90%以上,遠低于美國同行的水平。
總部位于北京的01.ai,由前谷歌中國區(qū)總裁李開復領(lǐng)導,通過構(gòu)建以較少數(shù)據(jù)量進行訓練、需要較少計算能力的模型,并優(yōu)化硬件,成功降低了推理成本。李開復表示,中國的優(yōu)勢在于制造出價格實惠的推理引擎,并廣泛推廣其應用。
在加州大學伯克利分校SkyLab和LMSYS研究人員發(fā)布的排名中,01.ai的Yi-Lightning模型與馬斯克名下公司x.AI的Grok-2在大型語言模型(LLM)公司中并列第三,僅次于OpenAI和谷歌。其他中國公司如字節(jié)跳動、阿里巴巴和DeepSeek也在大模型排名榜上名列前茅。
Yi-Lightning的推理成本為每百萬token 14美分,遠低于OpenAI的GPT-4等模型。李開復表示,其目標不是擁有最佳模型,而是開發(fā)出一個具有競爭力的模型,開發(fā)人員使用它來構(gòu)建應用程序的成本要低5到10倍。
為了降低成本,許多中國AI企業(yè)采用了所謂的“混合專家模型(MoE)”方法,這一策略最初由美國研究人員提出。該方法結(jié)合了多個針對行業(yè)特定數(shù)據(jù)進行訓練的神經(jīng)網(wǎng)絡,而不是在龐大的數(shù)據(jù)庫上一次性訓練一個“密集模型”。研究人員認為,這是實現(xiàn)與密集模型相同智能水平但計算能力較低的關(guān)鍵方法。
然而,混合專家模型方法更容易失敗,因為工程師必須協(xié)調(diào)多個“專家”的訓練過程。因此,中國AI企業(yè)在過去一年中一直在競相開發(fā)最高質(zhì)量的數(shù)據(jù)集,以訓練這些“專家”,從而在競爭中脫穎而出。
李開復強調(diào),中國的優(yōu)勢不在于進行前所未有的突破性研究,而在于建設得好、快、可靠且便宜。這一理念正引領(lǐng)著中國AI企業(yè)在降低成本、提高模型競爭力的道路上不斷前行。
-
AI
+關(guān)注
關(guān)注
88文章
34890瀏覽量
277751 -
人工智能
+關(guān)注
關(guān)注
1806文章
48940瀏覽量
248356 -
LLM
+關(guān)注
關(guān)注
1文章
324瀏覽量
796
發(fā)布評論請先 登錄
Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)
匯川技術(shù)榮獲2025中國自動化領(lǐng)域年度企業(yè)與年度最具競爭力創(chuàng)新產(chǎn)品
Qwen大模型助力開發(fā)低成本AI推理方案
租用站群服務器時如何降低成本?
數(shù)據(jù)驅(qū)動變革:設備管理系統(tǒng)如何重塑企業(yè)競爭力

企業(yè)AI解決方案包括哪些內(nèi)容
芯和半導體榮獲2024上海軟件核心競爭力企業(yè)
降低成本和提高效率:提高連接器生產(chǎn)效率的獨特策略
知存科技榮獲2024中國AI算力層創(chuàng)新企業(yè)
在飽和狀態(tài)下運行UCC2888x離線降壓以降低成本

AI即服務平臺的優(yōu)勢
CC2340系統(tǒng)降低成本的方案剖析

評論