0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

中國AI今天的問題,是大模型又多又亂

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2023-11-21 01:01 ? 次閱讀

OpenAI開發(fā)者日活動后,GPTs模式引發(fā)了新一輪的AI熱潮,開發(fā)者調用過分火爆,甚至導致OpenAI服務器一度宕機。隨后,花式把玩GPTs的經驗,以及圍繞這種新形態(tài)的巨大爭議開始涌現(xiàn)。中國的IT從業(yè)者、軟件開發(fā)者與AI工程師也積極參與討論,迎來了一場新的AI狂歡。

但在這種氛圍下,卻有一種沉默顯得像個顯眼包。那就是絕大多數(shù)大模型公司,似乎都沉默了。為了模仿類GPT的大模型,中國AI圈用了一年時間,雨后春筍般打造了上百個大模型。但其中能夠誕生明星應用,能夠推動產品創(chuàng)新,甚至能夠擁有規(guī)?;脩舻乃坪醵剂攘葻o幾。當OpenAI的飛輪效應顯現(xiàn),這些大模型公司就有種越是模仿差距越大的感覺。于是干脆不去追新的熱點,埋頭把眼前能做的先做完。

記得今年年初的時候,社交網(wǎng)絡和媒體都在討論中國能否有大模型?

當時我們說過,這其實是個偽命題,因為中國早就有大模型。而在ChatGPT爆火之后,中國AI遇到的問題一定不是大模型太少,而是大模型過剩。

今天,這種問題開始浮現(xiàn)了出來。此刻中國AI行業(yè)最大的問題,就是大模型太多,而且還挺亂。

摩肩接踵的大模型

中國到底有多少AI大模型?經過一年的井噴式發(fā)展,這已經變成了一筆糊涂賬。上半年的時候,答案大概是幾十個。時間來到11月,有人說是一百多個,有人說是二百多個??傊?,中國此刻必然是全世界擁有大模型最多的國家,遠遠超過美國。

但是,這一百多個大模型有人用過嗎?有人對比、評測過嗎?恐怕沒有。因為除了幾個頭部大模型形成了用戶規(guī)模外,其中大部分存在于開源社區(qū),還有一部分只存在通稿里。

這就像什么呢?其實很多人不知道,根據(jù)相關數(shù)據(jù),中國有2600萬足球人口,同樣居世界第一。我們無從考證數(shù)據(jù)從何而來,反正周圍踢足球的人看著是不多,而國足的成績有目共睹。

為什么會出現(xiàn)這么多大模型呢?

首先是今年大模型賽道好,機會難得。雖然科技板塊的VC市場非常低迷,但在其他互聯(lián)網(wǎng)創(chuàng)投項目普遍失效,虛擬貨幣被嚴格限制的情況下,AI大模型成為今年近乎唯一的故事。因此即便熱錢不多,但還是集中涌向了大模型創(chuàng)業(yè)。

其次,與很多人設想的不同,大模型創(chuàng)業(yè)并沒有真正意義上的高門檻。一旦以股權、期權等方式吸引到了合適的人才,大模型創(chuàng)業(yè)公司過多的費用支出。相比于其他科技領域有產品研發(fā)、用戶推廣、硬件化等燒錢選項,在擁有大量開放數(shù)據(jù)集、免費工具的情況下,僅僅是訓練大模型并沒有過高的成本門檻,并且所謂大模型項目,往往一個科研團隊就可以支撐,不需要像互聯(lián)網(wǎng)創(chuàng)業(yè)公司搭建較為復雜的業(yè)務體系。

此外,還有一種“刷業(yè)績”式的大模型,極大程度增加了大模型數(shù)量。這種一般是高校、科研機構相關團隊,選報大模型方面課題更容易獲得立項。其結項結果發(fā)布后,大模型數(shù)量就又增加了一個?;蛘呤谴笮推髽I(yè)上級要求做大模型,于是IT部門會根據(jù)開源的模型框架搭建一個出來,即使效果不佳,落地困難,也要進行對內對外宣傳。

賽道好、成本低、需要完成任務,這幾種動力,導致中國大模型越來越多,且產生效率越來越快。

但問題在于,足球人口規(guī)??赡艽_實很重要,但更重要的是有一支能踢進世界杯的球隊。

沒有希望的窄賽道

那么有人或許要問了。大模型數(shù)量說難道不能成為優(yōu)勢嗎?我們靠數(shù)量出奇跡,說不定數(shù)量一多就能選出拔尖的來?

這恐怕并不現(xiàn)實。因為從種種理由來看,今天龐大的大模型規(guī)模,都是不可能持續(xù)存在。通稿打造類GPT模型而擠入下一個科技時代的美好想法,已經將AI大模型變成了一條沒有希望的窄賽道。

我們可以來正視這樣幾個問題:

1.大模型的數(shù)量多,其實和大模型本質背道而馳。

提起大模型,我們會說它的優(yōu)點是模型的泛化性、高魯棒性,繼而帶來了“智能涌現(xiàn)”效果。我們總是驚嘆OpenAI的成績,就是因為GPT系列始終在深度挖掘模型的泛化性。也就是說,大模型的優(yōu)勢就是一個頂一群,用一個模型代替一堆模型,結果反而出現(xiàn)了數(shù)量過剩的大模型,這與大模型初衷南轅北轍,并且浪費了海量的社會資源。

2.大模型是底層技術,底層技術的玩家不可能很多。

僅僅以AI開發(fā)為例,模型之上還有AI芯片、AI框架。在過去幾年,這些領域也有很多廠商布局,但最后大多不了了之。AI芯片無法出貨,AI框架無人問津,能夠剩下的只有頭部一兩家而已。大模型也是同樣的道理,這是一個注定洗牌到存量很少的賽道。

大模型,距離開發(fā)者很遠。

絕大多數(shù)初創(chuàng)大模型,都會選擇開源吸引開發(fā)者的模式。但現(xiàn)實情況是,這些模型無論是與國外開源大模型,還是國內頭部大模型相比,都沒有實際競爭力,無法形成規(guī)?;拈_發(fā)者聚合效應。這些大模型普遍是開源時大力宣傳一波吸引關注,但開發(fā)者實際體驗后馬上遇冷。

4.大模型,距離用戶很遠。

在可見的場景中,絕大多數(shù)大模型都缺乏商業(yè)化支撐,是這個賽道最大的問題。對應大模型創(chuàng)業(yè)型企業(yè)來說,一開局就是最艱難的局面。后來廣受詬病的機器視覺公司,在開局階段還有智能安防市場作為支撐。但大模型公司擁有的只是算法,甚至連一條可行的商業(yè)化通道都找不到。

這些問題,導致堆積了巨大數(shù)量的大模型賽道開始變得并不美好。它今天的情況是,說算法,各個創(chuàng)新;說參數(shù),各個龐大;說調用,根本沒人用;說商業(yè),根本沒去想。

模型一多,亂象也多

大模型一多,產業(yè)賽道開始熱絡起來,也必不可免出現(xiàn)一些問題。這就是我們說的,大模型不僅有點多,還有點亂。

由于目前階段,有一股“大模型用不用不重要,先要擁有大模型”的思潮。因此就開始有各種方式降低大模型的開發(fā)成本,通過話術夸大價值,甚至硬蹭大模型熱度,把不是大模型技術的項目包裝成大模型,進而導致大模型圈子里,開始出現(xiàn)良莠不齊、魚龍混雜的態(tài)勢,我們可以列舉其中的幾種:

1.打榜刷分型大模型。由于大模型數(shù)量龐大,且實現(xiàn)思路基本一致,這就導致不同公司之間的差異化微乎其微。而為了凸顯自己的差異化與領先性,目前通用方式是硬造一個技術術語,然后宣傳通過這項技術自身項目刷新了某榜單紀錄,在某測試中跑出了多少分。

事實上,大部分榜單都只測試模型的某個維度,可以進行針對性調參。打榜刷分并不難,且有比較大的操作空間。類似的,社區(qū)開發(fā)者打多少顆星,發(fā)了多少篇頂會,也都是慣用的包裝方案。

2.結項為主型大模型。有很多用作課題結項,或者企業(yè)數(shù)字化成果結項的大模型。評審結束,結項成功,開源開放,這三條做到就是它們的生命終點。這類大模型不考慮應用場景與后續(xù)更新,有某種朝生夕死的精神特質。

3.動輒開源型大模型。軟件開源當然是大勢所趨,但隨著這幾年中國開源事業(yè)的興旺發(fā)展,AI模型開源似乎變成了某種“時尚”。加上一些企業(yè)更愿意將大模型的開源與免費作為流量聚攏工具。開源,逐漸成為了低質量、低維護大模型的遮羞布。

4.冒名頂替型大模型。大模型火了之后,開始有公司打起了蹭熱點的主意。于是,用并非標準預訓練大模型技術冒充大模型,甚至干脆把古早的對話機器人、應用軟件包裝成大模型的案例屢見不鮮。用大模型的瓶子,裝其他老酒,也成為了一門生意。

5.套殼變身型大模型。最近,一些創(chuàng)業(yè)公司套殼國外開源模型的事件引起爭議。其實業(yè)界類似手法并不少見,將開源大模型進行改寫和包裝,搖身一變,成為自研大模型的例子非常多。

這些大模型隊伍里的妖魔鬼怪,也紛紛可以通過發(fā)明術語、加強定語的方式,來宣傳自己的創(chuàng)新能力和差異化。最終導致把真正的技術創(chuàng)新,淹沒在了一系列的“偽裝創(chuàng)新”當中。

中國AI之春,在去掉90%的大模型之后

如果我們看美國的大模型產業(yè)結構,會發(fā)現(xiàn)它處在一個每層數(shù)量差異不大的金字塔結構里。即OpenAI一家獨大,谷歌、微軟、Meta、X保持持續(xù)競爭力,此外還有20幾個較為常用,開發(fā)者群落比較活躍的大模型。

當然咱們不是說一定要照搬美國,但從中大概可以看見一個科技大國,在目前情況下大模型產業(yè)體量是什么。

中國大模型,已經在短時間內發(fā)展出了遠遠超過本身應有存量的大模型。數(shù)量過于龐大的大模型,一方面浪費了極大的研發(fā)、算力,以及數(shù)據(jù)資源;另一方面也蘊藏了一場并不會太久的“危機”。

在資本泡沫相對冷卻之后,我們很容易看到這樣的情況:忽然之間,眾多大模型開始停止更新,緊接著大模型領域的公司大量倒閉。伴隨著資本退場,員工待遇下降等問題開始發(fā)生,于是媒體開始唱衰大模型寒冬,社交媒體上開始冷嘲熱諷AI這門技術。

這種行業(yè)猛然轉冷,大概率會給真正具有競爭力、創(chuàng)新能力的中國AI企業(yè)帶來巨大的麻煩。

但是請記住,這并不是AI不行了,而是這些AI公司和大模型項目本來就不行。

這不是AI寒冬,而是中國AI的春天剛剛要真正開始。產業(yè)優(yōu)化重組后的大模型產業(yè)形態(tài),才是真正能發(fā)揮出中國在應用創(chuàng)新、產品打磨、產業(yè)智能化落地等領域的優(yōu)勢。

在中國,相對良性的大模型產業(yè)形態(tài),應該是有5家左右可以互相競爭的主流大模型,1到2個能夠進行底層技術創(chuàng)新,保持全球競爭力的大模型體系,同時有一系列開源大模型作為補充,以及一些學術領域的大模型作為AI for sience的支撐。此外,還要具備較為完善的大模型配套設施,包括AI芯片、AI計算、深度學習開發(fā)框架、AI開發(fā)工具,并且這些領域都有較高的自主化程度。換言之,必須要淘汰今天超過90%的大模型。

在這些底層軟硬件基礎之上,應該有大量創(chuàng)業(yè)公司、AI開發(fā)者去探索C端和B端的大模型落地。在大模型與行業(yè)結合的垂直領域,組成推廣和復制行業(yè)大模型的產業(yè)生態(tài);在主要的C端市場,比如大模型+辦公、大模型+娛樂、大模型+信息獲取方面,涌入成千上萬家公司,形成互聯(lián)網(wǎng)經濟之后的AI經濟奇跡。

而從“百模大戰(zhàn)”中能夠留到那時的只有三種公司:具備核心技術創(chuàng)新的、形成平臺型產業(yè)鏈的以及能夠快速找到商業(yè)出口,形成正向資金循環(huán)的。

我們依舊篤信,有一天AI技術上會出現(xiàn)新的抖音、微信、office,甚至更多此前無法想象的東西。

但今天絕大多數(shù)的大模型,結局恐怕只能是躺在歷史空隙與開源平臺上,成為大時代的小腳注。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31225

    瀏覽量

    269579
  • GPT
    GPT
    +關注

    關注

    0

    文章

    354

    瀏覽量

    15445
  • OpenAI
    +關注

    關注

    9

    文章

    1103

    瀏覽量

    6597
  • 大模型
    +關注

    關注

    2

    文章

    2499

    瀏覽量

    2909
收藏 人收藏

    評論

    相關推薦

    AI模型部署和管理的關系

    AI模型的部署與管理是AI項目成功的兩大支柱,它們之間既相互獨立緊密相連,共同推動著AI技術從實驗室走向實際應用。
    的頭像 發(fā)表于 11-21 10:02 ?183次閱讀

    博聯(lián)AI模型全屋智能亮相2024中國建博會

    2024中國建博會(廣州)在廣交會展館及保利世貿博覽館盛大啟幕。 BroadLink博聯(lián)智能攜AI模型全屋智能以及AI商業(yè)照明解決方案驚喜亮相, 全方位展示
    的頭像 發(fā)表于 09-12 15:46 ?442次閱讀

    商湯AI模型中國國家籃球隊達成戰(zhàn)略合作

    商湯科技與中國國家籃球隊達成戰(zhàn)略合作,將基于商湯“日日新SenseNova5.5”大模型技術共同打造AI模型籃球產品,推動AI
    的頭像 發(fā)表于 07-17 09:58 ?742次閱讀

    ai模型ai框架的關系是什么

    AI模型AI框架是人工智能領域中兩個重要的概念,它們之間的關系密切且復雜。 AI模型的定義和特點
    的頭像 發(fā)表于 07-16 10:07 ?4.1w次閱讀

    ai模型和傳統(tǒng)ai的區(qū)別在哪?

    AI模型和傳統(tǒng)AI的區(qū)別主要體現(xiàn)在以下幾個方面: 數(shù)據(jù)量和訓練規(guī)模 AI模型通常需要大量的數(shù)據(jù)進行訓練,以獲得更好的性能。相比之下,傳統(tǒng)
    的頭像 發(fā)表于 07-16 10:06 ?1462次閱讀

    AI模型與小模型的優(yōu)缺點

    在人工智能(AI)的廣闊領域中,模型作為算法與數(shù)據(jù)之間的橋梁,扮演著至關重要的角色。根據(jù)模型的大小和復雜度,我們可以將其大致分為AI模型
    的頭像 發(fā)表于 07-10 10:39 ?3023次閱讀

    AI模型,中國如何贏,Haivivi嘗試給出答案

    算法和系統(tǒng)基礎軟件等起步早,技術優(yōu)勢積累深厚,是大模型技術的“原產地”,同時美國AI領域的早期天使投資和種子融資較多,更有利于初創(chuàng)期AI企業(yè)發(fā)展。 中國的核心優(yōu)勢在于“場景”,如同互聯(lián)
    的頭像 發(fā)表于 07-02 09:42 ?323次閱讀

    STM CUBE AI錯誤導入onnx模型報錯的原因?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 05-27 07:15

    中國聯(lián)通推出車聯(lián)網(wǎng)AI模型

    在近日舉辦的“中國聯(lián)通車聯(lián)網(wǎng)大會”上,中國聯(lián)通重磅推出了基于“元景大模型”的車聯(lián)網(wǎng)AI模型。據(jù)中國
    的頭像 發(fā)表于 05-13 10:13 ?597次閱讀

    2024中國AI模型產業(yè)發(fā)展報告

    日前,人民網(wǎng)財經研究院、至頂科技聯(lián)合發(fā)布《開啟智能新時代:2024年中國AI模型產業(yè)發(fā)展報告》(以下簡稱《報告》),對于AI模型產業(yè)發(fā)展
    的頭像 發(fā)表于 03-30 08:26 ?824次閱讀
    2024<b class='flag-5'>中國</b><b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>產業(yè)發(fā)展報告

    AI模型將如何推動中國產業(yè)升級?華為盤古大模型深耕千行萬業(yè)

    AI模型將如何推動中國產業(yè)升級?日前,華為混合云副總裁胡玉海在做客央視網(wǎng)《中國神氣局》時,暢談AI
    的頭像 發(fā)表于 03-22 10:40 ?613次閱讀

    防止AI模型被黑客病毒入侵控制(原創(chuàng))聆思大模型AI開發(fā)套件評測4

    在設計防止AI模型被黑客病毒入侵時,需要考慮到復雜的加密和解密算法以及模型的實現(xiàn)細節(jié),首先需要了解模型的結構和實現(xiàn)細節(jié)。 以下是我使用Python和TensorFlow 2.x實現(xiàn)
    發(fā)表于 03-19 11:18

    cubemx ai導入onnx模型后壓縮失敗了怎么解決?

    cubemx ai導入onnx模型后壓縮失敗。請問我怎么解決
    發(fā)表于 03-19 07:58

    AI模型遠程控制啟動車輛(原創(chuàng))

    AI模型
    還沒吃飯
    發(fā)布于 :2024年03月18日 15:18:29

    使用cube-AI分析模型時報錯的原因有哪些?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發(fā)表于 03-14 07:09