0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圍剿Kimi,只是大模型“新賽季”play的一環(huán)

腦極體 ? 來(lái)源: 腦極體 ? 作者: 腦極體 ? 2024-04-05 01:16 ? 次閱讀

大模型巨頭“圍剿”Kimi的戰(zhàn)役,已經(jīng)進(jìn)行了一段時(shí)間了。想必讀者們已經(jīng)從Kimi帶來(lái)的震撼中冷靜下來(lái),開始理性審視2024的大模型“新賽季”。

毫無(wú)疑問(wèn),“卷”長(zhǎng)文本,是基礎(chǔ)通用大模型在新賽季的首個(gè)賽點(diǎn)。3月18日,月之暗面宣布Kimi智能助手支持200萬(wàn)字超長(zhǎng)無(wú)損上下文,并開啟內(nèi)測(cè)。200萬(wàn)字是什么概念呢?《紅樓夢(mèng)》等古典名著、企業(yè)財(cái)報(bào)等專業(yè)文獻(xiàn),Kimi都能“手拿把掐”,展現(xiàn)出了極強(qiáng)的理解分析能力。

wKgZomYNPLmARNo7AAC7kJPxhUg176.jpg

打擂臺(tái)容易守擂難。Kimi這位新秀的亮相固然驚艷,但其他更早問(wèn)世的TOP級(jí)基礎(chǔ)大模型,也都不是吃素的,很快百度文心一言、阿里通義千問(wèn),都宣布跟進(jìn)長(zhǎng)文本能力,直接卷到1000萬(wàn)字。

Kimi突如其來(lái)的熱度、巨頭的積極反撲、長(zhǎng)文本賽事的狂飆,無(wú)不說(shuō)明基礎(chǔ)大模型已經(jīng)進(jìn)入了新賽段。

Kimi不是來(lái)終結(jié)比賽的,而是來(lái)加入這個(gè)家的。而去年倉(cāng)促備戰(zhàn)、緊跟ChatGPT的第一梯隊(duì)廠商,如今也對(duì)大模型的商業(yè)化前景、落地方向等,有了更成熟的思考。

Kimi掀起的“長(zhǎng)文本之戰(zhàn)”,只是大模型“新賽季”paly中的一環(huán),接下來(lái)還會(huì)有哪些看點(diǎn),我們來(lái)預(yù)測(cè)一下。

Kimi,終結(jié)不了比賽

月之暗面(Moonshot AI)是大模型賽道上,第一波獲得較大規(guī)模融資的明星創(chuàng)業(yè)公司。而相比同時(shí)期動(dòng)作不斷的AI大廠如BAT、明星企業(yè)如百川,月之暗面直到去年10月才交出了第一份成績(jī)單Kimi,頗有種“謀定而后動(dòng)”的味道。

wKgaomYNPLqAOMmaAACJjGASk58993.jpg

參數(shù)上看,Kimi的長(zhǎng)文本能力超越了當(dāng)時(shí)的谷歌gemini 1.5、Claude3,處于全球領(lǐng)先水平。

從市場(chǎng)動(dòng)作看,Kimi的宣傳,也不像其他基礎(chǔ)通用大模型廠商那樣謹(jǐn)慎,而是大規(guī)模投流,廣告鋪天蓋地,在B站、抖音、小紅書等平臺(tái)都有信息流投放。據(jù)媒體報(bào)道,Kimi每天獲客成本都在20萬(wàn),正在“燒錢換規(guī)模”。

從實(shí)際效果看,有大量個(gè)人用戶和企業(yè)開發(fā)者在使用Kimi后表示,其在中文上的理解、分析、問(wèn)答能力,確實(shí)優(yōu)于當(dāng)時(shí)主流的國(guó)產(chǎn)大模型,上下文銜接更好,總結(jié)能力更強(qiáng)。

幾重因素疊加,升級(jí)后的Kimi引爆了資本市場(chǎng)的新一波熱情,甚至出現(xiàn)了“Kimi概念股”。

那么,Kimi能“亂拳打死老師傅”,一舉終結(jié)基礎(chǔ)大模型的比賽嗎?子彈飛了這么久,結(jié)果已經(jīng)很明顯了,不能。

一方面,隨著用戶規(guī)模的增多、應(yīng)用場(chǎng)景和用例的增加,Kimi的能力局限越來(lái)越多地暴露出來(lái),比如有用戶提到,Kimi的編程能力跟ChatGPT、GLM4、文心一言有很大的差距,ToC場(chǎng)景下長(zhǎng)文本處理的需求并不高頻,新鮮感過(guò)了之后,感覺(jué)沒(méi)有其他太大用處。

wKgZomYNPLqAPbXpAADGadWlZSA843.jpg

同時(shí),Kimi視為核心差異化優(yōu)勢(shì)的長(zhǎng)文本能力,并不構(gòu)成真正的護(hù)城河。從其他巨頭很快就跟進(jìn)并上線了相關(guān)能力,就可以看出,長(zhǎng)文本處理技術(shù)的壁壘并沒(méi)有很高,能做基礎(chǔ)通用大模型的頭部廠商,都有相關(guān)技術(shù)和人才積累。

而過(guò)去一年AI大廠在多模態(tài)大模型、智算基礎(chǔ)設(shè)施、ToC應(yīng)用、Tob客情關(guān)系等多個(gè)維度構(gòu)筑起的壁壘,則是月之暗面很難快速追趕的。比如,目前月之暗面還沒(méi)有發(fā)布多模態(tài)大模型,云服務(wù)運(yùn)維跟不上,難以保證B端用戶的體驗(yàn)。

目前Kimi面向大眾免費(fèi)試用,但其付費(fèi)API的定價(jià),有的版本幾乎達(dá)到了GPT-3.5等領(lǐng)先大模型的數(shù)倍,后續(xù)付費(fèi)轉(zhuǎn)化也要打一個(gè)問(wèn)號(hào)。

總的來(lái)說(shuō),Kimi是月之暗面在大模型技術(shù)上的一次成功“秀肌肉”,但別說(shuō)直接終結(jié)比賽,要躋身“可規(guī)模落地大模型”這一賽道的TOP席位,恐怕為時(shí)尚早。

新賽季,“遭遇戰(zhàn)”告一段落

有讀者可能會(huì)問(wèn),既然大廠有做長(zhǎng)文本處理的能力,為什么去年不卷,非要Kimi火了之后才卷?

所以說(shuō),Kimi爆火是一個(gè)很好的契機(jī),標(biāo)志著中國(guó)大模型已經(jīng)從倉(cāng)促備戰(zhàn)的“遭遇戰(zhàn)”,進(jìn)入到了步步為營(yíng)的“陣地戰(zhàn)”。

簡(jiǎn)單來(lái)說(shuō),2023年ChatGPT橫空出世,中國(guó)的AI大廠是在猝不及防的情況下,極短的時(shí)間內(nèi)統(tǒng)籌資源、組織人馬,快速跟上OpenAI的技術(shù)進(jìn)展,一度出現(xiàn)了“大模型日拋”的局面。這時(shí)候最重要的是爭(zhēng)取主動(dòng),避免中國(guó)AI在大模型浪潮中缺席。文心一言、訊飛星火、騰訊混元、華為盤古、百川智能、智譜AI等一大批基礎(chǔ)大模型廠商和初創(chuàng)機(jī)構(gòu),確實(shí)讓中國(guó)在“遭遇戰(zhàn)”中拿下一城。

wKgaomYNPLuAV1dhAABYA3oFu-8023.jpg

狂奔一年,無(wú)論海內(nèi)外都對(duì)大模型有了更清晰,也更務(wù)實(shí)的認(rèn)知。中國(guó)的基礎(chǔ)大模型廠商,已經(jīng)開始“高筑墻、廣積糧”,逐步進(jìn)入到充分準(zhǔn)備、保障嚴(yán)密、戰(zhàn)略穩(wěn)定的“陣地戰(zhàn)”了。

為什么之前不卷長(zhǎng)文本,Kimi出現(xiàn)又快速集體圍剿?恰恰是新賽季“陣地戰(zhàn)”開始的信號(hào)。

信號(hào)一,不打沒(méi)意義的仗。

國(guó)內(nèi)基礎(chǔ)大模型的競(jìng)爭(zhēng)基本告一段落了。

隨著Sora、Claude3等開源或閉源大模型都越來(lái)越強(qiáng)大,基礎(chǔ)通用大模型的投入門檻也更加高昂,不能長(zhǎng)期拿出天文數(shù)字來(lái)卷的都心生退意,轉(zhuǎn)而去挖掘垂直場(chǎng)景和細(xì)分行業(yè)的機(jī)會(huì),這也讓頭部廠商的認(rèn)知度和市場(chǎng)認(rèn)可度更加穩(wěn)固。

基礎(chǔ)大模型廠商也開始精打細(xì)算,關(guān)注如何從硬件中壓榨出更多算力、降低單位推理成本、構(gòu)建可持續(xù)的國(guó)產(chǎn)算力、挖掘商業(yè)化項(xiàng)目潛力等。而長(zhǎng)文本處理要消耗大量的硬件資源,平白無(wú)故瞎卷,燒錢費(fèi)力還未必討好,確實(shí)沒(méi)必要。

但Kimi的爆火,更多是讓ToB場(chǎng)景,尤其是金融、政務(wù)客戶,看到了大模型的應(yīng)用價(jià)值,讀財(cái)報(bào)、讀合同、做客服,更長(zhǎng)的文本確實(shí)能在這類知識(shí)密集型場(chǎng)景,發(fā)揮出更好的效果,減少幻覺(jué)問(wèn)題。這代表了基礎(chǔ)模型的底層能力,所以Kimi的長(zhǎng)文本之戰(zhàn),必須打。

信號(hào)二,競(jìng)爭(zhēng)更加立體復(fù)雜

2023年末,大模型熱度已經(jīng)開始降溫。應(yīng)用側(cè)落地困難,所謂的殺手級(jí)AI應(yīng)用似乎還是沒(méi)有出現(xiàn),而投入成本持續(xù)加碼,基礎(chǔ)模型一升級(jí)就會(huì)覆蓋創(chuàng)業(yè)者的工作,導(dǎo)致投資市場(chǎng)態(tài)度也偏向謹(jǐn)慎。于是,很多人開始質(zhì)疑這一波大模型只是自嗨,唯一賺錢的只有賣鏟子的英偉達(dá),焦慮情緒開始彌漫。

這時(shí)候,Kimi作為一款現(xiàn)象級(jí)產(chǎn)品,確實(shí)打破了僵局。

作為一個(gè)有實(shí)際意義的應(yīng)用層產(chǎn)品,Kimi讓大眾再一次感受并認(rèn)可了大模型的價(jià)值。根據(jù)產(chǎn)業(yè)規(guī)律,應(yīng)用爆發(fā)往往會(huì)在產(chǎn)業(yè)基礎(chǔ)平臺(tái)條件具備之后的一兩年內(nèi)出現(xiàn),Kimi正處于這一時(shí)間軸的關(guān)節(jié)上,標(biāo)志著AI應(yīng)用爆發(fā)即將開始。

Kimi對(duì)大模型價(jià)值的再度確認(rèn),也會(huì)讓接下來(lái)的通用大模型競(jìng)爭(zhēng),從卷參數(shù)、卷benchmark等基礎(chǔ)項(xiàng)PK,進(jìn)入到更加復(fù)雜、多元的能力角斗。

信號(hào)三,跑馬圈地白熱化。

這一競(jìng)爭(zhēng)階段,“遭遇戰(zhàn)”時(shí)的靈活、機(jī)動(dòng)、大干快上,就不太管用了,而需要細(xì)致部署、步步為營(yíng),跑馬圈地。

對(duì)Kimi的圍剿說(shuō)明各家基礎(chǔ)大模型廠商的底層能力,會(huì)很快趨同。除非像OpenAI那樣,技術(shù)的飛輪效應(yīng)極強(qiáng),跟競(jìng)爭(zhēng)對(duì)手的差距越拉越大,否則,技術(shù)天然會(huì)擴(kuò)散,很難長(zhǎng)期成為商業(yè)秘密與護(hù)城河。

壞消息是,國(guó)內(nèi)的基礎(chǔ)大模型,想要建立差異化優(yōu)勢(shì)越來(lái)越難,沒(méi)有人能獲得壟斷地位;好消息是,政企客戶更希望構(gòu)建“模型花園”,根據(jù)需要調(diào)用多個(gè)大模型,減少對(duì)單一供應(yīng)商的依賴,所以市場(chǎng)仍在增長(zhǎng),仍然開放,大家都還有機(jī)會(huì)。

wKgZomYNPLyAZDnxAAAzi9l0jTk173.jpg

(企業(yè)希望引入的模型數(shù)量)

a16z調(diào)研了七十多位財(cái)富500強(qiáng)企業(yè)和頂級(jí)企業(yè)領(lǐng)袖,發(fā)現(xiàn)這些公司2024年在AI上的支出預(yù)算比2023年增加了2-5倍。國(guó)內(nèi)市場(chǎng)的智能化速度也不會(huì)遜色,更增強(qiáng)了對(duì)基礎(chǔ)大模型的需求,所以接下來(lái),會(huì)進(jìn)入到白熱化的跑馬圈地階段。

大模型新賽季,正式拉開帷幕。

長(zhǎng)文本,只是“陣地戰(zhàn)”的一環(huán)

長(zhǎng)文本,是“秀肌肉”的必爭(zhēng)之地,但解決政企客戶的切實(shí)需求,長(zhǎng)文本卻未必那么實(shí)用。從Kimi的長(zhǎng)短板,我們可以看到目前市場(chǎng)更需要怎樣的大模型。

首先說(shuō)說(shuō)短板。前面提到了,Kimi的長(zhǎng)文本在很多場(chǎng)景下屬于低頻需求,再長(zhǎng)的token只會(huì)帶來(lái)更大的計(jì)算量、更高的資源成本,對(duì)用戶來(lái)說(shuō)性價(jià)比不高。對(duì)此,吳恩達(dá)也認(rèn)為,快速生成token,可能比使用更強(qiáng)的模型更重要。長(zhǎng)文本處理導(dǎo)致的硬件資源需求、GPU短缺和云服務(wù)能力,也是Kimi面臨的現(xiàn)實(shí)挑戰(zhàn)。

而Kimi的長(zhǎng)板在于,在文本摘要和知識(shí)管理等任務(wù)中,發(fā)揮出了極高的生產(chǎn)力效能,對(duì)企業(yè)的吸引力很大。應(yīng)用更友好,企業(yè)不需要從頭開始訓(xùn)練自己的LLM。

所以,長(zhǎng)文本之戰(zhàn)引發(fā)的連鎖反應(yīng),會(huì)讓一些能力,成為battle重點(diǎn):

1.與云的深度融合。Maas服務(wù)會(huì)成為模型購(gòu)買決策的首要原因之一,繼續(xù)深化、細(xì)化。

2.對(duì)Agent開發(fā)的支撐。基礎(chǔ)大模型很難提供所有端到端的解決方案,長(zhǎng)文本處理是應(yīng)用層公司的舞臺(tái),通過(guò)基礎(chǔ)大模型+Agent式工作流,去解決客戶的專有問(wèn)題。而Agent式推理拼的是token生成速度,而非文本有多長(zhǎng)。試想一下,如果一個(gè)金融客服助手半天憋不出一段話,即使生成的效果再好,用戶也不會(huì)有耐心等待。所以,長(zhǎng)文本能力并非應(yīng)用型企業(yè)選擇基座模型的唯一標(biāo)準(zhǔn),甚至不是最重要的標(biāo)準(zhǔn)。

wKgZomYNPL2ARfFIAAA0PlI5HfQ757.jpg

3.生態(tài)規(guī)模。Kimi的爆火說(shuō)明,大廠不可能壟斷所有應(yīng)用方向。利用新的技術(shù)能力(如長(zhǎng)文本處理)來(lái)解決新的問(wèn)題,創(chuàng)業(yè)公司和個(gè)人開發(fā)者更具備貼近客戶、深入場(chǎng)景的優(yōu)勢(shì),為各類行業(yè)用戶的特定需求進(jìn)行微調(diào)、定制。大模型的商業(yè)城池,必須由眾多生態(tài)伙伴一起來(lái)守,誰(shuí)能在2024奠定生態(tài)的規(guī)模優(yōu)勢(shì),是接下來(lái)博弈的關(guān)鍵點(diǎn)。

總的來(lái)說(shuō),大模型落地,是一個(gè)復(fù)雜的系統(tǒng)工程。2024進(jìn)入“陣地戰(zhàn)”的大模型市場(chǎng),準(zhǔn)備更加充分,作戰(zhàn)更有條理,商業(yè)化戰(zhàn)略也日益清晰?;A(chǔ)模型廠商,將在一次又一次的迎敵與防御中,構(gòu)筑起系統(tǒng)性的攻防能力。

一個(gè)平臺(tái)級(jí)的大模型公司,一定會(huì)是萬(wàn)億級(jí)別,也一定會(huì)誕生在中國(guó)。讓我們拭目以待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30887

    瀏覽量

    269063
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2448

    瀏覽量

    2701
  • Kimi
    +關(guān)注

    關(guān)注

    0

    文章

    10

    瀏覽量

    54
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【「大模型啟示錄」閱讀體驗(yàn)】對(duì)大模型更深入的認(rèn)知

    閱讀《大模型啟示錄》這本書,我得說(shuō),它徹底顛覆了我對(duì)大模型的理解。作為個(gè)經(jīng)常用KIMI和豆包這類AI工具來(lái)完成作業(yè)、整理資料的大學(xué)生,我原以為大
    發(fā)表于 12-20 15:46

    Kimi發(fā)布視覺(jué)思考模型k1,展現(xiàn)卓越基礎(chǔ)科學(xué)能力

    近日,Kimi公司正式發(fā)布了其最新的視覺(jué)思考模型——k1。這款模型基于先進(jìn)的強(qiáng)化學(xué)習(xí)技術(shù)構(gòu)建,原生支持端到端的圖像理解和思維鏈技術(shù),為用戶提供了全新的視覺(jué)思考體驗(yàn)。 k1模型不僅在數(shù)學(xué)
    的頭像 發(fā)表于 12-17 09:59 ?251次閱讀

    請(qǐng)問(wèn)mateXT鴻蒙 4.2.0.130, 如何可以安裝并正常使用goople play store?

    store, 但是無(wú)法打開,說(shuō)google play商店屢次停止運(yùn)行。 究竟是不是下載了microG, 里面就有個(gè)google play store,還是說(shuō)microG只是
    發(fā)表于 11-28 08:43

    Kimi發(fā)布新代推理模型k0-math

    近日,Kimi國(guó)產(chǎn)大模型正式推出了其首款強(qiáng)化推理能力的模型——k0-math。該模型在多項(xiàng)數(shù)學(xué)基準(zhǔn)能力測(cè)試中展現(xiàn)出了出色的表現(xiàn),成功對(duì)標(biāo)了OpenAI的o1系列
    的頭像 發(fā)表于 11-19 17:18 ?687次閱讀

    Kimi發(fā)布新代數(shù)學(xué)推理模型k0-math

    近日,Kimi正式推出了其新代數(shù)學(xué)推理模型k0-math。據(jù)基準(zhǔn)測(cè)試顯示,該模型的數(shù)學(xué)能力可與全球領(lǐng)先的OpenAI o1系列中的o1-mini和o1-preview
    的頭像 發(fā)表于 11-18 11:38 ?443次閱讀

    【附實(shí)操視頻】聆思CSK6大模型開發(fā)板接入國(guó)內(nèi)主流大模型(星火大模型、文心言、豆包、kimi、智譜glm、通義千問(wèn))

    接入文心言、通義千問(wèn)、豆包、智譜glm、kimi等國(guó)內(nèi)的大模型,但由于各家接口和數(shù)據(jù)格式不樣,調(diào)試驗(yàn)證會(huì)浪費(fèi)很多時(shí)間。因此本篇以聆思CSK6大
    發(fā)表于 08-22 10:12

    智能硬件接入主流大模型做語(yǔ)音交互(附文心言、豆包、kimi、智譜glm、通義千問(wèn)示例)

    接入文心言、通義千問(wèn)、豆包、智譜glm、kimi等國(guó)內(nèi)的大模型,這個(gè)是必須可以的。但由于各家接口和數(shù)據(jù)格式不樣,有些朋友直接參考chatgpt的方式?jīng)]有走通,因此本篇以聆思CSK6
    發(fā)表于 08-21 19:13

    PSpice學(xué)習(xí)筆記 - TI器件模型導(dǎo)入

    電路功能仿真是電路設(shè)計(jì)過(guò)程中非常重要的一環(huán),由于大部分仿真軟件都不會(huì)自動(dòng)更新器件模型,因此,為保證仿真結(jié)果的準(zhǔn)確性,有時(shí)候就需要使用者手動(dòng)更新器件模型,下面就介紹下如何在PSpice
    的頭像 發(fā)表于 06-17 14:22 ?1236次閱讀
    PSpice學(xué)習(xí)筆記 - TI器件<b class='flag-5'>模型</b>導(dǎo)入

    ZR執(zhí)行器:提升生產(chǎn)效率的關(guān)鍵一環(huán)

    ZR執(zhí)行器:提升生產(chǎn)效率的關(guān)鍵一環(huán) 在當(dāng)今競(jìng)爭(zhēng)激烈的工業(yè)環(huán)境中,提升生產(chǎn)效率是每個(gè)企業(yè)都追求的目標(biāo)。而在這個(gè)過(guò)程中,ZR執(zhí)行器以其卓越的性能和穩(wěn)定性,成為了提升生產(chǎn)效率的關(guān)鍵一環(huán)。 ZR執(zhí)行器是
    的頭像 發(fā)表于 06-07 20:07 ?314次閱讀

    智慧園區(qū):未來(lái)城市建設(shè)的重要一環(huán)

    現(xiàn)如今,隨著數(shù)字化技術(shù)的迅猛發(fā)展,智慧園區(qū)已經(jīng)成為了未來(lái)城市建設(shè)的重要一環(huán)。而在智慧園區(qū)建設(shè)中,集成運(yùn)維發(fā)揮著至關(guān)重要的作用。古河云科技將深入探討智慧園區(qū)和集成運(yùn)維的關(guān)系,并解析其未來(lái)發(fā)展趨勢(shì),為
    的頭像 發(fā)表于 04-29 16:38 ?294次閱讀

    Kimi爆火背后的技術(shù)奧秘 大模型長(zhǎng)文本能力的技術(shù)難點(diǎn)

    當(dāng)用戶認(rèn)為在國(guó)內(nèi)的大模型中,長(zhǎng)文本=kimi的時(shí)候,除非競(jìng)爭(zhēng)對(duì)手能以絕對(duì)的實(shí)力碾壓幾個(gè)量級(jí),但凡與kimi打平或者是微弱超越,都很難威脅到kimi在用戶心目中的地位。
    發(fā)表于 04-17 10:11 ?1251次閱讀
    <b class='flag-5'>Kimi</b>爆火背后的技術(shù)奧秘 大<b class='flag-5'>模型</b>長(zhǎng)文本能力的技術(shù)難點(diǎn)

    Kimi AI模型崛起 各大廠商競(jìng)相效仿

    Kimi的出色表現(xiàn)自然吸引了各大廠商的密切關(guān)注,并紛紛效仿其做法。作為月之暗面推出的對(duì)話式AI產(chǎn)品,Kimi在技術(shù)上不斷創(chuàng)新和突破。
    的頭像 發(fā)表于 04-08 15:08 ?2824次閱讀

    多個(gè)ST60在同一環(huán)境中工作時(shí),它們之間是否會(huì)相互干擾?

    多個(gè)ST60在同一環(huán)境中工作時(shí),它們之間是否會(huì)相互干擾?會(huì)不會(huì)有配對(duì)錯(cuò)誤的風(fēng)險(xiǎn)?
    發(fā)表于 03-29 07:10

    新火種AI|大廠圍剿,“長(zhǎng)文本”成不了Kimi的護(hù)城河

    Kimi帶火的市場(chǎng),被大廠盯上了
    的頭像 發(fā)表于 03-28 22:37 ?400次閱讀
    新火種AI|大廠<b class='flag-5'>圍剿</b>,“長(zhǎng)文本”成不了<b class='flag-5'>Kimi</b>的護(hù)城河

    KIMI與海內(nèi)外主流模型對(duì)比及應(yīng)用方向

    從目前來(lái)看,KIMI的參數(shù)量還能夠增長(zhǎng)數(shù)倍,這對(duì)發(fā)展來(lái)說(shuō)是必要的。盡管存在些稀疏化技術(shù),但大模型訓(xùn)練對(duì)算力的需求仍然在不斷增加。我們之前也做過(guò)10萬(wàn)億參數(shù)的模型,并證明了大參數(shù)
    的頭像 發(fā)表于 03-26 11:20 ?1076次閱讀