0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新火種AI|股價暴漲30%!商湯發(fā)布日日新5.0,暴打GPT-4

新火種 ? 來源:新火種 ? 作者:新火種 ? 2024-04-25 23:22 ? 次閱讀

作者:一號

編輯:美美

沉寂多時的AI巨頭商湯,這次站在了市場焦點上。

股價沉寂多日的AI巨頭商湯,在4月24日迎來了大爆發(fā),當日股價飆升31.15%。這樣的大漲行情,也讓商湯成為了市場焦點,在當天上午11時15分起,公司股票暫停了買賣。

wKgaomYqdSSAcHy6AAB1X6RzQko490.jpg

而到了4月25日,商湯已漲超15%,如此火熱的背后,是商湯在4月23日推出了其6000億參數(shù)的大模型“日日新5.0”,在知識、數(shù)學、推理和代碼能力方面大幅提升,綜合性能甚至能夠全面對標GPT-4 Turbo。

誰能想到,如此火熱的商湯,在之前還面臨著虧損危機。

暴打GPT-4,推理速度快到看不清

目前市場上將商湯近期股價暴漲歸功于其日前發(fā)布的“日日新5.0”大模型。第一代“日日新”大模型體系發(fā)布于2023年4月,并在同年8月獲批上線。據(jù)其官網(wǎng)資料顯示,日日新大模型體系包括了商量大語言模型、秒畫文生圖大模型、語音大模型和向量模型等。

wKgZomYqdSWAR7mNAATUfQL2C20086.jpg

時隔一年,“日日新5.0”正式誕生,它基于超過10TB tokens訓練,覆蓋了大量合成數(shù)據(jù);同時也采用了當前業(yè)內(nèi)主流的混合專家架構(gòu)(MoE架構(gòu)),上下文窗口可達到200K左右,在綜合能力上,可以全面對標GPT-4 Turbo,“主流客觀評測上達到或超越GPT-4 Turbo”。

wKgZomYqdSWAXqWJADJ9FIgi3zc985.jpg

在發(fā)布會現(xiàn)場上,商湯還上演了一次《街頭霸王》游戲PK,兩個角色分別由商湯新發(fā)布的日日新端側(cè)大模型SenseChat Life(商量輕量版)和GPT-4操縱,其中綠人由GPT-4操縱,紅人則由商量輕量版操作,當GPT-4還在思考如何決策時,商量輕量版的拳頭就已經(jīng)打了上去,名副其實的“暴打GPT-4”,生動地體現(xiàn)了商量輕量版推理速度之快。

wKgaomYqdSaAeRs6AACNmb_vc04180.jpg

而且它還是一個端側(cè)大模型,采用了端云聯(lián)動的MoE框架,“以小博大”,已經(jīng)在多項測試中擊敗了Llama2-7B,甚至是13B,在同等尺度上性能已經(jīng)達到了SOTA水平。在中等性能手機上,商量輕量版可以達到18.3字/秒的推理速度,而人眼一般的閱讀速度為20字/秒。而在高端旗艦手機上,它的推理速度更是可以達到78.3字/秒。

大版本升級,全面對標GPT-4 Turbo

除了端側(cè)大模型的展示,商湯在此次發(fā)布會上還在“大基座”方面,把自家的日日新大模型來了個大版本升級——日日新SenseNova 5.0,全面對標GPT-4 Turbo!

wKgZomYqdSaAFY1xAADPaMPkPM0574.jpg

從評測榜單的數(shù)據(jù)上來看,商量5.0在常規(guī)客觀評測已經(jīng)達到或超越了GPT-4 Turbo。其主要依靠兩點做到了這一點,一是數(shù)據(jù),二是算力。首先,商湯采用了超過10T的tokens,讓日日新5.0具備了高質(zhì)量數(shù)據(jù)的完備性,此外,商湯還合成構(gòu)造了高達數(shù)千億tokens的思維鏈數(shù)據(jù),以激活大模型推理的能力。

在算力方面,商湯將算法設(shè)計和算力設(shè)施進行了聯(lián)合的優(yōu)化:算力設(shè)施的拓撲極限用來定義下一階段的算法,而算法上的新進展又要重新指導算力設(shè)施的建設(shè)。

wKgZomYqdSeAGeXnAAB_DB8cIOk751.jpg

整體上來說,日日新5.0的亮點可以總結(jié)為:①采用MoE架構(gòu);②基于超過10TB tokens訓練,擁有大量合成數(shù)據(jù);③推理上下文窗口達到200K;④知識、推理、數(shù)學和代碼等能力全面對標GPT-4 Turbo。

wKgaomYqdSeAReKXAACWoeyZO4o300.jpg

在多模態(tài)能力方面,日日新5.0也有整體的提升,在識圖、生圖以及代碼能力等方面均可比肩行業(yè)領(lǐng)先模型,可以說是夠全面了,這也是商湯所一直強調(diào)的“大模型+大裝置”的打法。

股價暴漲之后,商湯能否走出虧損陰云?

作為“AI四小龍”之首的商湯,不久前,剛發(fā)布了2023年年度業(yè)績公告,公司實現(xiàn)營收34億元,同比下滑10.6%;年度虧損64.95億元,較2022年同期的60.93億元增加了6.6%,自2018年以來,商湯已經(jīng)虧損了近500億。

但與此同時,年報顯示,生成式AI成為了商湯業(yè)績的亮點,生成式AI收入突破11.84億元,實現(xiàn)199.9%的飛速增長,占公司總收入的比例由2022年的10.4%提升到了34.8%。因此,商湯在2024年戰(zhàn)略目標中提到,推動核心業(yè)務(wù)盈利,集中資源于生成式AI業(yè)務(wù)以改善現(xiàn)金流和減少虧損。

wKgZomYqdSeAcdDJAABSeDo97O0064.jpg

可見,商湯正在踐行這一目標,在日日新5.0的發(fā)布會上,商湯也交出了一份客戶的使用反饋。華為、WPS、小米、閱文、海通證券,從辦公到文娛,從金融到終端,均分享了他們使用商湯日日新大模型體系后,給自身業(yè)務(wù)帶來的獎杯呢增效,也因此,商湯股價在發(fā)布會之后迎來了大漲。

wKgaomYqdSiAetpSAADffbHQjCU727.jpg

可見,有技術(shù)、有算力、有方法論還有使用場景的商湯,或許真的成功轉(zhuǎn)型稱為生成式AI新的龍頭,在AIGC時代,獲得不錯的發(fā)展。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31316

    瀏覽量

    269659
  • AIGC
    +關(guān)注

    關(guān)注

    1

    文章

    366

    瀏覽量

    1573
收藏 人收藏

    評論

    相關(guān)推薦

    商湯科技推出“日日新”融合大模型

    剛剛,商湯正式推出“日日新”融合大模型,領(lǐng)先實現(xiàn)原生融合模態(tài),深度推理能力與多模態(tài)信息處理能力均大幅提升,并在兩大權(quán)威評測榜單奪得第一,成為“雙冠王”。
    的頭像 發(fā)表于 01-10 15:59 ?224次閱讀

    商湯日日新”大模型全面賦能2024 WAIC

    7月6日,WAIC 2024迎來第三天。 商湯科技全新升級的「日日新SenseNova 5.5」備受熱議,作為國內(nèi)首個具備流式原生多模態(tài)交互能力的大模型,交互效果和多項核心指標實現(xiàn)對標GPT-4o?!八娂此谩钡哪P湍芰?,
    的頭像 發(fā)表于 07-08 15:54 ?657次閱讀

    商湯科技發(fā)布日日新5.5大模型體系

    商湯科技近日震撼發(fā)布其最新的日日新5.5大模型體系,標志著人工智能領(lǐng)域又邁出了堅實的一步。該體系以6000億參數(shù)的超大規(guī)?;A(chǔ)模型——日日新5.5為核心,性能較上一代實現(xiàn)了顯著提升,高
    的頭像 發(fā)表于 07-08 15:05 ?601次閱讀

    商湯發(fā)布日日新大模型5.0粵語版

    近日,人工智能領(lǐng)軍企業(yè)商湯科技正式對外發(fā)布了其最新研發(fā)成果——日日新大模型5.0粵語版。該模型針對粵語用戶進行了深度優(yōu)化,旨在提供更精準、更高效的自然語言處理服務(wù)。
    的頭像 發(fā)表于 05-30 09:21 ?652次閱讀

    中文大模型測評基準SuperCLUE:商湯日日新5.0,刷新國內(nèi)最好成績

    日前,中文大模型測評基準SuperCLUE發(fā)布最新榜單,對商湯科技全新升級「日日新SenseNova 5.0」大模型進行了全方位綜合性測評,結(jié)果顯示在SuperCLUE綜合基準上,
    的頭像 發(fā)表于 05-21 14:45 ?799次閱讀
    中文大模型測評基準SuperCLUE:<b class='flag-5'>商湯</b><b class='flag-5'>日日新</b><b class='flag-5'>5.0</b>,刷新國內(nèi)最好成績

    商湯科技即將推出日日新大模型5.0粵語版本

    在盛大的“新質(zhì)企業(yè)家聯(lián)合會”成立典禮上,商湯科技副總裁、智慧城市與商業(yè)事業(yè)群總裁張果琲宣布了一項重要消息。商湯科技即將推出日日新大模型5.0的粵語版本,這一新版本將基于大裝置和強大的技
    的頭像 發(fā)表于 05-13 10:58 ?612次閱讀

    商湯發(fā)布日日新大模型5.0粵語版本

    商湯科技即將迎來一項重要更新,他們將發(fā)布日日新大模型5.0的粵語版本。這一版本是基于商湯科技現(xiàn)有的大裝置和
    的頭像 發(fā)表于 05-08 09:33 ?516次閱讀

    股價久違飆漲,商湯要用自己的Scaling law挑戰(zhàn)GPT4

    前一天的“2024年商湯技術(shù)交流日”上,商湯發(fā)布了對標GPT4-Turbo的大模型日日新大模型SenseNova
    的頭像 發(fā)表于 05-08 08:05 ?276次閱讀
    <b class='flag-5'>股價</b>久違飆漲,<b class='flag-5'>商湯</b>要用自己的Scaling law挑戰(zhàn)<b class='flag-5'>GPT4</b>

    商湯科技發(fā)布日日新SenseNova 5.0”大模型

    商湯科技近日隆重推出全新升級的“日日新SenseNova 5.0”大模型,其卓越性能贏得了業(yè)界的廣泛贊譽。憑借這一行業(yè)領(lǐng)先的技術(shù)實力,商湯絕影成功打造了一系列車端大模型產(chǎn)品,并在202
    的頭像 發(fā)表于 05-07 14:13 ?583次閱讀

    商湯科技推出6000億參數(shù)大模型,全力對標GPT-4 Turbo?

    稍晚些時候,商湯科技發(fā)布公告稱,4月23日在上海臨港AIDC舉辦技術(shù)交流日活動,推出了6000億參數(shù)大模型(日日新5.0),其知識、數(shù)學、推
    的頭像 發(fā)表于 04-25 10:11 ?417次閱讀

    商湯科技發(fā)布日新5.0大模型,對標GPT-4 Turbo,預計2024年落地端側(cè)

    據(jù)了解,4月23日,商湯科技在上海舉行了技術(shù)交流日活動,公布了“云、端、邊”全棧大模型產(chǎn)品矩陣,并對“日日新SenseNova 5.0”大模型進行了全面升級。
    的頭像 發(fā)表于 04-25 09:30 ?596次閱讀

    商湯科技新升級大模型,對標GPT-4 Turbo?

    昨日,商湯科技在滬舉辦技術(shù)交流日活動,公布了其“云、端、邊”全棧大模型產(chǎn)品矩陣,并對“日日新SenseNova 5.0”大模型體系進行了全面升級?;诖?,商湯科技還推出了包括
    的頭像 發(fā)表于 04-24 17:17 ?706次閱讀

    商湯科技發(fā)布5.0多模態(tài)大模型,綜合能力全面對標GPT-4 Turbo

    場景應(yīng)用需求;升級“日日新SenseNova 5.0”大模型體系,綜合能力全面對標GPT-4 Turbo。 此外對于文生視頻徐立也表示商湯科技很快就會
    的頭像 發(fā)表于 04-24 16:49 ?1142次閱讀

    商湯日日新SensNova 4.0發(fā)布

    商湯科技“日日新SenseNova 4.0”正式發(fā)布,標志著大模型體系的一次重大飛躍。該模型在知識覆蓋、推理能力、長文本理解、數(shù)字推理以及代碼生成等多個維度上實現(xiàn)了全面升級。
    的頭像 發(fā)表于 02-05 10:29 ?949次閱讀

    商湯科技發(fā)布新版日日新·商量大語言模型

    商湯科技近日發(fā)布了新版的日日新·商量大語言模型-通用版本(SenseChat V4)。這一版本的模型在知識理解、閱讀理解、綜合推理、數(shù)理、代碼和長文本理解等領(lǐng)域的通用能力得到了顯著提升
    的頭像 發(fā)表于 02-04 10:30 ?998次閱讀