亚洲国产福利一区二区三区,婷婷色综合视频在线观看

作者：一號

編輯：美美

沉寂多時的AI巨頭商湯，這次站在了市場焦點上。

股價沉寂多日的AI巨頭商湯，在4月24日迎來了大爆發(fā)，當日股價飆升31.15%。這樣的大漲行情，也讓商湯成為了市場焦點，在當天上午11時15分起，公司股票暫停了買賣。

而到了4月25日，商湯已漲超15%，如此火熱的背后，是商湯在4月23日推出了其6000億參數(shù)的大模型“日日新5.0”，在知識、數(shù)學、推理和代碼能力方面大幅提升，綜合性能甚至能夠全面對標GPT-4 Turbo。

誰能想到，如此火熱的商湯，在之前還面臨著虧損危機。

暴打GPT-4，推理速度快到看不清

目前市場上將商湯近期股價暴漲歸功于其日前發(fā)布的“日日新5.0”大模型。第一代“日日新”大模型體系發(fā)布于2023年4月，并在同年8月獲批上線。據(jù)其官網(wǎng)資料顯示，日日新大模型體系包括了商量大語言模型、秒畫文生圖大模型、語音大模型和向量模型等。

時隔一年，“日日新5.0”正式誕生，它基于超過10TB tokens訓練，覆蓋了大量合成數(shù)據(jù)；同時也采用了當前業(yè)內(nèi)主流的混合專家架構(gòu)（MoE架構(gòu)），上下文窗口可達到200K左右，在綜合能力上，可以全面對標GPT-4 Turbo，“主流客觀評測上達到或超越GPT-4 Turbo”。

在發(fā)布會現(xiàn)場上，商湯還上演了一次《街頭霸王》游戲PK，兩個角色分別由商湯新發(fā)布的日日新端側(cè)大模型SenseChat Life（商量輕量版）和GPT-4操縱，其中綠人由GPT-4操縱，紅人則由商量輕量版操作，當GPT-4還在思考如何決策時，商量輕量版的拳頭就已經(jīng)打了上去，名副其實的“暴打GPT-4”，生動地體現(xiàn)了商量輕量版推理速度之快。

而且它還是一個端側(cè)大模型，采用了端云聯(lián)動的MoE框架，“以小博大”，已經(jīng)在多項測試中擊敗了Llama2-7B，甚至是13B，在同等尺度上性能已經(jīng)達到了SOTA水平。在中等性能手機上，商量輕量版可以達到18.3字/秒的推理速度，而人眼一般的閱讀速度為20字/秒。而在高端旗艦手機上，它的推理速度更是可以達到78.3字/秒。

大版本升級，全面對標GPT-4 Turbo

除了端側(cè)大模型的展示，商湯在此次發(fā)布會上還在“大基座”方面，把自家的日日新大模型來了個大版本升級——日日新SenseNova 5.0，全面對標GPT-4 Turbo!

從評測榜單的數(shù)據(jù)上來看，商量5.0在常規(guī)客觀評測已經(jīng)達到或超越了GPT-4 Turbo。其主要依靠兩點做到了這一點，一是數(shù)據(jù)，二是算力。首先，商湯采用了超過10T的tokens，讓日日新5.0具備了高質(zhì)量數(shù)據(jù)的完備性，此外，商湯還合成構(gòu)造了高達數(shù)千億tokens的思維鏈數(shù)據(jù)，以激活大模型推理的能力。

在算力方面，商湯將算法設(shè)計和算力設(shè)施進行了聯(lián)合的優(yōu)化：算力設(shè)施的拓撲極限用來定義下一階段的算法，而算法上的新進展又要重新指導算力設(shè)施的建設(shè)。

整體上來說，日日新5.0的亮點可以總結(jié)為：①采用MoE架構(gòu)；②基于超過10TB tokens訓練，擁有大量合成數(shù)據(jù)；③推理上下文窗口達到200K；④知識、推理、數(shù)學和代碼等能力全面對標GPT-4 Turbo。

在多模態(tài)能力方面，日日新5.0也有整體的提升，在識圖、生圖以及代碼能力等方面均可比肩行業(yè)領(lǐng)先模型，可以說是夠全面了，這也是商湯所一直強調(diào)的“大模型+大裝置”的打法。

股價暴漲之后，商湯能否走出虧損陰云？

作為“AI四小龍”之首的商湯，不久前，剛發(fā)布了2023年年度業(yè)績公告，公司實現(xiàn)營收34億元，同比下滑10.6%；年度虧損64.95億元，較2022年同期的60.93億元增加了6.6%，自2018年以來，商湯已經(jīng)虧損了近500億。

但與此同時，年報顯示，生成式AI成為了商湯業(yè)績的亮點，生成式AI收入突破11.84億元，實現(xiàn)199.9%的飛速增長，占公司總收入的比例由2022年的10.4%提升到了34.8%。因此，商湯在2024年戰(zhàn)略目標中提到，推動核心業(yè)務(wù)盈利，集中資源于生成式AI業(yè)務(wù)以改善現(xiàn)金流和減少虧損。

可見，商湯正在踐行這一目標，在日日新5.0的發(fā)布會上，商湯也交出了一份客戶的使用反饋。華為、WPS、小米、閱文、海通證券，從辦公到文娛，從金融到終端，均分享了他們使用商湯日日新大模型體系后，給自身業(yè)務(wù)帶來的獎杯呢增效，也因此，商湯股價在發(fā)布會之后迎來了大漲。

可見，有技術(shù)、有算力、有方法論還有使用場景的商湯，或許真的成功轉(zhuǎn)型稱為生成式AI新的龍頭，在AIGC時代，獲得不錯的發(fā)展。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴