電子發(fā)燒友網(wǎng)報道(文/李彎彎)今年4月10日,商湯科技正式首次公布“日日新SenseNova”大模型體系。在日前的2023世界人工智能大會上,商湯科技宣布“商湯日日新SenseNova”大模型體系將多方位全面升級,并宣布在該體系下一系列的大模型產(chǎn)品更新和落地成果。
“日日新SenseNova”全面升級及應用落地
商湯科技發(fā)布的“商量”2.0版本,是一個千億級參數(shù)的自然語言處理模型,它突破了大語言模型輸入長度的限制,推出不同參數(shù)量級的模型版本,可完美適配移動端、云端等不同終端及場景的應用需求,降低部署成本。
商湯還推出小模型商量S版(SenseChat S)等不同參數(shù)量級的模型版本,小模型不但性能上有一定突破,在前端的運行上也能夠跑到高通驍龍8 Gen2的終端芯片上,適配移動端等不同終端及場景的應用需求。
另外,商湯全新的秒畫3.0,模型參數(shù)從今年4月首發(fā)的10億提升至70億量級;如影SenseAvatar 2.0數(shù)字人生成平臺,相較1.0版本的語音和口型流暢度提升30%以上,實現(xiàn)4K高清視頻效果,并帶來AIGC生成形象及數(shù)字人歌唱功能。
基于神經(jīng)輻射場技術(shù)(NeRF)的大場景3D內(nèi)容生成平臺商湯瓊宇SenseSpace2.0,在空間重建效率上提升20%,渲染性能提升50%,每100平方公里場景的建圖僅需38小時即可完成(1200 TFLOPS/秒算力支持),同等工作量由人工建圖需要10000人天。
商湯格物SenseThings 2.0對小物體的紋理及材質(zhì)還原達到毫米級精細度,并突破對高反光和鏡面物體的采集難題。
在應用上,比如格物在線下場景的落地,商湯科技靈境空間事業(yè)部總監(jiān)李宇飛介紹,目前,“格物”支持多種物品品類的復刻,并突破了行業(yè)難題——高反光、鏡面物體的復刻,比如珠寶首飾、小家電、金屬物件等。
傳統(tǒng)的重建技術(shù)通常難以解決高反光,鏡面物體的采集和復刻。然而,“格物”不僅可以避免傷害和改變物品的情況,還能精確還原物品的外觀和特征。除此之外,“格物”包含一鍵成圖和一鍵成片等再創(chuàng)作服務。通過一鍵成圖功能,用戶可以生成商品與場景融合的海報,或者試穿試戴的真人海報,相比其他AI技術(shù)只能部分還原商品細節(jié),一鍵成圖可以100%還原商品的各個視角和效果。
再比如影SenseAvatar 2.0數(shù)字人生成平臺,商湯數(shù)字人在金融領域,銀行、保險、券商等擔任智能客服、智慧營銷等工作,接入大語言模型能力,還能提供投研分析、研報撰寫等新功能,實現(xiàn)降本增效。掛載金融知識庫后,還能100%基于客戶的產(chǎn)品說明進行內(nèi)容問答輸出,并實現(xiàn)信息及時更新。此外,商湯如影2.0生成的數(shù)字人,正在進入多個頭部企業(yè)的直播間、短視頻頻道。
“大模型+大裝置”的AGI戰(zhàn)略布局
2022年,以GPT為代表的預訓練大模型帶來新一波AI應用的爆發(fā),大模型的研發(fā)依賴于大規(guī)模智能計算基礎設施。商湯科技堅持“大模型+大裝置”的AGI戰(zhàn)略布局。商湯科技打造了人工智能基礎設施AI大裝置SenseCore,打通算力、算法和平臺,并在此基礎上建立商湯“日日新SenseNova”大模型及研發(fā)體系。
根據(jù)該公司2022年度報告,商湯SenseCore AI大裝置持續(xù)擴建,完成2.7萬塊GPU的部署并實現(xiàn)了5.0 exaFLOPS算力輸出能力,以AIaaS的模式面向行業(yè)伙伴提供服務,全面賦能商湯自身以及行業(yè)伙伴的大模型生產(chǎn)。SenseCore目前可有效支持最多20個千億參數(shù)量大模型(以千卡并行)同時訓練,最高可支持萬億參數(shù)超大模型的訓練。
目前,SenseCore已支持了超過10個大模型訓練項目,包括語言大模型、文生圖模型、視覺大模型、多模態(tài)模型等自研模型和客戶自定義模型。同時商湯面向8家大型客戶支持了7000多張GPU的計算資源,以服務其自定義的大模型訓練任務。
SenseCore提供的AIaaS具體包括了計算基礎設施服務(IaaS)、深度學習平臺服務(PaaS)、模型部署及推理服務(MaaS)三大部分的能力。
1、強大的計算基礎設施(IaaS):SenseCore提供高性能計算資源(例如GPU集群和高速網(wǎng)絡),以支持大型模型訓練所需的強大算力。分布式訓練構(gòu)架支持千卡級別的大規(guī)模分布式訓練,千卡并行效率達91.5%,最高支持4,000塊GPU卡的單任務訓練,有效降低訓練時間,提升計算效率。2022年,位于上海臨港的商湯AIDC開放運營,是由公司自建的大規(guī)模、低碳節(jié)能的先進計算基礎設施,是目前亞洲最大的人工智能算力中心之一。上海臨港AIDC的開業(yè)大大增強了SenseCore的高性能算力供應能力。
2、易用的深度學習平臺、豐富的開發(fā)工具、預訓練模型庫和開源體系(PaaS):商湯提供易用的開發(fā)工具和深度學習平臺,協(xié)助內(nèi)外部高效構(gòu)建和優(yōu)化模型。也提供涵蓋多個領域和場景的預訓練模型庫。用戶可基于這些模型進行二次開發(fā),大幅縮短研發(fā)周期,降低研發(fā)成本和風險。同時,公司開源了OpenMMLab、OpenGVLab、OpenDILab、OpenXRLab及OpenPPL五大平臺,包含了共計2,500多種預訓練模型及400多種算法,這些開源體系吸引全球AI開發(fā)者的參與,在Github上獲得77,000+的星標。
3、靈活的模型部署及推理服務(MaaS):SenseCore支持用戶將訓練好的AI模型一鍵跨平臺部署到云端、邊緣設備或混合環(huán)境中。公司針對30款芯片、100多種平臺進行了常規(guī)模型的適配和優(yōu)化,支持大規(guī)模的實時推理。提供模型壓縮、模型融合等優(yōu)化工具和技術(shù),進一步提高模型在部署和推理階段的性能。
小結(jié)
過去幾個月時間,國內(nèi)外已經(jīng)涌現(xiàn)出大量大模型產(chǎn)品,如今,探索大模型應用落地已經(jīng)成為當前業(yè)界關注的焦點。目前包括商湯科技在內(nèi)的不少企業(yè)已經(jīng)在多個領域?qū)崿F(xiàn)應用。此外,無論是大模型的訓練還是推理都離不開算力的支持,而在這方面,商湯科技也早有布局。在算力匱乏的當下,大模型+大裝置的戰(zhàn)略路線對于其后續(xù)的發(fā)展,也極其有利。
-
商湯
+關注
關注
0文章
55瀏覽量
3962
發(fā)布評論請先 登錄
相關推薦
評論