事件
12月10日,OpenAl正式上線Sora,并向包括美國(guó)在內(nèi)的多數(shù)國(guó)家用戶(hù)開(kāi)放,用戶(hù)可在OpenAI官網(wǎng)上體驗(yàn)Sora。同時(shí),Sora被包含在ChatGPTPlus和ChatGPTPro的會(huì)員訂閱方案中,用戶(hù)無(wú)需額外付費(fèi)。其中,訂閱Plus方案的用戶(hù)可使用Sora生成最多50個(gè)分辨率達(dá)720p、時(shí)長(zhǎng)為5秒的高級(jí)視頻而Pro方案能生成最多500個(gè)分辨率達(dá)1080p、時(shí)長(zhǎng)為20秒的高級(jí)視頻,并且提供去水印功能。
新Sora視頻再創(chuàng)作能力大幅提升
相較于OpenAI2月份發(fā)布的版本,此次上線的新Sora新增Storyboard、Remix、Re-cut等功能,視頻再創(chuàng)作能力大幅提升,并且優(yōu)化了視頻生成速度及生成方式。新Sora的新功能包括1)Storyboard:類(lèi)似于電影里的分鏡,即用戶(hù)只需借助文字設(shè)計(jì)幾段視頻幀或直接上傳圖片作為靜態(tài)視頻幀,并在視頻幀之間預(yù)留一些時(shí)間供Sora發(fā)揮,Sora便能自動(dòng)把這些視頻幀串聯(lián)起來(lái)形成一段完整的視頻:2)Remix:通過(guò)不同的文字描述對(duì)視頻中的元素進(jìn)行替換、刪除或重構(gòu),比如可以把圖書(shū)館變成宇宙飛船:3)Re-cut:智能識(shí)別并剪切出視頻中的最佳幀,并將其導(dǎo)入Storyboard中,拓展該視頻幀:4)Loop:用于創(chuàng)建無(wú)限循環(huán)的視頻:5)Blend:將兩個(gè)視頻無(wú)合并為一個(gè)視頻:6)Stylepresets:為視頻預(yù)設(shè)風(fēng)格,比如黑白電影、紙片人等。此外,借助SoraTurbo,新Sora的視頻生成速度顯著提升,同時(shí),新Sora將視頻生成方式擴(kuò)展為文/文+圖/文+視頻生成視頻。
國(guó)內(nèi)企業(yè)開(kāi)始加速研發(fā)并選代AI視頻生成產(chǎn)品
今年以來(lái),國(guó)內(nèi)企業(yè)開(kāi)始加速研發(fā)并選代AI視頻生成產(chǎn)品,產(chǎn)品能力不斷提升,應(yīng)用場(chǎng)景持續(xù)拓寬。1)今年6月,快手AI團(tuán)隊(duì)發(fā)布可靈AI視頻生成大模型,可生成長(zhǎng)達(dá)2分鐘、分辨率達(dá)1080p的視頻,可靈AI主要功能包括文生視頻、圖生視頻、視頻續(xù)寫(xiě)等;2)今年7月,智譜AI上線視頻生成產(chǎn)品智譜清影,并在11月進(jìn)行全新升級(jí),支持生成時(shí)長(zhǎng)為10秒的4K超高清視頻,除常規(guī)的文生視頻和圖生視頻功能外,智譜清影引入CogSound模型,可以對(duì)為生成的視頻添加背景音樂(lè):3)今年8月,字節(jié)推出即夢(mèng)AI一站式創(chuàng)作平臺(tái),隨后在11月宣布即夢(mèng)AI兩大視頻模型S2.0Pro和P2.0Pro正式全量上線,其中,S2.0Pro在圖生視頻場(chǎng)景具有較高的首一致性,能夠保持視頻與用戶(hù)輸入圖像的色彩、風(fēng)格等保持一致,P2.0Pro具有極高提示詞遵循能力,能夠在一句提示詞內(nèi)實(shí)現(xiàn)多個(gè)鏡頭切換及多鏡頭組合,同時(shí)保持視頻內(nèi)形象主體、風(fēng)格和氛圍的一致性。此外,Minimax、阿里云等初創(chuàng)企業(yè)及大模型廠商也在布局AI視頻生成賽道,整體來(lái)看,視頻生成工具今年以來(lái),國(guó)內(nèi)企業(yè)開(kāi)始加速研發(fā)并選代AI視頻生成產(chǎn)品,產(chǎn)品能力不斷提升,應(yīng)用場(chǎng)景持續(xù)拓寬。1)今年6月,快手AI團(tuán)隊(duì)發(fā)布可靈AI視頻生成大模型,可生成長(zhǎng)達(dá)2分鐘、分辨率達(dá)1080p的視頻,可靈AI主要功能包括文生視頻、圖生視頻、視頻續(xù)寫(xiě)等;2)今年7月,智譜AI上線視頻生成產(chǎn)品智譜清影,并在11月進(jìn)行全新升級(jí),支持生成時(shí)長(zhǎng)為10秒的4K超高清視頻,除常規(guī)的文生視頻和圖生視頻功能外,智譜清影引入CogSound模型,可以對(duì)為生成的視頻添加背景音樂(lè):3)今年8月,字節(jié)推出即夢(mèng)AI一站式創(chuàng)作平臺(tái),隨后在11月宣布即夢(mèng)AI兩大視頻模型S2.0Pro和P2.0Pro正式全量上線,其中,S2.0Pro在圖生視頻場(chǎng)景具有較高的首一致性,能夠保持視頻與用戶(hù)輸入圖像的色彩、風(fēng)格等保持一致,P2.0Pro具有極高提示詞遵循能力,能夠在一句提示詞內(nèi)實(shí)現(xiàn)多個(gè)鏡頭切換及多鏡頭組合,同時(shí)保持視頻內(nèi)形象主體、風(fēng)格和氛圍的一致性。此外,Minimax、阿里云等初創(chuàng)企業(yè)及大模型廠商也在布局AI視頻生成賽道,整體來(lái)看,視頻生成工具的能力不斷提升,未來(lái)有望滲透更多應(yīng)用場(chǎng)景。
相關(guān)公司
三六零(601360):目前360搜索是中國(guó)搜索引擎的Top2,市場(chǎng)份額為35%,公司的人工智能研究院從2020年開(kāi)始一直在包括類(lèi)ChatGPT技術(shù)在內(nèi)的AIGC技術(shù)上有持續(xù)性的投入,但截至目前僅作為內(nèi)部業(yè)務(wù)自用的生產(chǎn)力工具使用,且投資規(guī)模及技術(shù)水平與當(dāng)前的ChatGPT3相比還有較大差距,各項(xiàng)技術(shù)指標(biāo)只能做到略強(qiáng)于ChatGPT2。由于訓(xùn)練數(shù)據(jù)源及應(yīng)用方向的原因,在中文環(huán)境下的實(shí)際效果強(qiáng)于ChatGPT2。360在數(shù)據(jù)資源端有豐富的多模態(tài)大數(shù)據(jù)積累和相關(guān)語(yǔ)料、尤其是中文語(yǔ)料,相較于國(guó)外同行落后的是預(yù)訓(xùn)練大模型和有效的多模態(tài)數(shù)據(jù)清洗與融合技術(shù)。公司有充足的資金儲(chǔ)備可用于購(gòu)買(mǎi)大規(guī)模算力,在繼續(xù)深入自行研發(fā)的同時(shí),不排除尋找強(qiáng)有力的合作伙伴,以開(kāi)放的心態(tài)搭建多方共享平臺(tái)、補(bǔ)足短板,快速縮小差距。公司也計(jì)劃盡快推出類(lèi)ChatGPT技術(shù)的demo版產(chǎn)品。
中科曙光(603019):伴隨寧夏“算力交易平臺(tái)”的上線,“東數(shù)西算”工程迎來(lái)重要里程碑。2月24日,由寧夏回族自治區(qū)聯(lián)合中科曙光、中國(guó)電信寧夏公司、北京國(guó)際大數(shù)據(jù)交易所等打造的國(guó)內(nèi)首個(gè)一體化算力交易調(diào)度平臺(tái)——東數(shù)西算一體化算力服務(wù)平臺(tái)正式上線。該平臺(tái)上線后將整合寧夏地區(qū)零散算力資源,解決算力輸出、應(yīng)用、交易等難題,賦能寧夏“六新六特”等產(chǎn)業(yè)數(shù)字轉(zhuǎn)型升級(jí)。
參考資料:20241212-山西證券-計(jì)算機(jī)行業(yè)點(diǎn)評(píng):Sora正式上線,多模態(tài)模型的里程碑
免責(zé)聲明:以上信息出自匯陽(yáng)研究部,內(nèi)容不做具體操作指導(dǎo),客戶(hù)亦不應(yīng)將其作為投資決策的唯一參考因素。據(jù)此買(mǎi)入,責(zé)任自負(fù),股市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。
審核編輯 黃宇
-
模型
+關(guān)注
關(guān)注
1文章
3243瀏覽量
48840 -
Sora
+關(guān)注
關(guān)注
0文章
81瀏覽量
199
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論