0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

成都匯陽(yáng)投資關(guān)于Sora 正式上線,多模態(tài)模型的里程碑

話(huà)說(shuō)科技 ? 來(lái)源:話(huà)說(shuō)科技 ? 作者:話(huà)說(shuō)科技 ? 2024-12-16 14:39 ? 次閱讀

事件

12月10日,OpenAl正式上線Sora,并向包括美國(guó)在內(nèi)的多數(shù)國(guó)家用戶(hù)開(kāi)放,用戶(hù)可在OpenAI官網(wǎng)上體驗(yàn)Sora。同時(shí),Sora被包含在ChatGPTPlus和ChatGPTPro的會(huì)員訂閱方案中,用戶(hù)無(wú)需額外付費(fèi)。其中,訂閱Plus方案的用戶(hù)可使用Sora生成最多50個(gè)分辨率達(dá)720p、時(shí)長(zhǎng)為5秒的高級(jí)視頻而Pro方案能生成最多500個(gè)分辨率達(dá)1080p、時(shí)長(zhǎng)為20秒的高級(jí)視頻,并且提供去水印功能。

新Sora視頻再創(chuàng)作能力大幅提升

相較于OpenAI2月份發(fā)布的版本,此次上線的新Sora新增Storyboard、Remix、Re-cut等功能,視頻再創(chuàng)作能力大幅提升,并且優(yōu)化了視頻生成速度及生成方式。新Sora的新功能包括1)Storyboard:類(lèi)似于電影里的分鏡,即用戶(hù)只需借助文字設(shè)計(jì)幾段視頻幀或直接上傳圖片作為靜態(tài)視頻幀,并在視頻幀之間預(yù)留一些時(shí)間供Sora發(fā)揮,Sora便能自動(dòng)把這些視頻幀串聯(lián)起來(lái)形成一段完整的視頻:2)Remix:通過(guò)不同的文字描述對(duì)視頻中的元素進(jìn)行替換、刪除或重構(gòu),比如可以把圖書(shū)館變成宇宙飛船:3)Re-cut:智能識(shí)別并剪切出視頻中的最佳幀,并將其導(dǎo)入Storyboard中,拓展該視頻幀:4)Loop:用于創(chuàng)建無(wú)限循環(huán)的視頻:5)Blend:將兩個(gè)視頻無(wú)合并為一個(gè)視頻:6)Stylepresets:為視頻預(yù)設(shè)風(fēng)格,比如黑白電影、紙片人等。此外,借助SoraTurbo,新Sora的視頻生成速度顯著提升,同時(shí),新Sora將視頻生成方式擴(kuò)展為文/文+圖/文+視頻生成視頻。

國(guó)內(nèi)企業(yè)開(kāi)始加速研發(fā)并選代AI視頻生成產(chǎn)品

今年以來(lái),國(guó)內(nèi)企業(yè)開(kāi)始加速研發(fā)并選代AI視頻生成產(chǎn)品,產(chǎn)品能力不斷提升,應(yīng)用場(chǎng)景持續(xù)拓寬。1)今年6月,快手AI團(tuán)隊(duì)發(fā)布可靈AI視頻生成大模型,可生成長(zhǎng)達(dá)2分鐘、分辨率達(dá)1080p的視頻,可靈AI主要功能包括文生視頻、圖生視頻、視頻續(xù)寫(xiě)等;2)今年7月,智譜AI上線視頻生成產(chǎn)品智譜清影,并在11月進(jìn)行全新升級(jí),支持生成時(shí)長(zhǎng)為10秒的4K超高清視頻,除常規(guī)的文生視頻和圖生視頻功能外,智譜清影引入CogSound模型,可以對(duì)為生成的視頻添加背景音樂(lè):3)今年8月,字節(jié)推出即夢(mèng)AI一站式創(chuàng)作平臺(tái),隨后在11月宣布即夢(mèng)AI兩大視頻模型S2.0Pro和P2.0Pro正式全量上線,其中,S2.0Pro在圖生視頻場(chǎng)景具有較高的首一致性,能夠保持視頻與用戶(hù)輸入圖像的色彩、風(fēng)格等保持一致,P2.0Pro具有極高提示詞遵循能力,能夠在一句提示詞內(nèi)實(shí)現(xiàn)多個(gè)鏡頭切換及多鏡頭組合,同時(shí)保持視頻內(nèi)形象主體、風(fēng)格和氛圍的一致性。此外,Minimax、阿里云等初創(chuàng)企業(yè)及大模型廠商也在布局AI視頻生成賽道,整體來(lái)看,視頻生成工具今年以來(lái),國(guó)內(nèi)企業(yè)開(kāi)始加速研發(fā)并選代AI視頻生成產(chǎn)品,產(chǎn)品能力不斷提升,應(yīng)用場(chǎng)景持續(xù)拓寬。1)今年6月,快手AI團(tuán)隊(duì)發(fā)布可靈AI視頻生成大模型,可生成長(zhǎng)達(dá)2分鐘、分辨率達(dá)1080p的視頻,可靈AI主要功能包括文生視頻、圖生視頻、視頻續(xù)寫(xiě)等;2)今年7月,智譜AI上線視頻生成產(chǎn)品智譜清影,并在11月進(jìn)行全新升級(jí),支持生成時(shí)長(zhǎng)為10秒的4K超高清視頻,除常規(guī)的文生視頻和圖生視頻功能外,智譜清影引入CogSound模型,可以對(duì)為生成的視頻添加背景音樂(lè):3)今年8月,字節(jié)推出即夢(mèng)AI一站式創(chuàng)作平臺(tái),隨后在11月宣布即夢(mèng)AI兩大視頻模型S2.0Pro和P2.0Pro正式全量上線,其中,S2.0Pro在圖生視頻場(chǎng)景具有較高的首一致性,能夠保持視頻與用戶(hù)輸入圖像的色彩、風(fēng)格等保持一致,P2.0Pro具有極高提示詞遵循能力,能夠在一句提示詞內(nèi)實(shí)現(xiàn)多個(gè)鏡頭切換及多鏡頭組合,同時(shí)保持視頻內(nèi)形象主體、風(fēng)格和氛圍的一致性。此外,Minimax、阿里云等初創(chuàng)企業(yè)及大模型廠商也在布局AI視頻生成賽道,整體來(lái)看,視頻生成工具的能力不斷提升,未來(lái)有望滲透更多應(yīng)用場(chǎng)景。

相關(guān)公司

三六零(601360):目前360搜索是中國(guó)搜索引擎的Top2,市場(chǎng)份額為35%,公司的人工智能研究院從2020年開(kāi)始一直在包括類(lèi)ChatGPT技術(shù)在內(nèi)的AIGC技術(shù)上有持續(xù)性的投入,但截至目前僅作為內(nèi)部業(yè)務(wù)自用的生產(chǎn)力工具使用,且投資規(guī)模及技術(shù)水平與當(dāng)前的ChatGPT3相比還有較大差距,各項(xiàng)技術(shù)指標(biāo)只能做到略強(qiáng)于ChatGPT2。由于訓(xùn)練數(shù)據(jù)源及應(yīng)用方向的原因,在中文環(huán)境下的實(shí)際效果強(qiáng)于ChatGPT2。360在數(shù)據(jù)資源端有豐富的多模態(tài)大數(shù)據(jù)積累和相關(guān)語(yǔ)料、尤其是中文語(yǔ)料,相較于國(guó)外同行落后的是預(yù)訓(xùn)練大模型和有效的多模態(tài)數(shù)據(jù)清洗與融合技術(shù)。公司有充足的資金儲(chǔ)備可用于購(gòu)買(mǎi)大規(guī)模算力,在繼續(xù)深入自行研發(fā)的同時(shí),不排除尋找強(qiáng)有力的合作伙伴,以開(kāi)放的心態(tài)搭建多方共享平臺(tái)、補(bǔ)足短板,快速縮小差距。公司也計(jì)劃盡快推出類(lèi)ChatGPT技術(shù)的demo版產(chǎn)品。

中科曙光(603019):伴隨寧夏“算力交易平臺(tái)”的上線,“東數(shù)西算”工程迎來(lái)重要里程碑。2月24日,由寧夏回族自治區(qū)聯(lián)合中科曙光、中國(guó)電信寧夏公司、北京國(guó)際大數(shù)據(jù)交易所等打造的國(guó)內(nèi)首個(gè)一體化算力交易調(diào)度平臺(tái)——東數(shù)西算一體化算力服務(wù)平臺(tái)正式上線。該平臺(tái)上線后將整合寧夏地區(qū)零散算力資源,解決算力輸出、應(yīng)用、交易等難題,賦能寧夏“六新六特”等產(chǎn)業(yè)數(shù)字轉(zhuǎn)型升級(jí)。

參考資料:20241212-山西證券-計(jì)算機(jī)行業(yè)點(diǎn)評(píng):Sora正式上線,多模態(tài)模型的里程碑

免責(zé)聲明:以上信息出自匯陽(yáng)研究部,內(nèi)容不做具體操作指導(dǎo),客戶(hù)亦不應(yīng)將其作為投資決策的唯一參考因素。據(jù)此買(mǎi)入,責(zé)任自負(fù),股市有風(fēng)險(xiǎn),投資需謹(jǐn)慎。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3243

    瀏覽量

    48840
  • Sora
    +關(guān)注

    關(guān)注

    0

    文章

    81

    瀏覽量

    199
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    商湯日日新模態(tài)模型權(quán)威評(píng)測(cè)第一

    剛剛,商湯科技日日新SenseNova模態(tài)模型,在權(quán)威綜合評(píng)測(cè)權(quán)威平臺(tái)OpenCompass的模態(tài)評(píng)測(cè)中取得榜單第一。
    的頭像 發(fā)表于 12-20 10:39 ?189次閱讀

    e絡(luò)盟實(shí)現(xiàn)重要里程碑:成功分銷(xiāo) 1000 萬(wàn)套 micro:bit 設(shè)備

    安富利旗下全球電子元器件產(chǎn)品與解決方案分銷(xiāo)商e絡(luò)盟與合作伙伴 Micro:bit 教育基金會(huì)日前攜手宣布,e絡(luò)盟成功達(dá)成了制造并分銷(xiāo)超過(guò) 1000 萬(wàn)臺(tái) BBC micro:bit 計(jì)算機(jī)的重大里程碑,以幫助全球青少年通過(guò)物理計(jì)算發(fā)現(xiàn)編程的樂(lè)趣。
    的頭像 發(fā)表于 12-12 10:34 ?164次閱讀
    e絡(luò)盟實(shí)現(xiàn)重要<b class='flag-5'>里程碑</b>:成功分銷(xiāo) 1000 萬(wàn)套 micro:bit 設(shè)備

    利用OpenVINO部署Qwen2模態(tài)模型

    模態(tài)模型的核心思想是將不同媒體數(shù)據(jù)(如文本、圖像、音頻和視頻等)進(jìn)行融合,通過(guò)學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián),實(shí)現(xiàn)更加智能化的信息處理。簡(jiǎn)單來(lái)說(shuō),
    的頭像 發(fā)表于 10-18 09:39 ?440次閱讀

    亞馬遜云科技上線Meta Llama 3.2模型

    亞馬遜云科技近日宣布,Meta公司的新一代模型Llama 3.2已在其平臺(tái)上正式上線。該模型包括Meta首款模態(tài)
    的頭像 發(fā)表于 10-11 18:08 ?460次閱讀

    特斯拉里程碑達(dá)成:第1億顆4680電池震撼問(wèn)世

    特斯拉的4680電池技術(shù)再次跨越重要里程碑,公司于9月15日欣然宣布,其第1億顆創(chuàng)新性的4680電池已成功下線,這一成就標(biāo)志著特斯拉在電池制造領(lǐng)域的飛速進(jìn)展。特斯拉首席執(zhí)行官埃隆·馬斯克通過(guò)社交媒體向辛勤工作的電池團(tuán)隊(duì)致以熱烈祝賀,彰顯了公司對(duì)這一里程碑事件的自豪與重視。
    的頭像 發(fā)表于 09-18 15:30 ?1244次閱讀

    人大系初創(chuàng)公司智子引擎發(fā)布全新模態(tài)模型Awaker 1.0

    人大系初創(chuàng)公司智子引擎近日震撼發(fā)布了新一代模態(tài)模型Awaker 1.0,這一里程碑式的成果標(biāo)志著公司在通用人工智能(AGI)領(lǐng)域取得了重要突破。與前代ChatImg序列
    的頭像 發(fā)表于 05-06 09:59 ?608次閱讀

    湯姆貓加速布局AI應(yīng)用,接入OpenAI Sora模型,探索生成視頻素材之道

    湯姆貓稱(chēng),Sora是人工智能不斷演進(jìn)的里程碑之作。類(lèi)似Sora的各類(lèi)AI工具能夠助其以更高效率、更低成本創(chuàng)建豐富多樣且用戶(hù)體驗(yàn)佳的AI應(yīng)用產(chǎn)品和服務(wù)。
    的頭像 發(fā)表于 03-04 13:46 ?702次閱讀

    sora模型中國(guó)可以使用嗎 sora模型是哪個(gè)公司

    Sora是一種擴(kuò)散模型,具備從噪聲中生成完整視頻的能力,它生成的視頻一開(kāi)始看起來(lái)像靜態(tài)噪音,通過(guò)多個(gè)步驟逐漸去除噪聲后,視頻也從最初的隨機(jī)像素轉(zhuǎn)化為清晰的圖像場(chǎng)景 ,其能夠一次生成幀預(yù)測(cè),確保畫(huà)面主體在暫時(shí)離開(kāi)視野時(shí)仍保持
    的頭像 發(fā)表于 02-22 16:52 ?3297次閱讀

    sora模型怎么使用 sora模型對(duì)現(xiàn)實(shí)的影響

    美國(guó)當(dāng)?shù)貢r(shí)間2024年2月15日 ,OpenAI正式發(fā)布文生視頻模型Sora ,并發(fā)布了48個(gè)文生視頻案例和技術(shù)報(bào)告 ,正式入局視頻生成領(lǐng)域 。Sora能夠根據(jù)提示詞生成60s的連貫視頻,“碾壓”了
    的頭像 發(fā)表于 02-22 16:42 ?1177次閱讀

    Sora爆紅,模態(tài)模型是下一發(fā)展階段

    “大語(yǔ)言模型為 AI 產(chǎn)業(yè)帶來(lái)新的生機(jī),然而語(yǔ)言模型的應(yīng)用場(chǎng)景有限。要全面打開(kāi)生成式 AI 的想象力,還是要依托模態(tài)模型?!盜DC 中國(guó)
    的頭像 發(fā)表于 02-20 16:13 ?442次閱讀

    成都陽(yáng)投資關(guān)于Sora 橫空出世,AI 產(chǎn)業(yè)鏈風(fēng)云再起!

    Sora 在視頻生成和模擬能力實(shí)現(xiàn)重大突破】 2 月16 日,OpenAI 發(fā)布最新文生視頻大模型 Sora ,并在官網(wǎng)發(fā)布由其生成的 48 個(gè)視頻樣例。 目前,Sora 仍處于測(cè)試
    的頭像 發(fā)表于 02-20 09:43 ?848次閱讀
    <b class='flag-5'>成都</b><b class='flag-5'>匯</b><b class='flag-5'>陽(yáng)</b><b class='flag-5'>投資</b><b class='flag-5'>關(guān)于</b><b class='flag-5'>Sora</b> 橫空出世,AI 產(chǎn)業(yè)鏈風(fēng)云再起!

    奧特曼發(fā)布王炸模型Sora OpenAI首個(gè)文生視頻模型Sora正式亮相

    奧特曼發(fā)布王炸模型Sora OpenAI首個(gè)文生視頻模型Sora正式亮相 2月16日凌晨OpenAI的首個(gè)文生視頻模型
    的頭像 發(fā)表于 02-18 17:41 ?993次閱讀

    OpenAI推出新款大模型Sora,引領(lǐng)模態(tài)AI新潮流

    全球人工智能領(lǐng)域的佼佼者OpenAI近日發(fā)布了一款名為Sora的短視頻生成模型,該模型能夠根據(jù)文字指令即時(shí)生成高質(zhì)量短視頻,引起了業(yè)界的廣泛關(guān)注。
    的頭像 發(fā)表于 02-18 10:16 ?1345次閱讀

    機(jī)器人基于開(kāi)源的模態(tài)語(yǔ)言視覺(jué)大模型

    ByteDance Research 基于開(kāi)源的模態(tài)語(yǔ)言視覺(jué)大模型 OpenFlamingo 開(kāi)發(fā)了開(kāi)源、易用的 RoboFlamingo 機(jī)器人操作模型,只用單機(jī)就可以訓(xùn)練。
    發(fā)表于 01-19 11:43 ?422次閱讀
    機(jī)器人基于開(kāi)源的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>語(yǔ)言視覺(jué)大<b class='flag-5'>模型</b>

    百度地圖宣布城市車(chē)道級(jí)導(dǎo)航取得里程碑突破

    近日,百度地圖宣布其城市車(chē)道級(jí)導(dǎo)航取得里程碑突破,已率先覆蓋全國(guó)超100城普通道路。
    的頭像 發(fā)表于 01-09 17:28 ?1204次閱讀
    百度地圖宣布城市車(chē)道級(jí)導(dǎo)航取得<b class='flag-5'>里程碑</b>突破