0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里首推AI視頻生成利器Tora:指尖畫(huà)圈,自由操控物體運(yùn)動(dòng)軌跡

要長(zhǎng)高 ? 2024-08-06 16:41 ? 次閱讀

近日,阿里巴巴團(tuán)隊(duì)震撼發(fā)布了一項(xiàng)革命性的創(chuàng)新成果——Tora,一個(gè)前所未有的AI視頻生成框架。Tora深度融合了文本、視覺(jué)與軌跡條件,依托其獨(dú)創(chuàng)的軌跡導(dǎo)向擴(kuò)散變換器(DiT)技術(shù),徹底顛覆了視頻內(nèi)容的創(chuàng)造與控制方式,為電影特效、虛擬現(xiàn)實(shí)等多個(gè)領(lǐng)域開(kāi)辟了廣闊的創(chuàng)意天地。

該框架的精髓在于其三大核心組件的精密協(xié)作:軌跡提取器(TE)、時(shí)空DiT模塊以及運(yùn)動(dòng)引導(dǎo)融合器(MGF)。TE運(yùn)用前沿的3D視頻壓縮網(wǎng)絡(luò)技術(shù),如同魔法般將輸入的軌跡信息轉(zhuǎn)化為高效的分層時(shí)空運(yùn)動(dòng)補(bǔ)丁,為視頻生成鋪設(shè)了一條堅(jiān)實(shí)的道路。隨后,MGF憑借其獨(dú)特魅力,將這些運(yùn)動(dòng)補(bǔ)丁與DiT模塊無(wú)縫對(duì)接,確保每一幀視頻都嚴(yán)格遵循預(yù)設(shè)軌跡,展現(xiàn)出流暢且逼真的動(dòng)態(tài)畫(huà)面。

尤為令人矚目的是,Tora框架能夠輕松駕馭長(zhǎng)達(dá)204幀、720P高清視頻的創(chuàng)作,同時(shí)賦予用戶前所未有的自由度,精準(zhǔn)調(diào)控視頻的時(shí)長(zhǎng)、尺寸及分辨率,滿足不同場(chǎng)景下的多樣化需求。在保持卓越運(yùn)動(dòng)保真度的同時(shí),Tora還能細(xì)膩捕捉并模擬物理世界的微妙運(yùn)動(dòng)規(guī)律,為觀眾開(kāi)啟一扇通往極致沉浸體驗(yàn)的大門(mén)。

阿里巴巴團(tuán)隊(duì)將Tora譽(yù)為“數(shù)字時(shí)代的神筆馬良”,象征著用戶只需簡(jiǎn)單勾勒,即可駕馭物體的運(yùn)動(dòng)軌跡,輕松編織出復(fù)雜而精彩的視頻故事。這一創(chuàng)新不僅極大降低了視頻制作的技術(shù)門(mén)檻,更為電影特效師、廣告創(chuàng)意人及虛擬現(xiàn)實(shí)開(kāi)發(fā)者等業(yè)界精英提供了前所未有的強(qiáng)大工具,預(yù)示著視頻創(chuàng)作與傳播領(lǐng)域即將迎來(lái)一場(chǎng)深刻的變革。

隨著Tora框架的正式問(wèn)世,阿里巴巴再次證明了其在人工智能領(lǐng)域的領(lǐng)先地位與創(chuàng)新能力。展望未來(lái),隨著技術(shù)的持續(xù)演進(jìn)與升級(jí),我們有充分的理由期待Tora能夠引領(lǐng)全球視頻創(chuàng)作與傳播領(lǐng)域邁向更加輝煌的明天,不斷創(chuàng)造新的奇跡與可能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 視頻
    +關(guān)注

    關(guān)注

    6

    文章

    1949

    瀏覽量

    72969
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31097

    瀏覽量

    269423
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1617

    瀏覽量

    47300
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無(wú)疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的AI工具DALL-E有著
    的頭像 發(fā)表于 12-12 09:40 ?209次閱讀

    OpenAI開(kāi)放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統(tǒng)Sora已正式向美國(guó)及其他市場(chǎng)的ChatGPT Plus訂閱用戶開(kāi)放。自去年首次公開(kāi)預(yù)覽以來(lái),Sora歷經(jīng)約10個(gè)月的精心研發(fā)與優(yōu)化,現(xiàn)已全面
    的頭像 發(fā)表于 12-10 11:16 ?346次閱讀

    字節(jié)跳動(dòng)自研視頻生成模型Seaweed開(kāi)放

    近日,字節(jié)跳動(dòng)旗下的AI內(nèi)容平臺(tái)即夢(mèng)AI傳來(lái)新消息,宣布自研的視頻生成模型Seaweed即日起正式面向平臺(tái)用戶開(kāi)放使用。這一舉措標(biāo)志著字節(jié)跳動(dòng)在AI
    的頭像 發(fā)表于 11-11 14:31 ?264次閱讀

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標(biāo)志著火山引擎在視頻內(nèi)容生成領(lǐng)域邁出了重要一步。豆包模型憑借其獨(dú)特的技術(shù)優(yōu)勢(shì),吸引了業(yè)
    的頭像 發(fā)表于 09-25 14:11 ?315次閱讀

    阿里通義將發(fā)布視頻生成大模型

    在即將召開(kāi)的云棲大會(huì)上,阿里通義將震撼發(fā)布其自主研發(fā)的視頻生成大模型。目前,用戶已可通過(guò)通義App頻道及通義萬(wàn)相PC端預(yù)約體驗(yàn)這一創(chuàng)新功能,盡管具體使用尚未開(kāi)放。
    的頭像 發(fā)表于 09-19 17:01 ?356次閱讀

    MediaTek與快手?jǐn)y手創(chuàng)新,端側(cè)視頻生成技術(shù)引領(lǐng)AI新紀(jì)元

    在科技日新月異的今天,MediaTek與快手再次攜手,于近日宣布了一項(xiàng)重大技術(shù)突破——高效端側(cè)視頻生成技術(shù)的誕生。這項(xiàng)技術(shù)不僅是對(duì)即將于2024年世界移動(dòng)通信大會(huì)(MWC 2024)上亮相的先進(jìn)視頻生成技術(shù)的有力延續(xù),更是雙方在生成
    的頭像 發(fā)表于 07-05 11:52 ?1027次閱讀

    MediaTek聯(lián)合快手推出高效端側(cè)視頻生成技術(shù)

    MediaTek 與快手共同宣布,推出高效端側(cè)視頻生成技術(shù),共同探索并推進(jìn)生成AI 技術(shù)的革新。作為對(duì) 2024 世界移動(dòng)通信大會(huì)(MWC 2024)上亮相的視頻生成技術(shù)的延續(xù),該
    的頭像 發(fā)表于 07-05 11:23 ?4802次閱讀

    Runway發(fā)布Gen-3 Alpha視頻生成模型

    專為電影和圖像內(nèi)容創(chuàng)作者提供生成AI工具的Runway公司近日宣布,其最新的Gen-3 Alpha視頻生成模型已經(jīng)正式問(wèn)世。這款模型在多方面均取得了顯著的進(jìn)步,為創(chuàng)作者們帶來(lái)了前所未有的便利和可能性。
    的頭像 發(fā)表于 06-19 09:25 ?589次閱讀

    谷歌發(fā)布全新視頻生成模型Veo與Imagen文生圖模型

    谷歌近日宣布了兩項(xiàng)重大技術(shù)進(jìn)展,首先是視頻生成模型Veo的正式推出。這款先進(jìn)的模型能夠支持生成質(zhì)量更高的視頻內(nèi)容,讓用戶能夠根據(jù)自己的需求設(shè)定光照、鏡頭語(yǔ)言、視頻顏色風(fēng)格等參數(shù),為
    的頭像 發(fā)表于 05-16 10:46 ?408次閱讀

    阿里視頻生成技術(shù)創(chuàng)新!視頻生成使用了哪些AI技術(shù)和算法

    照片就能讓 EMO 合成演戲唱歌視頻。 ? 阿里云在視頻生成領(lǐng)域的創(chuàng)新 ? EMO(Emote Portrait Alive)是一個(gè)由阿里巴巴集團(tuán)智能計(jì)算研究院開(kāi)發(fā)的框架,一個(gè)音頻驅(qū)動(dòng)
    的頭像 發(fā)表于 05-08 00:07 ?3394次閱讀

    新火種AI|圍攻光明頂:Sora效應(yīng)下的AI視頻生成競(jìng)賽

    Sora的出現(xiàn),讓AI視頻生成領(lǐng)域真正“活”了起來(lái)
    的頭像 發(fā)表于 03-16 11:12 ?652次閱讀

    除了刷屏的Sora,國(guó)內(nèi)外還有哪些AI視頻生成工具

    。Sora的發(fā)布也讓AI生成視頻有了突破性進(jìn)展。 ? 過(guò)去一年多,全球科技公司都在發(fā)布各種大模型,然而AI生成內(nèi)容更多集中在文本和圖片方面,
    的頭像 發(fā)表于 02-26 08:42 ?4459次閱讀
    除了刷屏的Sora,國(guó)內(nèi)外還有哪些<b class='flag-5'>AI</b><b class='flag-5'>視頻生成</b>工具

    openai發(fā)布首個(gè)視頻生成模型sora

    美國(guó)當(dāng)?shù)貢r(shí)間2024年2月15日 ,OpenAI正式發(fā)布文生視頻模型Sora ,并發(fā)布了48個(gè)文生視頻案例和技術(shù)報(bào)告 ,正式入局視頻生成領(lǐng)域 。Sora能夠根據(jù)提示詞生成60s的連貫
    的頭像 發(fā)表于 02-21 16:45 ?1290次閱讀

    AI視頻年大爆發(fā)!2023年AI視頻生成領(lǐng)域的現(xiàn)狀全盤(pán)點(diǎn)

    2023年,也是AI視頻元年。過(guò)去一年究竟有哪些爆款應(yīng)用誕生,未來(lái)視頻生成領(lǐng)域面臨的難題還有哪些?
    的頭像 發(fā)表于 02-20 10:40 ?1291次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>視頻</b>年大爆發(fā)!2023年<b class='flag-5'>AI</b><b class='flag-5'>視頻生成</b>領(lǐng)域的現(xiàn)狀全盤(pán)點(diǎn)

    OpenAI發(fā)布文生視頻模型Sora,引領(lǐng)AI視頻生成新紀(jì)元

    在人工智能(AI)領(lǐng)域掀起新一輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業(yè)界廣泛贊譽(yù)的模型,以其“逼真”和“富有想象力”的視頻生成能力,徹底顛覆了傳統(tǒng)視頻生成
    的頭像 發(fā)表于 02-19 11:03 ?970次閱讀