baoyu777永久免费视频,一吸一夹都是练出来的吗

“跟不上的可能就要被淘汰了。”看到Sora演示視頻后，從業(yè)10多年的動畫制作師黃斌得出了這樣的判斷。

隨著影視業(yè)***呼聲漸起，Sora的誕生也給中國AI行業(yè)帶來了巨大的焦慮。

360集團創(chuàng)始人周鴻祎認為，Sora模型展現(xiàn)出了超越當(dāng)前中國同類產(chǎn)品的性能和技術(shù)水平，這不僅體現(xiàn)在Sora可能實現(xiàn)通用人工智能（AGI）的時間表上，還體現(xiàn)在其實際應(yīng)用效果和創(chuàng)新能力上。

更有甚者，網(wǎng)上流傳著“Sora的誕生是牛頓時刻”的說法，認為Sora代表了新一輪產(chǎn)業(yè)革命的興起。

事實上，國內(nèi)在經(jīng)過“百模大戰(zhàn)”之后，才剛剛在文本模型上取得顯著成果，達到或超過GPT-3.5的水平，并正朝著GPT-4的方向努力追趕。

但Sora的誕生，展示了OpenAI在多模態(tài)模型而非單一文本領(lǐng)域的突破性進展，讓國內(nèi)AI廠商追上甚至超越OpenAI，幾乎成了不可能完成的任務(wù)。

由此不少網(wǎng)友對中國AI發(fā)出質(zhì)問：

為什么Sora沒有誕生在中國？中國跟美國的AI差距越來越大，Sora這波國內(nèi)慢了十年吧？永遠都是在追趕路上，為啥沒有原創(chuàng)？

在一句句靈魂版的拷問中，中國AI廠商集體陷入了沉默。

那么，在Sora這樣的多模態(tài)大模型上，中美到底有多大差距？追趕的難點在哪兒？在種種限制之下，中國是否有自己的優(yōu)勢？

中美AI差距幾何？

盡管OpenAI承認Sora仍處于開發(fā)的早期階段，需要進一步完善，但業(yè)界已形成一個共識——Sora的推出標志著生成人工智能領(lǐng)域的一個重要里程碑。

這是因為Sora不僅僅是一個文生視頻的工具，更是AGI的一個關(guān)鍵節(jié)點，它驗證了一條通向AGI的可行技術(shù)路線。

和之前的GPT-3一樣，Sora再次驗證了Scaling Law可以在這個技術(shù)方向上繼續(xù)發(fā)揮作用實現(xiàn)涌現(xiàn)。

而這背后，不僅是驚人的資本和算力支持的結(jié)果，更是通過無數(shù)工程實驗試錯和強大技術(shù)力量支持的結(jié)果。

不少人推斷，OpenAI手里應(yīng)該已經(jīng)有一個基本完整的多模態(tài)GPT-5，可以根據(jù)需要隨時釋放其中的某一部分打擊對手，或者引導(dǎo)輿論。

360集團創(chuàng)始人周鴻祎更是直接斷言，Sora的出現(xiàn)，意味著AGI（人工通用智能）的實現(xiàn)將從10年縮短到1年。

事實上，在Sora面前，無論是現(xiàn)有的頂級AI模型如Pika、Runway等，還是在多模態(tài)AI上有投入的國內(nèi)廠商，基本上都被“吊打”了。

這也側(cè)面反映出中美在AI技術(shù)研發(fā)深度和資源投入上的差距。

首先，門檻來自算力。

雖然有學(xué)者認為Sora只是一個大約30億參數(shù)的模型，訓(xùn)練成本并沒有想象的高，但視頻數(shù)據(jù)本身的處理、標注等成本，加上長視頻在推理階段注定的巨大token數(shù)量和算力消耗，顯然對任何公司都是難以承受的挑戰(zhàn)。

即便Sora真的只有30億參數(shù)，視頻分析對算力的消耗應(yīng)該也是遠遠超過一個千億模型的。在國內(nèi)GPU被卡脖子之后，算力是一個巨大的挑戰(zhàn)。

其次，是高質(zhì)量的數(shù)據(jù)。

根據(jù)OpenAI發(fā)布的技術(shù)報告，Sora強大能力歸功于兩點：其一是使用了基于Transformer的擴散模型（Diffusion Model）；其二是將不同類型視覺數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一格式——像素塊（patch），從而能利用數(shù)量龐大、質(zhì)量過硬且算力性價比高的數(shù)據(jù)。

業(yè)內(nèi)人士認為，數(shù)據(jù)質(zhì)量和數(shù)量上的顯著優(yōu)勢，很可能是Sora成功的最關(guān)鍵因素之一。

在算力方面，雖然OpenAI訓(xùn)練Sora模型使用的GPU卡數(shù)量并非無法企及，但其他公司在具備足夠硬件資源的情況下，仍然難以復(fù)制OpenAI的成功，主要瓶頸還是在于如何獲取和處理大規(guī)模高質(zhì)量的視頻數(shù)據(jù)。

2022年，OpenAI曾宣布以創(chuàng)新方法來訓(xùn)練AI模型，省去標注大量資料的訓(xùn)練過程。

據(jù)報道，OpenAI所公布的視頻預(yù)訓(xùn)練模型（VPT），讓AI學(xué)會了在《我的世界》里從頭開始造石鎬。

研究人員首先收集一波數(shù)據(jù)標注外包們玩游戲的數(shù)據(jù)，其中包含視頻和鍵鼠操作的記錄。

然后，利用這些數(shù)據(jù)制作逆動力學(xué)模型（IDM），從而推測出視頻里每一步在進行的時候，鍵鼠都是怎么動的。這樣只需比原來少很多的數(shù)據(jù)就可以實現(xiàn)目的。

這項研究發(fā)表于2022年6月，同時文中還注明這個工作已經(jīng)進行了一年之久，也就是說，OpenAI至少從2021年起就開始進行這項研究。

Logenic AI聯(lián)合創(chuàng)始人李博杰認為，OpenAI的先發(fā)優(yōu)勢決定了早期的數(shù)據(jù)壁壘，對于后進入市場的公司來說，增加了追趕的難度。

“即使是谷歌這樣全球數(shù)據(jù)量最大的公司，在訓(xùn)練大模型時，訓(xùn)練數(shù)據(jù)也未必能比OpenAI更好”，李博杰表示。

相比之下，國內(nèi)公司在數(shù)據(jù)上的積累和利用上也存在一定差距：一方面，由于政策變化和其他限制，后來者可能無法獲取之前可用的一些關(guān)鍵數(shù)據(jù)；另一方面，隨著AI生成內(nèi)容越來越多地充斥互聯(lián)網(wǎng)，原始的真實世界數(shù)據(jù)被“污染”，使得獲取高質(zhì)量、無偏見的訓(xùn)練數(shù)據(jù)更加困難。

最后，是創(chuàng)新的訓(xùn)練方法。

Sora實現(xiàn)了將Transformer和擴散模型結(jié)合的創(chuàng)新，首先將不同類型的視覺數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的視覺數(shù)據(jù)表示（視覺patch），然后將原始視頻壓縮到一個低維潛在空間，并將視覺表示分解成時空patch（相當(dāng)于Transformer token），讓Sora在這個潛在空間里進行訓(xùn)練并生成視頻。

接著做加噪去噪，輸入噪聲patch后，Sora通過預(yù)測原始“干凈”patch來生成視頻。

OpenAI發(fā)現(xiàn)，訓(xùn)練計算量越大，樣本質(zhì)量就會越高，特別是經(jīng)過大規(guī)模訓(xùn)練后，Sora展現(xiàn)出模擬現(xiàn)實世界某些屬性的“涌現(xiàn)”能力。

總的來說，Sora是好的架構(gòu)+好的數(shù)據(jù)，然后把模型做大，達到量變到質(zhì)變。

盡管Sora在方案設(shè)計上大部分是已有的技術(shù)，但能夠做出驚艷效果的也只有Sora，這也說明在訓(xùn)練過程中有很多訓(xùn)練技巧的問題要解決。

中國AI廠商能否追趕OpenAI？

Sora的技術(shù)突破讓AI焦慮在國內(nèi)蔓延開來，但中國AI并非完全無招架之力。在Sora出現(xiàn)并占據(jù)大眾視野之前，國內(nèi)也曾有多家上市公司在多模態(tài)AI方面展開過布局。

2023年12月18日，東方證券在一份研報中提及，國內(nèi)的海康威視、大華股份、螢石網(wǎng)絡(luò)等視頻分析行業(yè)領(lǐng)先廠商，紛紛投入到多模態(tài)大模型研究和行業(yè)應(yīng)用落地進程。

與此同時，百度、阿里、騰訊、華為、字節(jié)跳動等大廠也都布局了多模態(tài)基礎(chǔ)大模型。

據(jù)不完全統(tǒng)計，2023年12月至今三個月內(nèi)，已有包括萬興科技、博匯科技、易點天下、數(shù)碼視訊、漢王科技、當(dāng)虹科技、東方國信等在內(nèi)的十余家A股公司，在投資者互動平臺披露過視頻生成模型領(lǐng)域的業(yè)務(wù)情況。

盡管目前國內(nèi)廠商呈現(xiàn)的“文生視頻”效果遠不如Sora，但Sora所用到的基礎(chǔ)模型LLM、文生圖模型DALL·E 3、大規(guī)模視頻數(shù)據(jù)集、AI算力體系、大模型開發(fā)工具棧等核心基礎(chǔ)設(shè)施，中國都已經(jīng)具備。

比如原創(chuàng)的基礎(chǔ)大語言模型文心一言、訊飛星火、BAICHUAN等，以及文生圖模型文心一格、騰訊混元等，加上過去一年大模型基礎(chǔ)設(shè)施的突飛猛進，有能力和條件支持中國AI修成正果，在視頻生成賽道再現(xiàn)類似ChatGPT式的成功。

騰訊研究院資深專家王鵬認為，Sora的發(fā)布進一步明確了DiT（=VAE編碼器+ViT+DDPM+VAE解碼器）是多模態(tài)AI的可行方向，中國AI大廠仍然有可能以現(xiàn)有資源在一年左右接近Sora目前的水平。

中國AI的機會

事實上，不僅是技術(shù)代際差異并沒有想象中的那么大，視頻生成模型走向行業(yè)的長跑才剛剛開始。大模型的價值需要商業(yè)化來證明，Sora也不例外。

首先，相比“人人皆可上手”的大語言模型，視頻生成模型的應(yīng)用門檻更高，受眾群體更小。目前OpenAI僅開放給創(chuàng)作者使用，而非像ChatGPT那樣開放給大眾。

不難看到，視頻生成模型從研發(fā)到落地，整個過程會更加緩慢，應(yīng)用潛力與商業(yè)出口還有待探索。

其次，Sora雖然強大，但成本確實是一個現(xiàn)實問題。

有人估算，Sora生成一條視頻的成本在幾美元到幾十美元不等，如果普及到大眾使用，成本需要降到目前的1%才能接受。

降低成本的同時提高生成質(zhì)量和邏輯連貫性，是亟待解決的關(guān)鍵挑戰(zhàn)。

同時，考慮到無法解決“幻覺”的問題，要想生成真正可控可用的視頻，短期內(nèi)成本高昂。

這些局限性，都為中國AI產(chǎn)學(xué)各界留下了較長的追趕窗口期。

目前，Sora能夠激活多大的商業(yè)價值尚不明確，但是利用大模型找應(yīng)用場景卻是中國市場的優(yōu)勢所在。

中國擁有豐富的行業(yè)和場景，如果中國AI廠商能為垂直的行業(yè)用戶解決具體的場景問題，打磨好工具，做好視頻生成模型的提示詞工程，以便非專業(yè)背景的廣大行業(yè)用戶們上手使用，那么在特定領(lǐng)域超過GPT-4甚至是GPT-5的可能性是非常大的。

不僅如此，中國AI廠商也可以在Sora等大模型的基礎(chǔ)上，做進一步的應(yīng)用創(chuàng)新，例如在Sora之上能夠提供更復(fù)雜的視頻剪輯能力、革新醫(yī)療教學(xué)與模擬訓(xùn)練等，從而率先探索出商業(yè)化之路。

結(jié)語

Sora作為人工智能視頻生成技術(shù)的重大突破，顯示了中美之間存在顯著的技術(shù)差距。這對于中國科技界而言，既是警醒也是鞭策。在承認現(xiàn)實差距的同時，中國AI也不必妄自菲薄，審視自我、調(diào)整戰(zhàn)略、奮起直追，抓住機會窗口，才是彎道超車的必由之路。

【關(guān)于科技云報道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年，是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認可，可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
30896

瀏覽量
269108
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47279

瀏覽量
238511
Sora

Sora

+關(guān)注

關(guān)注
0

文章
81

瀏覽量
199

OpenAI推出AI視頻生成模型Sora

近日，備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布，無疑為AI技術(shù)注入了新的活力。據(jù)悉，Sora與OpenAI旗下的

發(fā)表于 12-12 09:40 ?190次閱讀

Sora還在PPT階段，“中國版Sora”已經(jīng)開放使用了！

電子發(fā)燒友網(wǎng)報道（文/梁浩斌）今年春節(jié)期間，OpenAI的AI文字生成視頻模型Sora驚艷全世界，極高的視頻生成效果、長達60秒的視頻生成長度，讓過去Pika Labs推出的Pika 1.0、去年

發(fā)表于 06-17 09:07 ?3418次閱讀

Sora的最強競爭對手，來自中國

今年2月發(fā)布的Sora，先是引得業(yè)界“哇聲一片”，馬斯克直接表態(tài)「人類愿賭服輸」；周鴻祎說借助Sora人類實現(xiàn)AGI將縮減至一兩年。大佬的彩虹屁不是白吹的。利用

發(fā)表于 05-13 17:11 ?171次閱讀

<b class='flag-5'>Sora</b>的最強競爭對手，來自<b class='flag-5'>中國</b>

智譜AI正研發(fā)對標Sora的國產(chǎn)文生視頻模型

智譜AI，這家國內(nèi)估值超過200億的AI大模型獨角獸企業(yè)，正全力投入研發(fā)一款與OpenAI的Sora相媲美的國產(chǎn)文生視頻模型。據(jù)公司內(nèi)部人士透露，該模型預(yù)計最快將在今年內(nèi)發(fā)布，將成為AI

發(fā)表于 05-07 09:22 ?533次閱讀

新火種AI|圍攻光明頂：Sora效應(yīng)下的AI視頻生成競賽

Sora的出現(xiàn)，讓AI視頻生成領(lǐng)域真正“活”了起來

發(fā)表于 03-16 11:12 ?642次閱讀

湯姆貓加速布局AI應(yīng)用，接入OpenAI Sora模型，探索生成視頻素材之道

湯姆貓稱，Sora是人工智能不斷演進的里程碑之作。類似Sora的各類AI工具能夠助其以更高效率、更低成本創(chuàng)建豐富多樣且用戶體驗佳的AI應(yīng)用產(chǎn)品和服務(wù)。

發(fā)表于 03-04 13:46 ?702次閱讀

面對Sora，中國AI可以不急不躁不焦慮

AISora

腦極體
發(fā)布于 :2024年02月23日 00:51:52

sora模型是什么意思 sora模型引發(fā)行業(yè)變革

約為290億美元)，且文生視頻大模型將會大幅推動人工智能基礎(chǔ)設(shè)施的需求，英偉達、OpenAI、軟銀等巨頭公司都被曝正在進行AI芯片的制造布局，英偉達也因大模型訓(xùn)練需要GPU算力支持而股價大漲。與此同時，受Sora發(fā)布的影響，美國圖片供應(yīng)商Shutterstock的股價大

發(fā)表于 02-22 17:00 ?1854次閱讀

sora模型中國可以使用嗎 sora模型是哪個公司

。 Sora是一種擴散模型，具備從噪聲中生成完整視頻的能力，它生成的視頻一開始看起來像靜態(tài)噪音，通過多個步驟逐漸去除噪聲后，視頻也從最初的隨機像素轉(zhuǎn)化為清晰的圖像場景，其能夠一次生成多幀預(yù)測，確保畫面主體在暫時離開視野時仍保持一致。 sora模型

發(fā)表于 02-22 16:52 ?3297次閱讀

sora模型怎么使用 sora模型對現(xiàn)實的影響

美國當(dāng)?shù)貢r間2024年2月15日，OpenAI正式發(fā)布文生視頻模型Sora ，并發(fā)布了48個文生視頻案例和技術(shù)報告，正式入局視頻生成領(lǐng)域。Sora能夠根據(jù)提示詞生成60s的連貫視頻，“碾壓”了

發(fā)表于 02-22 16:42 ?1177次閱讀

Sora來了,會砸掉誰的飯碗?反觀第一撥靠Sora賺錢的人已經(jīng)出現(xiàn)

？龍年OpenAI再次用Sora講出了新故事；Sora來了AI商業(yè)化進程有望加速推進但是也帶來了更多問題。 Sora來了，會砸掉誰的飯碗？文生視頻大模型

發(fā)表于 02-22 14:11 ?1067次閱讀

sora最新消息 sora是什么意思

Sora，是美國人工智能研究公司OpenAI發(fā)布的人工智能文生視頻大模型(但OpenAI并未單純將其視為視頻模型，而是作為“世界模擬器”，于2024年2月15日(美國當(dāng)?shù)貢r間)正式對外發(fā)布

發(fā)表于 02-21 16:38 ?1909次閱讀

探索OpenAI Sora視頻AI生成技術(shù)及其應(yīng)用如何使用指南

OpenAI的Sora現(xiàn)已擴展其能力范圍，進入視頻生成領(lǐng)域，標志著人工智能技術(shù)在多媒體內(nèi)容創(chuàng)作上的一個重大突破。Sora的視頻AI功能使得用戶能夠根據(jù)文本描述自動生成高質(zhì)量的視頻內(nèi)容，這項技術(shù)

發(fā)表于 02-20 12:01 ?1441次閱讀

openai sora如何使用?Sora 使用指南：快速上手

OpenAI Sora 使用指南：快速上手歡迎使用OpenAI Sora，一款強大的人工智能視頻生成工具。無論您是視頻制作新手還是專業(yè)人士，本指南將幫助您快速掌握Sora，輕松創(chuàng)作出高質(zhì)量的視頻

發(fā)表于 02-20 11:19 ?4284次閱讀

Sora到底懂不懂物理世界? Sora開啟更多可能

OpenAI的視頻生成模型Sora持續(xù)引發(fā)關(guān)注，而圍繞Sora到底懂不懂物理世界？這個討論越發(fā)火熱，甚至是在討論Sora 到底是不是物理引擎甚至世界模型？當(dāng)然Sora 目前看起來似乎

發(fā)表于 02-20 11:08 ?692次閱讀

搜索歷史

Sora陰影之下，焦慮的中國AI

評論

OpenAI推出AI視頻生成模型Sora

Sora還在PPT階段，“中國版Sora”已經(jīng)開放使用了！

Sora的最強競爭對手，來自中國

智譜AI正研發(fā)對標Sora的國產(chǎn)文生視頻模型

新火種AI|圍攻光明頂：Sora效應(yīng)下的AI視頻生成競賽

湯姆貓加速布局AI應(yīng)用，接入OpenAI Sora模型，探索生成視頻素材之道

面對Sora，中國AI可以不急不躁不焦慮

sora模型是什么意思 sora模型引發(fā)行業(yè)變革

sora模型中國可以使用嗎 sora模型是哪個公司

sora模型怎么使用 sora模型對現(xiàn)實的影響

Sora來了,會砸掉誰的飯碗?反觀第一撥靠Sora賺錢的人已經(jīng)出現(xiàn)

sora最新消息 sora是什么意思

探索OpenAI Sora視頻AI生成技術(shù)及其應(yīng)用如何使用指南

openai sora如何使用?Sora 使用指南：快速上手

Sora到底懂不懂物理世界? Sora開啟更多可能

搜索歷史

Sora陰影之下，焦慮的中國AI

評論

Sora陰影之下，焦慮的中國AI