精品综合久久久久久99蜜桃,久久久噜噜噜www成人网

Sora炸裂了的地方，在于它能理解自然語(yǔ)言，知道那個(gè)畫面該是怎么樣的，它學(xué)習(xí)很多視頻內(nèi)容（大力出奇跡，需要很多算力），而且一上來就是能制作60s的視頻，剛好是短視頻的需求，之前的AI視頻生成的時(shí)間都很短（幾秒鐘).

就說Sora有多火吧，生成的視頻上線一個(gè)，瘋傳一個(gè)。

明顯能看出來Sora生成的視頻中的各項(xiàng)細(xì)節(jié)都讓人驚嘆，一如去年的ChatGPT，Sora被認(rèn)為是AGI（通用人工智能）的又一個(gè)里程碑時(shí)刻。

一.sora的出現(xiàn)可以如何看待:

對(duì)于許多行業(yè)來說，都應(yīng)該關(guān)注Open AI和sora這些人工智能相關(guān)的產(chǎn)品。

尤其是對(duì)設(shè)計(jì)領(lǐng)域來說，比如以前做logo、做海報(bào)、宣傳冊(cè)、做操作視頻剪輯、拍攝等等相關(guān)的行業(yè)。

其一是思考，面對(duì)這些新技術(shù)、新工具，對(duì)自己有哪些挑戰(zhàn)，應(yīng)對(duì)策略是什么。

其二是結(jié)合，基于自己當(dāng)前的業(yè)務(wù)，哪些可以利用這些技術(shù)進(jìn)行結(jié)合，從而提升自己的效率和業(yè)務(wù)場(chǎng)景。

比如美圖秀秀、稿定設(shè)計(jì)、剪映等產(chǎn)品，就基于AI立馬推出了相關(guān)的產(chǎn)品。

（PS：目前 openai 官方還未開放 sora 灰度，不過根據(jù)文生圖模型 DALL·E 案例，一定是先給 ChatGPT Plus 付費(fèi)用戶使用，需要注冊(cè)或者升級(jí) GPT Plus 可以看這個(gè)教程:升級(jí) ChatGPT Plus 的教程，一分鐘完成升級(jí))

二. 以終為始地看，AI爆發(fā)的大趨勢(shì)下，普通人真正該學(xué)的是什么？

我覺得有三點(diǎn)：講故事的能力、結(jié)構(gòu)化思考力和內(nèi)容專業(yè)力。

1. 講故事的能力

以文生視頻為例，先不說Sora，很多人連Pika、Runway都用不利索。

用文字描述一件事、一個(gè)觀點(diǎn)、一個(gè)訴求并不難，但描述一段畫面、一個(gè)場(chǎng)景、一則完整故事，對(duì)絕大多數(shù)人是極高的門檻。

Sora不會(huì)讓影視行業(yè)失業(yè)，正相反，如果視頻生成的AI技術(shù)持續(xù)普及，會(huì)讓真正會(huì)寫故事的人發(fā)揮才能，而不是受限于影視行業(yè)的潛規(guī)則而灰心放棄。

2. 結(jié)構(gòu)化思考力

很多寫Sora的文章，都在講它在模型算法、算力涌現(xiàn)、物理模擬上的創(chuàng)新。對(duì)我而言，會(huì)更驚訝它在訓(xùn)練視頻數(shù)據(jù)時(shí)，以一種結(jié)構(gòu)化提示詞方法，解決了視頻標(biāo)注問題：

“We first train a highly descriptive captioner model and then use it to produce text captions for all videos in our training set”

本質(zhì)上看，無(wú)論是B端訓(xùn)練數(shù)據(jù)，還是C端和大模型對(duì)話，都用到了結(jié)構(gòu)化表達(dá)能力。包括那些所謂“Sora培訓(xùn)”，其實(shí)教你的也是怎么寫好提示詞。舉個(gè)例子，對(duì)這樣的場(chǎng)景：

該怎么描述呢？一個(gè)在沉思的老爺爺？一個(gè)戴眼鏡的老爺爺？一個(gè)在咖啡廳發(fā)呆的老爺爺？可能大部分人想到這兒就結(jié)束了。但更加結(jié)構(gòu)化的描述可以是：

主體人物：：一位 60 多歲留著胡須的白發(fā)老人

鏡頭景別：臉部特寫

背景環(huán)境：巴黎的一家咖啡館

人物狀態(tài)：注視著窗外行走的人們，一動(dòng)不動(dòng)陷入沉思，后又抿嘴微微一笑

人物細(xì)節(jié)：穿著一件羊毛大衣和一件紐扣襯衫、頭戴棕色貝雷帽，戴著眼鏡，像是個(gè)教授

環(huán)境細(xì)節(jié)：金色的燈光和背景中的巴黎街道和城市

鏡頭技術(shù)：景深、35 毫米電影膠片，有電影感

具備寫出上述提示詞的能力，才能真正發(fā)揮多模態(tài)技術(shù)的價(jià)值。這背后蘊(yùn)含著的，就是結(jié)構(gòu)化總結(jié)和思考能力。

有句話很形象，寫提示詞就像客戶講brief，能把需求說清楚，就離正確答案不遠(yuǎn)了。

3. 內(nèi)容專業(yè)力

這點(diǎn)又說回到創(chuàng)作者本身，我比較喜歡楊遠(yuǎn)騁老師（「躺島」和「新世相」聯(lián)合創(chuàng)始人）的一個(gè)觀點(diǎn)：

最大的影響會(huì)是出現(xiàn)新的創(chuàng)作者，會(huì)出現(xiàn)完全不在人們視野里的新的內(nèi)容偶像，他們有非常好的品位、思維方式和世界觀，但受限于表達(dá)技術(shù)，在過去卻連基本的視頻制作能力都不具備。

Koji，公眾號(hào)：十字路口CrossingSora 喧囂過后，理性浮現(xiàn) | 我問出了這 5 位頂級(jí)創(chuàng)作者的真實(shí)想法

是的，除了上文提到的講故事能力。如果你具備對(duì)“好內(nèi)容”的理解力，懂得怎樣更合理地設(shè)計(jì)腳本、做分鏡、上特效、畫故事板、運(yùn)鏡、調(diào)度、選角、布景、調(diào)光、配音、后期等等，AI就是你發(fā)揮想象力最好的幫手。能用好 AI 的人，一定能做出更好作品、獲得更多收入。

因此我堅(jiān)定地認(rèn)為，這波AI趨勢(shì)，對(duì)高潛力的作家、畫手、設(shè)計(jì)師、編劇等創(chuàng)作者，是絕對(duì)的利好。如果你也想從中獲益，先把“創(chuàng)作一部好內(nèi)容”作為目標(biāo)學(xué)起來吧。

總的來講，我認(rèn)為圍著Sora去追新聞沒啥必要。能跳出對(duì)Sora本身鋪天蓋地的宣傳，去思考這背后該真正掌握的技能是什么。用結(jié)構(gòu)化思維去訓(xùn)練講故事的能力，成為一名優(yōu)秀創(chuàng)作者，才是值得為此付出時(shí)間的。

三、sora原理常見問題及解答:

Q：訓(xùn)練數(shù)據(jù)的一個(gè) clip 中如果有場(chǎng)景/鏡頭的切換，那 casual 3D CNN 還是會(huì)和過往的幀都有關(guān)系嗎？

A：訓(xùn)練數(shù)據(jù)中大概率是有：一個(gè) clip 有鏡頭/場(chǎng)景的切換。如果有切換，那么使用 casual 3D CNN 可能會(huì)帶來問題：在切換前后的內(nèi)容是不同的，不僅會(huì)增加模型訓(xùn)練難度，也會(huì)帶來瑕疵。這個(gè)可能就直接訓(xùn)練了，通過相應(yīng)數(shù)據(jù)的訓(xùn)練就能解決。

Q：訓(xùn)練數(shù)據(jù)的來源？

A：大家猜測(cè)有 1）youtube 的視頻。2）Shutterstock，之前有公告：Shutterstock 擴(kuò)大與 OpenAI 的合作伙伴關(guān)系，簽署新的六年協(xié)議以提供高質(zhì)量的訓(xùn)練數(shù)據(jù)：渲染引擎的數(shù)據(jù)，這個(gè)網(wǎng)絡(luò)上大家貼出了一些間接證據(jù)。渲染引擎的數(shù)據(jù)能夠針對(duì)性地模擬出很多符合 3D 一致性、物理一致性的數(shù)據(jù)，對(duì)于模型的訓(xùn)練應(yīng)該有很好的幫助。

Q：輸出變長(zhǎng)的長(zhǎng)度、分辨率和長(zhǎng)寬比是如何做到的？

A：1. diffusion 過程中，輸入的 noise tokens 就添加 factorized positional embedding。比如最直接的實(shí)現(xiàn)方式，每個(gè) token 對(duì)應(yīng)有三個(gè)數(shù)字（t, h, w）分別表示時(shí)間、長(zhǎng)和寬，然后添加相應(yīng)的 position embedding 去區(qū)分。

訓(xùn)練的時(shí)候也采用了變長(zhǎng)的長(zhǎng)度、分辨率和長(zhǎng)寬比。這些 examples 模型在訓(xùn)練的時(shí)候見過。

這樣，可以做到技術(shù)報(bào)告中提到的：At inference time, we can control the size of generated videos by arranging randomly-initialized patches in an appropriately-sized grid。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
31294

瀏覽量
269651
ChatGPT

ChatGPT

+關(guān)注

關(guān)注
29

文章
1564

瀏覽量
7865
Sora

Sora

+關(guān)注

關(guān)注
0

文章
82

瀏覽量
230

評(píng)論

相關(guān)推薦

華為發(fā)布2025數(shù)據(jù)中心能源十大趨勢(shì)

今日，華為舉辦2025數(shù)據(jù)中心能源十大趨勢(shì)發(fā)布會(huì)，華為數(shù)據(jù)中心能源領(lǐng)域總裁堯權(quán)全面解讀數(shù)據(jù)中心能源十大趨勢(shì)，為AI時(shí)代數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展注入新動(dòng)力，洞見變革，引領(lǐng)產(chǎn)業(yè)跨越式發(fā)展。

發(fā)表于 01-14 10:24 ?85次閱讀

OpenAI推出AI視頻生成模型Sora

近日，備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布，無(wú)疑為AI技術(shù)注入了新的活力。據(jù)悉，Sora與OpenAI旗下的

發(fā)表于 12-12 09:40 ?225次閱讀

智慧燈桿到底“智慧”在哪里？條形智能為您專業(yè)解讀 AI燈桿屏

發(fā)表于 11-14 13:51 ?229次閱讀

智慧燈桿<b class='flag-5'>到底</b>“智慧”<b class='flag-5'>在哪</b>里？條形智能為您專業(yè)解讀 <b class='flag-5'>AI</b>燈桿屏

Sora還在PPT階段，“中國(guó)版Sora”已經(jīng)開放使用了！

電子發(fā)燒友網(wǎng)報(bào)道（文/梁浩斌）今年春節(jié)期間，OpenAI的AI文字生成視頻模型Sora驚艷全世界，極高的視頻生成效果、長(zhǎng)達(dá)60秒的視頻生成長(zhǎng)度，讓過去Pika Labs推出的Pika 1.0、去年

發(fā)表于 06-17 09:07 ?3457次閱讀

AI浪潮下的十大消費(fèi)者新趨勢(shì)

《2030年代十大熱門消費(fèi)趨勢(shì)——AI賦能的未來》收集了來自全球13座城市6,500名早期采用者對(duì)2030年代AI場(chǎng)景的反饋，并將其總結(jié)為了十大趨勢(shì)： ? 01?

發(fā)表于 06-05 10:30 ?375次閱讀

智譜AI劉江：5-10年內(nèi)AGI會(huì)達(dá)到普通人水平

在2024亞馬遜云科技中國(guó)峰會(huì)上，智譜AI首席生態(tài)官劉江發(fā)表了引人注目的觀點(diǎn)。他預(yù)測(cè)，在未來的5至10年內(nèi)，AGI（通用人工智能）的發(fā)展將達(dá)到普通人的水平，這將是“我們這一代人遇到的最大的技術(shù)突破”。

發(fā)表于 05-31 10:33 ?762次閱讀

智譜AI正研發(fā)對(duì)標(biāo)Sora的國(guó)產(chǎn)文生視頻模型

智譜AI，這家國(guó)內(nèi)估值超過200億的AI大模型獨(dú)角獸企業(yè)，正全力投入研發(fā)一款與OpenAI的Sora相媲美的國(guó)產(chǎn)文生視頻模型。據(jù)公司內(nèi)部人士透露，該模型預(yù)計(jì)最快將在今年內(nèi)發(fā)布，將成為AI

發(fā)表于 05-07 09:22 ?546次閱讀

基站式無(wú)人機(jī)屏蔽器對(duì)普通人有威脅嗎？

式無(wú)人機(jī)屏蔽器應(yīng)運(yùn)而生。那么，這種看似神秘的設(shè)備對(duì)普通人是否有威脅呢？今天，深圳市特信電子有限公司就來揭開它的神秘面紗。

發(fā)表于 04-08 09:10 ?684次閱讀

新火種AI|圍攻光明頂：Sora效應(yīng)下的AI視頻生成競(jìng)賽

Sora的出現(xiàn)，讓AI視頻生成領(lǐng)域真正“活”了起來

發(fā)表于 03-16 11:12 ?662次閱讀

智能硬件 | AI PC新市場(chǎng)，英特爾、高通、AMD、蘋果誰(shuí)能拔得頭籌？

我們普通人和大模型的距離有多遠(yuǎn)？AI發(fā)展到2024年，已經(jīng)附著在各種智能硬件上了，什么AI PC，AI手機(jī)，AI藍(lán)牙音箱，

發(fā)表于 03-05 15:51 ?594次閱讀

湯姆貓加速布局AI應(yīng)用，接入OpenAI Sora模型，探索生成視頻素材之道

湯姆貓稱，Sora是人工智能不斷演進(jìn)的里程碑之作。類似Sora的各類AI工具能夠助其以更高效率、更低成本創(chuàng)建豐富多樣且用戶體驗(yàn)佳的AI應(yīng)用產(chǎn)品和服務(wù)。

發(fā)表于 03-04 13:46 ?731次閱讀

面對(duì)Sora，中國(guó)AI可以不急不躁不焦慮

AISora

腦極體
發(fā)布于 :2024年02月23日 00:51:52

探索OpenAI Sora視頻AI生成技術(shù)及其應(yīng)用如何使用指南

OpenAI的Sora現(xiàn)已擴(kuò)展其能力范圍，進(jìn)入視頻生成領(lǐng)域，標(biāo)志著人工智能技術(shù)在多媒體內(nèi)容創(chuàng)作上的一個(gè)重大突破。Sora的視頻AI功能使得用戶能夠根據(jù)文本描述自動(dòng)生成高質(zhì)量的視頻內(nèi)容，這項(xiàng)技術(shù)

發(fā)表于 02-20 12:01 ?1476次閱讀

openai sora如何使用?Sora 使用指南：快速上手

OpenAI Sora 使用指南：快速上手歡迎使用OpenAI Sora，一款強(qiáng)大的人工智能視頻生成工具。無(wú)論您是視頻制作新手還是專業(yè)人士，本指南將幫助您快速掌握Sora，輕松創(chuàng)作出高質(zhì)量的視頻

發(fā)表于 02-20 11:19 ?4375次閱讀

Sora到底懂不懂物理世界? Sora開啟更多可能

OpenAI的視頻生成模型Sora持續(xù)引發(fā)關(guān)注，而圍繞Sora到底懂不懂物理世界？這個(gè)討論越發(fā)火熱，甚至是在討論Sora 到底是不是物理引擎

發(fā)表于 02-20 11:08 ?712次閱讀

搜索歷史

Sora到底牛在哪 | AI爆發(fā)的大趨勢(shì)下，普通人真正該學(xué)的是什么

評(píng)論

華為發(fā)布2025數(shù)據(jù)中心能源十大趨勢(shì)

OpenAI推出AI視頻生成模型Sora

智慧燈桿到底“智慧”在哪里？條形智能為您專業(yè)解讀 AI燈桿屏

Sora還在PPT階段，“中國(guó)版Sora”已經(jīng)開放使用了！

AI浪潮下的十大消費(fèi)者新趨勢(shì)

智譜AI劉江：5-10年內(nèi)AGI會(huì)達(dá)到普通人水平

智譜AI正研發(fā)對(duì)標(biāo)Sora的國(guó)產(chǎn)文生視頻模型

基站式無(wú)人機(jī)屏蔽器對(duì)普通人有威脅嗎？

新火種AI|圍攻光明頂：Sora效應(yīng)下的AI視頻生成競(jìng)賽

智能硬件 | AI PC新市場(chǎng)，英特爾、高通、AMD、蘋果誰(shuí)能拔得頭籌？

湯姆貓加速布局AI應(yīng)用，接入OpenAI Sora模型，探索生成視頻素材之道

面對(duì)Sora，中國(guó)AI可以不急不躁不焦慮

探索OpenAI Sora視頻AI生成技術(shù)及其應(yīng)用如何使用指南

openai sora如何使用?Sora 使用指南：快速上手

Sora到底懂不懂物理世界? Sora開啟更多可能

搜索歷史

Sora到底牛在哪 | AI爆發(fā)的大趨勢(shì)下，普通人真正該學(xué)的是什么

評(píng)論

Sora到底牛在哪 | AI爆發(fā)的大趨勢(shì)下，普通人真正該學(xué)的是什么