OpenAI視頻模型Sora的架構(gòu)及應(yīng)用場(chǎng)景

今天，一則重磅消息席卷了 AI 圈：OpenAI 發(fā)布了視頻模型 Sora，能根據(jù)文本生成長(zhǎng)達(dá)一分鐘的高質(zhì)量 1920x1080 視頻，生成能力遠(yuǎn)超此前只能生成 25 幀 576x1024 圖像的頂尖視頻生成模型 Stable Video Diffusion。

同時(shí)，OpenAI 也公布了一篇非常簡(jiǎn)短的技術(shù)報(bào)告。報(bào)告僅大致介紹了 Sora 的架構(gòu)及應(yīng)用場(chǎng)景，并未對(duì)模型的原理詳加介紹。讓我們來(lái)快速瀏覽一下這份報(bào)告，看看科研人員從這份報(bào)告中能學(xué)到什么。

LDM 與 DiT 的結(jié)合

簡(jiǎn)單來(lái)說(shuō)，Sora 就是 Latent Diffusion Model (LDM) [1] 加上 Diffusion Transformer (DiT) [2]。我們先簡(jiǎn)要回顧一下這兩種模型架構(gòu)。

LDM 就是 Stable Diffusion 使用的模型架構(gòu)。擴(kuò)散模型的一大問(wèn)題是計(jì)算需求大，難以擬合高分辨率圖像。為了解決這一問(wèn)題，實(shí)現(xiàn) LDM時(shí)，會(huì)先訓(xùn)練一個(gè)幾乎能無(wú)損壓縮圖像的自編碼器，能把 512x512 的真實(shí)圖像壓縮成 64x64 的壓縮圖像并還原。接著，再訓(xùn)練一個(gè)擴(kuò)散模型去擬合分辨率更低的壓縮圖像。這樣，僅需少量計(jì)算資源就能訓(xùn)練出高分辨率的圖像生成模型。

LDM 的擴(kuò)散模型使用的模型是 U-Net。而根據(jù)其他深度學(xué)習(xí)任務(wù)中的經(jīng)驗(yàn)，相比 U-Net，Transformer 架構(gòu)的參數(shù)可拓展性強(qiáng)，即隨著參數(shù)量的增加，Transformer 架構(gòu)的性能提升會(huì)更加明顯。這也是為什么大模型普遍都采用了 Transformer 架構(gòu)。從這一動(dòng)機(jī)出發(fā)，DiT 應(yīng)運(yùn)而生。DiT 在 LDM 的基礎(chǔ)上，把 U-Net 換成了 Transformer。

順帶一提，Transformer 本來(lái)是用于文本任務(wù)的，它只能處理一維的序列數(shù)據(jù)。為了讓 Transformer 處理二維圖像，通常會(huì)把輸入圖像先切成邊長(zhǎng)為的圖塊，再把每個(gè)圖塊處理成一項(xiàng)數(shù)據(jù)。也就是說(shuō)，原來(lái)邊長(zhǎng)為的正方形圖片，經(jīng)圖塊化后，變成了長(zhǎng)度為的一維序列數(shù)據(jù)。

Transformer 是一種和順序無(wú)關(guān)的計(jì)算。比如對(duì)于輸入"abc"和"bca"，Transformer 會(huì)輸出一模一樣的值。為了描述數(shù)據(jù)的先后順序，使用 Transformer 時(shí)，一般會(huì)給數(shù)據(jù)加一個(gè)位置編碼。

Sora 是一個(gè)視頻版的 DiT 模型。讓我們看一下 Sora 在 DiT 上做了哪些改進(jìn)。

時(shí)空自編碼器

在此之前，許多工作都嘗試把預(yù)訓(xùn)練 Stable Diffusion 拓展成視頻生成模型。在拓展時(shí)，視頻的每一幀都會(huì)單獨(dú)輸入進(jìn) Stable Diffusion 的自編碼器，再重新構(gòu)成一個(gè)壓縮過(guò)的圖像序列。而 VideoLDM[3] 工作發(fā)現(xiàn)，直接對(duì)視頻使用之前的圖像自編碼器，會(huì)令輸出視頻出現(xiàn)閃爍的現(xiàn)象。為此，該工作對(duì)自編碼器的解碼器進(jìn)行了微調(diào)，加入了一些能夠處理時(shí)間維度的模塊，使之能一次性處理整段壓縮視頻，并輸出連貫的真實(shí)視頻。

Sora 則是從頭訓(xùn)練了一套能直接壓縮視頻的自編碼器。相比之前的工作，Sora 的自編碼器不僅能在空間上壓縮圖像，還能在時(shí)間上壓縮視頻長(zhǎng)度。這估計(jì)是為什么 Sora 能生成長(zhǎng)達(dá)一分鐘的視頻。

報(bào)告中提到，Sora 也能處理圖像，即長(zhǎng)度為1的視頻。那么，自編碼器怎么在時(shí)間上壓縮長(zhǎng)度為1的視頻呢？報(bào)告中并沒(méi)有給出細(xì)節(jié)。我猜測(cè)該自編碼器在時(shí)間維度做了填充（比如時(shí)間被壓縮成原來(lái)的 1/2，那么就對(duì)輸入視頻填充空數(shù)據(jù)直至視頻長(zhǎng)度為偶數(shù)），也可能是輸入了視頻長(zhǎng)度這一額外約束信息。

時(shí)空壓縮圖塊

輸入視頻經(jīng)過(guò)自編碼器后，會(huì)被轉(zhuǎn)換成一段空間和時(shí)間維度上都變小的壓縮視頻。這段壓縮視頻就是 Sora 的 DiT 的擬合對(duì)象。在處理視頻數(shù)據(jù)時(shí)，DiT 較 U-Net 又有一些優(yōu)勢(shì)。

之前基于 U-Net 的去噪模型在處理視頻數(shù)據(jù)時(shí)（如 [3])，都需要額外加入一些和時(shí)間維度有關(guān)的操作，比如時(shí)間維度上的卷積、自注意力。而 Sora 的 DiT 是一種完全基于圖塊的 Transformer 架構(gòu)。要用 DiT 處理視頻數(shù)據(jù)，不需要這種設(shè)計(jì)，只要把視頻看成一個(gè) 3D 物體，再把 3D 物體分割成「圖塊」，并重組成一維數(shù)據(jù)輸入進(jìn) DiT 即可。和原本圖像 DiT 一樣，假設(shè)視頻邊長(zhǎng)為，時(shí)長(zhǎng)也為，要切成邊長(zhǎng)為的圖塊，最后會(huì)得到個(gè)數(shù)據(jù)。

處理任意分辨率、時(shí)長(zhǎng)的視頻

報(bào)告中反復(fù)提及，Sora 在訓(xùn)練和生成時(shí)使用的視頻可以是任何分辨率（在 1920x1080 以內(nèi)）、任何長(zhǎng)寬比、任何時(shí)長(zhǎng)的。這意味著視頻訓(xùn)練數(shù)據(jù)不需要做縮放、裁剪等預(yù)處理。這些特性是絕大多數(shù)其他視頻生成模型做不到的，讓我們來(lái)著重分析一下這一特性的原理。

Sora 的這種性質(zhì)還是得益于 Transformer 架構(gòu)。前文提到，Transformer 的計(jì)算與輸入順序無(wú)關(guān)，必須用位置編碼來(lái)指明每個(gè)數(shù)據(jù)的位置。盡管報(bào)告沒(méi)有提及，我覺(jué)得 Sora 的 DiT 使用了類似于的位置編碼來(lái)表示一個(gè)圖塊的時(shí)空位置。這樣，不管輸入的視頻的大小如何，長(zhǎng)度如何，只要給每個(gè)圖塊都分配一個(gè)位置編碼，DiT 就能分清圖塊間的相對(duì)關(guān)系了。

相比以前的工作，Sora 的這種設(shè)計(jì)是十分新穎的。之前基于 U-Net 的 Stable Diffusion 為了保證所有訓(xùn)練數(shù)據(jù)可以統(tǒng)一被處理，輸入圖像都會(huì)被縮放與裁剪至同一大小。由于訓(xùn)練數(shù)據(jù)中有被裁剪的圖像，模型偶爾也會(huì)生成被裁剪的圖像。生成訓(xùn)練分辨率以外的圖像時(shí)，模型的表現(xiàn)有時(shí)也會(huì)不太好。SDXL [4] 的解決方式是把裁剪的長(zhǎng)寬做為額外信息輸入進(jìn) U-Net。為了生成沒(méi)有裁剪的圖像，只要令輸入的裁剪長(zhǎng)寬為 0 即可。類似地，SDXL 也把圖像分辨率做為額外輸入，使得 U-Net 學(xué)習(xí)不同分辨率、長(zhǎng)寬比的圖像。相比 SDXL，Sora 的做法就簡(jiǎn)潔多了。

之前基于 DiT 的模型（比如華為的 PixArt [5]）似乎都沒(méi)有利用到 Transformer 可以隨意設(shè)置位置編碼這一性質(zhì)。DiT 在處理輸入圖塊時(shí)，會(huì)先把圖塊變形成一維數(shù)據(jù)，再?gòu)淖蟮接揖幪?hào)，即從從左到右，從上到下地給二維圖塊組編號(hào)。這種位置編碼并沒(méi)有保留圖像的二維空間信息，因此，在這種編碼下，模型的輸入分辨率必須固定。比如對(duì)于下面這個(gè)的圖塊組，如果是從左到右、從上到下編碼，模型等于是強(qiáng)行學(xué)習(xí)到了「1號(hào)在0號(hào)右邊、4號(hào)在0號(hào)下面」這樣的位置信息。如果輸入的圖塊形狀為，那么圖塊間的相對(duì)關(guān)系就完全對(duì)不上了。而如果像 Sora 這樣以視頻圖塊的來(lái)生成位置編碼的話，就沒(méi)有這種問(wèn)題了，輸入視頻可以是任何分辨率、任何長(zhǎng)度。

Transformer 在視頻生成的可拓展性

前文提過(guò)，Transformer 的特點(diǎn)就是可拓展性強(qiáng)，即模型越大，訓(xùn)練越久，效果越好。報(bào)告中展示了1倍、4倍、16倍某單位訓(xùn)練時(shí)間下的生成結(jié)果，可以看出模型確實(shí)一直有進(jìn)步。

語(yǔ)言理解能力

之前大部分文生圖擴(kuò)散模型都是在人工標(biāo)注的圖片-文字?jǐn)?shù)據(jù)集上訓(xùn)練的。后來(lái)大家發(fā)現(xiàn)，人工標(biāo)注的圖片描述質(zhì)量較低，紛紛提出了各種提升標(biāo)注質(zhì)量的方法。Sora 復(fù)用了自家 DALL·E 3 的重標(biāo)注技術(shù)，用一個(gè)訓(xùn)練的能生成詳細(xì)描述的標(biāo)注器來(lái)重新為訓(xùn)練視頻生成標(biāo)注。這種做法不僅解決了視頻缺乏標(biāo)注的問(wèn)題，且相比人工標(biāo)注質(zhì)量更高。Sora 的部分結(jié)果展示了其強(qiáng)大了抽象理解能力（如理解人和貓之間的交互），這多半是因?yàn)橐曨l標(biāo)注模型足夠強(qiáng)大，視頻生成模型學(xué)到了視頻標(biāo)注模型的知識(shí)。但同樣，視頻標(biāo)注模型的相關(guān)細(xì)節(jié)完全沒(méi)有公開(kāi)。

其他生成功能

基于已有圖像和視頻進(jìn)行生成：除了約束文本外，Sora 還支持在一個(gè)視頻前后補(bǔ)充內(nèi)容（如果是在一張圖片后面補(bǔ)充內(nèi)容，就是圖生視頻）。報(bào)告沒(méi)有給出實(shí)現(xiàn)細(xì)節(jié)，我猜測(cè)是直接做了反演（inversion）再把反演得到的隱變量替換到隨機(jī)初始隱變量中。

視頻編輯：報(bào)告明確寫(xiě)出，只用簡(jiǎn)單的 SDEdit （即目前 Stable Diffusion 中的圖生圖）即可實(shí)現(xiàn)視頻編輯。

視頻內(nèi)容融合：可能是對(duì)兩個(gè)視頻的初始隱變量做了插值。

圖像生成：當(dāng)然，Sora 也可以生成圖像。報(bào)告表明，Sora 可以生成最大 2048x2048 的圖像。

涌現(xiàn)出的能力

通過(guò)學(xué)習(xí)大量數(shù)據(jù)，Sora 還涌現(xiàn)出一些意想不到的能力。

3D 一致性：視頻中包含自然的相機(jī)視角變換。之前的 Stable Video Diffusion 也有類似發(fā)現(xiàn)。

長(zhǎng)距離連貫性：AI 生成出來(lái)的視頻往往有物體在中途突然消失的情況。而 Sora 有時(shí)候能克服這一問(wèn)題。

與世界的交互：比如在描述畫(huà)畫(huà)的視頻中，畫(huà)紙上的內(nèi)容隨畫(huà)筆生成。

模擬數(shù)字世界：報(bào)告展示了在輸入文本有"Minecraft"時(shí)，模型能生成非常真實(shí)的 Minecraft 游戲視頻。這大概只能說(shuō)明模型的擬合能力太強(qiáng)了，以至于學(xué)會(huì)了生成 Minecraft 這一種特定風(fēng)格的視頻。

局限性

報(bào)告結(jié)尾還是給出了一些失敗的生成示例，比如玻璃杯在桌子上沒(méi)有摔碎。這表明模型還不能完全學(xué)會(huì)某些物理性質(zhì)。然而，我覺(jué)得現(xiàn)階段 Sora 已經(jīng)展示了足夠強(qiáng)大的學(xué)習(xí)能力。想模擬現(xiàn)有視頻中已經(jīng)包含的物理現(xiàn)象，只需要增加數(shù)據(jù)就行了。

總結(jié)

Sora 是一個(gè)驚艷的視頻生成模型，它以卓越的生成能力（高分辨率、長(zhǎng)時(shí)間）與生成質(zhì)量令一眾同期的視頻生成模型黯然失色。Sora 的技術(shù)報(bào)告非常簡(jiǎn)短，不過(guò)我們從中還是可以學(xué)到一些東西。從技術(shù)貢獻(xiàn)上來(lái)看，Sora 的創(chuàng)新主要有兩點(diǎn)：

讓 LDM 的自編碼器也在視頻時(shí)間維度上壓縮。

使用了一種不限制輸入形狀的 DiT

其中，第二點(diǎn)貢獻(xiàn)是非常有啟發(fā)性的。DiT 能支持不同形狀的輸入，大概率是因?yàn)樗砸曨l的3D位置生成位置編碼，打破了一維編碼的分辨率限制。后續(xù)大家或許會(huì)逐漸從 U-Net 轉(zhuǎn)向 DiT 來(lái)建模擴(kuò)散模型的去噪模型。

我認(rèn)為 Sora 的成功有三個(gè)原因。前兩個(gè)原因?qū)?yīng)兩項(xiàng)創(chuàng)新。第一，由于在時(shí)間維度上也進(jìn)行了壓縮，Sora 最終能生成長(zhǎng)達(dá)一分鐘的視頻；第二，使用 DiT 不僅去除了視頻空間、時(shí)間長(zhǎng)度上的限制，還充分利用了 Transformer 本身的可拓展性，使訓(xùn)練一個(gè)視頻生成大模型變得可能。第三個(gè)原因來(lái)自于視頻標(biāo)注模型。之前 Stable Diffusion 能夠成功，很大程度上是因?yàn)橛幸粋€(gè)能夠關(guān)聯(lián)圖像與文本的 CLIP 模型，且有足夠多的帶標(biāo)注圖片。相比圖像，視頻訓(xùn)練本來(lái)就少，帶標(biāo)注的視頻就更難獲得了。一個(gè)能夠理解視頻內(nèi)容，生成詳細(xì)視頻標(biāo)注的標(biāo)注器，一定是讓視頻生成模型理解復(fù)雜文本描述的關(guān)鍵。除了這幾點(diǎn)原因外，剩下的就是砸錢(qián)、擴(kuò)大模型、加數(shù)據(jù)了。

Sora 顯然會(huì)對(duì) AIGC 社區(qū)產(chǎn)生一定影響。對(duì)于 AIGC 愛(ài)好者而言，他們或許會(huì)多了一些生成創(chuàng)意視頻的方法，比如給部分幀讓 Sora 來(lái)根據(jù)文本補(bǔ)全剩余幀。當(dāng)然，目前 Sora 依然不能取代視頻創(chuàng)作者，長(zhǎng)視頻的質(zhì)量依然有待觀察。對(duì)于正在開(kāi)發(fā)相似應(yīng)用的公司，我覺(jué)得他們應(yīng)該要連夜撤銷(xiāo)之前的方案，轉(zhuǎn)換為這套沒(méi)有分辨率限制的 DiT 的方案。他們的壓力應(yīng)該會(huì)很大。對(duì)于相關(guān)科研人員而言，除了學(xué)習(xí)這種較為新穎的 DiT 用法外，也沒(méi)有太多收獲了。這份技術(shù)報(bào)告透露出一股「我絕對(duì)不會(huì)開(kāi)源」的意思。沒(méi)有開(kāi)源模型，普通的研究者也就什么都做不了。新技術(shù)的誕生絕對(duì)不可能靠一家公司，一個(gè)模型就搞定。像之前的 Stable Diffusion，也是先開(kāi)源了一個(gè)基礎(chǔ)模型，科研者和愛(ài)好者再補(bǔ)充了各種豐富的應(yīng)用。我呼吁各大公司盡快訓(xùn)練并開(kāi)源一個(gè)這種不限分辨率的 DiT，這樣科研界或許會(huì)拋開(kāi) U-Net，基于 DiT 開(kāi)發(fā)出新的擴(kuò)散模型應(yīng)用。

審核編輯：黃飛

閱讀全文

編碼器(131226) 編碼器(131226)
AI(263628) AI(263628)
LDM(10620) LDM(10620)
深度學(xué)習(xí)(119798) 深度學(xué)習(xí)(119798)
OpenAI(5839) OpenAI(5839)

評(píng)論

相關(guān)推薦

除了刷屏的Sora，國(guó)內(nèi)外還有哪些AI視頻生成工具

? 電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）近日，OpenAI發(fā)布的文生視頻模型Sora全網(wǎng)刷屏。相比之前的文生視頻模型，Sora無(wú)論是視頻時(shí)長(zhǎng)，還是畫(huà)面精細(xì)度，細(xì)節(jié)完整性，或是多鏡頭拍攝，都更為突出

2024-02-26 08:42:00

2852

=>的使用場(chǎng)景有哪些

使用場(chǎng)景

2020-10-27 13:25:02

AG32VF-MIPI應(yīng)用場(chǎng)景

MIPI接口技術(shù)在圖像和視頻傳輸中的應(yīng)用越來(lái)越廣泛，應(yīng)用場(chǎng)景也在不斷拓展，而不僅限于移動(dòng)設(shè)備。MIPI接口在物聯(lián)網(wǎng)、智能家居、智能監(jiān)控、智能電視、智能汽車(chē)等領(lǐng)域也得到廣泛應(yīng)用。 MIPI還可

2024-01-22 08:56:38

ARM MPcore系統(tǒng)中ACP（加速器一致性接口的）應(yīng)用場(chǎng)景如何配置

ARM MPcore系統(tǒng)中ACP（加速器一致性接口的）作用，具體應(yīng)用場(chǎng)景？如何配置？

2022-09-08 11:24:54

ARM的技術(shù)特征是什么？應(yīng)用場(chǎng)景有哪些？

ARM的技術(shù)特征是什么？應(yīng)用場(chǎng)景有哪些？

2021-11-05 07:32:17

CP-OFMD調(diào)制波形應(yīng)用場(chǎng)景

圖1、5G的應(yīng)用場(chǎng)景5G使用5G多載波波形來(lái)為智能手機(jī)，辦公室，工廠自動(dòng)化，智能電網(wǎng)，智慧城市，物聯(lián)網(wǎng)，M2M，M2X等多種設(shè)備提供應(yīng)用平臺(tái)。5G新無(wú)線電(5G NR)根據(jù)應(yīng)用場(chǎng)景可分為三大類服務(wù)

2019-06-18 06:51:08

ChatGPT系統(tǒng)開(kāi)發(fā)AI人功智能方案

。ChatGPT是一個(gè)由OpenAI開(kāi)發(fā)的人工智能語(yǔ)言模型，可以實(shí)現(xiàn)自然語(yǔ)言處理、對(duì)話生成等功能。要開(kāi)發(fā)一個(gè)類似ChatGPT的人工智能系統(tǒng)軟件，可以遵循以下步驟：確定應(yīng)用場(chǎng)景：確定人工智能系統(tǒng)軟件要

2023-05-18 10:16:50

FPGA的應(yīng)用場(chǎng)景

目錄文章目錄目錄FPGAFPGA 的應(yīng)用場(chǎng)景FPGA 的技術(shù)難點(diǎn)FPGA 的工作原理FPGA 的體系結(jié)構(gòu)FPGA 的開(kāi)發(fā)FPGA 的使用FPGA 的優(yōu)缺點(diǎn)參考文檔FPGAFPGA（Field

2021-07-28 08:43:58

Firefly集群服務(wù)器的應(yīng)用場(chǎng)景資料介紹

1、Firefly集群服務(wù)器的應(yīng)用場(chǎng)景介紹Firefly集群服務(wù)器的每一個(gè)核心板卡都可以獨(dú)立運(yùn)行一個(gè)Android系統(tǒng)。用戶可以將自己的手機(jī)應(yīng)用部署到每個(gè)核心板上。針對(duì)云手機(jī)應(yīng)用場(chǎng)景，F(xiàn)irefly

2022-08-04 16:17:31

MOS管的應(yīng)用場(chǎng)景

mos管的應(yīng)用場(chǎng)景，你了解么？低壓MOS管可稱為金屬氧化物半導(dǎo)體場(chǎng)效應(yīng)管，因?yàn)榈蛪篗OS管具有良好的開(kāi)關(guān)特性，廣泛應(yīng)用在電子開(kāi)關(guān)的電路中。如開(kāi)關(guān)電源，電動(dòng)馬達(dá)、照明調(diào)光等！下面銀聯(lián)寶科技就跟大家一起

2018-11-14 09:24:34

MS9331的應(yīng)用場(chǎng)景是什么？

MS9331的應(yīng)用場(chǎng)景是什么？

2022-02-11 06:41:04

NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

能耗并提高數(shù)據(jù)安全性。本文將對(duì) NanoEdge AI 的技術(shù)原理、應(yīng)用場(chǎng)景以及優(yōu)勢(shì)進(jìn)行綜述。 1、技術(shù)原理 NanoEdge AI 的核心技術(shù)包括邊緣計(jì)算、神經(jīng)網(wǎng)絡(luò)壓縮和低功耗硬件設(shè)計(jì)。邊緣計(jì)算

2024-03-12 08:09:00

RK3308的特點(diǎn)及應(yīng)用場(chǎng)景是什么？

RK3308的特點(diǎn)及應(yīng)用場(chǎng)景是什么？

2022-03-09 08:04:31

SMT組裝工藝流程的應(yīng)用場(chǎng)景

工藝流程的應(yīng)用場(chǎng)景。 01單面純貼片工藝應(yīng)用場(chǎng)景：僅在一面有需要焊接的貼片器件。 02雙面純貼片工藝應(yīng)用場(chǎng)景： A/B面均為貼片元件。 03單面混裝工藝應(yīng)用場(chǎng)景： A面有貼片元件+插件元件，B

2023-10-20 10:31:48

SMT組裝工藝流程的應(yīng)用場(chǎng)景（多圖）

工藝流程的應(yīng)用場(chǎng)景。一、單面純貼片工藝應(yīng)用場(chǎng)景：僅在一面有需要焊接的貼片器件。二、雙面純貼片工藝應(yīng)用場(chǎng)景： A/B面均為貼片元件。三、單面混裝工藝應(yīng)用場(chǎng)景： A面有貼片元件+插件元件

2023-10-17 18:10:08

SSD268G主要應(yīng)用場(chǎng)景分享

加HDMI擴(kuò)展，能夠同時(shí)呈現(xiàn)不同畫(huà)面；安防級(jí)別的多攝像頭輸入，最高可達(dá)4K@30fps；豐富的接口和內(nèi)置Ip，可以滿足各種不同的應(yīng)用場(chǎng)景和產(chǎn)品形態(tài)，是多模態(tài)交互場(chǎng)景的理想選擇。該芯片主要應(yīng)用于以下場(chǎng)景中：

2022-03-17 14:30:25

WAPI的用戶使用場(chǎng)景有哪幾種？

WAPI的用戶使用場(chǎng)景有哪幾種？基于WAI的安全接入控制分類有哪些？WPI的封裝過(guò)程是怎樣的？

2021-05-31 06:51:07

Wi-Fi6創(chuàng)新技術(shù)特點(diǎn)及應(yīng)用場(chǎng)景

Wi-Fi 6創(chuàng)新技術(shù)特點(diǎn)Wi-Fi 6典型應(yīng)用場(chǎng)景

2020-12-04 06:11:18

eMBB中的CP-OFMD調(diào)制波形的應(yīng)用場(chǎng)景

5G新的無(wú)線電接口：eMBB中的CP-OFMD調(diào)制波形的應(yīng)用場(chǎng)景

2021-01-04 07:11:51

jlink的主要使用場(chǎng)景有沒(méi)有可以替代的非硬件方案？

jlink的主要使用場(chǎng)景，有沒(méi)有可以替代的非硬件方案？

2023-10-07 09:00:45

labview 和 wincc 的區(qū)別使用場(chǎng)景

labview 和 wincc 的區(qū)別使用場(chǎng)景 都是上位機(jī)軟件，都可以做監(jiān)控軟件 wincc的名氣也比較大對(duì)比的資料較少寫(xiě)這些文章的人，從自己的從事的行業(yè)出發(fā)，帶有自己的思維使用的場(chǎng)景 肯定

2023-10-27 18:01:14

this的使用場(chǎng)景及與C,Java中的this的區(qū)別

【JS】this有哪些使用場(chǎng)景？跟C,Java中的this有什么區(qū)別？如何改變this的值？

2019-03-11 10:17:18

volatile關(guān)鍵字應(yīng)用場(chǎng)景及示例

volatile關(guān)鍵字1.應(yīng)用場(chǎng)景2.示例1.應(yīng)用場(chǎng)景volatile關(guān)鍵字分析，往往應(yīng)用在三種場(chǎng)合1）多線程編程共享全局變量的時(shí)候，該全局變量要加上volatile進(jìn)行修飾，讓編譯器不要優(yōu)化該變量

2021-08-24 07:21:57

關(guān)于NXP IC SC18IM700 應(yīng)用場(chǎng)景

上圖是我們現(xiàn)在使用SC18IM700的應(yīng)用場(chǎng)景，現(xiàn)請(qǐng)教幾個(gè)關(guān)于使用方面的問(wèn)題1）我想請(qǐng)問(wèn)您這邊是否有過(guò)此款芯片的使用案例，我們的做法行不行的通？2）如果行得通的話，我想詢問(wèn)一下是否有軟體的驅(qū)動(dòng)代碼可以供我們參考？

2016-12-07 10:42:07

基于阿里云Serverless架構(gòu)下函數(shù)計(jì)算的最新應(yīng)用場(chǎng)景詳解（一）

摘要： Serverless概念是近年來(lái)特別火的一個(gè)技術(shù)概念，基于這種架構(gòu)能構(gòu)建出很多應(yīng)用場(chǎng)景，適合各行各業(yè)，只要對(duì)輕計(jì)算、高彈性、無(wú)狀態(tài)等場(chǎng)景有訴求的用戶都可以通過(guò)本文來(lái)普及一些基礎(chǔ)概念，看看這些

2018-01-25 11:06:42

基于阿里云Serverless架構(gòu)下函數(shù)計(jì)算的最新應(yīng)用場(chǎng)景詳解（二）

2018-01-25 11:46:07

大數(shù)據(jù)開(kāi)發(fā)之spark應(yīng)用場(chǎng)景

，其靈活的特性，適合各種環(huán)境，以下是Spark最常見(jiàn)的兩種應(yīng)用場(chǎng)景：離線場(chǎng)景：可以以時(shí)間為維度，幾年的數(shù)據(jù)集，或者以業(yè)務(wù)為維度，某個(gè)領(lǐng)域的大數(shù)據(jù)集等，這種數(shù)據(jù)我們一般叫做離線數(shù)據(jù)，或者冷數(shù)據(jù)。實(shí)時(shí)場(chǎng)景

2018-04-10 16:05:02

小容量OLT應(yīng)用場(chǎng)景分析

的嘗試和部署，而視頻業(yè)務(wù)的大流量特性導(dǎo)致對(duì)網(wǎng)絡(luò)的架構(gòu)和設(shè)備部署提出了新的需求，如設(shè)備下沉并逐步靠近用戶、網(wǎng)絡(luò)云化/虛擬化、家庭網(wǎng)絡(luò)智能化、光纖越來(lái)越靠近用戶并逐步替代銅線，使得全光接入成為發(fā)展趨勢(shì)

2020-12-03 14:29:02

應(yīng)用Bluetooth Smart技術(shù)的全套智能騎行設(shè)備的技術(shù)細(xì)節(jié)和應(yīng)用場(chǎng)景，不看肯定后悔

應(yīng)用Bluetooth Smart技術(shù)的全套智能騎行設(shè)備的技術(shù)細(xì)節(jié)和應(yīng)用場(chǎng)景，不看肯定后悔

2021-05-21 06:47:43

步進(jìn)電機(jī)是什么工作原理？有哪些分類？應(yīng)用場(chǎng)景是什么？

步進(jìn)電機(jī)是什么工作原理？有哪些分類？應(yīng)用場(chǎng)景是什么？

2021-10-19 08:21:37

永磁同步電機(jī)的應(yīng)用場(chǎng)景

1.永磁同步電機(jī)的應(yīng)用場(chǎng)景工業(yè)伺服驅(qū)動(dòng)、新能源汽車(chē)、新能源發(fā)電、機(jī)器人、醫(yī)療設(shè)備等2.PMSM數(shù)學(xué)模型其中ud、uq、id和iq分別表示定子d、q軸電壓和電流;Ld、Lq為定子d、q軸電感;Ｒs

2021-08-26 09:46:19

消息隊(duì)列的應(yīng)用場(chǎng)景

，因此寫(xiě)入消息隊(duì)列的速度很快，基本可以忽略，因此用戶的響應(yīng)時(shí)間可能是50毫秒。因此架構(gòu)改變后，系統(tǒng)的吞吐量提高到每秒20QPS。比串行提高了3倍，比并行提高了兩倍！　　2、應(yīng)用解耦　　場(chǎng)景說(shuō)明：用戶

2020-06-23 10:19:04

藍(lán)牙低功耗常見(jiàn)的應(yīng)用場(chǎng)景及架構(gòu)

淺談藍(lán)牙低功耗（BLE）的幾種常見(jiàn)的應(yīng)用場(chǎng)景及架構(gòu)

2021-06-15 09:51:18

藍(lán)牙多連接應(yīng)用場(chǎng)景舉例

藍(lán)牙多連接應(yīng)用場(chǎng)景舉例一、藍(lán)牙多連接的通信方式： 1-1、藍(lán)牙MESH組網(wǎng)圖： 1-2、藍(lán)牙星型組網(wǎng)圖；二、兩種方案的優(yōu)劣勢(shì)： 2-1、 MESH方式網(wǎng)絡(luò)中的節(jié)點(diǎn)數(shù)量多，能夠?qū)崿F(xiàn)單播、組播

2023-05-09 09:09:02

運(yùn)放電路有哪些應(yīng)用場(chǎng)景?

運(yùn)放電路的七大應(yīng)用場(chǎng)景

2021-03-11 07:49:46

OpenAI推出新模型Sora：文字秒變視頻短片

OpenAI行業(yè)資訊

深圳市浮思特科技有限公司發(fā)布于 2024-02-18 16:49:39

python應(yīng)用場(chǎng)景

本視頻主要詳細(xì)介紹了python應(yīng)用場(chǎng)景，分別是系統(tǒng)編程、用戶圖形接口、Internet腳本、組件集成、數(shù)據(jù)庫(kù)編程、數(shù)值計(jì)算和科學(xué)計(jì)算。

2018-12-26 16:15:58

8794

智慧交通應(yīng)用場(chǎng)景

本視頻主要詳細(xì)智慧交通應(yīng)用場(chǎng)景，分別是車(chē)路信息發(fā)布、智能停車(chē)管理、ETC應(yīng)用、電子車(chē)牌。

2019-04-08 17:53:39

8272

視頻圖像數(shù)據(jù)的應(yīng)用前景，智能商場(chǎng)應(yīng)用場(chǎng)景解決方案

智能商場(chǎng)是視頻圖像數(shù)據(jù)在智能化場(chǎng)景中的典型應(yīng)用之一。綜合來(lái)看，在智能化應(yīng)用場(chǎng)景中，我們通常會(huì)面對(duì)結(jié)構(gòu)化與非結(jié)構(gòu)化混合形成的數(shù)據(jù)，需要對(duì)數(shù)據(jù)做三個(gè)階段的處理，即視頻圖像數(shù)據(jù)的接入、視頻圖像數(shù)據(jù)及業(yè)務(wù)數(shù)據(jù)的處理、數(shù)據(jù)使用，這也是常見(jiàn)的物聯(lián)網(wǎng)數(shù)據(jù)處理架構(gòu)方案。

2019-04-29 15:27:50

7257

直插式燈珠應(yīng)用場(chǎng)景有哪些

一、直插式燈珠應(yīng)用場(chǎng)景有哪些

2023-03-31 10:19:36

616

華為盤(pán)古大模型與ChatGPT的應(yīng)用場(chǎng)景

　從應(yīng)用場(chǎng)景來(lái)看，華為盤(pán)古大模型與chatgpt的應(yīng)用場(chǎng)景相似，均可用于智能客戶服務(wù)、智能寫(xiě)作等領(lǐng)域。但是，華為盤(pán)古大模型還可以用于智能翻譯，具有更廣闊的應(yīng)用前景。

2023-09-05 10:01:27

2394

奧特曼發(fā)布王炸模型Sora

奧特曼，作為科技界的先驅(qū)者，近日攜手OpenAI發(fā)布了其首個(gè)視頻生成模型——Sora。這一創(chuàng)新模型完美繼承了DALL·E 3的卓越畫(huà)質(zhì)和強(qiáng)大指令遵循能力，能夠生成長(zhǎng)達(dá)一分鐘的高清視頻。

2024-02-18 10:06:16

618

OpenAI發(fā)布首個(gè)視頻生成模型Sora

OpenAI近日宣布推出其全新的文本到視頻生成模型——Sora。這一突破性的技術(shù)將視頻創(chuàng)作帶入了一個(gè)全新的紀(jì)元，為用戶提供了前所未有的創(chuàng)作可能性。

2024-02-18 10:07:09

532

OpenAI推出新款大模型Sora，引領(lǐng)多模態(tài)AI新潮流

全球人工智能領(lǐng)域的佼佼者OpenAI近日發(fā)布了一款名為Sora的短視頻生成模型，該模型能夠根據(jù)文字指令即時(shí)生成高質(zhì)量短視頻，引起了業(yè)界的廣泛關(guān)注。

2024-02-18 10:16:20

433

OpenAI發(fā)布視頻AI模型Sora，AI技術(shù)擴(kuò)展至視頻領(lǐng)域，有望助推AGI實(shí)現(xiàn)

隨后，發(fā)帖指出AGI實(shí)現(xiàn)過(guò)程可能僅需一兩年的360集團(tuán)創(chuàng)始人周鴻祎就Sora發(fā)表看法。他認(rèn)同Sora實(shí)力強(qiáng)大，效果驚人，特別是相對(duì)于其他競(jìng)爭(zhēng)對(duì)手如Pika和Runway更具優(yōu)勢(shì)。

2024-02-18 11:23:32

232

奧特曼發(fā)布王炸模型Sora OpenAI首個(gè)文生視頻模型Sora正式亮相

奧特曼發(fā)布王炸模型Sora OpenAI首個(gè)文生視頻模型Sora正式亮相 2月16日凌晨OpenAI的首個(gè)文生視頻模型Sora正式亮相。Sora只需輸入文字，便可生成一段長(zhǎng)達(dá)60秒的高清視頻

2024-02-18 17:41:13

547

OpenAI要約收購(gòu)協(xié)議已完成 OpenAI估值超800億美元

?？梢哉f(shuō)OpenAI 目前是全球最有價(jià)值初創(chuàng)科技公司之一。而且在2月16日OpenAI還推出了新的文生視頻模型Sora，Sora模型可以把簡(jiǎn)短的文本描述轉(zhuǎn)換為長(zhǎng)達(dá)60秒的高清視頻，這使得AI更具想象空間。

2024-02-18 18:19:01

873

OpenAI推出全新文生視頻模型Sora

近日，全球領(lǐng)先的人工智能研究公司OpenAI宣布推出其最新的文生視頻大模型“Sora”。該模型具有突破性的功能，能夠根據(jù)用戶提供的文本指令或靜態(tài)圖像，自動(dòng)生成長(zhǎng)達(dá)1分鐘的高清視頻。這些視頻中不僅包含精細(xì)復(fù)雜的場(chǎng)景和生動(dòng)的角色表情，還展示了復(fù)雜的鏡頭運(yùn)動(dòng)，為視頻創(chuàng)作領(lǐng)域帶來(lái)了全新的可能性。

2024-02-19 10:56:30

375

OpenAI發(fā)布文生視頻模型Sora，引領(lǐng)AI視頻生成新紀(jì)元

在人工智能(AI)領(lǐng)域掀起新一輪革命浪潮的，正是OpenAI最新推出的文生視頻大模型——Sora。這款被業(yè)界廣泛贊譽(yù)的模型，以其“逼真”和“富有想象力”的視頻生成能力，徹底顛覆了傳統(tǒng)視頻生成領(lǐng)域的局限，將平均生成長(zhǎng)度從4秒提升至驚人的60秒。

2024-02-19 11:03:31

379

OpenAI發(fā)布首個(gè)文生視頻模型Sora

開(kāi)發(fā)出熱門(mén)聊天機(jī)器人ChatGPT后，OpenAI繼續(xù)在生成式人工智能上玩出新花樣。

2024-02-19 13:56:03

501

谷歌AI Gemini1.5評(píng)OpenAI Sora生成視頻：評(píng)價(jià)負(fù)面

此前，兩家科技巨頭分別推出自家創(chuàng)新技術(shù)： Google Gemini 1.5 Pro與OpenAI文本視頻轉(zhuǎn)換工具Sora。Sora的發(fā)布時(shí)間備受矚目，有人質(zhì)疑OpenAI有意分散公眾對(duì)Google Gemini 1.5的關(guān)注度。

2024-02-19 14:18:42

257

英偉達(dá)市值躍居全球第四文生視頻大模型Sora帶動(dòng)

英偉達(dá)市值躍居全球第四文生視頻大模型Sora帶動(dòng) 文生視頻大模型Sora引發(fā)市場(chǎng)關(guān)注；OpenAI的首款文生視頻大模型Sora橫空出世帶動(dòng)了相關(guān)資金關(guān)注，英偉達(dá)市值躍居全球第四。 AI熱度不減極大

2024-02-19 16:48:05

620

sora已被多方注冊(cè)商標(biāo)

隨著OpenAI最新文生視頻大模型“Sora”的公布，該名稱在多個(gè)領(lǐng)域已被注冊(cè)為商標(biāo)，引發(fā)各界對(duì)商標(biāo)權(quán)歸屬和使用范圍的廣泛關(guān)注。

2024-02-19 18:16:44

901

OpenAI宣布推出全新的生成式人工智能模型“Sora”

2022年末，OpenAI聊天機(jī)器人ChatGPT的面世無(wú)疑成為了引領(lǐng)人工智能浪潮的標(biāo)志性事件，宣告了新一輪科技革命的到來(lái)。

2024-02-20 10:37:41

562

openai sora如何使用?Sora 使用指南：快速上手

OpenAI Sora 使用指南：快速上手歡迎使用OpenAI Sora，一款強(qiáng)大的人工智能視頻生成工具。無(wú)論您是視頻制作新手還是專業(yè)人士，本指南將幫助您快速掌握Sora，輕松創(chuàng)作出高質(zhì)量的視頻

2024-02-20 11:19:51

2454

OpenAI新年開(kāi)出王炸，視頻生成模型Sora問(wèn)世

近日，OpenAI在AI生成視頻領(lǐng)域取得重大突破，發(fā)布了全新的生成式人工智能模型“Sora”。該模型在視頻生成方面展現(xiàn)出了驚人的能力，通過(guò)文本指令，能夠直接輸出長(zhǎng)達(dá)60秒的視頻，不僅在視頻長(zhǎng)度上遠(yuǎn)超同行，而且精致程度和復(fù)雜性也令人嘆為觀止。

2024-02-20 11:46:10

326

探索OpenAI Sora視頻AI生成技術(shù)及其應(yīng)用如何使用指南

OpenAI的Sora現(xiàn)已擴(kuò)展其能力范圍，進(jìn)入視頻生成領(lǐng)域，標(biāo)志著人工智能技術(shù)在多媒體內(nèi)容創(chuàng)作上的一個(gè)重大突破。Sora的視頻AI功能使得用戶能夠根據(jù)文本描述自動(dòng)生成高質(zhì)量的視頻內(nèi)容，這項(xiàng)技術(shù)

2024-02-20 12:01:30

668

OpenAI發(fā)布Sora模型，瞬間生成高清大片

近日，人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI發(fā)布了一款名為“Sora”的視頻生成AI模型，再次展示了其在AI技術(shù)領(lǐng)域的創(chuàng)新實(shí)力。Sora以其出色的視頻生成能力，瞬間成為業(yè)界的焦點(diǎn)。

2024-02-20 13:33:58

253

字節(jié)跳動(dòng)推出一款顛覆性視頻模型—Boximator

在 Sora 引爆文生視頻賽道之前，國(guó)內(nèi)的字節(jié)跳動(dòng)也推出了一款顛覆性視頻模型——Boximator。

2024-02-20 13:44:49

352

OpenAI發(fā)布人工智能文生視頻大模型Sora

近日，人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI宣布推出其最新的人工智能文生視頻大模型——Sora。這款模型在繼承DALL-E 3卓越畫(huà)質(zhì)和遵循指令能力的基礎(chǔ)上，實(shí)現(xiàn)了對(duì)真實(shí)物理世界的深度模擬，為視頻制作領(lǐng)域帶來(lái)了前所未有的變革。

2024-02-20 13:54:17

230

新模型Sora引關(guān)注，OpenAI估值或達(dá)800億美元

近日，OpenAI發(fā)布了一款名為Sora的新模型，其強(qiáng)大的視頻生成能力迅速引發(fā)了全球關(guān)注。這款模型不僅能夠生成長(zhǎng)達(dá)一分鐘的視頻，而且能夠在單個(gè)視頻中創(chuàng)建多個(gè)鏡頭，多角度保留角色和視覺(jué)的風(fēng)格。視頻中可包含多個(gè)角色、特定的動(dòng)作、主題和背景，使得視頻內(nèi)容更加豐富多彩。

2024-02-20 14:06:30

203

Sora助推OpenAI估值飆升275%

近日，人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI發(fā)布了其首個(gè)文生視頻模型——Sora。這款模型具備令人驚嘆的能力：用戶只需通過(guò)一句話，便能生成長(zhǎng)達(dá)1分鐘的高清視頻。Sora的發(fā)布不僅為視頻制作領(lǐng)域帶來(lái)了革命性的變革，同時(shí)也推動(dòng)了OpenAI的估值大幅飆升。

2024-02-20 14:12:16

155

馬斯克稱特斯拉視頻生成技術(shù)超過(guò)Sora

特斯拉CEO埃隆·馬斯克在社交媒體平臺(tái)上發(fā)表言論，聲稱特斯拉所掌握的視頻生成技術(shù)超越了OpenAI最新發(fā)布的Sora模型。馬斯克自信地表示，特斯拉在這一領(lǐng)域的技術(shù)實(shí)力堪稱全球頂尖，甚至超越了OpenAI這一人工智能領(lǐng)域的佼佼者。

2024-02-20 14:16:05

208

Sora到底懂不懂物理世界? Sora開(kāi)啟更多可能

OpenAI的視頻生成模型Sora持續(xù)引發(fā)關(guān)注，而圍繞Sora到底懂不懂物理世界？這個(gè)討論越發(fā)火熱，甚至是在討論Sora 到底是不是物理引擎甚至世界模型？當(dāng)然Sora 目前看起來(lái)似乎還微有瑕疵

2024-02-20 11:08:15

314

Sora爆紅，多模態(tài)大模型是下一發(fā)展階段

“大語(yǔ)言模型為 AI 產(chǎn)業(yè)帶來(lái)新的生機(jī)，然而語(yǔ)言模型的應(yīng)用場(chǎng)景有限。要全面打開(kāi)生成式 AI 的想象力，還是要依托多模態(tài)大模型。”IDC 中國(guó)研究總監(jiān)盧言霞近日表示。Sora在文生視頻領(lǐng)域真正邁出

2024-02-20 16:13:26

159

周鴻祎談Sora：中美AI差距或在擴(kuò)大，挑戰(zhàn)與機(jī)遇并存

2月16日，360董事長(zhǎng)周鴻祎在微博發(fā)文，談到OpenAI的文字轉(zhuǎn)視頻模型Sora。他認(rèn)為：Sora意味著 AGI實(shí)現(xiàn)將從10年縮短到1年。

2024-02-21 10:08:51

347

微軟廣告與網(wǎng)絡(luò)服務(wù)部門(mén)CEO確認(rèn)Sora與Copilot集成

據(jù)悉，Sora由OpenAI研發(fā)，是一種大規(guī)模語(yǔ)言模型聊天機(jī)器人，用戶只需提供簡(jiǎn)單的文本提示，AI模型便可生成長(zhǎng)達(dá)60秒的高質(zhì)量視頻。此外，OpenAI宣稱Sora通過(guò)一種名為“簡(jiǎn)化視頻網(wǎng)絡(luò)”（SVN）進(jìn)行訓(xùn)練，該網(wǎng)絡(luò)能精準(zhǔn)去除繁瑣內(nèi)容

2024-02-21 16:12:43

144

sora最新消息 sora是什么意思

Sora，是美國(guó)人工智能研究公司OpenAI發(fā)布的人工智能文生視頻大模型(但OpenAI并未單純將其視為視頻模型，而是作為“世界模擬器”，于2024年2月15日(美國(guó)當(dāng)?shù)貢r(shí)間)正式對(duì)外發(fā)布

2024-02-21 16:38:29

1074

sora系列是哪個(gè)公司的 sora視頻怎么用

sora系列是哪個(gè)公司的 Sora，美國(guó)人工智能研究公司OpenAI發(fā)布的人工智能文生視頻大模型(但OpenAI并未單純將其視為視頻模型，而是作為“世界模擬器”，于2024年2月15日(美國(guó)當(dāng)?shù)貢r(shí)間

2024-02-21 16:35:09

2839

openai發(fā)布首個(gè)視頻生成模型sora

美國(guó)當(dāng)?shù)貢r(shí)間2024年2月15日，OpenAI正式發(fā)布文生視頻模型Sora ，并發(fā)布了48個(gè)文生視頻案例和技術(shù)報(bào)告，正式入局視頻生成領(lǐng)域。Sora能夠根據(jù)提示詞生成60s的連貫視頻，“碾壓

2024-02-21 16:45:24

585

sora如何使用 sora是什么軟件

Sora是一種擴(kuò)散模型，具備從噪聲中生成完整視頻的能力，它生成的視頻一開(kāi)始看起來(lái)像靜態(tài)噪音，通過(guò)多個(gè)步驟逐漸去除噪聲后，視頻也從最初的隨機(jī)像素轉(zhuǎn)化為清晰的圖像場(chǎng)景，其能夠一次生成多幀預(yù)測(cè)，確保畫(huà)面

2024-02-21 17:20:46

1400

國(guó)內(nèi)公司與SORA模型代差約半年，行業(yè)發(fā)展亟待加速

根據(jù)我們的計(jì)算，基于SORA模型生成視頻的過(guò)程中，如果假設(shè)一張圖的價(jià)格是0.02美元，一分鐘生成十幾張圖片，那么生成一段60秒的視頻可能需要消耗10到12美元。

2024-02-22 10:31:56

217

第一撥靠Sora賺錢(qián)的人已經(jīng)出現(xiàn)

隨著OpenAI最新發(fā)布的人工智能文生視頻大模型Sora的問(wèn)世，科技與創(chuàng)意產(chǎn)業(yè)再掀熱潮。據(jù)悉，Sora不僅能根據(jù)文字說(shuō)明創(chuàng)造出逼真且富有想象力的場(chǎng)景，更因其強(qiáng)大的生成能力引發(fā)了市場(chǎng)與消費(fèi)者的極大興趣。

2024-02-22 14:05:01

250

OpenAI新推文生視頻大模型Sora引發(fā)熱議，首批受益者涌現(xiàn)

在科技浪潮中，OpenAI再次引領(lǐng)潮流。繼2023年的文生文大語(yǔ)言模型之后，2024年春節(jié)期間，OpenAI推出的文生視頻大模型Sora迅速成為全球科技界的焦點(diǎn)。這款模型能夠根據(jù)文本內(nèi)容生成高質(zhì)量的視頻，其潛力在電影制作、廣告、游戲開(kāi)發(fā)等多個(gè)領(lǐng)域均得到了體現(xiàn)。

2024-02-22 14:15:37

274

Sora來(lái)了,會(huì)砸掉誰(shuí)的飯碗?反觀第一撥靠Sora賺錢(qián)的人已經(jīng)出現(xiàn)

？龍年OpenAI再次用Sora講出了新故事；Sora來(lái)了AI商業(yè)化進(jìn)程有望加速推進(jìn)但是也帶來(lái)了更多問(wèn)題。 Sora來(lái)了，會(huì)砸掉誰(shuí)的飯碗？文生視頻大模型Sora能夠根據(jù)文字指令創(chuàng)造出既逼真又充滿想象力的場(chǎng)景，而且動(dòng)作絲滑，對(duì)于文本提示的意思能夠準(zhǔn)確理解，從OpenAI放

2024-02-22 14:11:53

736

sora模型怎么使用 sora模型對(duì)現(xiàn)實(shí)的影響

2024-02-22 16:42:22

571

OpenAI文生視頻模型Sora要點(diǎn)分析

近日，美國(guó)人工智能公司OpenAI發(fā)布了首個(gè)視頻生成模型Sora。不同于此前許多AI大模型文生圖或視頻時(shí)，會(huì)出現(xiàn)人物形象前后不一致等問(wèn)題

2024-02-22 16:37:57

436

sora模型上市公司 sora模型對(duì)現(xiàn)實(shí)的影響

內(nèi)容的補(bǔ)充和完善。 Sora對(duì)于需要制作視頻的藝術(shù)家、電影制片人或?qū)W生來(lái)說(shuō)，都帶來(lái)了無(wú)限可能。該模型可以深度模擬真實(shí)物理世界，標(biāo)志著人工智能在理解真實(shí)世界場(chǎng)景并與之互動(dòng)的能力方面實(shí)現(xiàn)飛躍，也被認(rèn)為是實(shí)現(xiàn)通用人工智能(AGI)的重

2024-02-22 16:46:39

438

sora模型中國(guó)可以使用嗎 sora模型是哪個(gè)公司

Sora，美國(guó)人工智能研究公司OpenAI發(fā)布的人工智能文生視頻大模型(但OpenAI并未單純將其視為視頻模型，而是作為“世界模擬器” ，于2024年2月15日(美國(guó)當(dāng)?shù)貢r(shí)間)正式對(duì)外發(fā)布

2024-02-22 16:52:54

1317

sora模型是什么意思 sora模型引發(fā)行業(yè)變革

時(shí)其估值約為290億美元)，且文生視頻大模型將會(huì)大幅推動(dòng)人工智能基礎(chǔ)設(shè)施的需求，英偉達(dá)、OpenAI、軟銀等巨頭公司都被曝正在進(jìn)行AI芯片的制造布局，英偉達(dá)也因大模型訓(xùn)練需要GPU算力支持而股價(jià)大漲。與此同時(shí)，受Sora發(fā)布的影響，美國(guó)圖片供應(yīng)商Shutterstock的股價(jià)大跌。在中國(guó)，龍年開(kāi)

2024-02-22 17:00:18

1066

sora模型發(fā)布 sora模型對(duì)現(xiàn)實(shí)產(chǎn)生的影響有多大

Sora，美國(guó)人工智能研究公司OpenAI發(fā)布的人工智能文生視頻大模型(但OpenAI并未單純將其視為視頻模型，而是作為“世界模擬器” )，于2024年2月15日(美國(guó)當(dāng)?shù)貢r(shí)間)正式對(duì)外發(fā)布

2024-02-22 17:05:53

492

OpenAI表示Sora還有很長(zhǎng)的路要走

近日，OpenAI發(fā)布的Sora視頻生成器在技術(shù)圈內(nèi)引起了廣泛關(guān)注。盡管其初步展示的效果令人印象深刻，但該工具目前仍處在研究階段，距離實(shí)際應(yīng)用還有相當(dāng)?shù)木嚯x。

2024-02-27 17:38:09

296

7萬(wàn)張H100打造的OpenAI文生視頻Sora功能原理詳解|Sora注冊(cè)全攻略

近日，OpenAI發(fā)布的基于Transformer架構(gòu)的文生視頻Sora，可謂是在AI圈掀起新的熱潮。該模型具有強(qiáng)大的視頻生成能力，可產(chǎn)生高達(dá)一分鐘的高清視頻，并且用戶可以自由指定視頻時(shí)間長(zhǎng)度、分辨率和寬高比。據(jù)OpenAI的觀點(diǎn)，Sora的誕生可能預(yù)示著物理世界通用模擬器的重大突破。

2024-02-29 11:48:35

358

相較于ChatGPT，Sora的算力需求有多大？安全問(wèn)題誰(shuí)來(lái)解決？

2 月 16 日，AI 行業(yè)再一次迎來(lái)震驚四方的大新聞：OpenAI 發(fā)布了 Sora。

2024-02-29 15:36:48

362

Sora的出現(xiàn)給企業(yè)數(shù)字化轉(zhuǎn)型的啟示

？ ? Sora，OpenAI發(fā)布的人工智能文生視頻大模型，于2024年2月15日（美國(guó)當(dāng)?shù)貢r(shí)間）正式對(duì)外發(fā)布，Sora可以生成長(zhǎng)達(dá)一分鐘的視頻，同時(shí)保持視覺(jué)品質(zhì)并遵循用戶提示。它能夠生成具有多個(gè)角色、特定類型的運(yùn)動(dòng)以及精確的主題和背景細(xì)節(jié)的復(fù)雜場(chǎng)景。除了能夠僅由文本指令生成視頻外

2024-03-01 10:51:51

180

湯姆貓加速布局AI應(yīng)用，接入OpenAI Sora模型，探索生成視頻素材之道

湯姆貓稱，Sora是人工智能不斷演進(jìn)的里程碑之作。類似Sora的各類AI工具能夠助其以更高效率、更低成本創(chuàng)建豐富多樣且用戶體驗(yàn)佳的AI應(yīng)用產(chǎn)品和服務(wù)。

2024-03-04 13:46:40

168

湯姆貓正在推進(jìn)申請(qǐng)接入OpenAI的Sora模型

湯姆貓?jiān)诨?dòng)平臺(tái)上透露，公司正在積極推進(jìn)申請(qǐng)接入OpenAI的Sora模型，并計(jì)劃進(jìn)行相關(guān)素材制作的測(cè)試。目前，湯姆貓尚未正式接入Sora模型。

2024-03-05 10:20:49

217

OpenAI首席技術(shù)官穆拉蒂：Sora今年發(fā)布，音頻生成功能將提升場(chǎng)景呈現(xiàn)

穆拉提還提到，Sora將覆蓋音頻生成領(lǐng)域，以增強(qiáng)應(yīng)用效果；考慮到人工智能生成內(nèi)容有時(shí)不夠精確，OpenAI擬允許用戶自主修改、創(chuàng)建視聽(tīng)內(nèi)容。

2024-03-14 14:17:59

Sora短期不會(huì)向公眾開(kāi)放還處于反饋獲取階段

透露出一絲無(wú)奈，具體可以開(kāi)放的時(shí)間還不能確定。透露出這個(gè)消息的是 Bill Peebles、Tim Brooks 和 Aditya Ramesh，都是 OpenAI 旗下文生視頻模型 Sora

2024-03-14 14:55:08

316

Sora將于今年正式發(fā)布！OpenAI CTO Mira Murati披露Sora未來(lái)

視頻生成模型 Sora 的效果驚艷了全球，從宣布至今，我們時(shí)常能夠看到各種基于 Sora 生成的視頻在互聯(lián)網(wǎng)上流傳，盡管它有一些小瑕疵，但其效果依然引入驚嘆。

2024-03-15 15:22:51

218

OpenAI視頻生成工具Sora將于年內(nèi)正式向公眾推出

OpenAI的首席技術(shù)官M(fèi)ira Murati在近期采訪中透露，公司正計(jì)劃在今年晚些時(shí)候正式向公眾正式推出其視頻生成工具Sora。Murati表示，盡管具體的推出時(shí)間可能需要幾個(gè)月，但OpenAI正在積極準(zhǔn)備，并期待在未來(lái)能夠?yàn)閺V大用戶提供這一創(chuàng)新產(chǎn)品。

2024-03-19 11:41:58

301

云鼎科技：基于盤(pán)古礦山大模型已開(kāi)發(fā)9大專業(yè)63個(gè)應(yīng)用場(chǎng)景

云鼎科技近日宣布，基于盤(pán)古礦山大模型的研發(fā)取得顯著成果。據(jù)悉，公司已成功開(kāi)發(fā)出涵蓋9大專業(yè)領(lǐng)域的63個(gè)應(yīng)用場(chǎng)景，這些場(chǎng)景不僅涉及煤礦的安全生產(chǎn)，還拓展至流程制造的工藝優(yōu)化等多個(gè)方面。目前，這些應(yīng)用場(chǎng)景已在山能集團(tuán)得到廣泛推廣和應(yīng)用驗(yàn)證，實(shí)際效果顯著。

2024-03-21 13:38:43

OpenAI又打出王炸！一句話生成60秒視頻，馬斯克：人類認(rèn)輸吧

電子發(fā)燒友網(wǎng)報(bào)道（文/梁浩斌）在大年初七，春節(jié)假期的尾聲，OpenAI突然發(fā)布的AI文字生成視頻模型Sora被全網(wǎng)刷屏，馬斯克甚至感嘆“gg Humans”（gg是good game的縮寫(xiě)，在競(jìng)技

2024-02-19 09:02:10

3213

已全部加載完成

搜索歷史

OpenAI視頻模型Sora的架構(gòu)及應(yīng)用場(chǎng)景

評(píng)論