国产自产嫩模一二区,伊人成综合亚洲

Stability AI是一家主要以人工智能生成的視覺(jué)效果而聞名的公司，它推出了一個(gè)名為Stable audio的文本到音頻生成人工智能平臺(tái)。

Stable Audio使用擴(kuò)散模型，與該公司更受歡迎的圖像平臺(tái)Stable diffusion的AI模型相同，但使用音頻而非圖像進(jìn)行訓(xùn)練。用戶(hù)可以使用它為任何項(xiàng)目生成歌曲或背景音頻。

音頻擴(kuò)散模型傾向于生成固定長(zhǎng)度的音頻，這對(duì)音樂(lè)制作來(lái)說(shuō)很糟糕，因?yàn)楦枨拈L(zhǎng)度可能不同。Stability AI的新平臺(tái)允許用戶(hù)發(fā)出不同長(zhǎng)度的聲音，要求公司對(duì)音樂(lè)進(jìn)行訓(xùn)練，并在歌曲的開(kāi)始和結(jié)束時(shí)間周?chē)砑游谋驹獢?shù)據(jù)。

同時(shí)，它可以實(shí)現(xiàn)實(shí)時(shí)的音頻生成，無(wú)需等待長(zhǎng)時(shí)間的渲染過(guò)程。Stability AI 宣稱(chēng)，Stable Audio 模型可以在一秒內(nèi)渲染出 95 秒的立體聲音頻，并且只需要一個(gè) NVIDIA A100 GPU。

并且，Stable Audio是一個(gè)開(kāi)源的項(xiàng)目，任何人都可以免費(fèi)使用和修改。Stability AI 希望通過(guò)開(kāi)源的方式促進(jìn) AI 領(lǐng)域的創(chuàng)新和發(fā)展，并讓更多人享受到 AI 技術(shù)帶來(lái)的便利和樂(lè)趣。

該公司在一份聲明中表示：“Stable Audio代表了Stability AI生成音頻研究實(shí)驗(yàn)室Harmonai的尖端音頻生成研究。我們會(huì)繼續(xù)改進(jìn)我們的模型架構(gòu)、數(shù)據(jù)集和訓(xùn)練程序，以提高輸出質(zhì)量、可控性、推理速度和輸出長(zhǎng)度。”

文本到音頻的生成并不是什么新鮮事，因?yàn)樯扇斯ぶ悄茴I(lǐng)域的其他大牌一直在玩弄這個(gè)概念。Meta于8月發(fā)布了AudioCraft，這是一套生成的人工智能模型，有助于根據(jù)提示創(chuàng)建聽(tīng)起來(lái)自然的ERM、聲音和音樂(lè)。到目前為止，它只提供給研究人員和一些音頻專(zhuān)業(yè)人士。谷歌的MusicLM也可以讓人們產(chǎn)生聲音，但只對(duì)研究人員開(kāi)放。

審核編輯：彭菁

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

音頻

音頻

+關(guān)注

關(guān)注
29

文章
2880

瀏覽量
81582
AI

AI

+關(guān)注

關(guān)注
87

文章
30947

瀏覽量
269212
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47314

瀏覽量
238644
模型

模型

+關(guān)注

關(guān)注
1

文章
3248

瀏覽量
48864
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1208

瀏覽量
24713

原文標(biāo)題：Stability AI發(fā)布AI音頻平臺(tái)Stable Audio

文章出處：【微信號(hào)：IEEE_China，微信公眾號(hào)：IEEE電氣電子工程師】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

生成式AI工具作用

生成式AI工具是指那些能夠自動(dòng)生成文本、圖像、音頻、視頻等多種類(lèi)型數(shù)據(jù)的人工智能技術(shù)。在此，petacloud.

發(fā)表于 10-28 11:19 ?244次閱讀

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

幸得一好書(shū)，特此來(lái)分享。感謝平臺(tái)，感謝作者。受益匪淺。在閱讀《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章后，我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)

發(fā)表于 10-14 09:27

AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

很幸運(yùn)社區(qū)給我一個(gè)閱讀此書(shū)的機(jī)會(huì)，感謝平臺(tái)。《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分，為我們揭示了人工

發(fā)表于 10-14 09:21

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

周末收到一本新書(shū)，非常高興，也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。這是一本挺好的書(shū)，包裝精美，內(nèi)容詳實(shí)，干活滿(mǎn)滿(mǎn)。《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》這本書(shū)的第一章，作為整個(gè)著作的開(kāi)篇

發(fā)表于 10-14 09:12

人工智能ai4s試讀申請(qǐng)

目前人工智能在繪畫(huà)對(duì)話(huà)等大模型領(lǐng)域應(yīng)用廣闊，ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題，本書(shū)對(duì)ai4s基本原理和原則，方法進(jìn)行描訴，有利于總結(jié)經(jīng)驗(yàn)，擬

發(fā)表于 09-09 15:36

名單公布！【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

、污染治理、碳減排三個(gè)方面介紹了人工智能為環(huán)境科學(xué)引入的新價(jià)值和新機(jī)遇。第8章探討了AI for Science在快速發(fā)展過(guò)程中面臨的機(jī)遇和挑戰(zhàn)，并對(duì)“平臺(tái)科研”模式進(jìn)行了展望。申請(qǐng)時(shí)間

發(fā)表于 09-09 13:54

Whatsapp正在開(kāi)發(fā)一種新的生成人工智能功能

據(jù)悉，Whatsapp正在開(kāi)發(fā)一種新的生成人工智能功能，該功能應(yīng)允許用戶(hù)制作自己的個(gè)性化頭像，用于任何想象中的場(chǎng)景。WABetaInfo在新的Android版WhatsApp測(cè)試版2.24.14.7

發(fā)表于 07-14 17:50 ?1004次閱讀

Google開(kāi)發(fā)專(zhuān)為視頻生成配樂(lè)的人工智能技術(shù)

近日，科技巨頭Google旗下的人工智能研究實(shí)驗(yàn)室DeepMind宣布了一項(xiàng)引人注目的技術(shù)突破——V2A技術(shù)（Video to Audio），這是一項(xiàng)專(zhuān)為視頻生成配樂(lè)的人工智能技術(shù)。這

發(fā)表于 06-20 11:03 ?513次閱讀

Stability AI發(fā)布Stable Code Instruct 3B大語(yǔ)言模型，可編譯多種編程語(yǔ)言

據(jù)報(bào)道，Stability AI公司近期推出了適配程序員使用的Stable Code Instruct 3B大語(yǔ)言模型，此款模型的顯著特點(diǎn)是能夠?qū)崿F(xiàn)編程語(yǔ)言間的自如切換。

發(fā)表于 03-27 10:04 ?501次閱讀

Stability AI推出全新Stable Video 3D模型

近日，Stability AI 推出了全新的 Stable Video 3D 模型，該模型以其獨(dú)特的功能吸引了眾多關(guān)注。此模型具備從單張圖像中生成

發(fā)表于 03-22 10:30 ?860次閱讀

OpenAI首席技術(shù)官穆拉蒂：Sora今年發(fā)布，音頻生成功能將提升場(chǎng)景呈現(xiàn)

穆拉提還提到，Sora將覆蓋音頻生成領(lǐng)域，以增強(qiáng)應(yīng)用效果；考慮到人工智能生成內(nèi)容有時(shí)不夠精確，OpenAI擬允許用戶(hù)自主修改、創(chuàng)建視聽(tīng)內(nèi)容。

發(fā)表于 03-14 14:17 ?464次閱讀

OpenAI新年開(kāi)出王炸，視頻生成模型Sora問(wèn)世

近日，OpenAI在AI生成視頻領(lǐng)域取得重大突破，發(fā)布了全新的生成式人工智能模型“Sora”。該模型在視頻生成方面展現(xiàn)出了驚人的能力，通過(guò)

發(fā)表于 02-20 11:46 ?815次閱讀

Stability AI試圖通過(guò)新的圖像生成人工智能模型保持領(lǐng)先地位

Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強(qiáng)大，而

發(fā)表于 02-19 16:03 ?949次閱讀

OpenAI發(fā)布文生視頻模型Sora，引領(lǐng)AI視頻生成新紀(jì)元

在人工智能(AI)領(lǐng)域掀起新一輪革命浪潮的，正是OpenAI最新推出的文生視頻大模型——Sora。這款被業(yè)界廣泛贊譽(yù)的模型，以其“逼真”和“富有想象力”的視頻生成能力，徹底顛覆了傳統(tǒng)視

發(fā)表于 02-19 11:03 ?962次閱讀

谷歌發(fā)布Lumiere人工智能文本視頻生成器

隨著近年來(lái)AI應(yīng)用的不斷普及和改進(jìn)，自動(dòng)文本創(chuàng)作系統(tǒng)如ChatGPT已經(jīng)被廣泛接受，成為聊天窗口中的常客。類(lèi)似地，文本到圖畫(huà)生成工具讓人們得

發(fā)表于 01-31 16:45 ?865次閱讀

搜索歷史

Stability AI推出Stable audio的文本到音頻生成人工智能平臺(tái)

評(píng)論

生成式AI工具作用

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

《AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

人工智能ai4s試讀申請(qǐng)

名單公布！【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science：人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

Whatsapp正在開(kāi)發(fā)一種新的生成人工智能功能

Google開(kāi)發(fā)專(zhuān)為視頻生成配樂(lè)的人工智能技術(shù)

Stability AI發(fā)布Stable Code Instruct 3B大語(yǔ)言模型，可編譯多種編程語(yǔ)言

Stability AI推出全新Stable Video 3D模型

OpenAI首席技術(shù)官穆拉蒂：Sora今年發(fā)布，音頻生成功能將提升場(chǎng)景呈現(xiàn)

OpenAI新年開(kāi)出王炸，視頻生成模型Sora問(wèn)世

Stability AI試圖通過(guò)新的圖像生成人工智能模型保持領(lǐng)先地位

OpenAI發(fā)布文生視頻模型Sora，引領(lǐng)AI視頻生成新紀(jì)元

谷歌發(fā)布Lumiere人工智能文本視頻生成器