0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Stability AI推出Stable audio的文本到音頻生成人工智能平臺(tái)

IEEE電氣電子工程師 ? 來(lái)源:IEEE電氣電子工程師 ? 2023-09-20 10:20 ? 次閱讀

Stability AI是一家主要以人工智能生成的視覺(jué)效果而聞名的公司,它推出了一個(gè)名為Stable audio的文本到音頻生成人工智能平臺(tái)。

Stable Audio使用擴(kuò)散模型,與該公司更受歡迎的圖像平臺(tái)Stable diffusion的AI模型相同,但使用音頻而非圖像進(jìn)行訓(xùn)練。用戶(hù)可以使用它為任何項(xiàng)目生成歌曲或背景音頻。

音頻擴(kuò)散模型傾向于生成固定長(zhǎng)度的音頻,這對(duì)音樂(lè)制作來(lái)說(shuō)很糟糕,因?yàn)楦枨拈L(zhǎng)度可能不同。Stability AI的新平臺(tái)允許用戶(hù)發(fā)出不同長(zhǎng)度的聲音,要求公司對(duì)音樂(lè)進(jìn)行訓(xùn)練,并在歌曲的開(kāi)始和結(jié)束時(shí)間周?chē)砑游谋驹獢?shù)據(jù)。

同時(shí),它可以實(shí)現(xiàn)實(shí)時(shí)的音頻生成,無(wú)需等待長(zhǎng)時(shí)間的渲染過(guò)程。Stability AI 宣稱(chēng),Stable Audio 模型可以在一秒內(nèi)渲染出 95 秒的立體聲音頻,并且只需要一個(gè) NVIDIA A100 GPU。

并且,Stable Audio是一個(gè)開(kāi)源的項(xiàng)目,任何人都可以免費(fèi)使用和修改。Stability AI 希望通過(guò)開(kāi)源的方式促進(jìn) AI 領(lǐng)域的創(chuàng)新和發(fā)展,并讓更多人享受到 AI 技術(shù)帶來(lái)的便利和樂(lè)趣。

該公司在一份聲明中表示:“Stable Audio代表了Stability AI生成音頻研究實(shí)驗(yàn)室Harmonai的尖端音頻生成研究。我們會(huì)繼續(xù)改進(jìn)我們的模型架構(gòu)、數(shù)據(jù)集和訓(xùn)練程序,以提高輸出質(zhì)量、可控性、推理速度和輸出長(zhǎng)度。”

文本到音頻的生成并不是什么新鮮事,因?yàn)樯扇斯ぶ悄茴I(lǐng)域的其他大牌一直在玩弄這個(gè)概念。Meta于8月發(fā)布了AudioCraft,這是一套生成的人工智能模型,有助于根據(jù)提示創(chuàng)建聽(tīng)起來(lái)自然的ERM、聲音和音樂(lè)。到目前為止,它只提供給研究人員和一些音頻專(zhuān)業(yè)人士。谷歌的MusicLM也可以讓人們產(chǎn)生聲音,但只對(duì)研究人員開(kāi)放。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 音頻
    +關(guān)注

    關(guān)注

    29

    文章

    2880

    瀏覽量

    81582
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30947

    瀏覽量

    269212
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47314

    瀏覽量

    238644
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3248

    瀏覽量

    48864
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1208

    瀏覽量

    24713

原文標(biāo)題:Stability AI發(fā)布AI音頻平臺(tái)Stable Audio

文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    生成AI工具作用

    生成AI工具是指那些能夠自動(dòng)生成文本、圖像、音頻、視頻等多種類(lèi)型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.
    的頭像 發(fā)表于 10-28 11:19 ?244次閱讀

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書(shū),特此來(lái)分享。感謝平臺(tái),感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書(shū)的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    周末收到一本新書(shū),非常高興,也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。 這是一本挺好的書(shū),包裝精美,內(nèi)容詳實(shí),干活滿(mǎn)滿(mǎn)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》這本書(shū)的第一章,作為整個(gè)著作的開(kāi)篇
    發(fā)表于 10-14 09:12

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫(huà)對(duì)話(huà)等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書(shū)對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬
    發(fā)表于 09-09 15:36

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    、污染治理、碳減排三個(gè)方面介紹了人工智能為環(huán)境科學(xué)引入的新價(jià)值和新機(jī)遇。 第8章探討了AI for Science在快速發(fā)展過(guò)程中面臨的機(jī)遇和挑戰(zhàn),并對(duì)“平臺(tái)科研”模式進(jìn)行了展望。 申請(qǐng)時(shí)間
    發(fā)表于 09-09 13:54

    Whatsapp正在開(kāi)發(fā)一種新的生成人工智能功能

    據(jù)悉,Whatsapp正在開(kāi)發(fā)一種新的生成人工智能功能,該功能應(yīng)允許用戶(hù)制作自己的個(gè)性化頭像,用于任何想象中的場(chǎng)景。WABetaInfo在新的Android版WhatsApp測(cè)試版2.24.14.7
    的頭像 發(fā)表于 07-14 17:50 ?1004次閱讀

    Google開(kāi)發(fā)專(zhuān)為視頻生成配樂(lè)的人工智能技術(shù)

    近日,科技巨頭Google旗下的人工智能研究實(shí)驗(yàn)室DeepMind宣布了一項(xiàng)引人注目的技術(shù)突破——V2A技術(shù)(Video to Audio),這是一項(xiàng)專(zhuān)為視頻生成配樂(lè)的人工智能技術(shù)。這
    的頭像 發(fā)表于 06-20 11:03 ?513次閱讀

    Stability AI發(fā)布Stable Code Instruct 3B大語(yǔ)言模型,可編譯多種編程語(yǔ)言

    據(jù)報(bào)道,Stability AI公司近期推出了適配程序員使用的Stable Code Instruct 3B大語(yǔ)言模型,此款模型的顯著特點(diǎn)是能夠?qū)崿F(xiàn)編程語(yǔ)言間的自如切換。
    的頭像 發(fā)表于 03-27 10:04 ?501次閱讀

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨(dú)特的功能吸引了眾多關(guān)注。此模型具備從單張圖像中生成
    的頭像 發(fā)表于 03-22 10:30 ?860次閱讀

    OpenAI首席技術(shù)官穆拉蒂:Sora今年發(fā)布,音頻生成功能將提升場(chǎng)景呈現(xiàn)

    穆拉提還提到,Sora將覆蓋音頻生成領(lǐng)域,以增強(qiáng)應(yīng)用效果;考慮人工智能生成內(nèi)容有時(shí)不夠精確,OpenAI擬允許用戶(hù)自主修改、創(chuàng)建視聽(tīng)內(nèi)容。
    的頭像 發(fā)表于 03-14 14:17 ?464次閱讀

    OpenAI新年開(kāi)出王炸,視頻生成模型Sora問(wèn)世

    近日,OpenAI在AI生成視頻領(lǐng)域取得重大突破,發(fā)布了全新的生成人工智能模型“Sora”。該模型在視頻生成方面展現(xiàn)出了驚人的能力,通過(guò)
    的頭像 發(fā)表于 02-20 11:46 ?815次閱讀

    Stability AI試圖通過(guò)新的圖像生成人工智能模型保持領(lǐng)先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業(yè)界領(lǐng)先的前身Stable Diffusion更快、更強(qiáng)大,而
    的頭像 發(fā)表于 02-19 16:03 ?949次閱讀
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>試圖通過(guò)新的圖像<b class='flag-5'>生成人工智能</b>模型保持領(lǐng)先地位

    OpenAI發(fā)布文生視頻模型Sora,引領(lǐng)AI頻生成新紀(jì)元

    人工智能(AI)領(lǐng)域掀起新一輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業(yè)界廣泛贊譽(yù)的模型,以其“逼真”和“富有想象力”的視頻生成能力,徹底顛覆了傳統(tǒng)視
    的頭像 發(fā)表于 02-19 11:03 ?962次閱讀

    谷歌發(fā)布Lumiere人工智能文本頻生成

    隨著近年來(lái)AI應(yīng)用的不斷普及和改進(jìn),自動(dòng)文本創(chuàng)作系統(tǒng)如ChatGPT已經(jīng)被廣泛接受,成為聊天窗口中的常客。類(lèi)似地,文本圖畫(huà)生成工具讓人們得
    的頭像 發(fā)表于 01-31 16:45 ?865次閱讀