4月17日,昆侖萬維公司公布了天工3.0大模型的優(yōu)異性能,同時啟動了天工SkyMusic音樂大模型的公益試用。
天工3.0擁有4000億參數(shù),超越Grok-1的3140億參數(shù),成為全球最大的開源MoE大模型。該模型在語義理解、邏輯推理、通用性、泛化性、不確定性知識以及學(xué)習(xí)能力等方面均有顯著提升,數(shù)學(xué)/推理/代碼/文創(chuàng)能力提高超過30%。此外,天工3.0還新增了多輪搜索與綜合工具調(diào)用、圖表繪制、研究模式、增強模式、改圖擴圖等AI功能。
天工SkyMusic音樂大模型也于同日開啟公益試用。昆侖萬維表示,天工SkyMusic在人聲&BGM音質(zhì)、人聲自然度、發(fā)音可懂度等方面明顯優(yōu)于競爭對手,綜合性能超越Suno V3,成為音樂大模型中的最高水準(zhǔn)。
天工SkyMusic采用音樂音頻領(lǐng)域類Sora模型架構(gòu),Large-scale Transformer負責(zé)譜曲,學(xué)習(xí)Music Patches的上下文依賴關(guān)系,實現(xiàn)音樂可控性;而Diffusion Transformer則負責(zé)演唱,通過LDM將Music Patches還原為高質(zhì)量音頻,支持生成80秒44100Hz采樣率雙聲道立體聲歌曲。
據(jù)悉,天工SkyMusic具有以下特色:
1. 高質(zhì)量AI音樂:生成80秒44100Hz采樣率雙聲道立體聲AI歌曲
2. 人聲“以假亂真”:中文發(fā)音清晰無異響
3. 歌詞段落控制:歌曲能明確區(qū)分不同段落的情感變化
4. 多種音樂風(fēng)格:支持說唱/民謠/放克/古風(fēng)/電子等
5. 音樂智能表達:學(xué)習(xí)顫音、歌劇、吟唱、男女對唱等歌唱技巧
6. 參考音樂生成:用戶上傳參考音樂,生成相似風(fēng)格和唱腔的歌曲
7. 方言歌曲生成:支持粵語、成都話、北京話等眾多方言
-
開源
+關(guān)注
關(guān)注
3文章
3398瀏覽量
42668 -
LDM
+關(guān)注
關(guān)注
0文章
6瀏覽量
10661 -
大模型
+關(guān)注
關(guān)注
2文章
2544瀏覽量
3060 -
昆侖萬維
+關(guān)注
關(guān)注
0文章
17瀏覽量
20
發(fā)布評論請先 登錄
相關(guān)推薦
評論