0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

階躍星辰發(fā)布國(guó)內(nèi)首個(gè)千億參數(shù)端到端語(yǔ)音大模型

科技綠洲 ? 來(lái)源:網(wǎng)絡(luò)整理 ? 作者:網(wǎng)絡(luò)整理 ? 2024-12-17 13:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,階躍星辰在官方公眾號(hào)上宣布了一項(xiàng)重大突破——推出Step-1o千億參數(shù)端到端語(yǔ)音大模型。該模型被譽(yù)為“國(guó)內(nèi)首個(gè)千億參數(shù)端到端語(yǔ)音大模型”,標(biāo)志著我國(guó)在語(yǔ)音技術(shù)領(lǐng)域取得了新的里程碑。

據(jù)階躍星辰介紹,傳統(tǒng)的語(yǔ)音模型通常采用級(jí)聯(lián)方案,即先將用戶輸入的語(yǔ)音信息轉(zhuǎn)化為文本,再進(jìn)行二次轉(zhuǎn)化以生成語(yǔ)音輸出。這種方案不僅過(guò)程繁瑣,降低了傳輸效率,而且在轉(zhuǎn)化過(guò)程中容易折損掉包括情緒在內(nèi)的關(guān)鍵信息。這導(dǎo)致傳統(tǒng)語(yǔ)音模型存在時(shí)延長(zhǎng)、反應(yīng)慢、回答質(zhì)量和智能水平不足,以及情感表達(dá)空洞刻板等缺陷。

而階躍星辰推出的Step-1o模型則采用了端到端的語(yǔ)音方案,實(shí)現(xiàn)了語(yǔ)音理解和生成的一體化。這一創(chuàng)新設(shè)計(jì)不僅提升了模型的智商上限,還使其能夠更好地理解和表達(dá)情感,從而克服了傳統(tǒng)語(yǔ)音模型的諸多缺陷。

Step-1o千億參數(shù)端到端語(yǔ)音大模型的發(fā)布,不僅展示了階躍星辰在語(yǔ)音技術(shù)領(lǐng)域的深厚實(shí)力,也為我國(guó)語(yǔ)音技術(shù)的發(fā)展注入了新的活力。未來(lái),隨著該模型的不斷優(yōu)化和應(yīng)用推廣,相信將為用戶帶來(lái)更加智能、高效和自然的語(yǔ)音交互體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28601
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3131

    瀏覽量

    4044
收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    為什么自動(dòng)駕駛模型有黑盒特性?

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)落地,(End-to-End)大模型也成為行業(yè)研究與應(yīng)用的熱門(mén)方向。相較于傳統(tǒng)自動(dòng)駕駛系統(tǒng)中的模塊化結(jié)構(gòu),
    的頭像 發(fā)表于 07-04 16:50 ?193次閱讀
    為什么自動(dòng)駕駛<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大<b class='flag-5'>模型</b>有黑盒特性?

    德賽西威與面壁智能發(fā)布側(cè)大模型語(yǔ)音交互方案

    日前,全球領(lǐng)先的移動(dòng)出行科技公司德賽西威與側(cè)大模型技術(shù)領(lǐng)軍企業(yè)面壁智能共同發(fā)布業(yè)界首個(gè)基于高通座艙平臺(tái)(SA8255P,簡(jiǎn)稱8255)的
    的頭像 發(fā)表于 05-14 17:40 ?625次閱讀

    Momenta飛輪大模型開(kāi)啟智能輔助駕駛行車(chē)體驗(yàn)

    面對(duì)橋底迷宮下連續(xù)繞障左轉(zhuǎn)的場(chǎng)景,遭遇極窄夾縫、橋墩障礙物等復(fù)雜等路況,Momenta飛輪大模型以管家級(jí)智能輔助駕駛,無(wú)憂守護(hù)用戶的每一段旅程,將緊張時(shí)刻轉(zhuǎn)化為安全、安心的體驗(yàn),
    的頭像 發(fā)表于 05-14 14:37 ?435次閱讀

    一文帶你厘清自動(dòng)駕駛架構(gòu)差異

    [首發(fā)于智駕最前沿微信公眾號(hào)]隨著自動(dòng)駕駛技術(shù)飛速發(fā)展,智能駕駛系統(tǒng)的設(shè)計(jì)思路也經(jīng)歷了從傳統(tǒng)模塊化架構(gòu)模型轉(zhuǎn)變。傳統(tǒng)模塊化架構(gòu)將感
    的頭像 發(fā)表于 05-08 09:07 ?276次閱讀
    一文帶你厘清自動(dòng)駕駛<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>架構(gòu)差異

    自動(dòng)駕駛中基于規(guī)則的決策和模型有何區(qū)別?

    在自動(dòng)駕駛架構(gòu)的選擇上,也經(jīng)歷了從感知、決策控制、執(zhí)行的三段式架構(gòu)到現(xiàn)在火熱的模型,尤其是在2024年特斯拉推出FSD V12后,各車(chē)企更是陸續(xù)推出自家的
    的頭像 發(fā)表于 04-13 09:38 ?2880次閱讀
    自動(dòng)駕駛中基于規(guī)則的決策和<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>大<b class='flag-5'>模型</b>有何區(qū)別?

    階躍星辰開(kāi)源多模態(tài)模型,天數(shù)智芯迅速適配

    近日,頭部大模型創(chuàng)業(yè)公司階躍星辰在行業(yè)內(nèi)引起了軒然大波,宣布正式開(kāi)源兩款Step系列多模態(tài)模型——Step-Video-T2V視頻生成模型
    的頭像 發(fā)表于 02-19 14:30 ?508次閱讀

    靈初智能發(fā)布具身模型Psi R0,實(shí)現(xiàn)復(fù)雜操作與泛化能力

    近日,靈初智能在人工智能領(lǐng)域取得了重大突破,成功發(fā)布首個(gè)基于強(qiáng)化學(xué)習(xí)(RL)的具身模型
    的頭像 發(fā)表于 12-31 15:31 ?649次閱讀

    準(zhǔn)確性超Moshi和GLM-4-Voice,語(yǔ)音雙工模型Freeze-Omni

    GPT-4o 提供的全雙工語(yǔ)音對(duì)話帶來(lái)了一股研究熱潮,目前諸多工作開(kāi)始研究如何利用 LLM 來(lái)實(shí)現(xiàn)語(yǔ)音
    的頭像 發(fā)表于 12-17 10:21 ?914次閱讀
    準(zhǔn)確性超Moshi和GLM-4-Voice,<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>語(yǔ)音</b>雙工<b class='flag-5'>模型</b>Freeze-Omni

    訊飛星火側(cè)模型發(fā)布

    參數(shù)量小、內(nèi)存占比小的側(cè)模型,正成為“兵家必爭(zhēng)之地”。
    的頭像 發(fā)表于 12-04 16:07 ?1359次閱讀

    黑芝麻智能算法參考模型公布

    黑芝麻智能計(jì)劃推出支持華山及武當(dāng)系列芯片的算法參考方案。該方案采用One Model架構(gòu),并在決策規(guī)劃單元引入了VLM視覺(jué)語(yǔ)言大模型和PRR行車(chē)規(guī)則的概率化表征子模塊,進(jìn)一步提升
    的頭像 發(fā)表于 12-03 12:30 ?912次閱讀
    黑芝麻智能<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>算法參考<b class='flag-5'>模型</b>公布

    連接視覺(jué)語(yǔ)言大模型自動(dòng)駕駛

    自動(dòng)駕駛在大規(guī)模駕駛數(shù)據(jù)上訓(xùn)練,展現(xiàn)出很強(qiáng)的決策規(guī)劃能力,但是面對(duì)復(fù)雜罕見(jiàn)的駕駛場(chǎng)景,依然存在局限性,這是因?yàn)?b class='flag-5'>端
    的頭像 發(fā)表于 11-07 15:15 ?691次閱讀
    連接視覺(jué)語(yǔ)言大<b class='flag-5'>模型</b>與<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自動(dòng)駕駛

    InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

    的,這需要大量的計(jì)算資源和高速數(shù)據(jù)傳輸網(wǎng)絡(luò)。InfiniBand(IB)網(wǎng)絡(luò)作為高性能計(jì)算和AI模型訓(xùn)練的理想選擇,發(fā)揮著重要作用。在本文中,我們將深入探討大型語(yǔ)言
    的頭像 發(fā)表于 10-23 11:26 ?1771次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

    智駕進(jìn)程發(fā)力?小鵬、蔚來(lái)模型上車(chē)

    編者語(yǔ): 「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù): C-0546 ,獲取本文參考文檔:小鵬、蔚來(lái)模型上車(chē),智駕拐點(diǎn)加速到來(lái)?pdf下載方式。 近年來(lái),全球汽車(chē)行業(yè)正處于從傳統(tǒng)燃油車(chē)向電
    的頭像 發(fā)表于 09-26 09:19 ?631次閱讀
    智駕進(jìn)程發(fā)力?小鵬、蔚來(lái)<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>模型</b>上車(chē)

    測(cè)試用例怎么寫(xiě)

    編寫(xiě)測(cè)試用例是確保軟件系統(tǒng)從頭到尾能夠正常工作的關(guān)鍵步驟。以下是一個(gè)詳細(xì)的指南,介紹如何編寫(xiě)
    的頭像 發(fā)表于 09-20 10:29 ?958次閱讀

    實(shí)現(xiàn)自動(dòng)駕駛,唯有?

    ,去年行業(yè)主流方案還是輕高精地圖城區(qū)智駕,今年大家的目標(biāo)都瞄到了(End-to-End, E2E)。
    的頭像 發(fā)表于 08-12 09:14 ?1506次閱讀
    實(shí)現(xiàn)自動(dòng)駕駛,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品