0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲進(jìn)一步夯實(shí)AGI技術(shù)底座

云知聲 ? 來(lái)源:云知聲 ? 2023-08-31 16:07 ? 次閱讀

Unisound News

2023年8月20號(hào),最后一屆VoxSRC Workshop 在都柏林召開(kāi)。VoxSRC 2023 國(guó)際說(shuō)話(huà)人識(shí)別競(jìng)賽公布比賽榜單,云知聲團(tuán)隊(duì)奪得Track1(固定訓(xùn)練集說(shuō)話(huà)人確認(rèn))第一名、Track2(開(kāi)放訓(xùn)練集說(shuō)話(huà)人確認(rèn))第二名的優(yōu)異成績(jī)。

Track1 & Track2 名次

VoxSRC是由 University of Oxford(牛津大學(xué))、Facebook AI Research(facebook AI研究院)、Google Research(谷歌研究院)等組織聯(lián)合發(fā)起的國(guó)際說(shuō)話(huà)人識(shí)別競(jìng)賽,是在說(shuō)話(huà)人識(shí)別領(lǐng)域最具影響力和權(quán)威性的國(guó)際賽事之一。

VoxSRC 2023測(cè)試集數(shù)據(jù)來(lái)自訪(fǎng)談、新聞、談話(huà)、辯論等多個(gè)場(chǎng)景,包括專(zhuān)業(yè)編輯音頻和隨意的談話(huà)音頻,同時(shí)混雜著笑聲、其他說(shuō)話(huà)人噪聲等復(fù)雜的背景噪音,涉及跨年齡、跨語(yǔ)種說(shuō)話(huà)人識(shí)別,同時(shí)今年的測(cè)試數(shù)據(jù)繼續(xù)加大難度,專(zhuān)注于短語(yǔ)音說(shuō)話(huà)人識(shí)別,音頻時(shí)長(zhǎng)大部分在2-3s區(qū)間,是VoxSRC有史以來(lái)最難的一屆。

在此次競(jìng)賽中,云知聲采用并進(jìn)一步優(yōu)化了當(dāng)前最領(lǐng)先的算法。這些算法包括基于ResNet系列主干網(wǎng)絡(luò),MQMHA pooling,以及融合了Sub-center和inter-topK的Large-margin損失函數(shù)。此外,云知聲還實(shí)施了多階段訓(xùn)練調(diào)優(yōu)策略等技術(shù)。

除此之外,基于對(duì)比賽任務(wù)的深刻理解,云知聲團(tuán)隊(duì)首次提出了Consistency Measure Factor(CMF) 算法,即建模音頻“說(shuō)話(huà)人特征的一致性”,并將其引入說(shuō)話(huà)人相似度決策中,大幅提升了說(shuō)話(huà)人識(shí)別的準(zhǔn)確率。同時(shí),依托云知聲大規(guī)模算力中心,采用大規(guī)模模型訓(xùn)練框架,訓(xùn)練出ResNet314、ResNet518說(shuō)話(huà)人模型。憑借對(duì)“說(shuō)話(huà)人算法”的創(chuàng)新性研發(fā)和超強(qiáng)力的“算力”支持,云知聲團(tuán)隊(duì)在Track1(固定訓(xùn)練集說(shuō)話(huà)人識(shí)別)賽道以minDCF(最小檢測(cè)代價(jià)函數(shù))0.085、EER(等錯(cuò)誤率)1.588%的卓越表現(xiàn),一舉奪得本次大賽冠軍。

Track 1 (Verification fullysupervised, closed)

c1ed45ec-419c-11ee-a2ef-92fbcf53809c.png

Track 2 (Verification fullysupervised, open)

c2025630-419c-11ee-a2ef-92fbcf53809c.png

Track1 & Track2 榜單

值得注意的是,云知聲團(tuán)隊(duì)將Track1(官方固定訓(xùn)練數(shù)據(jù))賽道的結(jié)果,直接提交到Track2(可用任何規(guī)模數(shù)據(jù))賽道,卻依然取得了第二名的優(yōu)異成績(jī),這充分證明了其算法的出眾性和領(lǐng)先性。

云知聲:通過(guò)通用人工智能(AGI)創(chuàng)建互聯(lián)直覺(jué)的世界

c20bd534-419c-11ee-a2ef-92fbcf53809c.png

云知聲AI技術(shù)體系及U+X戰(zhàn)略

作為中國(guó)AGI技術(shù)產(chǎn)業(yè)化的先驅(qū)之一,云知聲于2016年建立了Atlas人工智能基礎(chǔ)設(shè)施,并據(jù)此開(kāi)發(fā)了具有通用能力的專(zhuān)有大模型山海(UniGPT),成為公司技術(shù)平臺(tái)云知大腦(UniBrain)的新核心,與多模態(tài)感知與生成、知識(shí)圖譜、物聯(lián)平臺(tái)等各類(lèi)智能組件相結(jié)合,為云知聲智慧物聯(lián)、智慧醫(yī)療等業(yè)務(wù)提供高效的產(chǎn)品化支撐,推動(dòng)“U(云知大腦)+X(應(yīng)用場(chǎng)景)”戰(zhàn)略落實(shí),踐行公司使命:“通過(guò)通用人工智能(AGI)創(chuàng)建互聯(lián)直覺(jué)的世界”。

說(shuō)話(huà)人識(shí)別技術(shù),作為云知大腦(UniBrain)的重要組件,已在智能家居、車(chē)載、客服等領(lǐng)域廣泛應(yīng)用,包括身份識(shí)別、個(gè)性化服務(wù)、角色分離等。此次奪冠,進(jìn)一步驗(yàn)證了云知聲的AI技術(shù)實(shí)力,也將進(jìn)一步通過(guò)云知大腦提供業(yè)界領(lǐng)先的說(shuō)話(huà)人感知技術(shù)能力,以及更好的人機(jī)交互體驗(yàn)和分析決策能力,夯實(shí)云知聲AGI技術(shù)底座,推動(dòng)山海大模型在各領(lǐng)域的廣泛應(yīng)用,為千行百業(yè)的智慧化升級(jí)注入更強(qiáng)大的AI動(dòng)力。

未來(lái),云知聲將繼續(xù)堅(jiān)定走在技術(shù)研發(fā)的前沿,不斷推動(dòng)其在AGI相關(guān)技術(shù)的研發(fā)突破,為各行各業(yè)帶來(lái)新的增長(zhǎng)范式與無(wú)限可能。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4626

    瀏覽量

    93157
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31399

    瀏覽量

    269787
  • Agi
    Agi
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    10213
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    194

    瀏覽量

    8406

原文標(biāo)題:AGI技術(shù)底座再夯實(shí),云知聲奪冠VoxSRC 2023

文章出處:【微信號(hào):云知聲,微信公眾號(hào):云知聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于山海大模型的多元智慧場(chǎng)景

    陳吉?jiǎng)俅黼p方簽約。 ? ? 雙方代表簽約 ? 英內(nèi)物聯(lián)董事長(zhǎng)李仲卿在致辭中表示,期待雙方以此次合作為起點(diǎn),共同探索多元化的智慧應(yīng)用場(chǎng)景,進(jìn)一步深化技術(shù)與業(yè)務(wù)的融合,攜手促進(jìn)科技創(chuàng)新與升級(jí)。未來(lái),無(wú)論是技術(shù)創(chuàng)新、業(yè)務(wù)拓
    的頭像 發(fā)表于 12-06 20:05 ?904次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>與英內(nèi)物聯(lián)簽署戰(zhàn)略合作協(xié)議 探索基于<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>山海大模型的多元智慧場(chǎng)景

    與國(guó)信領(lǐng)英簽署戰(zhàn)略合作協(xié)議

    智能科技股份有限公司(以下簡(jiǎn)稱(chēng)“”)與蘇州國(guó)信領(lǐng)英教育科技有限公司(以下簡(jiǎn)稱(chēng)“國(guó)信領(lǐng)
    的頭像 發(fā)表于 10-12 14:16 ?391次閱讀

    通過(guò)展頻進(jìn)一步優(yōu)化EMI

    電子發(fā)燒友網(wǎng)站提供《通過(guò)展頻進(jìn)一步優(yōu)化EMI.pdf》資料免費(fèi)下載
    發(fā)表于 09-04 09:32 ?1次下載
    通過(guò)展頻<b class='flag-5'>進(jìn)一步</b>優(yōu)化EMI

    西門(mén)子與微軟進(jìn)一步擴(kuò)展戰(zhàn)略合作關(guān)系

    近日,西門(mén)子數(shù)字化工業(yè)軟件與微軟宣布進(jìn)一步擴(kuò)展雙方的戰(zhàn)略合作關(guān)系。通過(guò)微軟Azure服務(wù),西門(mén)子正式推出Xcelerator as a Service工業(yè)軟件解決方案,為客戶(hù)提供更靈活、高效的服務(wù)體驗(yàn)。
    的頭像 發(fā)表于 05-21 10:47 ?710次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    引入英偉達(dá)機(jī)密計(jì)算技術(shù),在不影響性能的情況下,增強(qiáng)了大規(guī)模實(shí)時(shí)s生成式人工智能推理的安全性。該架構(gòu)還具有新的解壓縮引擎和用于人工智能預(yù)防性維護(hù)的可靠性引擎,有助于診斷并預(yù)測(cè)潛在的可靠性問(wèn)題,進(jìn)一步鞏固
    發(fā)表于 05-13 17:16

    攜手耘途教育成立學(xué)院福建分院

    近日,與耘途教育攜手,共同成立了學(xué)院福建分院,此舉標(biāo)志著雙方在智慧教育領(lǐng)域展開(kāi)了深度合作。根據(jù)合作協(xié)議,
    的頭像 發(fā)表于 05-13 10:38 ?457次閱讀

    攜手耘途教育成立學(xué)院福建分院,探索智慧教育新思路

    近日,與耘途教育聯(lián)合成立學(xué)院福建分院,深入探索智慧教育新模式、新思路。
    的頭像 發(fā)表于 05-11 15:52 ?574次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>攜手耘途教育成立<b class='flag-5'>云</b><b class='flag-5'>知</b>學(xué)院福建分院,探索智慧教育新思路

    卓馭科技與高通合作宣布進(jìn)一步推動(dòng)汽車(chē)行業(yè)智能駕駛技術(shù)的發(fā)展

    今日,深圳市卓馭科技有限公司(以下簡(jiǎn)稱(chēng):卓馭科技)與高通技術(shù)公司宣布擴(kuò)展雙方的技術(shù)合作,利用基于Snapdragon Ride平臺(tái)的全新智能駕駛產(chǎn)品,進(jìn)一步推動(dòng)汽車(chē)行業(yè)智能駕駛技術(shù)的發(fā)
    的頭像 發(fā)表于 04-25 16:25 ?1769次閱讀
    卓馭科技與高通合作宣布<b class='flag-5'>進(jìn)一步</b>推動(dòng)汽車(chē)行業(yè)智能駕駛<b class='flag-5'>技術(shù)</b>的發(fā)展

    Cognizant 將延續(xù)與 Pon IT 的合作,旨在進(jìn)一步管理和優(yōu)化服務(wù)

    得以繼續(xù)為 Pon IT 旗下各家運(yùn)營(yíng)公司提供平臺(tái)托管服務(wù)。在下階段的合作中,Cognizant 將繼續(xù)實(shí)施進(jìn)一步的優(yōu)化措施,旨在使 Pon IT 從
    的頭像 發(fā)表于 03-27 22:49 ?332次閱讀

    攜山海大模型再赴港IPO

    智能科技股份有限公司(簡(jiǎn)稱(chēng)“”)于3月15日更新了招股書(shū),繼續(xù)其在港交所主板上市的步
    的頭像 發(fā)表于 03-22 14:51 ?749次閱讀

    推進(jìn)港交所主板上市進(jìn)程

    近日,智能科技股份有限公司(以下簡(jiǎn)稱(chēng)“”)再次更新招股書(shū),繼續(xù)其在港交所主板上市的征
    的頭像 發(fā)表于 03-22 14:45 ?1086次閱讀

    再闖港股IPO

    近日,備受矚目的智能科技股份有限公司(以下簡(jiǎn)稱(chēng))再次更新了其招股書(shū),繼續(xù)穩(wěn)步推進(jìn)其在
    的頭像 發(fā)表于 03-22 14:42 ?737次閱讀

    推進(jìn)港股IPO!AI解決方案收入排名中國(guó)第四,2023年?duì)I收破7億

    于2012年,當(dāng)時(shí)國(guó)內(nèi)的AI產(chǎn)業(yè)剛剛萌芽,它率先開(kāi)啟AGI技術(shù)商業(yè)化。在成立僅三個(gè)月后,便發(fā)布了語(yǔ)音識(shí)別公有
    的頭像 發(fā)表于 03-22 00:12 ?3633次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>推進(jìn)港股IPO!AI解決方案收入排名中國(guó)第四,2023年?duì)I收破7億

    再闖港股IPO,深耕AI領(lǐng)域

    近日,智能科技股份有限公司(簡(jiǎn)稱(chēng):)正式向港交所遞交了招股書(shū),計(jì)劃主板IPO上市。這
    的頭像 發(fā)表于 03-19 15:36 ?868次閱讀

    材料價(jià)格進(jìn)一步下降,盈利觸底 鋰電材料企業(yè)如何應(yīng)對(duì)?

    在上游原料價(jià)格相對(duì)穩(wěn)定、終端銷(xiāo)量有所好轉(zhuǎn)的情況下,季度四大鋰電主材價(jià)格卻出現(xiàn)進(jìn)一步下跌。
    的頭像 發(fā)表于 03-01 10:25 ?1101次閱讀