0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì) 獲嬰兒啼哭聲識(shí)別的挑戰(zhàn)賽任務(wù)第一名

小米公司 ? 來(lái)源:小米公司 ? 作者:小米公司 ? 2020-11-13 10:28 ? 次閱讀

對(duì)嬰兒來(lái)說(shuō),啼哭聲是一種通訊的方式,一個(gè)非常有限、但類(lèi)似成年人進(jìn)行交流的方式。它也是一種生物報(bào)警器,向外界傳達(dá)著嬰兒生理和心理的需求。 基于啼哭聲聲波攜帶的信息,嬰兒的身體狀況才能被確定,疾病才能被檢測(cè)出來(lái)。因此,有效辨識(shí)啼哭聲,成功地將嬰兒啼哭聲“翻譯”成“成人語(yǔ)言”,讓成年人讀懂啼哭聲的含義,有重大的實(shí)際意義。 2020 iFLYTEK A.I.開(kāi)發(fā)者大賽中,有一項(xiàng)關(guān)于嬰兒啼哭聲識(shí)別的挑戰(zhàn)賽任務(wù)。本次競(jìng)賽總共吸引了678只隊(duì)伍參賽,分別來(lái)自國(guó)內(nèi)不同的公司和高校。最終小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì)以0.99123分的高分奪得第一名。

比賽的訓(xùn)練數(shù)據(jù)集包含了awake(蘇醒)、diaper(換尿布)、hug(要抱抱)、hungry(饑餓)、sleepy(困乏)和uncomfortable(不舒服)六類(lèi)哭聲,并且人工添加了來(lái)自Noisex-92標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)的噪聲。 這項(xiàng)任務(wù)旨在判別嬰兒啼哭聲所傳遞的信息,需要分別在簡(jiǎn)單噪聲環(huán)境和復(fù)雜噪聲環(huán)境下對(duì)嬰兒啼哭進(jìn)行識(shí)別,判斷容易引起混淆的啼哭聲,分析各類(lèi)啼哭聲的明顯特征及簡(jiǎn)單直接的判別方式。 初賽訓(xùn)練數(shù)據(jù)包含918條音頻,測(cè)試集包含228條。復(fù)賽賽方提供了添加不同噪聲的30294條訓(xùn)練數(shù)據(jù),需對(duì)7524條測(cè)試音頻進(jìn)行識(shí)別。

嬰兒啼哭比賽背后的技術(shù)原理 小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì)借鑒說(shuō)話(huà)人確認(rèn)的方法,訓(xùn)練網(wǎng)絡(luò)使得vector的余弦距在離類(lèi)間間距拉大而類(lèi)內(nèi)間距減小。 在模型的訓(xùn)練過(guò)程中,首先使用VAD算法對(duì)嬰兒啼哭音頻中的靜音部分進(jìn)行剔除。去除靜音后隨機(jī)選取160幀,不足160幀的語(yǔ)音采用Cycle Padding方式,利用中間特征進(jìn)行循環(huán)填充,相比與傳統(tǒng)的補(bǔ)0或用尾部填充的方式,特征更加豐富。 模型采用3 層 LSTM+256Dense 層,每層節(jié)點(diǎn)為 512。初賽訓(xùn)練集中的所有純凈語(yǔ)音均看作 enroll 語(yǔ)料,所有訓(xùn)練集中每個(gè)類(lèi)別的 embedding 由該類(lèi)別中的所有語(yǔ)音過(guò)模型求整體平均得到。測(cè)試集中的每條語(yǔ)音過(guò)模型后得到的 embedding與 enroll 中的每類(lèi) embedding 求余弦距離,分?jǐn)?shù)對(duì)應(yīng)最高的類(lèi)別為預(yù)測(cè)類(lèi)別。 訓(xùn)練策略為:首先迭代第一個(gè) 5000 次,學(xué)習(xí)率設(shè)置為 1e-3,第二次加載預(yù)訓(xùn)練模型(mAp 分?jǐn)?shù)高的),調(diào)整學(xué)習(xí)率,再迭代 5000 次,最終交叉加載預(yù)訓(xùn)練模型在不同的 part 上訓(xùn)練。

模型的選擇和推理過(guò)程分為以下4個(gè)步驟:

測(cè)試集統(tǒng)計(jì)分析:首先統(tǒng)計(jì)測(cè)試集語(yǔ)音的信噪比、時(shí)長(zhǎng)、靜音占比及語(yǔ)音相似度。通過(guò)對(duì)比分析,對(duì)相似數(shù)據(jù)進(jìn)行歸類(lèi),選取最高信噪比數(shù)據(jù)進(jìn)行預(yù)測(cè)。

模型選擇:在 5 個(gè)訓(xùn)練集上分別擇優(yōu)選取 2 個(gè)模型作為備用。

推理:計(jì)算測(cè)試語(yǔ)料經(jīng)模型推理得到的vector 與每類(lèi)哭聲embedding間的余弦距離,取分?jǐn)?shù)最高的對(duì)應(yīng)類(lèi)為備選結(jié)果。

投票:根據(jù)單個(gè)模型預(yù)測(cè)的結(jié)果投票得到最終結(jié)果。

聲學(xué)感知技術(shù)未來(lái)將如何發(fā)展? 當(dāng)前主流的聲學(xué)感知技術(shù)使用的是強(qiáng)監(jiān)督的深度學(xué)習(xí)方法,隨著數(shù)據(jù)量的增大和技術(shù)的發(fā)展,未來(lái)監(jiān)督學(xué)習(xí)的方法將逐漸過(guò)度為半監(jiān)督甚至無(wú)監(jiān)督學(xué)習(xí)。其中半監(jiān)督學(xué)習(xí)正是當(dāng)前聲音事件檢測(cè)技術(shù)的研究重點(diǎn)。 不僅如此,深度學(xué)習(xí)的網(wǎng)絡(luò)模型也從人工專(zhuān)家設(shè)計(jì)逐漸轉(zhuǎn)變?yōu)樽詣?dòng)搜索架構(gòu),而元學(xué)習(xí)等小樣本學(xué)習(xí)方法也開(kāi)始逐步應(yīng)用在聲學(xué)感知方向。 嬰兒哭聲分析只是聲學(xué)感知技術(shù)的其中一個(gè)應(yīng)用。當(dāng)前的聲音場(chǎng)景分類(lèi)和聲音事件檢測(cè)技術(shù)已能在設(shè)備端上實(shí)時(shí)分析當(dāng)前用戶(hù)所處的場(chǎng)景和識(shí)別出各式各樣的聲音,如貓狗寵物叫聲、警報(bào)聲、汽車(chē)?guó)Q笛聲等。

不僅如此,聲學(xué)感知技術(shù)還能分析出一些連人耳也無(wú)法聽(tīng)出的聲音,如本次競(jìng)賽的嬰兒啼哭意圖,以及應(yīng)用在工業(yè)上,通過(guò)分析機(jī)器發(fā)出的聲音來(lái)判斷機(jī)器保養(yǎng)狀態(tài)的聲學(xué)分析技術(shù)。聲音作為一種最常見(jiàn)的傳感媒介之一,聲音感知技術(shù)在智能家庭、自動(dòng)駕駛、智能工業(yè)化等領(lǐng)域都有廣泛的應(yīng)用場(chǎng)景。 手機(jī)xAIoT小米AI全力打造小米智能家居 隨著小米最新的手機(jī)xAIoT戰(zhàn)略,智能家居環(huán)境是手機(jī)設(shè)備與全部智能家居設(shè)備聯(lián)動(dòng)最全面的使用場(chǎng)景。手機(jī)、TWS耳機(jī)和越來(lái)越多的智能家居設(shè)備比如智能音箱、智能電視、米家IoT設(shè)備等都具有麥克風(fēng)拾音功能。 我們獲得了足夠多場(chǎng)景下的聲音數(shù)據(jù)時(shí),構(gòu)建基于設(shè)備端的場(chǎng)景感知、事件感知、人體感知和空間感知能力成為了可能。 依賴(lài)于全球第一的AIoT平臺(tái),小米可以實(shí)現(xiàn)對(duì)家中每一個(gè)角落無(wú)處不在的感知能力,并完成手機(jī)端事件提醒與多事件時(shí)間線(xiàn)回溯,聲學(xué)作為智能感知的一種手段,在未來(lái)與UWB技術(shù)、視覺(jué)圖像技術(shù)相結(jié)合,相互取長(zhǎng)補(bǔ)短將成為主流的趨勢(shì)。

責(zé)任編輯:xj

原文標(biāo)題:小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì)榮獲2020 iFLYTEK A.I.開(kāi)發(fā)者大賽嬰兒啼哭聲識(shí)別挑戰(zhàn)賽冠軍

文章出處:【微信公眾號(hào):小米公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31028

    瀏覽量

    269371
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    10

    文章

    786

    瀏覽量

    48805
  • 小米
    +關(guān)注

    關(guān)注

    70

    文章

    14363

    瀏覽量

    144368

原文標(biāo)題:小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì)榮獲2020 iFLYTEK A.I.開(kāi)發(fā)者大賽嬰兒啼哭聲識(shí)別挑戰(zhàn)賽冠軍

文章出處:【微信號(hào):xiaomigongsi0406,微信公眾號(hào):小米公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    達(dá)實(shí)再度榮獲十大出入口控制品牌第一名

    近日,被譽(yù)為智能建筑行業(yè)“奧斯卡”的中國(guó)智能建筑品牌獎(jiǎng)?lì)C獎(jiǎng)典禮于廣州盛大舉行。達(dá)實(shí)智能子公司——深圳達(dá)實(shí)物聯(lián)網(wǎng)技術(shù)有限公司 連續(xù)14年 “十大出入口控制品牌第一名”榮譽(yù),與此同時(shí)還攬“2024年優(yōu)秀AIoT智控平臺(tái)品牌”等兩
    的頭像 發(fā)表于 12-11 10:23 ?235次閱讀

    蔚來(lái)獲得CACSI車(chē)型滿(mǎn)意度和售后服務(wù)滿(mǎn)意度第一名

    近日,由中國(guó)質(zhì)量協(xié)會(huì)發(fā)布的2024年中國(guó)新能源汽車(chē)用戶(hù)滿(mǎn)意度測(cè)評(píng)結(jié)果(CACSI)出爐。蔚來(lái)ET5T榮獲純電動(dòng)中型轎車(chē)滿(mǎn)意度第一名,蔚來(lái)品牌榮獲售后服務(wù)滿(mǎn)意度第一名。蔚來(lái)已連續(xù)兩年獲得CACSI車(chē)型滿(mǎn)意度和售后服務(wù)滿(mǎn)意度第一名
    的頭像 發(fā)表于 12-06 17:19 ?848次閱讀

    理想L6和理想L8榮獲中國(guó)新能源汽車(chē)用戶(hù)滿(mǎn)意度測(cè)評(píng)第一名

    近日,中國(guó)質(zhì)量協(xié)會(huì)發(fā)布2024年中國(guó)新能源汽車(chē)行業(yè)用戶(hù)滿(mǎn)意度測(cè)評(píng)(NEV-CACSI)結(jié)果,理想L62024年市場(chǎng)關(guān)注新車(chē)(SUV) 第一名,理想L8也成為混動(dòng)中大型SUV第一名。雙雙登頂,證明著
    的頭像 發(fā)表于 12-05 14:00 ?409次閱讀

    小米與聚飛光電成立聯(lián)合實(shí)驗(yàn)室

    近日,“小米&聚飛聯(lián)合實(shí)驗(yàn)室”在惠州聚飛正式揭牌成立。該實(shí)驗(yàn)室將以Mini背光技術(shù)創(chuàng)新為主要方向,進(jìn)步強(qiáng)化雙方在顯示終端領(lǐng)域的多元化合作。
    的頭像 發(fā)表于 11-27 10:45 ?199次閱讀

    TüV萊茵授予聯(lián)想合作實(shí)驗(yàn)室資質(zhì)

    聯(lián)想(北京)有限公司近日迎來(lái)重要里程碑,其聲學(xué)實(shí)驗(yàn)室與安規(guī)實(shí)驗(yàn)室成功獲得德國(guó)萊茵TüV大中華區(qū)頒發(fā)的合作實(shí)驗(yàn)室資質(zhì)證書(shū)。這殊榮不僅標(biāo)志著聯(lián)
    的頭像 發(fā)表于 09-20 18:23 ?956次閱讀

    NVIDIA為AI城市挑戰(zhàn)賽構(gòu)建合成數(shù)據(jù)集

    一年一度的 AI 城市挑戰(zhàn)賽中,來(lái)自世界各地的數(shù)百支參賽隊(duì)伍在 NVIDIA Omniverse 生成的基于物理學(xué)的數(shù)據(jù)集上測(cè)試了他們的 AI 模型。
    的頭像 發(fā)表于 09-09 10:04 ?495次閱讀

    軟通動(dòng)力榮獲2023年中國(guó)IT服務(wù)市場(chǎng)第一名

    近日,迪顧問(wèn)最新發(fā)布《2023-2024年中國(guó)IT服務(wù)市場(chǎng)研究年度報(bào)告》。報(bào)告中,軟通動(dòng)力憑借在數(shù)字化轉(zhuǎn)型浪潮中卓越的數(shù)字化能力和表現(xiàn),持續(xù)領(lǐng)跑IT服務(wù)市場(chǎng),位列2023年中國(guó)IT服務(wù)市場(chǎng)第一名
    的頭像 發(fā)表于 07-31 10:18 ?460次閱讀

    潤(rùn)和軟件連續(xù)四年蟬聯(lián)數(shù)字業(yè)務(wù)類(lèi)解決方案市場(chǎng)第一名

    ,連續(xù)四年蟬聯(lián)數(shù)字業(yè)務(wù)類(lèi)解決方案市場(chǎng)第一名。在細(xì)分領(lǐng)域:數(shù)字信貸系統(tǒng)解決方案子市場(chǎng)持續(xù)保持第一名,數(shù)字銀行解決方案子市場(chǎng)穩(wěn)居第二,開(kāi)放銀行解決方案子市場(chǎng)上升至第三。 ? 數(shù)字業(yè)務(wù)類(lèi)
    的頭像 發(fā)表于 07-31 10:10 ?601次閱讀

    MediaTek與小米集團(tuán)聯(lián)合實(shí)驗(yàn)室正式揭幕

    MediaTek 宣布攜手小米集團(tuán)持續(xù)強(qiáng)化戰(zhàn)略合作,共同開(kāi)啟更深層次的多元合作,并為位于小米深圳研發(fā)總部的「聯(lián)合實(shí)驗(yàn)室」揭牌。此次「聯(lián)合實(shí)驗(yàn)室」的揭幕將進(jìn)
    的頭像 發(fā)表于 07-03 14:52 ?715次閱讀

    浪潮信息CVPR2024自動(dòng)駕駛挑戰(zhàn)賽"Occupancy& Flow"冠軍

    北京2024年6月25日 /美通社/ -- 近日,在全球權(quán)威的CVPR 2024自動(dòng)駕駛國(guó)際挑戰(zhàn)賽(Autonomous Grand Challenge)中,浪潮信息AI團(tuán)隊(duì)所提交的"F-OCC
    的頭像 發(fā)表于 06-25 20:29 ?386次閱讀
    浪潮信息<b class='flag-5'>獲</b>CVPR2024自動(dòng)駕駛<b class='flag-5'>挑戰(zhàn)賽</b>&quot;Occupancy&amp; Flow&quot;冠軍

    基于Tiny AI技術(shù)的嬰兒哭聲事件離線(xiàn)檢測(cè)方案

    基于Tiny AI技術(shù)的嬰兒哭聲事件離線(xiàn)檢測(cè)模型,基于A(yíng)rm Cortex/Risc V微處理器開(kāi)發(fā),芯片資源占用極少,有極高的準(zhǔn)確率和極低的誤識(shí)別率。
    的頭像 發(fā)表于 06-17 15:25 ?773次閱讀

    基于深度神經(jīng)網(wǎng)絡(luò)的嬰兒哭聲識(shí)別算法

    具體的軟硬件實(shí)現(xiàn)點(diǎn)擊 http://mcu-ai.com/ MCU-AI技術(shù)網(wǎng)頁(yè)_MCU-AI 嬰兒哭鬧識(shí)別
    發(fā)表于 05-20 19:20

    華潤(rùn)微電子以第一名的成績(jī)榮獲新吳區(qū)區(qū)長(zhǎng)質(zhì)量獎(jiǎng)

    近日,無(wú)錫高新區(qū)(新吳區(qū))召開(kāi)2023年度高質(zhì)量發(fā)展總結(jié)暨2024年工作推進(jìn)會(huì),會(huì)議隆重表彰了新吳區(qū)區(qū)長(zhǎng)質(zhì)量獎(jiǎng)單位,華潤(rùn)微電子以第一名的成績(jī)榮獲新吳區(qū)區(qū)長(zhǎng)質(zhì)量獎(jiǎng)。
    的頭像 發(fā)表于 04-07 09:19 ?671次閱讀
    華潤(rùn)微電子以<b class='flag-5'>第一名</b>的成績(jī)榮獲新吳區(qū)區(qū)長(zhǎng)質(zhì)量獎(jiǎng)

    長(zhǎng)城汽車(chē)自主品牌首個(gè)氣動(dòng)-聲學(xué)風(fēng)洞實(shí)驗(yàn)室即將建成

    長(zhǎng)城汽車(chē)自主品牌首個(gè)氣動(dòng)-聲學(xué)風(fēng)洞實(shí)驗(yàn)室將建成
    的頭像 發(fā)表于 03-28 10:03 ?417次閱讀
    長(zhǎng)城汽車(chē)自主品牌首個(gè)氣動(dòng)-<b class='flag-5'>聲學(xué)</b>風(fēng)洞<b class='flag-5'>實(shí)驗(yàn)室</b>即將建成

    上海AI實(shí)驗(yàn)室發(fā)布新代書(shū)生·視覺(jué)大模型

    近日,上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)聯(lián)手多所知名高校及科技公司共同研發(fā)出新代書(shū)生·視覺(jué)大模型(InternVL)。
    的頭像 發(fā)表于 02-04 11:25 ?1129次閱讀