0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員已經(jīng)開(kāi)發(fā)出一種能夠檢測(cè)“無(wú)聲語(yǔ)音”的AI模型

倩倩 ? 來(lái)源:文財(cái)網(wǎng) ? 作者:文財(cái)網(wǎng) ? 2020-12-17 10:09 ? 次閱讀

加州大學(xué)伯克利分校的研究人員已經(jīng)開(kāi)發(fā)出一種能夠檢測(cè)“無(wú)聲語(yǔ)音”的AI模型。該模型基于數(shù)字語(yǔ)音預(yù)測(cè)單詞并生成合成語(yǔ)音。肌電圖(EMG)的電極位于臉部和喉嚨,用于檢測(cè)無(wú)聲語(yǔ)音。

研究人員斷言,該模型可以為無(wú)法發(fā)出可聽(tīng)語(yǔ)音的人們啟用許多應(yīng)用程序,并可以幫助AI工具和其他響應(yīng)語(yǔ)音命令的設(shè)備進(jìn)行語(yǔ)音檢測(cè)。

該小組指出,以數(shù)字方式為無(wú)聲語(yǔ)音發(fā)聲具有廣泛的應(yīng)用。例如,它可以生成類(lèi)似于藍(lán)牙耳機(jī)的工具,該工具可以使個(gè)人繼續(xù)通話,而不會(huì)打擾周?chē)娜?。?dāng)環(huán)境聲音太大而無(wú)法捕獲可聽(tīng)見(jiàn)的語(yǔ)音或必須保持安靜時(shí),這種設(shè)備將非常有用。

口頭閱讀AI是可以從靜音語(yǔ)音中捕獲單詞的AI的另一個(gè)示例。它可以為監(jiān)視設(shè)備供電,并支持聾人的用例。

研究人員使用了一種方法,其中將所需語(yǔ)句的音頻輸出目標(biāo)從發(fā)聲錄音轉(zhuǎn)換為無(wú)聲錄音。然后,使用WaveNet解碼器生成音頻語(yǔ)音預(yù)測(cè)。

通過(guò)比較發(fā)聲的EMG數(shù)據(jù)和基線訓(xùn)練的數(shù)據(jù),發(fā)現(xiàn)發(fā)聲的EMG方法在從書(shū)中轉(zhuǎn)錄句子時(shí),單詞錯(cuò)誤率降低了64%至4%,而基線降低了95%。研究人員開(kāi)源了約20小時(shí)的面部EMG數(shù)據(jù)集,以鼓勵(lì)對(duì)該領(lǐng)域進(jìn)行進(jìn)一步研究。

在其他工作中,中國(guó)的研究人員建立了諷刺檢測(cè)模型,該模型在多模式Twitter數(shù)據(jù)集上提供SOTA性能。Masakhane開(kāi)放源代碼非洲語(yǔ)言翻譯項(xiàng)目的成員已發(fā)布了 有關(guān)低資源機(jī)器翻譯的 案例研究。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1144

    瀏覽量

    40827
  • 藍(lán)牙耳機(jī)
    +關(guān)注

    關(guān)注

    20

    文章

    5660

    瀏覽量

    59423
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31262

    瀏覽量

    269627
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    一種高靈敏的化學(xué)檢測(cè)系統(tǒng)

    近日,美國(guó)加州大學(xué)伯克利分校、勞倫斯伯克利國(guó)家實(shí)驗(yàn)室和Adamas Nanotechnologies公司等機(jī)構(gòu)的研究人員將量子傳感與液滴微流控技術(shù)相結(jié)合,開(kāi)發(fā)出一種高靈敏的化學(xué)檢測(cè)
    的頭像 發(fā)表于 01-02 11:35 ?92次閱讀
    <b class='flag-5'>一種</b>高靈敏的化學(xué)<b class='flag-5'>檢測(cè)</b>系統(tǒng)

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    的是百度的Picodet模型,它是一種基于深度卷積網(wǎng)絡(luò)(DNN)的輕量級(jí)目標(biāo)檢測(cè)模型,具有非常高的檢測(cè)精度,可以在低算力設(shè)備進(jìn)行實(shí)時(shí)的端到端
    發(fā)表于 12-19 14:33

    AMD發(fā)布10億參數(shù)開(kāi)源AI模型OLMo

    AMD公司近日宣布了項(xiàng)重大進(jìn)展,推出了首個(gè)完全開(kāi)放的10億參數(shù)語(yǔ)言模型系列——AMD OLMo。這舉措為開(kāi)發(fā)者和研究人員提供了強(qiáng)大的
    的頭像 發(fā)表于 11-12 18:08 ?471次閱讀

    BitEnergy AI公司開(kāi)發(fā)出一種AI處理方法

    BitEnergy AI公司,家專(zhuān)注于人工智能(AI)推理技術(shù)的企業(yè),其工程師團(tuán)隊(duì)創(chuàng)新性地開(kāi)發(fā)一種名為線性復(fù)雜度乘法(L-Mul)的
    的頭像 發(fā)表于 10-22 15:15 ?413次閱讀

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    偏見(jiàn)、倫理道德等問(wèn)題。此外,如何更好地將AI與科學(xué)研究人員的傳統(tǒng)工作模式相融合,也是個(gè)亟待解決的問(wèn)題。未來(lái),隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的拓展,AI for Science有望在更多
    發(fā)表于 10-14 09:16

    rup是一種什么模型

    RUP(Rational Unified Process,統(tǒng)建模語(yǔ)言)是一種軟件開(kāi)發(fā)過(guò)程模型,它是一種迭代和增量的軟件
    的頭像 發(fā)表于 07-09 10:13 ?1347次閱讀

    基于一種AI輔助可穿戴微流控比色傳感器系統(tǒng)

    存在的挑戰(zhàn)限制了這項(xiàng)技術(shù)的實(shí)際應(yīng)用。 據(jù)麥姆斯咨詢(xún)報(bào)道,為了克服這些挑戰(zhàn),來(lái)自中國(guó)石油大學(xué)(華東)的研究人員開(kāi)發(fā)一種人工智能(AI)輔助的可穿戴微流控比色傳感器系統(tǒng)(
    的頭像 發(fā)表于 06-29 10:57 ?1.1w次閱讀
    基于<b class='flag-5'>一種</b><b class='flag-5'>AI</b>輔助可穿戴微流控比色傳感器系統(tǒng)

    聆思CSK6視覺(jué)語(yǔ)音模型AI開(kāi)發(fā)板入門(mén)資源合集(硬件資料、大模型語(yǔ)音/多模態(tài)交互/英語(yǔ)評(píng)測(cè)SDK合集)

    豐富外設(shè)配件 配套多模態(tài)應(yīng)用示例,支持快速上手體驗(yàn)大模型語(yǔ)音交互、智能視覺(jué)等 AI 應(yīng)用 板載 DAPLINK 調(diào)試器,外接條USB 線即可實(shí)現(xiàn)燒錄、調(diào)試、串口日志查看 板載網(wǎng)絡(luò)模組
    發(fā)表于 06-18 17:33

    基于助聽(tīng)器開(kāi)發(fā)一種高效的語(yǔ)音增強(qiáng)神經(jīng)網(wǎng)絡(luò)

    受限的微控制器單元(microcontroller units,MCU)上,內(nèi)存和計(jì)算能力有限。在這項(xiàng)工作中,我們使用模型壓縮技術(shù)來(lái)彌補(bǔ)這差距。我們?cè)贖W上對(duì)RNN施加約束,并描述了一種方法來(lái)滿(mǎn)足它們
    發(fā)表于 06-07 11:29

    OpenAI推出專(zhuān)用的AI檢測(cè)工具

    OpenAI最近推出了款全新的AI檢測(cè)工具,這款工具專(zhuān)門(mén)針對(duì)由DALL·E 3模型生成的圖片。令人印象深刻的是,該工具能夠精準(zhǔn)識(shí)別出這類(lèi)圖
    的頭像 發(fā)表于 05-09 10:01 ?543次閱讀

    一種可實(shí)現(xiàn)穩(wěn)定壓力傳感的新型可拉伸電子皮膚

    現(xiàn)有的電子皮膚會(huì)隨材料拉伸而降低傳感精度。美國(guó)得克薩斯大學(xué)奧斯汀分校研究人員開(kāi)發(fā)出一種新型可拉伸電子皮膚,解決了這項(xiàng)新興技術(shù)的個(gè)主要難題。
    的頭像 發(fā)表于 05-09 09:07 ?495次閱讀

    研究人員利用定制光控制二維材料的量子特性

    光波控制谷值選擇性帶隙修正 個(gè)科學(xué)家團(tuán)隊(duì)開(kāi)發(fā)出一種利用光的結(jié)構(gòu)來(lái)扭曲和調(diào)整量子材料特性的方法。他們的研究成果發(fā)表在今天的《自然》(Nature)雜志上,為下
    的頭像 發(fā)表于 05-06 06:29 ?267次閱讀
    <b class='flag-5'>研究人員</b>利用定制光控制二維材料的量子特性

    研究人員開(kāi)發(fā)出新型AI輔助發(fā)音系統(tǒng),讓人沒(méi)有聲帶也能說(shuō)話

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,加州大學(xué)洛杉磯分校生物工程系助理教授陳俊及其團(tuán)隊(duì),開(kāi)發(fā)一種可以在機(jī)器學(xué)習(xí)輔助下將喉部肌肉運(yùn)動(dòng)轉(zhuǎn)化為語(yǔ)音的“柔性貼片”助聽(tīng)裝置,這將有望幫助部分嗓音障礙患者實(shí)現(xiàn)
    的頭像 發(fā)表于 03-28 09:11 ?2418次閱讀

    防止AI模型被黑客病毒入侵控制(原創(chuàng))聆思大模型AI開(kāi)發(fā)套件評(píng)測(cè)4

    監(jiān)控 :實(shí)時(shí)監(jiān)控模型的輸入和輸出,檢測(cè)異常行為或異常數(shù)據(jù),及時(shí)采取措施防止入侵。對(duì)模型進(jìn)行監(jiān)控,以便及時(shí)發(fā)現(xiàn)異常行為。 員工培訓(xùn) :培訓(xùn)開(kāi)發(fā)和使用
    發(fā)表于 03-19 11:18

    研究人員開(kāi)發(fā)出一種新型太赫茲成像系統(tǒng)

    系統(tǒng)使用的輻射探測(cè)器。 由加州大學(xué)洛杉磯分校Samueli工程學(xué)院電氣和計(jì)算機(jī)工程教授Mona Jarrahi和Aydogan Ozcan領(lǐng)導(dǎo)的研究團(tuán)隊(duì)發(fā)明了一種新的太赫茲焦平面陣列來(lái)解決這個(gè)問(wèn)題。 帶PSR的等離子體光電導(dǎo)THz-FPA 通過(guò)消除逐點(diǎn)捕獲和顯示圖像
    的頭像 發(fā)表于 01-19 10:05 ?923次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>開(kāi)發(fā)出</b><b class='flag-5'>一種</b>新型太赫茲成像系統(tǒng)