0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Mozilla使用開源Common Voice語(yǔ)音識(shí)別數(shù)據(jù)集進(jìn)行多語(yǔ)言操作

JsPm_robot_1hjq ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-06-12 11:18 ? 次閱讀

Mozilla 宣布它正在使其眾包項(xiàng)目 Common Voice 支持更多語(yǔ)言。Common Voice 是一個(gè)旨在創(chuàng)建開源語(yǔ)音識(shí)別數(shù)據(jù)集的項(xiàng)目,于去年6月發(fā)布,它邀請(qǐng)來(lái)自世界各地的志愿者通過網(wǎng)絡(luò)和移動(dòng)應(yīng)用程序,用他們的聲音記錄文本片段。

業(yè)內(nèi)普遍認(rèn)為語(yǔ)音將成為下一個(gè)重要的技術(shù)平臺(tái),近年來(lái)隨著人工智能理論與技術(shù)的迅猛發(fā)展,語(yǔ)音識(shí)別技術(shù)在不斷突破,通過語(yǔ)音助手如 Alexa、Google Assistant、Siri 和 Cortana,各公司將收集到的用戶語(yǔ)音數(shù)據(jù)歸為公司自己所有,這些數(shù)據(jù)的價(jià)值或許目前很難被外界看出來(lái),但是在信息化高度發(fā)達(dá),特別是今天這樣一個(gè)大數(shù)據(jù)和人工智能時(shí)代,為開發(fā)機(jī)器學(xué)習(xí)模型提供語(yǔ)音數(shù)據(jù)集怎么看都是一件有深遠(yuǎn)意義的事,這些語(yǔ)音數(shù)據(jù)的意義會(huì)慢慢體現(xiàn)。

而最終當(dāng)它們的價(jià)值逐漸顯現(xiàn),人們會(huì)發(fā)現(xiàn)在這背后亞馬遜、谷歌、蘋果和微軟等公司已經(jīng)牢牢鎖住了語(yǔ)音技術(shù)的命門,主導(dǎo)了這場(chǎng)語(yǔ)音市場(chǎng)之爭(zhēng)。

Common Voice 項(xiàng)目就是為了避免這樣的事情而誕生的,它的目的是將收集到的語(yǔ)音數(shù)據(jù)集開源給公眾,使得任何人都可以自由使用這些數(shù)據(jù)集來(lái)將語(yǔ)音識(shí)別技術(shù)智能地構(gòu)建到各種應(yīng)用程序和服務(wù)中。Mozilla 已經(jīng)在去年11月公布了 Common Voice 英語(yǔ)數(shù)據(jù)集的第一批成果,其中收錄了20000個(gè)人錄制的40萬(wàn)個(gè)錄音、大約500小時(shí)的演講。此次 Mozilla 又宣布它正式開始收集法語(yǔ)、德語(yǔ)和威爾士語(yǔ)三種語(yǔ)言的語(yǔ)音數(shù)據(jù),同時(shí)也在為收集另外40種語(yǔ)言做準(zhǔn)備,巴西葡萄牙語(yǔ)、印度尼西亞語(yǔ)、波蘭語(yǔ)和荷蘭語(yǔ)等已經(jīng)準(zhǔn)備好啟動(dòng)眾包語(yǔ)音數(shù)據(jù)收集。

Mozilla 首席創(chuàng)新官 Katharina Borchert 在他的博客中寫到:“我們希望用戶使用自己的語(yǔ)言甚至方言的時(shí)候是可以被機(jī)器理解的,但是我們相信這些技術(shù)上的接口不應(yīng)該由少數(shù)幾家公司控制,他們不能像守門員一樣來(lái)完全把控語(yǔ)音服務(wù)。”

Common Voice 項(xiàng)目的意義與用于打擊私人平臺(tái)的開放許可證項(xiàng)目類似,OpenStreetMap 就是一個(gè)很好的例子。OpenStreetMap 為開發(fā)者提供了開放且可自由使用的世界地圖,使得開發(fā)商不再需要依賴于 Google Maps 這樣的競(jìng)爭(zhēng)對(duì)手,不僅降低了成本開銷,技術(shù)上也不再受到限制。

“使用多種語(yǔ)言標(biāo)志著 Common Voice 邁出了重要的一步,我們希望它對(duì)整體語(yǔ)音技術(shù)來(lái)說也是一大步”,Mozilla Common Voice 項(xiàng)目的數(shù)字策略師 Michael Henretty 補(bǔ)充到:“語(yǔ)音技術(shù)的民主化不僅會(huì)降低全球創(chuàng)新的障礙,也會(huì)讓人們獲取信息更加便捷?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Mozilla
    +關(guān)注

    關(guān)注

    0

    文章

    50

    瀏覽量

    11239
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1742

    瀏覽量

    112755

原文標(biāo)題:打破語(yǔ)音壟斷 Mozilla Common Voice 支持更多語(yǔ)言

文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    語(yǔ)音識(shí)別與自然語(yǔ)言處理的關(guān)系

    在人工智能的快速發(fā)展中,語(yǔ)音識(shí)別和自然語(yǔ)言處理(NLP)成為了兩個(gè)重要的技術(shù)支柱。語(yǔ)音識(shí)別技術(shù)使得機(jī)器能夠理解人類的
    的頭像 發(fā)表于 11-26 09:21 ?508次閱讀

    ASR與傳統(tǒng)語(yǔ)音識(shí)別的區(qū)別

    識(shí)別技術(shù)。 構(gòu)建更深更復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,利用大量數(shù)據(jù)進(jìn)行訓(xùn)練。 提高了語(yǔ)音識(shí)別的準(zhǔn)確率和穩(wěn)定性。 傳統(tǒng)
    的頭像 發(fā)表于 11-18 15:22 ?565次閱讀

    車載空氣凈化器語(yǔ)音芯片方案

    車載空氣凈化器采用離線語(yǔ)音識(shí)別NRK3301芯片,提升便捷性、安全性,高識(shí)別率、低誤報(bào)率,支持多語(yǔ)言、自定義指令,滿足用戶需求,增強(qiáng)使用體驗(yàn)。
    的頭像 發(fā)表于 11-13 10:22 ?193次閱讀
    車載空氣凈化器<b class='flag-5'>語(yǔ)音</b>芯片方案

    ChatGPT 的多語(yǔ)言支持特點(diǎn)

    )技術(shù)迎來(lái)了巨大的挑戰(zhàn)和機(jī)遇。ChatGPT,作為一個(gè)領(lǐng)先的語(yǔ)言模型,其多語(yǔ)言支持的特點(diǎn)成為了它在眾多應(yīng)用場(chǎng)景中不可或缺的優(yōu)勢(shì)。 1. 多語(yǔ)言理解能力 ChatGPT 的多語(yǔ)言支持首先
    的頭像 發(fā)表于 10-25 17:30 ?847次閱讀

    離線語(yǔ)音控制技術(shù)特點(diǎn)

    離線語(yǔ)音控制通過結(jié)合高性能的音頻前端處理算法和本地AI模型實(shí)現(xiàn)了高效的語(yǔ)音識(shí)別和控制能力,不依賴于互聯(lián)網(wǎng)連接,同時(shí)具備靈活的應(yīng)用擴(kuò)展性。這種解決方案為各種智能設(shè)備提供了穩(wěn)定、高效和多語(yǔ)言
    的頭像 發(fā)表于 06-26 18:12 ?528次閱讀
    離線<b class='flag-5'>語(yǔ)音</b>控制技術(shù)特點(diǎn)

    有效提升智能會(huì)議系統(tǒng)語(yǔ)音識(shí)別準(zhǔn)確性案例分享

    。多語(yǔ)言支持的語(yǔ)音識(shí)別技術(shù)還可以準(zhǔn)確識(shí)別不同語(yǔ)言和方言,對(duì)于夸全球交流的國(guó)際會(huì)議必不可缺。語(yǔ)音
    的頭像 發(fā)表于 06-21 11:15 ?379次閱讀
    有效提升智能會(huì)議系統(tǒng)<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>準(zhǔn)確性案例分享

    有效提升智能會(huì)議系統(tǒng)語(yǔ)音識(shí)別準(zhǔn)確性案例分享

    。多語(yǔ)言支持的語(yǔ)音識(shí)別技術(shù)還可以準(zhǔn)確識(shí)別不同語(yǔ)言和方言,對(duì)于夸全球交流的國(guó)際會(huì)議必不可缺。語(yǔ)音
    的頭像 發(fā)表于 06-21 11:13 ?556次閱讀
    有效提升智能會(huì)議系統(tǒng)<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b>準(zhǔn)確性案例分享

    這個(gè)多語(yǔ)言包 怎么搜不到

    大家好,這個(gè)多語(yǔ)言包怎么搜不到 seven language lib 誰(shuí)有離線包不 感謝分享,
    發(fā)表于 03-24 10:06

    語(yǔ)言模型(LLMs)如何處理多語(yǔ)言輸入問題

    研究者們提出了一個(gè)框架來(lái)描述LLMs在處理多語(yǔ)言輸入時(shí)的內(nèi)部處理過程,并探討了模型中是否存在特定于語(yǔ)言的神經(jīng)元。
    發(fā)表于 03-07 14:44 ?663次閱讀
    大<b class='flag-5'>語(yǔ)言</b>模型(LLMs)如何處理<b class='flag-5'>多語(yǔ)言</b>輸入問題

    車內(nèi)語(yǔ)音識(shí)別數(shù)據(jù)在智能駕駛中的價(jià)值與應(yīng)用

    車內(nèi)語(yǔ)音識(shí)別數(shù)據(jù)在智能駕駛中的價(jià)值與應(yīng)用 一、引言 隨著智能駕駛技術(shù)的不斷發(fā)展,車內(nèi)語(yǔ)音識(shí)別數(shù)據(jù)在智能駕駛中的應(yīng)用越來(lái)越廣泛。車內(nèi)語(yǔ)音
    的頭像 發(fā)表于 02-19 11:47 ?630次閱讀

    語(yǔ)音數(shù)據(jù)在智能駕駛中的價(jià)值與應(yīng)用

    、應(yīng)用場(chǎng)景以及挑戰(zhàn)。 二、語(yǔ)音數(shù)據(jù)在智能駕駛中的價(jià)值 提升駕駛安全性:通過語(yǔ)音指令,駕駛員可以在不分散注意力的情況下對(duì)車輛進(jìn)行
    的頭像 發(fā)表于 01-31 17:08 ?453次閱讀

    語(yǔ)音數(shù)據(jù)在智能駕駛中的關(guān)鍵作用與應(yīng)用

    一、引言 隨著智能駕駛技術(shù)的快速發(fā)展,語(yǔ)音識(shí)別技術(shù)在其中扮演著越來(lái)越重要的角色。而語(yǔ)音數(shù)據(jù)作為語(yǔ)音
    的頭像 發(fā)表于 01-31 16:22 ?520次閱讀

    語(yǔ)音數(shù)據(jù):智能駕駛中車內(nèi)語(yǔ)音識(shí)別技術(shù)的基石

    一、引言 在智能駕駛中,車內(nèi)語(yǔ)音識(shí)別技術(shù)發(fā)揮著越來(lái)越重要的作用。語(yǔ)音數(shù)據(jù)作為這一技術(shù)的基石,其質(zhì)量和規(guī)模對(duì)
    的頭像 發(fā)表于 01-31 16:07 ?575次閱讀

    車內(nèi)語(yǔ)音識(shí)別數(shù)據(jù)在智能駕駛中的應(yīng)用與挑戰(zhàn)

    詳細(xì)介紹車內(nèi)語(yǔ)音識(shí)別數(shù)據(jù)在智能駕駛中的應(yīng)用、面臨的挑戰(zhàn)以及未來(lái)的發(fā)展趨勢(shì)。 二、車內(nèi)語(yǔ)音識(shí)別數(shù)據(jù)在智能駕駛中的應(yīng)用 語(yǔ)音控制:通過車內(nèi)
    的頭像 發(fā)表于 01-26 18:14 ?1160次閱讀

    語(yǔ)音數(shù)據(jù)在智能語(yǔ)音助手中的應(yīng)用與挑戰(zhàn)

    。本文將詳細(xì)介紹語(yǔ)音數(shù)據(jù)在智能語(yǔ)音助手中的應(yīng)用、面臨的挑戰(zhàn)以及未來(lái)的發(fā)展趨勢(shì)。 二、語(yǔ)音數(shù)據(jù)
    的頭像 發(fā)表于 01-18 15:46 ?428次閱讀