0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里AI科技語(yǔ)音交互技術(shù),已實(shí)現(xiàn)在85分貝工業(yè)噪聲下將語(yǔ)音轉(zhuǎn)換為文字

Qp2m_ggservicer ? 來(lái)源:未知 ? 作者:李倩 ? 2018-05-03 16:05 ? 次閱讀

近日,阿里巴巴機(jī)器智能技術(shù)實(shí)驗(yàn)室消息,其正研發(fā)在高工業(yè)噪聲環(huán)境下的語(yǔ)音識(shí)別及傳輸技術(shù),以后,眾多車間工人將告別“通訊靠吼”的境況,簡(jiǎn)單的交流言語(yǔ)會(huì)轉(zhuǎn)換成文字,讓彼此心領(lǐng)神會(huì)。

圖:阿里巴巴工程師正在調(diào)試AI語(yǔ)音識(shí)別系統(tǒng)

根據(jù)《職業(yè)性噪聲聾診斷標(biāo)準(zhǔn)》等相關(guān)標(biāo)準(zhǔn),噪聲大于等于85分貝便可認(rèn)定為噪聲作業(yè)環(huán)境,工人需有所防護(hù)。

阿里巴巴AI語(yǔ)音工程師許先生介紹,很多中小型工廠車間的噪聲都在90分貝以上。而工人很少佩戴防護(hù)器具。

在金華一家小型印刷廠,車間噪聲接近90分貝。一位工人說(shuō),他每天工作10個(gè)小時(shí)左右,工廠接單多,他和同事須時(shí)刻交流、協(xié)同調(diào)適印刷機(jī)?!皫戏雷o(hù)耳罩就聽(tīng)不見(jiàn)同事說(shuō)話。”

浙江省疾控中心4月25日公布職業(yè)病數(shù)據(jù)顯示,近10年來(lái),浙江省新發(fā)5924例職業(yè)病中,職業(yè)性噪聲聾占29.21%。浙江省疾控中心環(huán)境與職業(yè)衛(wèi)生所副所長(zhǎng)張美辨表示,工人長(zhǎng)期接觸超85分貝噪聲易患職業(yè)性噪聲聾。

2018年1月,國(guó)家安全監(jiān)管總局網(wǎng)站公布的2015、2016年全國(guó)職業(yè)病報(bào)告來(lái)看。職業(yè)性噪聲聾已成“塵肺病”之后的第二大職業(yè)病。

圖:在高噪聲環(huán)境下,阿里巴巴工程師正在測(cè)試語(yǔ)音識(shí)別設(shè)備

要預(yù)防職業(yè)性噪聲聾并不容易。

阿里巴巴AI語(yǔ)音工程師許先生表示,大多數(shù)中小制造企業(yè)沒(méi)經(jīng)驗(yàn)和能力考慮降噪。最現(xiàn)實(shí)的,還是給工人戴防護(hù)耳罩,但又不便于交流。

許工程師介紹,他們研究的語(yǔ)音交互技術(shù),已實(shí)現(xiàn)在85分貝工業(yè)噪聲下,將一米處正常音量語(yǔ)音轉(zhuǎn)換為文字。

圖:高噪聲語(yǔ)音交互系統(tǒng)構(gòu)想圖

語(yǔ)音轉(zhuǎn)換都在云端完成,只要有網(wǎng)絡(luò)并配上類似智能音箱的語(yǔ)音終端,便可構(gòu)建局域性的語(yǔ)音文字轉(zhuǎn)換和傳輸系統(tǒng)。

“轉(zhuǎn)換為文字的信息,可指定傳輸至手機(jī)等帶顯示屏設(shè)備。只要一部手機(jī),一個(gè)語(yǔ)音終端,便可組建高噪聲語(yǔ)音交互系統(tǒng)?!痹S工程師說(shuō)表示他和同事的語(yǔ)音測(cè)試仍在繼續(xù),“85分貝還是太安靜,按照預(yù)期,要在95分貝噪音下識(shí)別語(yǔ)音?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1742

    瀏覽量

    112779
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1618

    瀏覽量

    47368

原文標(biāo)題:GGAI 前沿 | 阿里AI科技正終結(jié)“耳聾工廠”:85分貝噪聲下仍可識(shí)別語(yǔ)音

文章出處:【微信號(hào):ggservicerobot,微信公眾號(hào):高工智能未來(lái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    HarmonyOS NEXT 應(yīng)用開(kāi)發(fā)練習(xí):AI智能語(yǔ)音播報(bào)

    (Text-To-Speech,文本轉(zhuǎn)語(yǔ)音技術(shù)文本轉(zhuǎn)換為語(yǔ)音進(jìn)行播報(bào)。 當(dāng)然除了基本的文本輸入和播報(bào)功能外,我們還增加了
    發(fā)表于 01-06 15:33

    基于語(yǔ)音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)科技專注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別和語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)與多個(gè)智
    的頭像 發(fā)表于 12-20 10:35 ?168次閱讀

    標(biāo)智能語(yǔ)音識(shí)別在智能會(huì)議場(chǎng)景中的落地案例

    標(biāo)科技專注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別和語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)與多個(gè)智
    的頭像 發(fā)表于 12-20 10:31 ?246次閱讀
    標(biāo)<b class='flag-5'>貝</b>智能<b class='flag-5'>語(yǔ)音</b>識(shí)別在智能會(huì)議場(chǎng)景中的落地案例

    基于智能語(yǔ)音交互的智能呼叫中心工作機(jī)制

    作為實(shí)現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語(yǔ)音交互技術(shù),它通過(guò)集成自然語(yǔ)言處理(NLP)、語(yǔ)音識(shí)別
    的頭像 發(fā)表于 12-03 16:44 ?352次閱讀
    基于智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的智能呼叫中心工作機(jī)制

    語(yǔ)音識(shí)別與自然語(yǔ)言處理的關(guān)系

    了人機(jī)交互的革命,使得機(jī)器能夠更加自然地與人類溝通。 語(yǔ)音識(shí)別技術(shù)概述 語(yǔ)音識(shí)別,也稱為自動(dòng)語(yǔ)音識(shí)別(ASR),是指
    的頭像 發(fā)表于 11-26 09:21 ?522次閱讀

    ASR語(yǔ)音識(shí)別技術(shù)應(yīng)用

    語(yǔ)音識(shí)別技術(shù)應(yīng)用的分析: 一、ASR語(yǔ)音識(shí)別技術(shù)原理 ASR語(yǔ)音識(shí)別技術(shù)的基本原理是
    的頭像 發(fā)表于 11-18 15:12 ?922次閱讀

    如何用PCM1808來(lái)獲取MIC的音量?最大值能到130分貝嗎?

    出現(xiàn)了一個(gè)問(wèn)題,從PCMI808獲取的數(shù)據(jù)一直再跳,用(LP = 20log(Prms/pref))這個(gè)公式換算出來(lái)的音量一直在100分貝到144分貝,偶爾也會(huì)有90多分貝、10多分貝
    發(fā)表于 10-11 07:13

    【算能RADXA微服務(wù)器試用體驗(yàn)】+ GPT語(yǔ)音與視覺(jué)交互:4,文字轉(zhuǎn)語(yǔ)音

    文字轉(zhuǎn)語(yǔ)音使用的技術(shù)簡(jiǎn)稱為T(mén)TS。一般情況我用的都是在線的EDGE-TTS服務(wù)。但非常幸運(yùn)的是,BM1684X上居然有適配好的本地運(yùn)行TTS,那自然是要體驗(yàn)一番。 先轉(zhuǎn)到projec
    發(fā)表于 07-15 23:18

    聆思CSK6視覺(jué)語(yǔ)音大模型AI開(kāi)發(fā)板入門(mén)資源合集(硬件資料、大模型語(yǔ)音/多模態(tài)交互/英語(yǔ)評(píng)測(cè)SDK合集)

    豐富外設(shè)配件 配套多模態(tài)應(yīng)用示例,支持快速上手體驗(yàn)大模型語(yǔ)音交互、智能視覺(jué)等 AI 應(yīng)用 板載 DAPLINK 調(diào)試器,外接一條USB 線即可實(shí)現(xiàn)燒錄、調(diào)試、串口日志查看 板載網(wǎng)絡(luò)模組
    發(fā)表于 06-18 17:33

    語(yǔ)音控制模塊_雷龍發(fā)展

    、回聲消除、降噪等處理,以提高語(yǔ)音信號(hào)的質(zhì)量。同時(shí),進(jìn)行采樣和量化,連續(xù)的模擬信號(hào)轉(zhuǎn)換為離散的數(shù)字信號(hào)。主要通過(guò)DSP來(lái)處理,雷龍語(yǔ)音模塊內(nèi)置DSP芯片,可以做各種卷積和數(shù)字濾波處理
    發(fā)表于 06-14 17:18

    蘋(píng)果iOS18新增多款AI功能

    語(yǔ)音備忘錄轉(zhuǎn)錄:蘋(píng)果將在“語(yǔ)音備忘錄”應(yīng)用中增加一個(gè)大錄音按鈕,用戶只需按即可開(kāi)始錄音,隨后系統(tǒng)內(nèi)建的AI模型將自動(dòng)
    的頭像 發(fā)表于 05-27 11:04 ?563次閱讀

    智能語(yǔ)音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話

    智能語(yǔ)音交互技術(shù)是指通過(guò)語(yǔ)音識(shí)別、語(yǔ)音合成和自然語(yǔ)言理解等技術(shù),
    的頭像 發(fā)表于 05-23 15:14 ?410次閱讀

    標(biāo)語(yǔ)音識(shí)別技術(shù)在金融領(lǐng)域中的應(yīng)用實(shí)例

    隨著語(yǔ)音識(shí)別技術(shù)與文本挖掘、自然語(yǔ)言處理等技術(shù)的不斷融合,智能語(yǔ)音交互技術(shù)在金融領(lǐng)域中爆發(fā)了出巨
    的頭像 發(fā)表于 05-16 16:55 ?657次閱讀
    標(biāo)<b class='flag-5'>貝</b><b class='flag-5'>語(yǔ)音</b>識(shí)別<b class='flag-5'>技術(shù)</b>在金融領(lǐng)域中的應(yīng)用實(shí)例

    蘋(píng)果iOS 18備忘錄搭載AI升級(jí)功能,新增語(yǔ)音轉(zhuǎn)文字和文本摘要功能

    其中,針對(duì)語(yǔ)音備忘錄,蘋(píng)果將在該應(yīng)用中加入一個(gè)較大的錄音按鍵,據(jù)稱占據(jù)應(yīng)用界面的顯著位置。用戶只需輕按此鍵即可開(kāi)始錄音,隨后,系統(tǒng)內(nèi)置的AI模型會(huì)將語(yǔ)音
    的頭像 發(fā)表于 05-11 10:50 ?861次閱讀

    玩轉(zhuǎn)語(yǔ)音合成芯片(TTS芯片),看這一篇就夠了

    什么是語(yǔ)音合成芯片:語(yǔ)音合成芯片也稱為T(mén)TS芯片,即文字轉(zhuǎn)語(yǔ)音芯片,是一種能夠輸入的文字信息
    的頭像 發(fā)表于 03-19 18:13 ?1478次閱讀
    玩轉(zhuǎn)<b class='flag-5'>語(yǔ)音</b>合成芯片(TTS芯片),看這一篇就夠了