0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI手語識別技術(shù)存在的挑戰(zhàn)

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2021-11-17 09:16 ? 次閱讀

據(jù)外媒報道,日本電氣大學與軟銀公司聯(lián)合,通過人工智能AI技術(shù),能將手語直接翻譯成日語,這將使聾啞人士的溝通更順暢。

目前該系統(tǒng)只能用于柜臺設(shè)備上,聾啞人士能在攝像頭前通過手語溝通,然后系統(tǒng)用圖像識別技術(shù),分析手指和手臂等身體幾個部位的骨骼運動,將手勢翻譯成日文,顯示在工作人員的電腦屏幕上,隨后口頭回復(fù)以文本的形式出現(xiàn)在聽障人士面前的屏幕上,使交流更加順暢。

該系統(tǒng)的核心技術(shù)由ABEJA提供,谷歌2018年投資了它,ABEJA的核心產(chǎn)品是使用機器學習幫助公司從他們的數(shù)據(jù)堆中開展商業(yè)分析。在這個項目中,ABEJA通過讓AI學習了5萬個手語視頻,使其捕捉到手語特征和變化,目前該系統(tǒng)能準確將手勢翻譯成大約1500個日語單詞。

早在2015年就有手語識別研究

人工智能技術(shù)的出現(xiàn)和逐漸成熟,不僅有利于產(chǎn)業(yè)升級,事實上很早開始,就有研究人員嘗試利用AI技術(shù)幫助聾啞人士更加順暢的交流。

2015年9月沙特設(shè)計師就專門研發(fā)了一款無線智能手套,內(nèi)置傳感器,聾啞人戴上交流的時候,傳感器可以根據(jù)手指的運動追蹤手勢,再通過語言軟件轉(zhuǎn)換成聲音和文字,在初期,這款無線智能手套只會講法語、英語和阿拉伯語,該研究團隊表示,后續(xù)會支持更多種語言。

在中國也很早就有相關(guān)的研究,2016年有媒體報道,東大自動化專業(yè)李師寧等同學研發(fā)出了一種最新型的手語識別發(fā)聲系統(tǒng),這是一種結(jié)合人體生物及姿態(tài)信息的便攜手語發(fā)聲器,聾啞人可以通過手語使該機器發(fā)聲翻譯。

2018年東北大學也研制出一款幫助聽障人士溝通交流的智能系統(tǒng),由智能傳感手環(huán)、前端APP及云端服務(wù)組成,智能傳感手環(huán)可以將聽障人士的手語動作捕捉識別,并在云端轉(zhuǎn)換為文字及語音呈現(xiàn)在APP端,傳遞給非手語使用者,同時又可以將非手語使用者的語音在APP端轉(zhuǎn)換為文字加手語動圖的“雙語形式”。

百度、騰訊等互聯(lián)網(wǎng)巨頭企業(yè)也進行了相關(guān)研究,2019年百度在AI開發(fā)者大會上提出“Everyone can AI”的理想,意思是讓每個人都能有平等接收AI的能力,百度以百度飛槳開源內(nèi)容為基礎(chǔ)建立訓練模型,通過采集手勢得到數(shù)據(jù),借助手機轉(zhuǎn)化成文字信息,聽障人士可以使用翻譯器,在咖啡館、餐廳如同正常人一樣點餐、交流。

優(yōu)圖AI手語翻譯機界面

同是在2019年,騰訊優(yōu)圖實驗室也推出了一款基于自研算法的優(yōu)圖AI手語翻譯機,以普通攝像頭作為手語采集裝置,用戶正對攝像頭完成手語表達,翻譯機就能通過后臺運算將手語快速翻譯成文字。據(jù)介紹,優(yōu)圖AI手語翻譯機數(shù)據(jù)集覆蓋近千句日常表達,包括900個常用詞匯,同時還對數(shù)據(jù)進行了分析和歸納,是當前最大的中文手語識別數(shù)據(jù)集。

手語識別技術(shù)存在很大挑戰(zhàn)

相比于其他AI視覺識別技術(shù),手語識別研發(fā)存在更大困難。在2018年東北大學的研究中,就透露出手語識別研究存在的現(xiàn)實問題,即每位聽障人士的手語規(guī)劃不同,同一個詞打出的手勢有差異,因此智能識別可能就沒那么準確。

不過好在2018年中央頒發(fā)了國家通用手語標準方案,這很大程度有利于后續(xù)手語轉(zhuǎn)文字或語音方面的研究。即使如此可能還是會存在細微差異,百度此前就表示,手語復(fù)雜、多樣、以及地域性差異給研究帶來不少困難。

百度還談到另外一大困難,即可用于訓練模型的數(shù)據(jù)量小,在上述日本的項目中,一位參與開發(fā)的軟銀工程師也表示,要建立一個將符號準確翻譯成日文的模型,需要大量的手語數(shù)據(jù)。因此他們通過網(wǎng)站等方式,呼吁更多人發(fā)送手語圖像數(shù)據(jù)。

小結(jié)

AI技術(shù)在服務(wù)產(chǎn)業(yè)升級的同時,也可以極大的幫助聾啞人群更好的實現(xiàn)溝通,這是這個時代的福音。據(jù)第二次全國殘疾人抽樣調(diào)查結(jié)果顯示,我國有2780萬聽障人士,如果能夠利用AI技術(shù)實現(xiàn)將手語實時翻譯成文字和語音,這將是一項極其有意義的事。

日本聾人聯(lián)合會認為,要使人工智能成為聾啞人群的有效工具,還需要很長的時間來實現(xiàn)。不過很明顯從2015年到現(xiàn)在,手語識別在逐漸取得進步,也有相當多的研究人員和企業(yè)投入其中,對于未來逐步突破困難取得更大進步還是值得期待。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31028

    瀏覽量

    269372
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47373

    瀏覽量

    238868

原文標題:騰訊、百度、軟銀都在研究,利用AI技術(shù)將手語轉(zhuǎn)文字有多重要?

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    中山大學:基于定制裂紋設(shè)計的超靈敏透氣水凝膠纖維應(yīng)變傳感器及無線手語識別應(yīng)用

    和地域多樣性可能會給不懂手語的人造成交流障礙。目前,各種識別人類手勢的技術(shù),包括視覺圖像處理、肌電圖和可穿戴應(yīng)變傳感器,在改善聾啞人群體的溝通方面發(fā)揮了重要作用。特別地,視覺圖像處理在手語
    的頭像 發(fā)表于 12-02 17:29 ?493次閱讀
    中山大學:基于定制裂紋設(shè)計的超靈敏透氣水凝膠纖維應(yīng)變傳感器及無線<b class='flag-5'>手語</b><b class='flag-5'>識別</b>應(yīng)用

    AI智能識別監(jiān)測攝像機

    隨著人工智能技術(shù)的飛速發(fā)展,AI智能識別監(jiān)測攝像機逐漸成為各行各業(yè)安全管理的重要工具。這種高科技設(shè)備不僅具備傳統(tǒng)監(jiān)控攝像機的基本功能,還通過深度學習和圖像處理等先進技術(shù),實現(xiàn)了對人、車
    的頭像 發(fā)表于 11-28 10:39 ?268次閱讀
    <b class='flag-5'>AI</b>智能<b class='flag-5'>識別</b>監(jiān)測攝像機

    AI行為識別攝像機

    隨著科技的飛速發(fā)展,人工智能(AI)在各個領(lǐng)域的應(yīng)用越來越廣泛。在安全監(jiān)控領(lǐng)域,AI行為識別攝像機作為一種新興技術(shù),正逐漸改變傳統(tǒng)監(jiān)控方式,為公共安全和商業(yè)運營提供了全新的解決方案。
    的頭像 發(fā)表于 11-21 10:49 ?195次閱讀
    <b class='flag-5'>AI</b>行為<b class='flag-5'>識別</b>攝像機

    AI圖像識別攝像機

    隨著科技的迅猛發(fā)展,人工智能(AI)在各個領(lǐng)域的應(yīng)用越來越廣泛,其中圖像識別技術(shù)尤為引人注目。AI圖像識別攝像機作為這一
    的頭像 發(fā)表于 11-08 10:38 ?272次閱讀
    <b class='flag-5'>AI</b>圖像<b class='flag-5'>識別</b>攝像機

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    的深入發(fā)展。 3. 挑戰(zhàn)與機遇并存 盡管AI在生命科學領(lǐng)域取得了顯著的成果,但也面臨著諸多挑戰(zhàn)。例如,數(shù)據(jù)隱私、算法偏見、倫理道德等問題都需要我們認真思考和解決。同時,如何更好地將AI
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第二章AI for Science的技術(shù)支撐學習心得

    的物理可信度,還為科學研究提供了新的視角和方法。 5. 挑戰(zhàn)與未來展望 第二章也提到了AI for Science面臨的挑戰(zhàn)和未來展望。盡管AI技術(shù)
    發(fā)表于 10-14 09:16

    平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平

    方面的立法和標準存在差異,這不僅給全球化的企業(yè)運營帶來挑戰(zhàn),也影響了全球用戶權(quán)益的平等保護。國際組織應(yīng)當發(fā)揮引領(lǐng)作用,推動制定統(tǒng)一的AI倫理框架,同時鼓勵各國根據(jù)自身國情調(diào)整和實施。 AI
    發(fā)表于 07-16 15:07

    AI大模型與傳統(tǒng)AI的區(qū)別

    AI大模型(如LLM,即大型語言模型)與傳統(tǒng)AI在多個方面存在顯著的區(qū)別。以下將從技術(shù)層面、應(yīng)用場景、性能表現(xiàn)、計算資源和成本、以及發(fā)展趨勢和挑戰(zhàn)
    的頭像 發(fā)表于 07-15 11:37 ?2840次閱讀

    人工智能的語音識別技術(shù)詳解

    隨著科技的飛速發(fā)展,人工智能(AI技術(shù)已經(jīng)滲透到我們生活的方方面面,其中語音識別技術(shù)作為AI領(lǐng)域的重要分支,更是以其獨特的魅力和廣泛的應(yīng)用
    的頭像 發(fā)表于 07-01 11:39 ?1305次閱讀

    開源項目!設(shè)計一款智能手語翻譯眼鏡

    手語翻譯的依賴。 這款眼鏡的設(shè)計既實用又低調(diào),方便日常佩戴,能夠無縫融入用戶的日常生活中,讓使用者能夠輕松地與不懂手語的人士溝通。它的亮點在于利用人工智能技術(shù)檢測手勢并進行實時翻譯,不僅打破了交流障礙
    發(fā)表于 05-20 15:59

    **十萬級口語識別,離線自然說技術(shù),讓智能照明更懂你**

    ,使得語音芯片在風噪和人聲疊加的情況下,仍能保持較高的識別率,可滿足用戶對風扇燈語音識別性能的要求。 可應(yīng)用照明品類 離線自然說: 離線自然說是啟英泰倫研發(fā)的一種能在端側(cè)AI語音芯片上實現(xiàn)的輕量級
    發(fā)表于 04-29 17:09

    AI基坑監(jiān)測識別攝像機

    AI基坑監(jiān)測識別攝像機是一種利用人工智能技術(shù)進行基坑監(jiān)測的智能設(shè)備,其作用是監(jiān)測基坑工程施工過程中的變化,并識別潛在的風險因素,以提供準確數(shù)據(jù)和及時預(yù)警,確?;庸こ痰陌踩M行。這種攝
    的頭像 發(fā)表于 04-22 10:03 ?395次閱讀
    <b class='flag-5'>AI</b>基坑監(jiān)測<b class='flag-5'>識別</b>攝像機

    開發(fā)者手機 AI - 目標識別 demo

    功能簡介 該應(yīng)用是在Openharmony 4.0系統(tǒng)上開發(fā)的一個目標識別AI應(yīng)用,旨在從上到下打通Openharmony AI子系統(tǒng),展示Openharmony系統(tǒng)的AI能力,并為
    發(fā)表于 04-11 16:14

    AI車牌監(jiān)測識別攝像機

    AI車牌監(jiān)測識別攝像機是一種基于人工智能技術(shù)的高級監(jiān)控設(shè)備,用于識別和記錄車輛的車牌信息。該攝像機利用深度學習算法和圖像識別
    的頭像 發(fā)表于 04-02 09:55 ?479次閱讀
    <b class='flag-5'>AI</b>車牌監(jiān)測<b class='flag-5'>識別</b>攝像機

    NanoEdge AI技術(shù)原理、應(yīng)用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計算的人工智能技術(shù),旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳輸延遲、降低
    發(fā)表于 03-12 08:09