0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦語(yǔ)音 AI:在 AR 眼鏡上可視化語(yǔ)音和聲音

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-07-26 19:30 ? 次閱讀

音頻可以包含從人類語(yǔ)言到非語(yǔ)言聲音等各種聲音,例如狗吠和警笛聲。在為聽力困難的人設(shè)計(jì)無(wú)障礙應(yīng)用程序時(shí),該應(yīng)用程序應(yīng)能夠識(shí)別聲音并理解語(yǔ)義。

這種技術(shù)將有助于聾啞或聽力有障礙的人可視化語(yǔ)音,例如人類的對(duì)話和非語(yǔ)音聲音。通過(guò)將語(yǔ)音和聲音 AI 相結(jié)合,可以將這些可視化效果疊加到 AR 眼鏡上,從而使用戶能夠看到并理解他們無(wú)法聽到的聲音。

根據(jù)世界衛(wèi)生組織的統(tǒng)計(jì),約有 15 億人(占全球人口近 20%)患有聽力損失。到 2050 年,這一數(shù)字將上升至 25 億。

Cochl 是 NVIDIA 的合作伙伴,總部位于圣何塞。該公司是一家利用聲音 AI 技術(shù)來(lái)理解各類音頻的科技密集型初創(chuàng)企業(yè)。他同時(shí)也是 NVIDIA 初創(chuàng)加速計(jì)劃的會(huì)員。通過(guò)提供尖端技術(shù)和 NVIDIA 專家的支持,該計(jì)劃幫助初創(chuàng)企業(yè)更快地構(gòu)建解決方案。

該平臺(tái)可識(shí)別 37 種環(huán)境聲音,并且 CochI 還加入了先進(jìn)的語(yǔ)音轉(zhuǎn)文本技術(shù),使用戶能夠真正全方位地了解聲音世界。

AR 眼鏡可視化任何聲音

AR 眼鏡作為一個(gè)可視化聲音的工具,有望極大改善聽力損失者的生活。這項(xiàng)技術(shù)可以幫助提高他們的交流能力,使他們更容易理解和融入到周圍的世界。

Cochl.Sense 和 NVIDIA Riva 在微軟 HoloLens 2 上運(yùn)行!

在此方案中,自動(dòng)語(yǔ)音識(shí)別(ASR)使眼鏡能夠識(shí)別并理解人類的語(yǔ)音。這項(xiàng)技術(shù)可通過(guò)多種方式集成到眼鏡中:

  • 使用麥克風(fēng)捕捉與聾啞人或聽力有障礙者交談的人的語(yǔ)音,然后使用 ASR 算法解釋語(yǔ)音并將其轉(zhuǎn)錄為文本,最后將該文本顯示在眼鏡上,從而使聾啞人或聽力有障礙者能夠閱讀并理解該語(yǔ)音。

  • ASR 還可以使眼鏡能夠響應(yīng)語(yǔ)音命令,以便用戶可以通過(guò)語(yǔ)音控制眼鏡。

  • AR 眼鏡還能在屏幕上顯示所有對(duì)話(例如在駕車時(shí)轉(zhuǎn)錄地圖上的語(yǔ)音指示)以及其他聲音(例如緊急車輛的喇叭聲、警報(bào)聲以及風(fēng)聲)。

解決方案背后的技術(shù)

Cochl 在其軟件堆棧中使用了 NVIDIA Riva 來(lái)增強(qiáng)其 ASR 功能。Riva 是一個(gè)使用 GPU 加速、完全可定制的 SDK,用于開發(fā)語(yǔ)音 AI 的應(yīng)用程序。通過(guò)使用 Riva,該平臺(tái)的功能得以擴(kuò)展,能夠理解包括非語(yǔ)音聲音在內(nèi)的各種聲音。

Cochl 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Yoonchang Han 表示:“我們測(cè)試了很多語(yǔ)音識(shí)別服務(wù),但只有 Riva 提供了極高且穩(wěn)定的實(shí)時(shí)性能。所以現(xiàn)在我們可以讓我們的聲音 AI 系統(tǒng)更加接近人類的聽覺(jué)感知。”

“正如我們所觀察到的,AR 眼鏡最有可能在環(huán)境嘈雜的開放空間中使用。NVIDIA Riva 幫助我們?cè)卩须s的環(huán)境中也能準(zhǔn)確轉(zhuǎn)錄語(yǔ)音,并為我們提供了無(wú)縫體驗(yàn),可以集成到我們的 Cochl.Sense 平臺(tái)上。”

輔助技術(shù)的未來(lái)

創(chuàng)建一個(gè)能像人類一樣感知聲音的通用 AI 系統(tǒng)是一項(xiàng)巨大的挑戰(zhàn)。為了使 AR 眼鏡更易于使用,需要更輕便的可穿戴技術(shù)。

盡管它們?nèi)匀皇菍⒙曇艉驼Z(yǔ)音轉(zhuǎn)化為視覺(jué)信息的理想媒介。通過(guò)集成機(jī)器聽覺(jué)功能,AR 眼鏡能夠?yàn)槭澜绺鞯氐拿@啞或聽力障礙者帶來(lái)更加安全、便捷和愉快的日常生活體驗(yàn)。

Cochl 還在探索語(yǔ)音 AI 的更多用例,例如為 AR 眼鏡上的任何視頻提供隱藏式字幕和實(shí)現(xiàn)多個(gè)發(fā)言者的轉(zhuǎn)錄。為了給聽力障礙者帶來(lái)最佳體驗(yàn),該公司正在探索分析并可視化音樂(lè)的方法,以幫助他們至少能夠理解音樂(lè)的類型和情感。

該公司期待體驗(yàn)更多的 NVIDIA 解決方案,包括 Riva、NVIDIA NeMo 和 NVIDIA TensorRT。

點(diǎn)擊“閱讀原文”,或掃描下方海報(bào)二維碼,在 8 月 8日聆聽NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 SIGGRAPH 現(xiàn)場(chǎng)發(fā)表的 NVIDIA 主題演講,了解 NVIDIA 的新技術(shù),包括屢獲殊榮的研究,OpenUSD 開發(fā),以及最新的 AI 內(nèi)容創(chuàng)作解決方案。


原文標(biāo)題:聚焦語(yǔ)音 AI:在 AR 眼鏡上可視化語(yǔ)音和聲音

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3776

    瀏覽量

    91117

原文標(biāo)題:聚焦語(yǔ)音 AI:在 AR 眼鏡上可視化語(yǔ)音和聲音

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    什么是大屏數(shù)據(jù)可視化?特點(diǎn)有哪些?

    大屏數(shù)據(jù)可視化是指通過(guò)大屏幕展示大量數(shù)據(jù)和信息,以直觀、可視化的方式幫助用戶理解和分析數(shù)據(jù)。這種展示方式通常用于展示復(fù)雜的數(shù)據(jù)集、實(shí)時(shí)監(jiān)控系統(tǒng)、企業(yè)管理儀表盤等。以下是關(guān)于 大屏數(shù)據(jù)可視化 的詳細(xì)
    的頭像 發(fā)表于 12-16 16:59 ?179次閱讀

    智慧能源可視化監(jiān)管平臺(tái)——助力可視化能源數(shù)據(jù)管理

    博達(dá)可視化大屏設(shè)計(jì)平臺(tái)智慧能源領(lǐng)域的價(jià)值體現(xiàn)在實(shí)時(shí)監(jiān)控、數(shù)據(jù)可視化、決策支持和效率提升等方面。借助該平臺(tái),企業(yè)可以輕松搭建智慧能源類可視化大屏,更加精確和高效地管理生產(chǎn)和生活,實(shí)現(xiàn)能
    的頭像 發(fā)表于 11-29 10:00 ?303次閱讀
    智慧能源<b class='flag-5'>可視化</b>監(jiān)管平臺(tái)——助力<b class='flag-5'>可視化</b>能源數(shù)據(jù)管理

    智慧樓宇可視化的優(yōu)點(diǎn)

    智慧樓宇可視化是指通過(guò)數(shù)據(jù)可視化技術(shù)來(lái)展示和分析樓宇的各種數(shù)據(jù),為樓宇管理者和用戶提供直觀、清晰的信息展示和決策支持。以下是智慧樓宇可視化的優(yōu)點(diǎn),詳細(xì)介紹其樓宇管理和運(yùn)營(yíng)中的重要作用
    的頭像 發(fā)表于 11-19 14:25 ?189次閱讀

    三維可視化運(yùn)用的主要技術(shù)

    介紹三維可視化運(yùn)用的主要技術(shù),涵蓋渲染技術(shù)、建模技術(shù)、交互技術(shù)以及數(shù)據(jù)處理技術(shù)等方面。 首先,渲染技術(shù)是三維可視化中至關(guān)重要的一環(huán)。渲染是指將模型轉(zhuǎn)化為圖像或動(dòng)畫的過(guò)程,使其能夠屏幕
    的頭像 發(fā)表于 07-19 13:56 ?293次閱讀

    大屏數(shù)據(jù)可視化 開源

    在當(dāng)今信息爆炸的時(shí)代,數(shù)據(jù)已經(jīng)成為各個(gè)行業(yè)決策制定和業(yè)務(wù)發(fā)展的關(guān)鍵。為了更直觀、準(zhǔn)確地理解和利用海量數(shù)據(jù), 大屏數(shù)據(jù)可視化 成為一種強(qiáng)大的工具。通過(guò)將數(shù)據(jù)以圖表、圖形等形式展示大屏幕,不僅
    的頭像 發(fā)表于 06-27 16:06 ?412次閱讀
    大屏數(shù)據(jù)<b class='flag-5'>可視化</b> 開源

    如何實(shí)現(xiàn)園區(qū)大屏可視化?

    孿生可視化 構(gòu)建平臺(tái)利用Web三維可視化技術(shù)對(duì)現(xiàn)實(shí)場(chǎng)景進(jìn)行仿真,實(shí)現(xiàn)園區(qū)級(jí)業(yè)務(wù)場(chǎng)景 的可視化呈現(xiàn),助力企業(yè)快速完成項(xiàng)目的實(shí)施。實(shí)現(xiàn)園區(qū)場(chǎng)景立體可先,極致可視。那么,今天古河云科技就來(lái)給
    的頭像 發(fā)表于 06-19 15:39 ?427次閱讀
    如何實(shí)現(xiàn)園區(qū)大屏<b class='flag-5'>可視化</b>?

    態(tài)勢(shì)數(shù)據(jù)可視化技術(shù)有哪些

    智慧華盛恒輝態(tài)勢(shì)數(shù)據(jù)可視化技術(shù)是一種將數(shù)據(jù)以圖形、圖像、動(dòng)畫等視覺(jué)形式展現(xiàn)出來(lái)的技術(shù),特別是處理和分析態(tài)勢(shì)數(shù)據(jù)時(shí),該技術(shù)能夠?qū)?fù)雜的數(shù)據(jù)轉(zhuǎn)化為直觀、易于理解的視覺(jué)表現(xiàn)。以下是態(tài)勢(shì)數(shù)據(jù)可視化技術(shù)
    的頭像 發(fā)表于 06-11 15:47 ?381次閱讀

    大屏數(shù)據(jù)可視化的作用和意義

    大屏數(shù)據(jù)可視化是指利用大屏幕設(shè)備展示數(shù)據(jù)信息,通過(guò)圖表、圖像、動(dòng)畫等視覺(jué)手段將數(shù)據(jù)呈現(xiàn)出來(lái),以便用戶能夠直觀、清晰地理解數(shù)據(jù)背后的含義和關(guān)聯(lián)。信息化時(shí)代,數(shù)據(jù)已經(jīng)成為企業(yè)決策和運(yùn)營(yíng)的重要依托,而
    的頭像 發(fā)表于 06-03 17:56 ?675次閱讀

    三維可視化數(shù)據(jù)大屏的設(shè)計(jì)原理和技巧

    三維可視化數(shù)據(jù)大屏設(shè)計(jì)面向交通、園區(qū)、城市、建筑、應(yīng)急等領(lǐng)域的客戶,以孿生可視能力賦能,提供行業(yè)解決方案。雙渲染引擎,1:1還原真實(shí)世界,模型運(yùn)行流暢的基礎(chǔ)提供極佳的視覺(jué)效果。今天
    的頭像 發(fā)表于 05-30 17:09 ?550次閱讀

    請(qǐng)問(wèn)freertos可視化調(diào)試中打印任務(wù)信息是不是只可以打印一次?

    freertos中,使用可視化調(diào)試打印任務(wù)消息,但是打印不全,還只能打印一次,使用IAR自帶的調(diào)試插件看,顯示可視化調(diào)試任務(wù)的堆棧頂全是a,這事怎么回事?
    發(fā)表于 05-07 06:16

    FUXA基于Web的過(guò)程可視化軟件案例

    FUXA——基于Web的過(guò)程可視化軟件
    發(fā)表于 04-24 18:32 ?2次下載

    態(tài)勢(shì)數(shù)據(jù)可視化技術(shù)有哪些

    智慧華盛恒輝態(tài)勢(shì)數(shù)據(jù)可視化技術(shù)是一種將復(fù)雜、動(dòng)態(tài)的態(tài)勢(shì)數(shù)據(jù)以直觀、易于理解的方式展現(xiàn)出來(lái)的技術(shù)手段。以下是幾種主要的態(tài)勢(shì)數(shù)據(jù)可視化技術(shù): 網(wǎng)絡(luò)安全態(tài)勢(shì)指標(biāo)可視化分析系統(tǒng)及方法,針對(duì)安全態(tài)勢(shì)指標(biāo)不準(zhǔn)
    的頭像 發(fā)表于 04-22 15:17 ?405次閱讀

    物聯(lián)網(wǎng)可視化監(jiān)控大屏如何實(shí)現(xiàn)?有什么功能?

    物聯(lián)網(wǎng)飛速發(fā)展的時(shí)代,可視化監(jiān)控大屏成為了眾多企業(yè)和機(jī)構(gòu)實(shí)現(xiàn)智能管理和監(jiān)控的重要工具。它將各種各樣設(shè)備的運(yùn)行狀態(tài)和數(shù)據(jù)以圖形、圖表、動(dòng)畫等形式展示大屏或其他移動(dòng)設(shè)備
    的頭像 發(fā)表于 04-11 09:25 ?880次閱讀

    OPPO發(fā)布全新AR眼鏡Air Glass 3,集成AI語(yǔ)音助手功能

    OPPO于近日MWC 2024震撼發(fā)布了其最新增實(shí)境(AR眼鏡原型——OPPO Air Glass 3。這款新型眼鏡不僅在設(shè)計(jì)和技術(shù)上
    的頭像 發(fā)表于 03-04 14:00 ?953次閱讀

    可視化全程追溯,可視化資產(chǎn)管理系統(tǒng)

    摘要:本文將從應(yīng)用價(jià)值、系統(tǒng)功能、資產(chǎn)盤點(diǎn)、資產(chǎn)出入庫(kù)、資產(chǎn)定位以及系統(tǒng)實(shí)現(xiàn)能效等幾個(gè)方面,闡述新導(dǎo)物聯(lián)可視化資產(chǎn)管理系統(tǒng)為企業(yè)提供的優(yōu)勢(shì),以提升資產(chǎn)管理的效率和準(zhǔn)確度。 一、應(yīng)用價(jià)值 可視化資產(chǎn)
    的頭像 發(fā)表于 01-11 13:54 ?516次閱讀
    <b class='flag-5'>可視化</b>全程追溯,<b class='flag-5'>可視化</b>資產(chǎn)管理系統(tǒng)