0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Seeing AI幫助盲人和弱視用戶“看”世界

NVIDIA英偉達企業(yè)解決方案 ? 來源:未知 ? 作者:胡薇 ? 2018-05-15 10:44 ? 次閱讀

導盲犬可以很好地幫助盲人或視障人士出行,但是如果想辨別出前面路口的標識,或者想知道錢包里還有多少錢,導盲犬可就辦不到了。

由微軟AI研究小組開發(fā)的應(yīng)用程序Seeing AI為這個問題給出了解決方案。該應(yīng)用程序可為盲人和弱視用戶描述這個世界,使他們可以使用自己的智能手機來識別一切:包括單個物體、顏色、鈔票、文檔等。

自去年問世以來,這一應(yīng)用程序的下載量已突破15萬次,執(zhí)行任務(wù)500萬次,其中一些任務(wù)的服務(wù)對象還是全球知名的盲人。

“Stevie Wonder(美國知名藝人)每天都會用,這確實很令人振奮。”微軟高級數(shù)據(jù)科學家Anirudh Koul在3月于圣何塞舉行的GPU技術(shù)大會上發(fā)表演講時說道。

該應(yīng)用程序的現(xiàn)場演示就已展現(xiàn)出了其強大的功能。和Koul一同上臺的還有他的一位同事,當他在自己的智能手機上運行應(yīng)用程序,并將手機朝向他的同事時,應(yīng)用程序描述他看到的是“一位31歲、有著黑頭發(fā)、戴著眼鏡且看起來很開心的男士”。

如果這位同事在他的聯(lián)系人列表中,則有更佳的使用效果,因為Seeing AI可以與用戶的聯(lián)系人進行整合,并能識別出朋友的名字。

Koul還分享了幾個令人嘆服的使用案例:一位盲人教師將運行該應(yīng)用的手機面朝教室門口,這樣孩子們就不會因她是盲人而趁機偷偷進出教室;另一位用戶在颶風肆虐的地區(qū)穿行時,利用這款應(yīng)用程序避開了倒落的電線和其他障礙物。

Seeing AI的開發(fā)始于2014年2月,開發(fā)人員曾試圖創(chuàng)建一個能發(fā)現(xiàn)并識別周圍物體的卷積神經(jīng)網(wǎng)絡(luò)。但是其延遲時間達10秒,這樣的速度不能及時幫助人們快速作出決策。

第二年,微軟贊助了一場為期一周的黑客馬拉松,活動共吸引了13000人參與,并由此引發(fā)了第二次嘗試:在用戶的頭上配備手機。

在使用智能眼鏡進行試驗后,Koul的團隊開始著手于應(yīng)用程序本身的開發(fā)工作。網(wǎng)絡(luò)本地訓練過程在NVIDIA GPU上進行,而較為繁重的工作則交給了基于NVIDIA Tesla P100 GPU運行的Azure云實例。通過逐幀分析確定每一部分訓練的發(fā)生位置。

AI調(diào)優(yōu)

應(yīng)用程序需要辨別不同圖像,而圖像屬性具有不確定性,所以開發(fā)人員針對此特性對模型進行了訓練。例如,如果訓練應(yīng)用程序識別貨幣,則需要向訓練網(wǎng)絡(luò)內(nèi)輸入不清晰和無背景的貨幣圖片,以及貨幣某一極小部分放大后的圖片,再讓其識別出圖片的真實內(nèi)容。

該團隊向志愿者征集,最終得到了各種類型的圖片,其中包括一張貓咪玩紙幣的圖片,以及紙幣被封在冰塊中的照片。通過這些變量對模型進行訓練,最終就能夠計算出識別圖片所需的最小參數(shù)。

Koul的團隊對網(wǎng)絡(luò)進行了調(diào)整,使其傾向于得出否定性分類或不分類的結(jié)果,而不是猜測結(jié)果(這樣可能將5元鈔票識別成10元),因為猜測很顯然會給盲人用戶造成麻煩。

隨著用戶人數(shù)的增多,這款應(yīng)用程序也將變得越好、越準確。AI將會成為盲人和視障用戶的福音。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 智能手機
    +關(guān)注

    關(guān)注

    66

    文章

    18495

    瀏覽量

    180279
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30947

    瀏覽量

    269216

原文標題:重見光明:深度學習幫助盲人“看”到世界

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    AI基礎(chǔ)數(shù)據(jù)服務(wù)是AI產(chǎn)業(yè)的關(guān)鍵支撐

    數(shù)據(jù)、算法和算力是構(gòu)建AI系統(tǒng)的三大核心要素,三者的協(xié)同使現(xiàn)代AI技術(shù)實現(xiàn)了從理論到應(yīng)用的飛躍。算法是處理信息、提取特征、進行預測的邏輯框架;算力支持算法處理龐人和復雜的數(shù)據(jù)集,使得研究人員能夠探索
    的頭像 發(fā)表于 12-13 15:45 ?221次閱讀
    <b class='flag-5'>AI</b>基礎(chǔ)數(shù)據(jù)服務(wù)是<b class='flag-5'>AI</b>產(chǎn)業(yè)的關(guān)鍵支撐

    AI基礎(chǔ)數(shù)據(jù)服務(wù)在AI產(chǎn)業(yè)升級中扮演哪些角色

    數(shù)據(jù)、算法和算力是構(gòu)建AI系統(tǒng)的三大核心要素,三者的協(xié)同使現(xiàn)代AI技術(shù)實現(xiàn)了從理論到應(yīng)用的飛躍。算法是處理信息、提取特征、進行預測的邏輯框架;算力支持算法處理龐人和復雜的數(shù)據(jù)集,使得研究人員能夠探索
    的頭像 發(fā)表于 12-13 15:41 ?412次閱讀
    <b class='flag-5'>AI</b>基礎(chǔ)數(shù)據(jù)服務(wù)在<b class='flag-5'>AI</b>產(chǎn)業(yè)升級中扮演哪些角色

    開發(fā)者大會成功舉辦 vivo用科技搭建人與數(shù)字世界的無障礙橋梁

    盲人協(xié)會主席李慶忠出席論壇,與資深用戶、合作伙伴們分享vivo信息無障礙建設(shè)最新成果,共同展望信息無障礙美好未來。 vivo副總裁、vvQ AI全球研究院院長周圍與中國殘疾人聯(lián)合會理事,中國
    發(fā)表于 10-12 14:18 ?147次閱讀
    開發(fā)者大會成功舉辦 vivo用科技搭建人與數(shù)字<b class='flag-5'>世界</b>的無障礙橋梁

    使用Google Play獲得安全可靠的AI體驗

    生成式 AI 的快速發(fā)展為開發(fā)者提供了機會,讓開發(fā)者能為世界各地用戶創(chuàng)造全新、引人入勝的沉浸式應(yīng)用體驗。在這個瞬息萬變的時代,我們很高興能繼續(xù)幫助開發(fā)者創(chuàng)建創(chuàng)新、優(yōu)質(zhì)的應(yīng)用,同時保持
    的頭像 發(fā)表于 09-09 15:53 ?435次閱讀

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結(jié)經(jīng)驗,擬按照要求準備相關(guān)體會材料。
    發(fā)表于 09-09 15:36

    FMEA:解鎖AI用戶體驗新境界,直擊用戶心坎的智能鑰匙

    在復雜多變的AI系統(tǒng)中,F(xiàn)MEA不僅僅是傳統(tǒng)制造業(yè)中預防缺陷的工具,它更是一把解鎖AI用戶體驗新境界的鑰匙。通過系統(tǒng)地識別、評估AI系統(tǒng)可能面臨的失效模式及其對
    的頭像 發(fā)表于 09-05 11:02 ?325次閱讀

    平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平

    機制,還包括了數(shù)據(jù)的來源、處理方式以及使用目的的明確披露。這樣不僅有助于監(jiān)管機構(gòu)進行審查,也讓普通用戶能夠理解AI系統(tǒng)的決策依據(jù),從而減少因“黑箱操作”帶來的不信任和誤解。例如,在AI輔助醫(yī)療診斷中
    發(fā)表于 07-16 15:07

    昆侖萬維天工AI日活用戶超過100萬

    昆侖萬維集團近日宣布,旗下天工AI的每日活躍用戶(DAU)已突破百萬大關(guān),標志著其在人工智能領(lǐng)域的強大影響力和用戶基礎(chǔ)。天工AI智能體平臺匯聚了近百萬個
    的頭像 發(fā)表于 05-28 09:16 ?641次閱讀

    EyeEm平臺默認使用用戶照片訓練AI模型,用戶可自行刪除作品

    據(jù)報道,攝影分享平臺EyeEm近期更新服務(wù)協(xié)議,宣稱將默認使用用戶上傳的圖片進行AI模型訓練,若用戶對此提出異議,則需自行刪除所有作品。
    的頭像 發(fā)表于 04-29 16:51 ?654次閱讀

    AI正通過智能家居幫助我們?nèi)朊?/a>

    不少企業(yè)已經(jīng)推出了個性化的睡眠方案,結(jié)合智能床墊和智能枕頭,通過智能分析和個性化設(shè)置,AI能夠根據(jù)用戶的睡眠習慣和偏好,自動調(diào)整睡眠環(huán)境,從而提供更加舒適和健康的睡眠體驗。 ? 要想實現(xiàn)這一技術(shù),與產(chǎn)品中的重要軟硬件是分不開的
    的頭像 發(fā)表于 04-12 00:08 ?3281次閱讀
    <b class='flag-5'>AI</b>正通過智能家居<b class='flag-5'>幫助</b>我們?nèi)朊? />    </a>
</div><div   id=

    AI芯片未來會控制這個世界嗎?

    AI芯片行業(yè)資訊
    芯廣場
    發(fā)布于 :2024年03月27日 18:21:28

    NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

    :在工業(yè)生產(chǎn)過程中,NanoEdge AI 可以幫助實現(xiàn)對生產(chǎn)線的實時監(jiān)控和故障預測,提高生產(chǎn)效率和降低維護成本。 3.智能交通:通過將 NanoEdge AI 應(yīng)用于交通信號燈、無人駕駛汽車等設(shè)備
    發(fā)表于 03-12 08:09

    谷歌發(fā)布全新AI基礎(chǔ)世界模型Genie

    谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨特之處在于,僅需一張圖片,便能生成一個充滿活力和交互性的虛擬世界用戶可以在這個
    的頭像 發(fā)表于 03-04 14:02 ?763次閱讀

    谷歌發(fā)布AI基礎(chǔ)世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎(chǔ)世界模型Genie。這一創(chuàng)新技術(shù)允許用戶通過單張圖像提示,生成一個可玩的、交互式的虛擬環(huán)境,從而開啟了一個全新的數(shù)字體驗時代。
    的頭像 發(fā)表于 02-28 17:41 ?839次閱讀

    Vitis AI用戶指南

    電子發(fā)燒友網(wǎng)站提供《Vitis AI用戶指南.pdf》資料免費下載
    發(fā)表于 01-03 10:51 ?1次下載
    Vitis <b class='flag-5'>AI</b><b class='flag-5'>用戶</b>指南