0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算機(jī)視覺(jué)中手語(yǔ)識(shí)別研究

BJ數(shù)據(jù)堂 ? 來(lái)源:BJ數(shù)據(jù)堂 ? 作者:BJ數(shù)據(jù)堂 ? 2023-04-14 16:11 ? 次閱讀

計(jì)算機(jī)視覺(jué)中手語(yǔ)識(shí)別研究

手語(yǔ)識(shí)別的目的就是通過(guò)計(jì)算機(jī)提供一種有效的、準(zhǔn)確的機(jī)制將聾啞人常用的手語(yǔ)手勢(shì)識(shí)別出來(lái),使得他們與健全人之間的交互變得更方便、快捷。同時(shí),手語(yǔ)識(shí)別的應(yīng)用還可以提供更自然的人機(jī)交互方式,方便聾啞人對(duì)計(jì)算機(jī)等常用信息設(shè)備的使用。目前手語(yǔ)識(shí)別可以分為基于視覺(jué)(圖像)的識(shí)別系統(tǒng)和基于數(shù)據(jù)手套(佩戴式設(shè)備)的識(shí)別系統(tǒng)?;谝曈X(jué)的手勢(shì)識(shí)別系統(tǒng)采用常見(jiàn)的視頻采集設(shè)備作為手勢(shì)感知輸入設(shè)備,價(jià)格便宜、便于安裝。鑒于基于視覺(jué)的手勢(shì)識(shí)別方法交互自然便利,適于普及應(yīng)用,且更能反映機(jī)器模擬人類(lèi)視覺(jué)的功能,所以目前是手勢(shì)識(shí)別的研究重點(diǎn)。

手語(yǔ)識(shí)別的研究開(kāi)始于1982年,Shantz和Poizner實(shí)現(xiàn)了一個(gè)合成美國(guó)手語(yǔ)的計(jì)算機(jī)程序。之后,中國(guó)、美國(guó)、日本、德國(guó)等許多國(guó)家都進(jìn)行了自己國(guó)家的手語(yǔ)識(shí)別與合成研究,并取得了許多重要的研究成果。Triesch和Malsburg開(kāi)發(fā)了一種彈性圖模板匹配技術(shù)對(duì)復(fù)雜背景下的手形進(jìn)行分類(lèi),在相對(duì)復(fù)雜的背景下的識(shí)別率達(dá)到86.2%。Davis和Shah將戴上指間具有高亮標(biāo)記的視覺(jué)手套的手勢(shì)作為系統(tǒng)的輸入,可識(shí)別7種手勢(shì)。Starner等在對(duì)美國(guó)手語(yǔ)中帶有詞性的40個(gè)詞匯隨機(jī)組成的短句子識(shí)別率達(dá)到99.2%。Yang等人采用7Hu不變矩特征量進(jìn)行手語(yǔ)字母識(shí)別,最好識(shí)別率為90%。

在圖像特征提取方面,為了能夠同時(shí)表征圖像的全局特性和局部特性,需要同時(shí)提取圖像的全局特征和局部特征,并且這些特征中用以描述圖像整體形狀的特征應(yīng)當(dāng)具備平移、旋轉(zhuǎn)和尺度不變性。SIFT(Scale Invariant Feature Transform)是一種對(duì)尺度空間、圖像縮放、旋轉(zhuǎn)甚至仿射不變的圖像局部特征描述算子;而7Hu不變矩特征量具有平移、旋轉(zhuǎn)和尺度不變性的特點(diǎn),具有很好的穩(wěn)定性,適合描述目標(biāo)整體形狀。

數(shù)據(jù)堂自制版權(quán)的系列數(shù)據(jù)集產(chǎn)品為“手勢(shì)識(shí)別”這一技術(shù)路徑的實(shí)現(xiàn)提供了強(qiáng)有力的支持。

1314,178張18種手勢(shì)識(shí)別數(shù)據(jù)

314,178張18種手勢(shì)識(shí)別數(shù)據(jù)涵蓋多種場(chǎng)景、18種手勢(shì)、5種拍攝角度、多年齡段、多種光照條件。在標(biāo)注方面,標(biāo)注21關(guān)鍵點(diǎn)(每個(gè)關(guān)鍵點(diǎn)有可見(jiàn)不可見(jiàn)屬性)、手勢(shì)類(lèi)別和手勢(shì)屬性。314,178張18種手勢(shì)識(shí)別數(shù)據(jù)可用于手勢(shì)識(shí)別、人機(jī)交互等任務(wù)。

基于線性核函數(shù)的SVM平均識(shí)別率為95.556%,基于徑向基核函數(shù)的SVM平均識(shí)別率為83.1282%。實(shí)驗(yàn)表明,采用徑向基核函數(shù)的SVM識(shí)別率普遍低于采用線性核函數(shù)的SVM。

本文提出了一種采用7Hu不變矩特征量等多種圖像特征相融合的SVMs手語(yǔ)識(shí)別方法。實(shí)驗(yàn)表明,在手語(yǔ)識(shí)別中,采用圖像全局和局部特征相結(jié)合的方法,可獲得較高的識(shí)別率,為手語(yǔ)識(shí)別方法的早日推廣應(yīng)用提供了理論依據(jù)。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    計(jì)算機(jī)視覺(jué)有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺(jué)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類(lèi)一樣理解和解釋圖像和視頻的信息。這一技術(shù)的發(fā)展不僅推動(dòng)了多個(gè)行業(yè)的變革,也帶來(lái)了諸多優(yōu)勢(shì),但同時(shí)也伴隨著一些挑戰(zhàn)和局限
    的頭像 發(fā)表于 08-14 09:49 ?1059次閱讀

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)有什么區(qū)別

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。 一、定義 機(jī)器視覺(jué) 機(jī)器視覺(jué),又稱(chēng)為計(jì)算機(jī)
    的頭像 發(fā)表于 07-16 10:23 ?573次閱讀

    計(jì)算機(jī)視覺(jué)的五大技術(shù)

    計(jì)算機(jī)視覺(jué)作為深度學(xué)習(xí)領(lǐng)域最熱門(mén)的研究方向之一,其技術(shù)涵蓋了多個(gè)方面,為人工智能的發(fā)展開(kāi)拓了廣闊的道路。以下是對(duì)計(jì)算機(jī)視覺(jué)五大技術(shù)的詳細(xì)解析
    的頭像 發(fā)表于 07-10 18:26 ?1464次閱讀

    計(jì)算機(jī)視覺(jué)的工作原理和應(yīng)用

    計(jì)算機(jī)視覺(jué)(Computer Vision,簡(jiǎn)稱(chēng)CV)是一門(mén)跨學(xué)科的研究領(lǐng)域,它利用計(jì)算機(jī)和數(shù)學(xué)算法來(lái)模擬人類(lèi)視覺(jué)系統(tǒng)對(duì)圖像和視頻進(jìn)行
    的頭像 發(fā)表于 07-10 18:24 ?2165次閱讀

    計(jì)算機(jī)視覺(jué)與人工智能的關(guān)系是什么

    引言 計(jì)算機(jī)視覺(jué)是一門(mén)研究如何使計(jì)算機(jī)能夠理解和解釋視覺(jué)信息的學(xué)科。它涉及到圖像處理、模式識(shí)別
    的頭像 發(fā)表于 07-09 09:25 ?708次閱讀

    計(jì)算機(jī)視覺(jué)與智能感知是干嘛的

    引言 計(jì)算機(jī)視覺(jué)(Computer Vision)是一門(mén)研究如何使計(jì)算機(jī)能夠理解和解釋視覺(jué)信息的學(xué)科。它涉及到圖像處理、模式
    的頭像 發(fā)表于 07-09 09:23 ?997次閱讀

    計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)區(qū)別在哪

    計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計(jì)算機(jī)視覺(jué) 計(jì)算機(jī)
    的頭像 發(fā)表于 07-09 09:22 ?486次閱讀

    計(jì)算機(jī)視覺(jué)和圖像處理的區(qū)別和聯(lián)系

    計(jì)算機(jī)視覺(jué)和圖像處理是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計(jì)算機(jī)視覺(jué) 計(jì)算機(jī)視覺(jué)
    的頭像 發(fā)表于 07-09 09:16 ?1392次閱讀

    計(jì)算機(jī)視覺(jué)在人工智能領(lǐng)域有哪些主要應(yīng)用?

    計(jì)算機(jī)視覺(jué)是人工智能領(lǐng)域的一個(gè)重要分支,它主要研究如何讓計(jì)算機(jī)能夠像人類(lèi)一樣理解和處理圖像和視頻數(shù)據(jù)。計(jì)算機(jī)
    的頭像 發(fā)表于 07-09 09:14 ?1525次閱讀

    計(jì)算機(jī)視覺(jué)屬于人工智能嗎

    屬于,計(jì)算機(jī)視覺(jué)是人工智能領(lǐng)域的一個(gè)重要分支。 引言 計(jì)算機(jī)視覺(jué)是一門(mén)研究如何使計(jì)算機(jī)具有
    的頭像 發(fā)表于 07-09 09:11 ?1360次閱讀

    深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其中的核心技術(shù)之一,已經(jīng)在計(jì)算機(jī)視覺(jué)領(lǐng)域取得了顯著的成果。計(jì)算機(jī)視覺(jué),作為計(jì)算機(jī)科學(xué)的一個(gè)重要分支,
    的頭像 發(fā)表于 07-01 11:38 ?883次閱讀

    機(jī)器視覺(jué)計(jì)算機(jī)視覺(jué)的區(qū)別

    在人工智能和自動(dòng)化技術(shù)的快速發(fā)展,機(jī)器視覺(jué)(Machine Vision, MV)和計(jì)算機(jī)視覺(jué)(Computer Vision, CV)作為兩個(gè)重要的分支領(lǐng)域,都扮演著至關(guān)重要的角色
    的頭像 發(fā)表于 06-06 17:24 ?1378次閱讀

    計(jì)算機(jī)視覺(jué)的主要研究方向

    計(jì)算機(jī)視覺(jué)(Computer Vision, CV)作為人工智能領(lǐng)域的一個(gè)重要分支,致力于使計(jì)算機(jī)能夠像人眼一樣理解和解釋圖像和視頻的信息。隨著深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)的快速發(fā)展,
    的頭像 發(fā)表于 06-06 17:17 ?1037次閱讀

    計(jì)算機(jī)視覺(jué)的十大算法

    隨著科技的不斷發(fā)展,計(jì)算機(jī)視覺(jué)領(lǐng)域也取得了長(zhǎng)足的進(jìn)步。本文將介紹計(jì)算機(jī)視覺(jué)領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場(chǎng)景和優(yōu)缺點(diǎn)。這些算法在圖像處理、目標(biāo)檢測(cè)、人臉
    的頭像 發(fā)表于 02-19 13:26 ?1289次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺(jué)</b>的十大算法

    計(jì)算機(jī)視覺(jué)與圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)學(xué)科之間的關(guān)系

    計(jì)算機(jī)視覺(jué)(computer vision):用計(jì)算機(jī)來(lái)模擬人的視覺(jué)機(jī)理獲取和處理信息的能力。就是指用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟
    的頭像 發(fā)表于 01-18 16:41 ?642次閱讀