0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

簡單闡述一下計算機視覺的幾大任務!

電子工程師 ? 來源:CSDN - ViatorSun ? 作者:CSDN - ViatorSun ? 2021-03-24 15:16 ? 次閱讀

計算機視覺的幾大任務:

目標跟蹤、圖像和視頻的生成

這里有一些比較常見的計算機視覺的應用,平時我們也會用到,包括多重的人臉識別,現(xiàn)在有些比較流行的照片應用,不知道大家平時會不會用到,包括比如像 Google photos,基本上傳一張照片上去,它就會對同樣的照片同樣的人物進行歸類,這個也是目前非常常見的一個應用。

中間那個叫 OCR,就是對文本進行掃描和識別,這個技術目前已經比較成熟了。照片上這張是比較老的技術,當時我記得有公司做這個應用,有個掃描筆,掃描一下就變成文字,現(xiàn)在的話,基本上已經不需要這么近的去掃描了,大家只要拍一張照片,如果這張照片是比較清晰的,經過一兩秒鐘,一般我們現(xiàn)在算法就可以直接把它轉換成文字,而且準確率相當高,所以圖片上的這種 OCR 是一個過時的技術。

右下角是車牌檢測,開車的時候不小心壓到線了,闖紅燈了,收到一張罰單,這個怎么做到呢?也是計算機視覺的功勞,它們可以很容易的就去識別這個照片里的車牌,甚至車牌有一定的污損,經過計算機視覺的增強都是可以把它給可以優(yōu)化回來的,所以這個技術也是比較實用的。

01. 圖像識別

車牌識別、人臉識別

02. 目標檢測

行人檢測、車輛檢測

03. 圖像分割

圖像語義分割、個體分割=檢測+分割

視頻分割:

04. 目標跟蹤

下面聊幾個比較有挑戰(zhàn)性的計算機視覺的任務。首先是目標跟蹤,目標跟蹤就是我們在連續(xù)的圖片或者視頻流里面,想要去追蹤某一個指定的對象,這個聽起來對人來說是一個非常容易的任務,大家只要目不轉睛盯著一個東西,沒有人能逃脫我們的視野。

實際上對機器來說,這是一個很有挑戰(zhàn)性的任務,為什么呢?因為機器在追蹤對象的時候,大部分會使用最原始的一些方法,采取一些對目標圖片進行形變的匹配,就是比較早期的計算機識別的方法,而這個方法在實際應用中間是非常難以實現(xiàn)的,為什么?因為需要跟蹤的對象,它由于角度、光照、遮擋的原因包括運動的時候,它會變得模糊,還有相似背景的干擾,所以我們很難利用模板匹配這種方法去追蹤這個對象。

一個人他面對你、背對你、側對你,可能景象完全不一樣,這種情況下,同樣一個模板是無法匹配的,所以說,很有潛力但也很有挑戰(zhàn)性,因為目前對象追蹤的算法完全沒有達到人臉識別的準確率,還有很多的人在不斷的努力去尋找新的方法去提升。

右邊也是一個例子,就是簡單的一個對我們頭部的追蹤,也是非常有挑戰(zhàn)性的,因為我們頭可以旋轉,尺度也可能發(fā)生變化,用手去遮擋,這都給匹配造成很大的難度。

05. 多模態(tài)問題

后面還有一些比較有挑戰(zhàn)性的計算機視覺任務,我們歸類把它們叫做多模態(tài)問題,其中包括 VQA,這是什么意思?這個就是說給定一張圖片,我們可以任意的去問它一些問題,一般是比較直接的一些問題,Who、Where、How,類似這些問題,或者這個多模態(tài)的模型,要能夠根據圖片的真實信息去回答我們的問題。

舉個例子,比如底下圖片中間有兩張是小朋友的,計算機視覺看到這張圖片的時候它要把其中所有的對象全部分割出來,要了解每個對象是什么,知道它們其中的聯(lián)系。比如左邊的小朋友在喝奶,如果把他的奶瓶分出來以后,它必須要知道這個小朋友在喝奶,這個關系也是很重要的。

屏幕上的問題是“Where is the child sitting?”,這個問題的復雜度就比單純的只是解析圖像要復雜的多。他需要把里面所有信息的全部解析出來,并且能準確的去關聯(lián)他們的關系,同時這個模型還要能夠理解我們問這個問題到底是個什么用意,他要知道問的是位置,而且這個對象是這個小孩,所以這個是包含著計算機視覺加上自然語言識別,兩種這種技術的相結合,所以才叫多模態(tài)問題,模態(tài)指的是像語音,文字,圖像,語音,這種幾種模態(tài)放在一起就叫多模態(tài)問題。

右邊一個例子是 Caption Generation,現(xiàn)在非常流行的研究的領域,給定一張圖片,然后對圖片里面的東西進行描述。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人臉識別
    +關注

    關注

    76

    文章

    4012

    瀏覽量

    81937
  • OCR
    OCR
    +關注

    關注

    0

    文章

    144

    瀏覽量

    16377
收藏 人收藏

    評論

    相關推薦

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領域的個重要分支,旨在使計算機能夠像人類樣理解和解釋圖像和視頻中的信息。這
    的頭像 發(fā)表于 08-14 09:49 ?985次閱讀

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的個重要分支,旨在使計算機能夠像人類樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這
    的頭像 發(fā)表于 07-24 12:46 ?885次閱讀

    機器視覺計算機視覺有什么區(qū)別

    機器視覺計算機視覺是兩個密切相關但又有所區(qū)別的概念。 、定義 機器視覺 機器視覺,又稱為
    的頭像 發(fā)表于 07-16 10:23 ?546次閱讀

    計算機視覺的五大技術

    計算機視覺作為深度學習領域最熱門的研究方向之,其技術涵蓋了多個方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計算機視覺五大技術的詳細解析
    的頭像 發(fā)表于 07-10 18:26 ?1388次閱讀

    計算機視覺的工作原理和應用

    計算機視覺(Computer Vision,簡稱CV)是門跨學科的研究領域,它利用計算機和數學算法來模擬人類視覺系統(tǒng)對圖像和視頻進行識別、
    的頭像 發(fā)表于 07-10 18:24 ?2031次閱讀

    計算機視覺與人工智能的關系是什么

    引言 計算機視覺門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域的知識。人工智能則是研究如
    的頭像 發(fā)表于 07-09 09:25 ?663次閱讀

    計算機視覺與智能感知是干嘛的

    引言 計算機視覺(Computer Vision)是門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等
    的頭像 發(fā)表于 07-09 09:23 ?952次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    計算機視覺和機器視覺是兩個密切相關但又有明顯區(qū)別的領域。 、定義 計算機視覺
    的頭像 發(fā)表于 07-09 09:22 ?458次閱讀

    計算機視覺和圖像處理的區(qū)別和聯(lián)系

    計算機視覺和圖像處理是兩個密切相關但又有明顯區(qū)別的領域。 1. 基本概念 1.1 計算機視覺 計算機視覺
    的頭像 發(fā)表于 07-09 09:16 ?1333次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領域的個重要分支。 引言 計算機視覺門研究如何使
    的頭像 發(fā)表于 07-09 09:11 ?1323次閱讀

    計算機視覺怎么給圖像分類

    圖像分類是計算機視覺領域中的項核心任務,其目標是將輸入的圖像自動分配到預定義的類別集合中。這過程涉及圖像的特征提取、特征表示以及分類器的
    的頭像 發(fā)表于 07-08 17:06 ?724次閱讀

    深度學習在計算機視覺領域的應用

    隨著人工智能技術的飛速發(fā)展,深度學習作為其中的核心技術之,已經在計算機視覺領域取得了顯著的成果。計算機視覺,作為
    的頭像 發(fā)表于 07-01 11:38 ?822次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領域的個重要分支,致力于使計算機能夠像人眼樣理解和解釋圖像和視頻中的信息
    的頭像 發(fā)表于 06-06 17:17 ?988次閱讀

    計算機視覺的十大算法

    視覺技術的發(fā)展起到了重要的推動作用。、圖像分割算法圖像分割算法是計算機視覺領域的基礎算法之,它的主要
    的頭像 發(fā)表于 02-19 13:26 ?1247次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法

    工業(yè)視覺計算機視覺的區(qū)別

    工業(yè)視覺主要解決以往需要人眼進行的工件的定位、測量、檢測等重復性勞動;計算機視覺的主要任務是賦予智能機器人視覺,利用測距、物體標定與識別等功
    發(fā)表于 01-16 10:06 ?596次閱讀
    工業(yè)<b class='flag-5'>視覺</b>與<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的區(qū)別