0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計(jì)算機(jī)視覺的工作流程與主要應(yīng)用

Dbwd_Imgtec ? 來源:Imagination Tech ? 作者:Imagination Tech ? 2021-01-08 14:06 ? 次閱讀

引言

計(jì)算機(jī)視覺(Computer Vision)自興起以來就非常迅速且廣泛應(yīng)用于各個領(lǐng)域,比如我們熟悉的且每天都會使用的基于手機(jī)攝像頭的人臉識別,除此之外,它還可以在自動駕駛領(lǐng)域輔助汽車識別交通信號、標(biāo)志和行人;在制造業(yè)輔助工業(yè)機(jī)器人監(jiān)督和指導(dǎo)人工操作。

計(jì)算機(jī)視覺的主要目的是讓計(jì)算機(jī)能像人類一樣甚至比人類更好地看見和識別世界。計(jì)算機(jī)視覺通常使用C++、PythonMATLAB編程語言,是增強(qiáng)現(xiàn)實(shí)(AR)的一項(xiàng)重要技術(shù)。目前主流的計(jì)算機(jī)視覺工具有OpenCV、Tensorflow、Gpu、YOLO、Keras等。計(jì)算機(jī)視覺其實(shí)是一個復(fù)雜多元的交叉領(lǐng)域,包含了很多來自數(shù)字信號處理、神經(jīng)科學(xué)、圖像處理、模式識別、機(jī)器學(xué)習(xí)(ML)、機(jī)器人人工智能(AI)等領(lǐng)域的概念。

本文將具體介紹一下計(jì)算機(jī)視覺的工作流程。

什么是計(jì)算機(jī)視覺(Computer Vision)

一言蔽之,計(jì)算機(jī)視覺是讓計(jì)算機(jī)理解并標(biāo)記圖像內(nèi)容的技術(shù)領(lǐng)域。

舉個例子,請看下圖:

對于人類來說,你很難向從沒穿過衣服的原始人解釋什么是連衣裙或者什么是鞋。計(jì)算機(jī)視覺也是如此,如果它并沒有相關(guān)輸入,就不會理解上圖的東西都是什么。

所以,我們需要收集并標(biāo)記大量關(guān)于衣服、鞋、包包的圖片,輸入進(jìn)計(jì)算機(jī)“告訴”它這些圖片里的東西是什么,在經(jīng)過不斷的學(xué)習(xí)和訓(xùn)練后,計(jì)算機(jī)將會識別出哪個是連衣裙,哪個是鞋、哪個是包包。

計(jì)算機(jī)視覺的主要應(yīng)用

計(jì)算機(jī)視覺目前應(yīng)用的領(lǐng)域不勝枚舉,小編就挑出5個具有代表性的應(yīng)用吧:

物體與行為識別

自動駕駛汽車

醫(yī)療影像分析與診斷

圖片標(biāo)記

人臉識別

計(jì)算機(jī)視覺工作流程

計(jì)算機(jī)視覺工作流程其實(shí)是大多數(shù)計(jì)算機(jī)視覺應(yīng)用程序?qū)⒔?jīng)歷的一系列步驟。許多視覺應(yīng)用程序都是從獲取圖像和數(shù)據(jù)開始,然后處理數(shù)據(jù),執(zhí)行一些分析和識別步驟,最后執(zhí)行一個動作的:

e146bbc4-4f39-11eb-8b86-12bb97331649.png

計(jì)算機(jī)視覺工作流程 就拿人臉識別來說吧,它也主要遵循了計(jì)算機(jī)視覺的工作流程:

e176140a-4f39-11eb-8b86-12bb97331649.png

人臉識別工作流程 我們可以看到,大部分計(jì)算機(jī)視覺技術(shù)應(yīng)用其實(shí)都是從數(shù)據(jù)預(yù)處理開始的,其實(shí)這也是機(jī)器學(xué)習(xí)的關(guān)鍵。

數(shù)據(jù)標(biāo)準(zhǔn)化

所謂預(yù)處理圖像就是將輸入的圖像數(shù)據(jù)標(biāo)準(zhǔn)化,以便后續(xù)工作流程的順利進(jìn)行。例如,假設(shè)我們創(chuàng)建了一個簡單的聚類算法來區(qū)分紅玫瑰和其他花朵:

e1b9ab02-4f39-11eb-8b86-12bb97331649.png

我們將算法設(shè)計(jì)為計(jì)算給定圖像中紅色像素的數(shù)量,如果有足夠多的紅色像素(大于300個紅色像素)就被歸類為紅玫瑰。(這個例子里我們只提取了顏色特征)

還有一點(diǎn)需要注意的是,輸入圖像的大小、裁切方式都會影響算法的輸出結(jié)果,因此數(shù)據(jù)預(yù)處理非常重要!

作為數(shù)據(jù)的圖像

圖像中的每一個像素都是一個我們可以改變的數(shù)值,比如,我們可以將一個像素乘以一個標(biāo)量來改變圖像亮度,我們也可以將每個像素值向右移動來改變圖像飽和度等。

e1ecb5ba-4f39-11eb-8b86-12bb97331649.png

將圖像視為數(shù)字網(wǎng)格是許多圖像處理技術(shù)的基礎(chǔ)。一般來說,色彩與形狀改變都是通過數(shù)學(xué)運(yùn)算對圖像進(jìn)行逐像素變換完成的。

訓(xùn)練神經(jīng)網(wǎng)絡(luò)

為了訓(xùn)練神經(jīng)網(wǎng)絡(luò),我們要提供一組標(biāo)記過的圖像數(shù)據(jù),然后比較這些輸入圖像與計(jì)算機(jī)預(yù)測的輸出標(biāo)簽或識別的測量值的差異以檢測算法模型的準(zhǔn)確率?;谏窠?jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)會監(jiān)督它所犯的錯誤(誤差),并通過修正它發(fā)現(xiàn)的圖像數(shù)據(jù)間的模式與差異來實(shí)現(xiàn)迭代與擬合。 其中,梯度下降法是一種減少神經(jīng)網(wǎng)絡(luò)誤差的數(shù)學(xué)方法,其中卷積神經(jīng)網(wǎng)絡(luò)是一種特殊類型的神經(jīng)網(wǎng)絡(luò),通常用于計(jì)算機(jī)視覺應(yīng)用。

e21dab48-4f39-11eb-8b86-12bb97331649.png

X =輸入;a = 活化函數(shù);W = 卷積神經(jīng)網(wǎng)絡(luò)中的權(quán)重;J = 損失函數(shù);Alpha = 學(xué)習(xí)率;y = 地面真值;y = 預(yù)測;k = 迭代次數(shù)

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像數(shù)據(jù)
    +關(guān)注

    關(guān)注

    0

    文章

    52

    瀏覽量

    11281
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1698

    瀏覽量

    45994
  • 自動駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13816

    瀏覽量

    166470

原文標(biāo)題:計(jì)算機(jī)視覺:你必須了解的圖像數(shù)據(jù)底層技術(shù)

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時(shí)也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?971次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺有什么區(qū)別

    機(jī)器視覺計(jì)算機(jī)視覺是兩個密切相關(guān)但又有所區(qū)別的概念。 一、定義 機(jī)器視覺 機(jī)器視覺,又稱為計(jì)算機(jī)
    的頭像 發(fā)表于 07-16 10:23 ?538次閱讀

    計(jì)算機(jī)視覺的五大技術(shù)

    計(jì)算機(jī)視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計(jì)算機(jī)視覺五大技術(shù)的詳細(xì)解析,包括圖像分類、對象檢測、目標(biāo)跟蹤、語義分割
    的頭像 發(fā)表于 07-10 18:26 ?1372次閱讀

    計(jì)算機(jī)視覺工作原理和應(yīng)用

    計(jì)算機(jī)視覺(Computer Vision,簡稱CV)是一門跨學(xué)科的研究領(lǐng)域,它利用計(jì)算機(jī)和數(shù)學(xué)算法來模擬人類視覺系統(tǒng)對圖像和視頻進(jìn)行識別、理解、分析和處理。其核心目標(biāo)在于使
    的頭像 發(fā)表于 07-10 18:24 ?1992次閱讀

    機(jī)器人視覺計(jì)算機(jī)視覺的區(qū)別與聯(lián)系

    機(jī)器人視覺計(jì)算機(jī)視覺是兩個密切相關(guān)但又有所區(qū)別的領(lǐng)域。 1. 引言 在當(dāng)今科技迅猛發(fā)展的時(shí)代,機(jī)器人和計(jì)算機(jī)視覺技術(shù)在各個領(lǐng)域發(fā)揮著越來越
    的頭像 發(fā)表于 07-09 09:27 ?659次閱讀

    計(jì)算機(jī)視覺與人工智能的關(guān)系是什么

    引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個領(lǐng)域的知識。人工智能則是研究如何使計(jì)算
    的頭像 發(fā)表于 07-09 09:25 ?653次閱讀

    計(jì)算機(jī)視覺與智能感知是干嘛的

    引言 計(jì)算機(jī)視覺(Computer Vision)是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個領(lǐng)域,是人工智能的重要組成部分。智能
    的頭像 發(fā)表于 07-09 09:23 ?940次閱讀

    計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪

    ,旨在實(shí)現(xiàn)對圖像和視頻的自動分析和理解。 機(jī)器視覺 機(jī)器視覺計(jì)算機(jī)視覺的一個分支,主要應(yīng)用于工業(yè)自動化領(lǐng)域。它利用
    的頭像 發(fā)表于 07-09 09:22 ?456次閱讀

    計(jì)算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系

    計(jì)算機(jī)視覺和圖像處理是兩個密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計(jì)算機(jī)視覺 計(jì)算機(jī)視覺
    的頭像 發(fā)表于 07-09 09:16 ?1323次閱讀

    計(jì)算機(jī)視覺在人工智能領(lǐng)域有哪些主要應(yīng)用?

    計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個重要分支,它主要研究如何讓計(jì)算機(jī)能夠像人類一樣理解和處理圖像和視頻數(shù)據(jù)。計(jì)算機(jī)
    的頭像 發(fā)表于 07-09 09:14 ?1375次閱讀

    計(jì)算機(jī)視覺屬于人工智能嗎

    屬于,計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個重要分支。 引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)具有視覺
    的頭像 發(fā)表于 07-09 09:11 ?1309次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺的區(qū)別

    在人工智能和自動化技術(shù)的快速發(fā)展中,機(jī)器視覺(Machine Vision, MV)和計(jì)算機(jī)視覺(Computer Vision, CV)作為兩個重要的分支領(lǐng)域,都扮演著至關(guān)重要的角色。盡管它們在
    的頭像 發(fā)表于 06-06 17:24 ?1334次閱讀

    計(jì)算機(jī)視覺主要研究方向

    計(jì)算機(jī)視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個重要分支,致力于使計(jì)算機(jī)能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)的快速發(fā)展,計(jì)算機(jī)
    的頭像 發(fā)表于 06-06 17:17 ?982次閱讀

    計(jì)算機(jī)視覺的十大算法

    視覺技術(shù)的發(fā)展起到了重要的推動作用。一、圖像分割算法圖像分割算法是計(jì)算機(jī)視覺領(lǐng)域的基礎(chǔ)算法之一,它的主要任務(wù)是將圖像分割成不同的區(qū)域或?qū)ο?。常見的圖像分割算法包括基
    的頭像 發(fā)表于 02-19 13:26 ?1242次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的十大算法

    工業(yè)視覺計(jì)算機(jī)視覺的區(qū)別

    工業(yè)視覺主要解決以往需要人眼進(jìn)行的工件的定位、測量、檢測等重復(fù)性勞動;計(jì)算機(jī)視覺主要任務(wù)是賦予智能機(jī)器人
    發(fā)表于 01-16 10:06 ?593次閱讀
    工業(yè)<b class='flag-5'>視覺</b>與<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的區(qū)別