0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

計算機視覺的實現(xiàn)基本過程

新機器視覺 ? 來源:新機器視覺 ? 2020-09-24 10:49 ? 次閱讀

如果想要機器能夠進行思考,我們需要先教會它們去看。

李飛飛——Director of Stanford AI Lab and Stanford Vision Lab

計算機視覺(Computer vision)是一門研究如何使機器“看”的科學,更進一步的說,就是指用攝影機和計算機代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖像處理,用計算機處理成更適合人眼觀察或進行儀器檢測的圖像。

學習和運算能讓機器能夠更好的理解圖片環(huán)境,并且建立具有真正智能的視覺系統(tǒng)。當下環(huán)境中存在著大量的圖片和視頻內容,這些內容亟需學者們理解并在其中找出模式,來揭示那些我們以前不曾注意過的細節(jié)。計算機視覺的實現(xiàn)基本過程為:

計算機從圖片中生成數(shù)學模型

計算機圖形在模型中對圖像進行繪制,然后在圖像處理過程中將其作為輸入,另外給出處理圖像作為輸出

計算機視覺的理念在某些方面其實與很多概念有部分重疊,包括:人工智能、數(shù)字圖像處理、機器學習、深度學習、模式識別、概率圖模型、科學計算以及一系列的數(shù)學計算等。因此,你可以將本文看成是深入這個領域研究的第一步。本文將盡量包涵到盡可能多的內容,但是可能仍然會存在一些較為復雜的主題,也有可能存在某些遺漏之處,敬請見諒。

丨第一步——背景

通常來說,你應該具有一點相關的學術背景,比如上過有關概率學、統(tǒng)計學、線性代數(shù)、微積分(微分與積分)等相關課程,對矩陣計算有一定了解更好。另外,從我的經驗來看如果你對數(shù)字信號處理有了解的話,在以后對于概念的理解來說會更加容易。
在實現(xiàn)層面來說,你最好能夠會用MATLAB或者Python中的一種,一定要記住的是計算機視覺幾乎全部與計算機編程有關。

你也可以在Coursera上選修《概率繪圖模型》一課,這門課程相對較難(講得比較深入),你也可以在學習一段時間之后再對其進行了解。

丨第二步——數(shù)字圖像處理

觀看來自杜克大學的Guillermo Sapiro所教授的課程——《圖像和視頻處理:從火星到好萊塢Image and Video Processing: From Mars to Hollywood with a Stop at the Hospital》,該課程所提供的教學大綱每章都是獨立的且包涵大量的練習,你可以在coursera和YouTube上找到相關的課程視頻信息。另外你可以看下Gonzalez與Woods編寫的《數(shù)字圖像處理(Digital Image Processing)》一書,使用MATLAB來運行其中所提到的范例,相信一定會有所獲。

丨第三步——計算機視覺

一旦學習完有關數(shù)字圖像處理有關內容,接下來應該了解相關的數(shù)學模型在各種圖像和視頻內容中的應用方法。來自佛羅里達大學的Mubarak Shah教授在計算機視覺方面的課程可以作為一門很好的入門課程,其涵蓋了幾乎所有的基礎概念。

觀看這些影片的同時,可以學習Gatech的James Hays教授的計算機視覺項目課程所使用的概念和算法,這些練習也都是基于MATLAB的。千萬不要跳過這些練習,只有在真正的練習過程中才會對這些算法和公式有更深入的了解。

丨第四步——高級計算機視覺

如果你認真學習了前三步中的內容,現(xiàn)在可以進入到高級計算機視覺相關學習了。
來自巴黎中央理工學院的Nikos Paragios和Pawan Kumar講授了一門人工視覺中的離散推理(Discrete Inference in Artificial Vision)課程,它能提供相關的概率圖形模型和計算機視覺相關的大量數(shù)學知識。

到現(xiàn)在這一步來看就比較有趣了,這門課程一定能讓你感受到用簡單模型構筑機器視覺系統(tǒng)有多么復雜。學完這門課程的話,在接觸學術論文之前又邁進一大步。

丨第五步——引入Python和開源框架

這一步我們要接觸到Python編程語言。
就Python而言有許多像 OpenCV、PIL、vlfeat這樣的相關擴展包,現(xiàn)在就是將這些擴展包運用到你的項目中的最好時機。因為如果有其他的開源框架存在的話,沒有必要從頭開始來編寫一切內容。
如果需要參考資料的話可以考慮《使用Python對計算機視覺進行編程 Programming Computer Vision with Python》,使用這本書就夠了。你可以動手去嘗試下,看看MATLAB和Python結合的話如何來實現(xiàn)你的算法。

丨第六步——機器學習與CovNets(卷積神經網絡

有關如何從頭開始機器學習的資料實在太多,你可以從在網上查找到大量相關教程

從現(xiàn)在開始最好一直使用Python進行編程,可以看下《使用Python建立機器學習系統(tǒng)——Building Machine Learning Systems with Python》和《Python機器學習——Python Machine Learning》這兩本書。
目前深度學習正大行其道,可以試著學習卷積神經網絡在計算機視覺中的應用( Computer Vision: the use of CovNets),在此推薦斯坦福的CS231n課程:針對視覺識別的卷積神經網絡。

丨第七步——如何才能更進一步

行文至此,你可能會覺得已經講了太多的內容,需要學的已經太多。但是,你還可以進一步進行探索研究。
其中一個方法是看看由多倫多大學的Sanja Fidler和James Hays所舉行的一系列研討會課程,能幫助你對當下計算機視覺研究方向的最新概念有所理解。
另一種即跟著 CVPR、ICCV、 ECCV、 BMVC這些頂級學術會議的相關學術論文,通過會上的研討會、主旨演講以及tutorial等日程一定能學到不少知識。

總結:如果你按照步驟一步步完成所有的學習任務,屆時你將大概了解計算機視覺中有關濾波器、特征檢測、描述、相機模型、追蹤器的歷史,另外還學習到分割和識別、神經網絡和深度學習的最新進展。希望本文能幫助你在計算機視覺領域走得更遠,學習得更加深入。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像處理
    +關注

    關注

    27

    文章

    1292

    瀏覽量

    56764
  • 機器視覺
    +關注

    關注

    162

    文章

    4375

    瀏覽量

    120366
  • 計算機視覺
    +關注

    關注

    8

    文章

    1698

    瀏覽量

    46005

原文標題:從計算機視覺的小白變?yōu)榇笊?,你需要經歷這七個階段

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限性。以下是對
    的頭像 發(fā)表于 08-14 09:49 ?984次閱讀

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標,計算機
    的頭像 發(fā)表于 07-24 12:46 ?885次閱讀

    機器視覺計算機視覺有什么區(qū)別

    機器視覺計算機視覺是兩個密切相關但又有所區(qū)別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機
    的頭像 發(fā)表于 07-16 10:23 ?546次閱讀

    計算機視覺的五大技術

    計算機視覺作為深度學習領域最熱門的研究方向之一,其技術涵蓋了多個方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計算機視覺五大技術的詳細解析,包括圖像分類、對象檢測、目標跟蹤、語義分割
    的頭像 發(fā)表于 07-10 18:26 ?1387次閱讀

    計算機視覺的工作原理和應用

    計算機視覺(Computer Vision,簡稱CV)是一門跨學科的研究領域,它利用計算機和數(shù)學算法來模擬人類視覺系統(tǒng)對圖像和視頻進行識別、理解、分析和處理。其核心目標在于使
    的頭像 發(fā)表于 07-10 18:24 ?2029次閱讀

    計算機視覺與人工智能的關系是什么

    、交流等方面。計算機視覺與人工智能之間存在著密切的聯(lián)系,計算機視覺是人工智能的一個重要分支,也是實現(xiàn)人工智能的關鍵技術之一。
    的頭像 發(fā)表于 07-09 09:25 ?663次閱讀

    計算機視覺與智能感知是干嘛的

    引言 計算機視覺(Computer Vision)是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域,是人工智能的重要組成部分。智能
    的頭像 發(fā)表于 07-09 09:23 ?952次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    ,旨在實現(xiàn)對圖像和視頻的自動分析和理解。 機器視覺 機器視覺計算機視覺的一個分支,主要應用于工業(yè)自動化領域。它利用
    的頭像 發(fā)表于 07-09 09:22 ?458次閱讀

    計算機視覺和圖像處理的區(qū)別和聯(lián)系

    數(shù)據(jù)的過程。計算機視覺的目標是使計算機能夠像人類一樣“看到”和理解圖像或視頻內容。 1.2 圖像處理 圖像處理,也稱為數(shù)字圖像處理,是應用數(shù)學和計算
    的頭像 發(fā)表于 07-09 09:16 ?1332次閱讀

    計算機視覺屬于人工智能嗎

    和解釋視覺信息,從而實現(xiàn)對圖像和視頻的自動分析和處理。 計算機視覺的基本概念 2.1 計算機視覺
    的頭像 發(fā)表于 07-09 09:11 ?1323次閱讀

    深度學習在計算機視覺領域的應用

    隨著人工智能技術的飛速發(fā)展,深度學習作為其中的核心技術之一,已經在計算機視覺領域取得了顯著的成果。計算機視覺,作為計算機科學的一個重要分支,
    的頭像 發(fā)表于 07-01 11:38 ?822次閱讀

    機器視覺計算機視覺的區(qū)別

    在人工智能和自動化技術的快速發(fā)展中,機器視覺(Machine Vision, MV)和計算機視覺(Computer Vision, CV)作為兩個重要的分支領域,都扮演著至關重要的角色。盡管它們在
    的頭像 發(fā)表于 06-06 17:24 ?1346次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學習、大數(shù)據(jù)等技術的快速發(fā)展,計算機
    的頭像 發(fā)表于 06-06 17:17 ?987次閱讀

    計算機視覺的十大算法

    隨著科技的不斷發(fā)展,計算機視覺領域也取得了長足的進步。本文將介紹計算機視覺領域的十大算法,包括它們的基本原理、應用場景和優(yōu)缺點。這些算法在圖像處理、目標檢測、人臉識別等領域有著廣泛的應
    的頭像 發(fā)表于 02-19 13:26 ?1247次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法

    工業(yè)視覺計算機視覺的區(qū)別

    工業(yè)視覺主要解決以往需要人眼進行的工件的定位、測量、檢測等重復性勞動;計算機視覺的主要任務是賦予智能機器人視覺,利用測距、物體標定與識別等功能實現(xiàn)
    發(fā)表于 01-16 10:06 ?596次閱讀
    工業(yè)<b class='flag-5'>視覺</b>與<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的區(qū)別