0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

選擇計算機視覺,是否是個錯誤的決定

lviY_AI_shequ ? 2019-08-29 11:09 ? 次閱讀

現(xiàn)在投身于計算機視覺是否明智?

周圍很多大佬都去深造或者工作做CV相關(guān)方向。然而看到一種言論,說現(xiàn)在學(xué)CV無異于48年加入國民黨,求問此話怎講。

PS 本人本科畢業(yè)正要工作,有圖像處理算法崗位offer。水平很菜,對計算機視覺方向很有興趣(也許是跟風(fēng),且自動駕駛等等領(lǐng)域的確很容易讓人產(chǎn)生興趣)。

假設(shè)僥幸拿到CV相關(guān)offer(或者machine learning/deep learning崗位)那么是否應(yīng)該果斷加入。(因為圖像處理算法可能相對傳統(tǒng)一些)

作者:匿名用戶
https://www.zhihu.com/question/317440183/answer/683203621

有多少人工就有多少AI,我相信各位真正的從業(yè)者是最清楚這點不過的,論文滿分的模型現(xiàn)實情況下基本沒法直接跑模型了事,必需跟隨大量的數(shù)據(jù)和集成工作。目前AI飽和主要在于產(chǎn)業(yè)市場還沒有起來,但是一旦其需求大起來,對應(yīng)的人才要求也會變多。至于未來市場怎樣,就不是我等工程師能預(yù)測的了。但按照《人類簡史》中的說法,現(xiàn)代社會經(jīng)濟建立于對未來的信用上,現(xiàn)代經(jīng)濟要繼續(xù)發(fā)展,必須有新的技術(shù)可以推動生產(chǎn),至于這個技術(shù)是物聯(lián)網(wǎng),5G,AI,AR,基因工程中的一個還是多個,也不好說

以下是原答案

有一段時間在一家創(chuàng)業(yè)公司做CV,當(dāng)時碰壁很多,人臉市場由巨頭把持,基本不太可能與其競爭,我們當(dāng)時打算做遙感AI,農(nóng)業(yè)AI,后來發(fā)現(xiàn)處于數(shù)據(jù)精度問題,基本無法落地,后來整個組不得不轉(zhuǎn)型做大數(shù)據(jù)外包。當(dāng)時我的想法是,CV真的是泡沫。

后來到了國內(nèi)某設(shè)備商做算法,發(fā)現(xiàn)CV可以用的地方不要太多了,降噪,定位,超分……CV從來不是單單指人臉這一塊,哪一塊都可以做,而它們又有相通之處,可以入的方向還是很多的。

之前和某些明星公司也有接觸,可以說,實在的落地效果和競賽榜單有天囊之別,在榜上刷的接近完美的指標(biāo),落地下來不足50%也是常有的事情,外界環(huán)境稍微差一點,算法效果非常恐怖,更別說性能……實際上算法領(lǐng)域如何在工程界落地,還有很長的路要走。實際調(diào)優(yōu)的過程,的確和經(jīng)驗積累有關(guān)。有的時候因為算法流程的設(shè)計,有經(jīng)驗的工程師能夠很快發(fā)現(xiàn)哪個流程有問題需要改進,這些慕課上是不會告訴你的。個人認(rèn)為,CV本質(zhì)上考察的是對系統(tǒng)的了解程度,對數(shù)據(jù)的了解程度,從來不是某個特定的算法。

如果能做到對系統(tǒng)了然于心,對性能優(yōu)化(這也是必須根據(jù)設(shè)備考慮的問題)有深入了解,這樣的人才是真的很缺。

作者:CPAPCF
www.zhihu.com/question/317440183/answer/794570674

說48年加入國民黨只因把cv限制在了2D分類/檢測/跟蹤任務(wù)里。這些傳統(tǒng)任務(wù)確實早在16年甚至更早就接近problem solved,任務(wù)明確數(shù)據(jù)標(biāo)準(zhǔn)方法成熟?,F(xiàn)在刷榜也只有微小提升。畫地為牢當(dāng)然沒搞。

且不說什么concept extraction/self-awareness/vision+language那套純煉丹的玄學(xué)意識流,vision的共同問題是什么?是從圖像分析信息,那能從圖像里分析光照/材質(zhì)/光源位置性質(zhì)嗎?能從圖像里分析物理系統(tǒng)做受力分析判斷受力點支撐面嗎?能從圖像分析物體運動狀態(tài)嗎?能從圖像分析物體內(nèi)部結(jié)構(gòu)預(yù)測應(yīng)力形變嗎?

再從方法來說,純煉丹就一定最好嗎?vision傳統(tǒng)的geometry理論和物理基礎(chǔ)規(guī)則為什么要棄之不顧拿去讓煉丹從頭approximate?

然后從輸入的角度看,雙目做過嗎?多目會有提升嗎?單目能做嗎(btw, 單目+純煉丹是邪路)?別的sensor呢?比如MRI掃描信號?電子顯微鏡掃描信號?雷達(dá)?雷達(dá)陣列?聲納?

我只是舉了一些非常片面的例子,但哪怕把上面這些暴力排列組合一下這都多少可能性了?

宏觀來說,vision在工業(yè)上的應(yīng)用絕不會停止也從沒有停止。舉個例子,我們今天能在超市里買到的整齊又便宜的紅蘋果和盒裝雞蛋,哪怕薯片,更不用說pcb芯片制造,都是靠70-80年代開發(fā)的vision系統(tǒng),才得以實現(xiàn)大規(guī)模流水線生產(chǎn),然后降低成本和普及。vision內(nèi)部流派可能會起起伏伏,跟不上市場需求的會很快暴死。但只要有外部市場demand,只要有資本家拿錢提出問題,就總有人能為錢做出解決方法,vision就絕不可能停止發(fā)展。ps,煉丹可能會死但vision絕不會死 :

作者:Encoder
https://www.zhihu.com/question/317440183/answer/684387715

視覺是人類最重要的感覺,人類認(rèn)識外界信息的80%來自視覺,視覺的認(rèn)知機制也最復(fù)雜。因此,計算機視覺(computer vision),也就是利用各種成像系統(tǒng)代替人類的視覺器官作為輸入手段,通過分析圖像生成關(guān)于成像物體和場景的描述,使得計算機像人那樣觀察和理解世界,以具有自主適應(yīng)環(huán)境的能力,始終是人工智能的一個重要組成部分。

計算機視覺已經(jīng)走過了半個世紀(jì)的風(fēng)風(fēng)雨雨,從借用信號處理的概念、將圖象視作“二維信號”而進行分析,到逐步發(fā)展出一套包含預(yù)處理、特征提取、目標(biāo)追蹤、三維重建等等方向在內(nèi)的完整的領(lǐng)域,再到機器學(xué)習(xí)、深度學(xué)習(xí)方法的廣泛運用,可以說,無論是過去、現(xiàn)在還是未來,計算機視覺領(lǐng)域都有大量的工作可以做,有大量的難題需要突破,也有大量的激動人心的寶藏、尚待我們?nèi)グl(fā)掘。刷臉支付、無人駕駛無人機航拍、手術(shù)機器人等等我們耳熟能詳?shù)膽?yīng)用,都與計算機視覺息息相關(guān)。

計算機視覺發(fā)展史

Faster R-CNN 用于目標(biāo)檢測,see https://arxiv.org/pdf/1506.01497.pdf

是否投身于計算機視覺的科研和工作,當(dāng)然首先有賴于自己的興趣。另一方面,“全民AI”“全民CS”甚至“全民CV”的確是造成了計算機視覺方向人才供過于求的情形,大量的學(xué)生和從業(yè)者的涌入,很有可能會造成內(nèi)卷的情況;人才飽和、甚至所謂的“泡沫破滅”也并不是不會發(fā)生。然而從普遍意義上說,在人工智能時代的浪潮中,作為計算機相關(guān)專業(yè)的學(xué)生,無論是選擇繼續(xù)科研還是進入工業(yè)界,計算機視覺都仍然是一個既有廣泛的應(yīng)用前景(錢景),又容易激發(fā)興趣、引人入勝的方向。

題主的擔(dān)心其實也有道理,因為,盡管智能化這個大的趨勢是不會變的,但是在這個大趨勢的過程中,起伏依然是不可預(yù)知的,甚至也是不可避免的。經(jīng)濟學(xué)告訴我們,過度擴張就會帶來收縮,過熱就可能在未來遇冷,這是行業(yè)本身調(diào)節(jié)的結(jié)果,也是行業(yè)健康發(fā)展的保證。越是站在浪潮之巔,越要保持冷靜清醒。作為CV領(lǐng)域的研究者和從業(yè)者,我們要準(zhǔn)備好應(yīng)對未來幾年可能出現(xiàn)的轉(zhuǎn)冷局面,應(yīng)對可能出現(xiàn)的CV行業(yè)人才飽和、就業(yè)困難的窘境。我想主要的還是要做好以下幾點。

第一,傳統(tǒng)算法不可偏廢。

舉幾個例子:

盡管基于深度學(xué)習(xí)的特征提取方法取得了很大的成功,但傳統(tǒng)的特征提取算法,例如Harris角點,SIFT, SURF等等,仍是需要認(rèn)真學(xué)習(xí)的。

圖像預(yù)處理的方法,包括圖像的濾波、分裂、歸并、分割以及形態(tài)學(xué)處理等等,也可以與深度學(xué)習(xí)方法相結(jié)合,例如dilated CNN就可以看做形態(tài)學(xué)操作與CNN的結(jié)合。

SVM, KNN等等經(jīng)典的機器學(xué)習(xí)算法在CV中的應(yīng)用也不可忽視。

傳統(tǒng)的計算機視覺和機器學(xué)習(xí)算法依然在很多場景下有用武之地,這些算法不僅在工程上有穩(wěn)健的性能,而且相比于深度學(xué)習(xí)算法,在數(shù)學(xué)上也有更清晰的解釋。因此,深入理解這些經(jīng)典算法的思想,對于我們改進既有算法和提出新算法,也是很有啟發(fā)性的。

第二,重視數(shù)學(xué)、重視編程。

我們需要有一批不滿足于import cv2, import torch, import torchvision,不滿足于機械調(diào)參,不滿足于堆砌網(wǎng)絡(luò)結(jié)構(gòu)的研究者,能夠提出一套嚴(yán)密的指導(dǎo)性的理論,改善目前深度學(xué)習(xí)中以試湊調(diào)參為主來達(dá)到目標(biāo)的訓(xùn)練方式。我們需要思考能否在底層實現(xiàn)上做出改進或提出新的算法,而非簡單地將既有算法排列組合。在數(shù)學(xué)和編程方面的積累,盡管需要下苦功夫,也不一定能夠立竿見影,但是最終一定會惠及你未來的發(fā)展,無論在科研還是工作上,都能讓你行穩(wěn)致遠(yuǎn)。

第三、推動CV真正落地。

許多行業(yè)都積累了大量的圖像信息,需要借由計算機來輔助甚至部分代替人腦對圖像進行處理和解釋,都有用計算機代替人去“看”的剛需。從圖像預(yù)處理、圖像特征提取及分割,到物體的幾何模型與圖像特性表達(dá),再到對物體和周圍環(huán)境的理解,都有廣泛的應(yīng)用場景。我們要避免空對空的灌水,要讓CV更好地從實驗室走入千家萬戶,真正應(yīng)用于實際的生產(chǎn)生活的場景之中,真正拉動經(jīng)濟社會各個部門、各個方面的發(fā)展,真正成為我們每個人生活中不可或缺的一部分。

總之,投身于計算機視覺不失為明智之選,面對競爭的關(guān)鍵不在于躑躅猶疑,而在于增強自身的競爭力。計算機視覺的舞臺足夠廣闊,將計算機視覺的理論與應(yīng)用相對接、算法與工程相融合、精確與快速相平衡、簡潔與清晰相印證、優(yōu)美與實用相增益,始終激勵著一批又一批有熱情、有韌勁、有定力、有決心、有才華的研究者,扎扎實實地做出成果,特別是讓計算機視覺更好地與各行各業(yè)相結(jié)合,真正助力經(jīng)濟社會發(fā)展,也使得我們的生活更加便捷。

作者:JohnMason
https://www.zhihu.com/question/317440183/answer/688971077

不邀自來。

計算機視覺方面的現(xiàn)狀:工程師很多,研究人才稀缺

這可能是現(xiàn)在計算機方面的整體情況,大部分領(lǐng)域都是這樣,研究人才稀缺。

那么造成這種情況的原因是因為:

1、相對其他行業(yè)來講資薪較高。

2、熱度高,人氣盛。

3、入門相對其他方面來講較容易。

如果拿到CV相關(guān)的offer,可以考慮按照這樣的方式來:

1、學(xué)習(xí)有關(guān)類的編程(python、Cpp)。

2、大概有一定的基礎(chǔ)后可以開始考慮框架(TensorFlow、Keras、Caffe、PyTroch等),具體的框架可以自己進行比較。

3、學(xué)習(xí)關(guān)于《機器學(xué)習(xí)》、《深度學(xué)習(xí)》的知識。

4、可以嘗試做一些簡單的項目。

5、確定方向,閱讀該方面的論文,實現(xiàn)該論文的網(wǎng)絡(luò)結(jié)構(gòu)。

但是,入門相對來說比較簡單,而且工程師的人才過剩。缺少的是相關(guān)的研究人才。如果想要進入研究方面,需要一定的數(shù)學(xué)知識和邏輯基礎(chǔ)。在數(shù)學(xué)和邏輯之上要多閱讀論文,講最新論文中的結(jié)構(gòu)復(fù)現(xiàn),理解其中的原理。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1699

    瀏覽量

    46050

原文標(biāo)題:現(xiàn)在投身于計算機視覺是否明智?

文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【小白入門必看】一文讀懂深度學(xué)習(xí)計算機視覺技術(shù)及學(xué)習(xí)路線

    ,幫我們做決定。整個過程就是為了讓機器能看懂圖像,然后根據(jù)這些圖像來做出聰明的選擇。二、計算機視覺實現(xiàn)起來難嗎?人類依賴視覺,找輛汽車輕而易
    的頭像 發(fā)表于 10-31 17:00 ?491次閱讀
    【小白入門必看】一文讀懂深度學(xué)習(xí)<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術(shù)及學(xué)習(xí)路線

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領(lǐng)域的一重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動了多個行業(yè)的變革,也帶來了諸多優(yōu)勢,但同時也伴隨著一些挑戰(zhàn)和局限
    的頭像 發(fā)表于 08-14 09:49 ?1053次閱讀

    計算機視覺技術(shù)的AI算法模型

    計算機視覺技術(shù)作為人工智能領(lǐng)域的一重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現(xiàn)這一目標(biāo),計算機
    的頭像 發(fā)表于 07-24 12:46 ?1004次閱讀

    機器視覺計算機視覺有什么區(qū)別

    機器視覺計算機視覺是兩密切相關(guān)但又有所區(qū)別的概念。 一、定義 機器視覺 機器視覺,又稱為
    的頭像 發(fā)表于 07-16 10:23 ?573次閱讀

    計算機視覺的五大技術(shù)

    計算機視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一,其技術(shù)涵蓋了多個方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計算機視覺五大技術(shù)的詳細(xì)解析,包括圖像分類、對象檢測、目標(biāo)跟蹤、語義分割
    的頭像 發(fā)表于 07-10 18:26 ?1463次閱讀

    計算機視覺的工作原理和應(yīng)用

    計算機視覺(Computer Vision,簡稱CV)是一門跨學(xué)科的研究領(lǐng)域,它利用計算機和數(shù)學(xué)算法來模擬人類視覺系統(tǒng)對圖像和視頻進行識別、理解、分析和處理。其核心目標(biāo)在于使
    的頭像 發(fā)表于 07-10 18:24 ?2163次閱讀

    計算機視覺與人工智能的關(guān)系是什么

    、交流等方面。計算機視覺與人工智能之間存在著密切的聯(lián)系,計算機視覺是人工智能的一重要分支,也是實現(xiàn)人工智能的關(guān)鍵技術(shù)之一。
    的頭像 發(fā)表于 07-09 09:25 ?706次閱讀

    計算機視覺與智能感知是干嘛的

    感知(Intelligent Perception)則是計算機視覺的一分支,它強調(diào)計算機在處理視覺信息時的智能性和自適應(yīng)性。 隨著
    的頭像 發(fā)表于 07-09 09:23 ?996次閱讀

    計算機視覺和機器視覺區(qū)別在哪

    計算機視覺和機器視覺是兩密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 一、定義 計算機視覺
    的頭像 發(fā)表于 07-09 09:22 ?486次閱讀

    計算機視覺和圖像處理的區(qū)別和聯(lián)系

    計算機視覺和圖像處理是兩密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計算機視覺 計算機
    的頭像 發(fā)表于 07-09 09:16 ?1392次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領(lǐng)域的一重要分支。 引言 計算機視覺是一門研究如何使計算機具有
    的頭像 發(fā)表于 07-09 09:11 ?1360次閱讀

    深度學(xué)習(xí)在計算機視覺領(lǐng)域的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其中的核心技術(shù)之一,已經(jīng)在計算機視覺領(lǐng)域取得了顯著的成果。計算機視覺,作為計算機科學(xué)的一
    的頭像 發(fā)表于 07-01 11:38 ?882次閱讀

    機器視覺計算機視覺的區(qū)別

    在人工智能和自動化技術(shù)的快速發(fā)展中,機器視覺(Machine Vision, MV)和計算機視覺(Computer Vision, CV)作為兩重要的分支領(lǐng)域,都扮演著至關(guān)重要的角色
    的頭像 發(fā)表于 06-06 17:24 ?1378次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)的快速發(fā)展,
    的頭像 發(fā)表于 06-06 17:17 ?1037次閱讀

    計算機視覺的十大算法

    隨著科技的不斷發(fā)展,計算機視覺領(lǐng)域也取得了長足的進步。本文將介紹計算機視覺領(lǐng)域的十大算法,包括它們的基本原理、應(yīng)用場景和優(yōu)缺點。這些算法在圖像處理、目標(biāo)檢測、人臉識別等領(lǐng)域有著廣泛的應(yīng)
    的頭像 發(fā)表于 02-19 13:26 ?1287次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法