現(xiàn)在投身于計算機視覺是否明智?
周圍很多大佬都去深造或者工作做CV相關(guān)方向。然而看到一種言論,說現(xiàn)在學(xué)CV無異于48年加入國民黨,求問此話怎講。
PS 本人本科畢業(yè)正要工作,有圖像處理算法崗位offer。水平很菜,對計算機視覺方向很有興趣(也許是跟風(fēng),且自動駕駛等等領(lǐng)域的確很容易讓人產(chǎn)生興趣)。
假設(shè)僥幸拿到CV相關(guān)offer(或者machine learning/deep learning崗位)那么是否應(yīng)該果斷加入。(因為圖像處理算法可能相對傳統(tǒng)一些)
作者:匿名用戶
https://www.zhihu.com/question/317440183/answer/683203621
有多少人工就有多少AI,我相信各位真正的從業(yè)者是最清楚這點不過的,論文滿分的模型現(xiàn)實情況下基本沒法直接跑模型了事,必需跟隨大量的數(shù)據(jù)和集成工作。目前AI飽和主要在于產(chǎn)業(yè)市場還沒有起來,但是一旦其需求大起來,對應(yīng)的人才要求也會變多。至于未來市場怎樣,就不是我等工程師能預(yù)測的了。但按照《人類簡史》中的說法,現(xiàn)代社會經(jīng)濟建立于對未來的信用上,現(xiàn)代經(jīng)濟要繼續(xù)發(fā)展,必須有新的技術(shù)可以推動生產(chǎn),至于這個技術(shù)是物聯(lián)網(wǎng),5G,AI,AR,基因工程中的一個還是多個,也不好說
以下是原答案
有一段時間在一家創(chuàng)業(yè)公司做CV,當(dāng)時碰壁很多,人臉市場由巨頭把持,基本不太可能與其競爭,我們當(dāng)時打算做遙感AI,農(nóng)業(yè)AI,后來發(fā)現(xiàn)處于數(shù)據(jù)精度問題,基本無法落地,后來整個組不得不轉(zhuǎn)型做大數(shù)據(jù)外包。當(dāng)時我的想法是,CV真的是泡沫。
后來到了國內(nèi)某設(shè)備商做算法,發(fā)現(xiàn)CV可以用的地方不要太多了,降噪,定位,超分……CV從來不是單單指人臉這一塊,哪一塊都可以做,而它們又有相通之處,可以入的方向還是很多的。
之前和某些明星公司也有接觸,可以說,實在的落地效果和競賽榜單有天囊之別,在榜上刷的接近完美的指標(biāo),落地下來不足50%也是常有的事情,外界環(huán)境稍微差一點,算法效果非常恐怖,更別說性能……實際上算法領(lǐng)域如何在工程界落地,還有很長的路要走。實際調(diào)優(yōu)的過程,的確和經(jīng)驗積累有關(guān)。有的時候因為算法流程的設(shè)計,有經(jīng)驗的工程師能夠很快發(fā)現(xiàn)哪個流程有問題需要改進,這些慕課上是不會告訴你的。個人認(rèn)為,CV本質(zhì)上考察的是對系統(tǒng)的了解程度,對數(shù)據(jù)的了解程度,從來不是某個特定的算法。
如果能做到對系統(tǒng)了然于心,對性能優(yōu)化(這也是必須根據(jù)設(shè)備考慮的問題)有深入了解,這樣的人才是真的很缺。
作者:CPAPCF
www.zhihu.com/question/317440183/answer/794570674
說48年加入國民黨只因把cv限制在了2D分類/檢測/跟蹤任務(wù)里。這些傳統(tǒng)任務(wù)確實早在16年甚至更早就接近problem solved,任務(wù)明確數(shù)據(jù)標(biāo)準(zhǔn)方法成熟?,F(xiàn)在刷榜也只有微小提升。畫地為牢當(dāng)然沒搞。
且不說什么concept extraction/self-awareness/vision+language那套純煉丹的玄學(xué)意識流,vision的共同問題是什么?是從圖像分析信息,那能從圖像里分析光照/材質(zhì)/光源位置性質(zhì)嗎?能從圖像里分析物理系統(tǒng)做受力分析判斷受力點支撐面嗎?能從圖像分析物體運動狀態(tài)嗎?能從圖像分析物體內(nèi)部結(jié)構(gòu)預(yù)測應(yīng)力形變嗎?
再從方法來說,純煉丹就一定最好嗎?vision傳統(tǒng)的geometry理論和物理基礎(chǔ)規(guī)則為什么要棄之不顧拿去讓煉丹從頭approximate?
然后從輸入的角度看,雙目做過嗎?多目會有提升嗎?單目能做嗎(btw, 單目+純煉丹是邪路)?別的sensor呢?比如MRI掃描信號?電子顯微鏡掃描信號?雷達(dá)?雷達(dá)陣列?聲納?
我只是舉了一些非常片面的例子,但哪怕把上面這些暴力排列組合一下這都多少可能性了?
宏觀來說,vision在工業(yè)上的應(yīng)用絕不會停止也從沒有停止。舉個例子,我們今天能在超市里買到的整齊又便宜的紅蘋果和盒裝雞蛋,哪怕薯片,更不用說pcb和芯片制造,都是靠70-80年代開發(fā)的vision系統(tǒng),才得以實現(xiàn)大規(guī)模流水線生產(chǎn),然后降低成本和普及。vision內(nèi)部流派可能會起起伏伏,跟不上市場需求的會很快暴死。但只要有外部市場demand,只要有資本家拿錢提出問題,就總有人能為錢做出解決方法,vision就絕不可能停止發(fā)展。ps,煉丹可能會死但vision絕不會死 :
作者:Encoder
https://www.zhihu.com/question/317440183/answer/684387715
視覺是人類最重要的感覺,人類認(rèn)識外界信息的80%來自視覺,視覺的認(rèn)知機制也最復(fù)雜。因此,計算機視覺(computer vision),也就是利用各種成像系統(tǒng)代替人類的視覺器官作為輸入手段,通過分析圖像生成關(guān)于成像物體和場景的描述,使得計算機像人那樣觀察和理解世界,以具有自主適應(yīng)環(huán)境的能力,始終是人工智能的一個重要組成部分。
計算機視覺已經(jīng)走過了半個世紀(jì)的風(fēng)風(fēng)雨雨,從借用信號處理的概念、將圖象視作“二維信號”而進行分析,到逐步發(fā)展出一套包含預(yù)處理、特征提取、目標(biāo)追蹤、三維重建等等方向在內(nèi)的完整的領(lǐng)域,再到機器學(xué)習(xí)、深度學(xué)習(xí)方法的廣泛運用,可以說,無論是過去、現(xiàn)在還是未來,計算機視覺領(lǐng)域都有大量的工作可以做,有大量的難題需要突破,也有大量的激動人心的寶藏、尚待我們?nèi)グl(fā)掘。刷臉支付、無人駕駛、無人機航拍、手術(shù)機器人等等我們耳熟能詳?shù)膽?yīng)用,都與計算機視覺息息相關(guān)。
計算機視覺發(fā)展史
Faster R-CNN 用于目標(biāo)檢測,see https://arxiv.org/pdf/1506.01497.pdf
是否投身于計算機視覺的科研和工作,當(dāng)然首先有賴于自己的興趣。另一方面,“全民AI”“全民CS”甚至“全民CV”的確是造成了計算機視覺方向人才供過于求的情形,大量的學(xué)生和從業(yè)者的涌入,很有可能會造成內(nèi)卷的情況;人才飽和、甚至所謂的“泡沫破滅”也并不是不會發(fā)生。然而從普遍意義上說,在人工智能時代的浪潮中,作為計算機相關(guān)專業(yè)的學(xué)生,無論是選擇繼續(xù)科研還是進入工業(yè)界,計算機視覺都仍然是一個既有廣泛的應(yīng)用前景(錢景),又容易激發(fā)興趣、引人入勝的方向。
題主的擔(dān)心其實也有道理,因為,盡管智能化這個大的趨勢是不會變的,但是在這個大趨勢的過程中,起伏依然是不可預(yù)知的,甚至也是不可避免的。經(jīng)濟學(xué)告訴我們,過度擴張就會帶來收縮,過熱就可能在未來遇冷,這是行業(yè)本身調(diào)節(jié)的結(jié)果,也是行業(yè)健康發(fā)展的保證。越是站在浪潮之巔,越要保持冷靜清醒。作為CV領(lǐng)域的研究者和從業(yè)者,我們要準(zhǔn)備好應(yīng)對未來幾年可能出現(xiàn)的轉(zhuǎn)冷局面,應(yīng)對可能出現(xiàn)的CV行業(yè)人才飽和、就業(yè)困難的窘境。我想主要的還是要做好以下幾點。
第一,傳統(tǒng)算法不可偏廢。
舉幾個例子:
盡管基于深度學(xué)習(xí)的特征提取方法取得了很大的成功,但傳統(tǒng)的特征提取算法,例如Harris角點,SIFT, SURF等等,仍是需要認(rèn)真學(xué)習(xí)的。
圖像預(yù)處理的方法,包括圖像的濾波、分裂、歸并、分割以及形態(tài)學(xué)處理等等,也可以與深度學(xué)習(xí)方法相結(jié)合,例如dilated CNN就可以看做形態(tài)學(xué)操作與CNN的結(jié)合。
SVM, KNN等等經(jīng)典的機器學(xué)習(xí)算法在CV中的應(yīng)用也不可忽視。
傳統(tǒng)的計算機視覺和機器學(xué)習(xí)算法依然在很多場景下有用武之地,這些算法不僅在工程上有穩(wěn)健的性能,而且相比于深度學(xué)習(xí)算法,在數(shù)學(xué)上也有更清晰的解釋。因此,深入理解這些經(jīng)典算法的思想,對于我們改進既有算法和提出新算法,也是很有啟發(fā)性的。
第二,重視數(shù)學(xué)、重視編程。
我們需要有一批不滿足于import cv2, import torch, import torchvision,不滿足于機械調(diào)參,不滿足于堆砌網(wǎng)絡(luò)結(jié)構(gòu)的研究者,能夠提出一套嚴(yán)密的指導(dǎo)性的理論,改善目前深度學(xué)習(xí)中以試湊調(diào)參為主來達(dá)到目標(biāo)的訓(xùn)練方式。我們需要思考能否在底層實現(xiàn)上做出改進或提出新的算法,而非簡單地將既有算法排列組合。在數(shù)學(xué)和編程方面的積累,盡管需要下苦功夫,也不一定能夠立竿見影,但是最終一定會惠及你未來的發(fā)展,無論在科研還是工作上,都能讓你行穩(wěn)致遠(yuǎn)。
第三、推動CV真正落地。
許多行業(yè)都積累了大量的圖像信息,需要借由計算機來輔助甚至部分代替人腦對圖像進行處理和解釋,都有用計算機代替人去“看”的剛需。從圖像預(yù)處理、圖像特征提取及分割,到物體的幾何模型與圖像特性表達(dá),再到對物體和周圍環(huán)境的理解,都有廣泛的應(yīng)用場景。我們要避免空對空的灌水,要讓CV更好地從實驗室走入千家萬戶,真正應(yīng)用于實際的生產(chǎn)生活的場景之中,真正拉動經(jīng)濟社會各個部門、各個方面的發(fā)展,真正成為我們每個人生活中不可或缺的一部分。
總之,投身于計算機視覺不失為明智之選,面對競爭的關(guān)鍵不在于躑躅猶疑,而在于增強自身的競爭力。計算機視覺的舞臺足夠廣闊,將計算機視覺的理論與應(yīng)用相對接、算法與工程相融合、精確與快速相平衡、簡潔與清晰相印證、優(yōu)美與實用相增益,始終激勵著一批又一批有熱情、有韌勁、有定力、有決心、有才華的研究者,扎扎實實地做出成果,特別是讓計算機視覺更好地與各行各業(yè)相結(jié)合,真正助力經(jīng)濟社會發(fā)展,也使得我們的生活更加便捷。
作者:JohnMason
https://www.zhihu.com/question/317440183/answer/688971077
不邀自來。
計算機視覺方面的現(xiàn)狀:工程師很多,研究人才稀缺
這可能是現(xiàn)在計算機方面的整體情況,大部分領(lǐng)域都是這樣,研究人才稀缺。
那么造成這種情況的原因是因為:
1、相對其他行業(yè)來講資薪較高。
2、熱度高,人氣盛。
3、入門相對其他方面來講較容易。
如果拿到CV相關(guān)的offer,可以考慮按照這樣的方式來:
1、學(xué)習(xí)有關(guān)類的編程(python、Cpp)。
2、大概有一定的基礎(chǔ)后可以開始考慮框架(TensorFlow、Keras、Caffe、PyTroch等),具體的框架可以自己進行比較。
3、學(xué)習(xí)關(guān)于《機器學(xué)習(xí)》、《深度學(xué)習(xí)》的知識。
4、可以嘗試做一些簡單的項目。
5、確定方向,閱讀該方面的論文,實現(xiàn)該論文的網(wǎng)絡(luò)結(jié)構(gòu)。
但是,入門相對來說比較簡單,而且工程師的人才過剩。缺少的是相關(guān)的研究人才。如果想要進入研究方面,需要一定的數(shù)學(xué)知識和邏輯基礎(chǔ)。在數(shù)學(xué)和邏輯之上要多閱讀論文,講最新論文中的結(jié)構(gòu)復(fù)現(xiàn),理解其中的原理。
-
計算機視覺
+關(guān)注
關(guān)注
8文章
1699瀏覽量
46050
原文標(biāo)題:現(xiàn)在投身于計算機視覺是否明智?
文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論