機(jī)器視覺(jué)之于人工智能等同于視覺(jué)之于人類(lèi),本文系統(tǒng)介紹決定機(jī)器視覺(jué)的兩大要素——視覺(jué)算法和芯片,重點(diǎn)介紹國(guó)內(nèi)外視覺(jué)芯片市場(chǎng)及發(fā)展前景,包括重量級(jí)玩家及其產(chǎn)品。
機(jī)器能否比人眼看得更清楚?近年來(lái),隨著CV (Computer Vision) 芯片產(chǎn)品不斷推出,這一疑惑正在慢慢變成現(xiàn)實(shí)。就如AlphaGo戰(zhàn)勝“圍棋天才”柯潔一樣,在某些應(yīng)用場(chǎng)景,機(jī)器視覺(jué)因其準(zhǔn)確性、客觀性、穩(wěn)定性,比人類(lèi)生理視覺(jué)更具優(yōu)勢(shì)。
在我們通常的印象中,一個(gè)視力正常的人可以迅速且毫不費(fèi)力地感知世界,甚至可以詳細(xì)生動(dòng)得感知整個(gè)視覺(jué)場(chǎng)景;但其實(shí)這只是一個(gè)錯(cuò)覺(jué),人類(lèi)生理視覺(jué)有著天然的局限,只有投射到眼球中心視覺(jué)場(chǎng)景的中間部分,我們才能詳細(xì)而色彩鮮明地看清楚。比起人眼來(lái),CV其實(shí)具備了相當(dāng)多的優(yōu)勢(shì)(詳見(jiàn)表一),可以清楚的看到,CV的視力已經(jīng)遠(yuǎn)不止5.0了!
表一:機(jī)器視覺(jué)相對(duì)人眼的優(yōu)勢(shì)
機(jī)器視覺(jué)的視力為何如此之強(qiáng)?關(guān)鍵在于芯片,核心是將一些特定圖像算法用芯片方式實(shí)現(xiàn),同時(shí)融入了深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法。
機(jī)器視覺(jué)原理——圖像處理和算法機(jī)器視覺(jué)或稱(chēng)計(jì)算機(jī)視覺(jué)是用一個(gè)可以代替人眼的光學(xué)裝置和傳感器來(lái)對(duì)客觀世界三維場(chǎng)景進(jìn)行感知,即獲取物體的數(shù)字圖像,利用計(jì)算機(jī)或者芯片,結(jié)合專(zhuān)門(mén)應(yīng)用軟件來(lái)模擬人腦的判斷準(zhǔn)則而對(duì)所獲取的數(shù)字圖像進(jìn)行測(cè)量和判斷。該技術(shù)已廣泛用于實(shí)際的測(cè)量、控制和檢測(cè)中,隨著芯片技術(shù)發(fā)展,在人工智能各個(gè)領(lǐng)域應(yīng)用也逐步展開(kāi)。
圖一:機(jī)器視覺(jué)代替人眼抽象圖
一個(gè)典型的工業(yè)機(jī)器視覺(jué)系統(tǒng)包括:光源、鏡頭、相機(jī) (包括CCD相機(jī)和COMS相機(jī))、圖像處理單元 (或機(jī)器視覺(jué)芯片)、圖像處理軟件、***器、通訊、輸入輸出單元等。系統(tǒng)可再分為主端電腦、影像采集與影像處理器、影像攝影機(jī)、CCTV鏡頭、顯微鏡頭、照明設(shè)備、Halogen光源、LED光源、高周波螢光燈源、閃光燈源、其他特殊光源、影像顯示器、LCD、機(jī)構(gòu)及控制系統(tǒng)、控制器、精密桌臺(tái)、伺服運(yùn)動(dòng)機(jī)臺(tái)。
可見(jiàn),從應(yīng)用技術(shù)劃分,機(jī)器視覺(jué)是一門(mén)綜合了模擬、數(shù)字電子、計(jì)算機(jī)、圖像處理、傳感器、機(jī)械工程、光源照明、光學(xué)成像等跨學(xué)科的前沿技術(shù);從應(yīng)用學(xué)科劃分,機(jī)器視覺(jué)是一門(mén)涉及人工智能、神經(jīng)生物學(xué)、心理物理學(xué)、計(jì)算機(jī)科學(xué)、圖像處理、模式識(shí)別等多個(gè)領(lǐng)域的交叉學(xué)科。
機(jī)器視覺(jué)技術(shù)的發(fā)展,歸功于計(jì)算機(jī)軟件技術(shù)使現(xiàn)有大規(guī)模集成電子電路技術(shù)發(fā)展的成果達(dá)到了極大化的利用,尤其是多媒體和數(shù)字圖像處理及分析理論方面的技術(shù)成熟,使得機(jī)器視覺(jué)技術(shù)不僅在理論,而且在應(yīng)用上都得到了高速發(fā)展。
機(jī)器視覺(jué)之于人工智能的意義等同于視覺(jué)之于人類(lèi)的意義,而決定著機(jī)器視覺(jué)的就是圖像處理技術(shù)。不同的應(yīng)用領(lǐng)域需要不同的圖像處理算法來(lái)實(shí)現(xiàn)機(jī)器視覺(jué)。常用的機(jī)器視覺(jué)領(lǐng)域圖像算法有運(yùn)動(dòng)目標(biāo)檢測(cè)算法、基于深度學(xué)習(xí)的人臉?biāo)惴ǖ取?/p>
下面介紹下機(jī)器視覺(jué)中的運(yùn)動(dòng)目標(biāo)檢測(cè)圖像算法,該方法是運(yùn)動(dòng)物體識(shí)別和跟蹤的基礎(chǔ)。移動(dòng)物體的檢測(cè)依據(jù)視頻圖像中背景環(huán)境地不同可以分為靜態(tài)背景檢測(cè)和動(dòng)態(tài)背景檢測(cè)。由于篇幅有限,我們這里只介紹靜態(tài)背景檢測(cè)算法。常見(jiàn)的靜態(tài)背景目標(biāo)的檢測(cè)算法包括幀間差分法、背景減除法、光流法等。這些背景不變算法的優(yōu)缺點(diǎn)描述如下表二。
在上述檢測(cè)算法中,幀間差分法和背景減除法更加適用于如視頻監(jiān)控、智能交通系統(tǒng)等圖像背景靜止的環(huán)境中。光流法則更加適用于背景不斷變化的動(dòng)態(tài)環(huán)境中。下面我們來(lái)介紹以上三種常用算法的基本原理。
表二 各種機(jī)器視覺(jué)物體運(yùn)動(dòng)檢測(cè)算法比較
幀間差分法的適應(yīng)環(huán)境能力強(qiáng)、計(jì)算量小、且穩(wěn)定性好,是目前應(yīng)用廣泛的一類(lèi)運(yùn)動(dòng)檢測(cè)方法。其原理是將相幀或者三幀序列圖像像素點(diǎn)的對(duì)應(yīng)灰度值進(jìn)行相減,如果灰度差值大于閾值則說(shuō)明此處物體發(fā)生了變化,它是運(yùn)動(dòng)的;如果像素的灰度差值小于給定閾值說(shuō)明此處物體沒(méi)有發(fā)生變化,認(rèn)為它是靜止的。將像素灰度值發(fā)生變化的部分標(biāo)記出來(lái),這些被標(biāo)記的點(diǎn)就組成了運(yùn)動(dòng)目標(biāo)區(qū)域。進(jìn)一步對(duì)灰度圖像進(jìn)行二值化分析,提取目標(biāo)運(yùn)動(dòng)信息,區(qū)分出前景和背景圖像,進(jìn)而分割出運(yùn)動(dòng)目標(biāo)。
背景減除法其實(shí)是一種特別的幀間差分法,背景減除法根據(jù)將當(dāng)前幀圖像與背景模型做差來(lái)實(shí)現(xiàn)對(duì)運(yùn)動(dòng)目標(biāo)的檢測(cè)。這種方法首先獲取背景模型,并將其保存起來(lái),當(dāng)對(duì)某一幀圖像進(jìn)行檢測(cè)時(shí),用實(shí)時(shí)獲取的幀圖像與背景模型做差分運(yùn)算,得到要檢測(cè)的運(yùn)動(dòng)目標(biāo)。
光流法是當(dāng)運(yùn)動(dòng)目標(biāo)在監(jiān)控場(chǎng)景中產(chǎn)生運(yùn)動(dòng)的時(shí)候,物體表面會(huì)形成位移矢量場(chǎng),根據(jù)其變化可以得到運(yùn)動(dòng)目標(biāo)。光流是指移動(dòng)物體在其對(duì)應(yīng)的灰度圖像上的表面運(yùn)動(dòng),在光流場(chǎng)中,運(yùn)動(dòng)目標(biāo)的速度矢量形成的平面投影構(gòu)成了目標(biāo)的運(yùn)動(dòng)信息。運(yùn)動(dòng)目標(biāo)在投影上形成的速度矢量是比較均勻,運(yùn)動(dòng)目標(biāo)速度不同形成的速度矢量也不相同,通過(guò)光流的計(jì)算結(jié)果就可以區(qū)分出速度不同的運(yùn)動(dòng)目標(biāo)。
圖像處理算法一開(kāi)始應(yīng)用應(yīng)該是采用服務(wù)器的軟件算法來(lái)完成,隨著互聯(lián)網(wǎng)技術(shù)的不斷成熟,會(huì)擴(kuò)展到云端計(jì)算來(lái)完成,但是這樣對(duì)于網(wǎng)絡(luò)帶寬要求非常大,對(duì)于云服務(wù)器的計(jì)量量要求也非常高。筆者估計(jì),視頻圖像處理技術(shù)算法的大規(guī)模產(chǎn)業(yè)化應(yīng)用,必然是需要專(zhuān)業(yè)的芯片來(lái)完成,該芯片就是機(jī)器視覺(jué) (CV) 芯片。芯片方式一定是能夠降低成本,同時(shí)提高運(yùn)算能力。從近年的整個(gè)行業(yè)情況來(lái)看,計(jì)算機(jī)視覺(jué)作為人工智能領(lǐng)域最重要的方向之一,由于機(jī)器視覺(jué)芯片誕生和深度學(xué)習(xí)算法不斷發(fā)展,近幾年獲得了巨大的發(fā)展,各項(xiàng)應(yīng)用在不同的行業(yè)里開(kāi)始落地生根。
機(jī)器視覺(jué)的應(yīng)用歷史
最早的機(jī)器視覺(jué)提出開(kāi)始與上個(gè)視覺(jué)60年代,隨后1973年,美國(guó)自然科學(xué)基金會(huì)制定了1973-1982 視覺(jué)系統(tǒng)和機(jī)器人的發(fā)展計(jì)劃,并研究成功了一些實(shí)用的視覺(jué)系統(tǒng),應(yīng)用于機(jī)械手定位、集成電路生產(chǎn)、精密電子產(chǎn)品裝配、飲料罐裝的檢驗(yàn)等場(chǎng)合;后來(lái)在PCB制作工藝中也采用機(jī)器視覺(jué)系統(tǒng),用于印制電路板的質(zhì)量監(jiān)測(cè)等。除了在生產(chǎn)制造領(lǐng)域外,軍事領(lǐng)域也廣泛應(yīng)用,如精確的制導(dǎo)系統(tǒng)等,無(wú)人機(jī)的自動(dòng)導(dǎo)航等;還有CV也應(yīng)用在生物實(shí)驗(yàn)等領(lǐng)域,用于監(jiān)測(cè)生物各個(gè)生產(chǎn)規(guī)律,通過(guò)加速視頻播放來(lái)呈現(xiàn)生物生長(zhǎng)等過(guò)程;在汽車(chē)自動(dòng)駕駛領(lǐng)域,CV芯片也有不斷深入的應(yīng)用。
現(xiàn)在
在當(dāng)今這個(gè)時(shí)代,計(jì)算機(jī)視覺(jué)領(lǐng)域呈現(xiàn)出很多新的趨勢(shì),其中最為顯著的一個(gè),就是應(yīng)用的爆炸性增長(zhǎng)。除了手機(jī)、個(gè)人電腦和工業(yè)檢測(cè)之外,計(jì)算機(jī)視覺(jué)技術(shù)在智能安防、機(jī)器人、自動(dòng)駕駛、智慧醫(yī)療、無(wú)人機(jī)、增強(qiáng)現(xiàn)實(shí)(AR)等領(lǐng)域都出現(xiàn)了各種形態(tài)的應(yīng)用方式。計(jì)算機(jī)視覺(jué)迎來(lái)了一個(gè)應(yīng)用爆炸性增長(zhǎng)的時(shí)代,目前的應(yīng)用如下圖所示,主要以運(yùn)動(dòng)控制為主。
圖二:當(dāng)前機(jī)器視覺(jué)多種應(yīng)用方式
隨著各個(gè)領(lǐng)域技術(shù)不斷發(fā)展,許多科技巨頭也開(kāi)始了在圖像識(shí)別和人工智能領(lǐng)域的布局,F(xiàn)acebook簽下的人工智能專(zhuān)家Yann LeCun最重大的成就就是在圖像識(shí)別領(lǐng)域,其提出的LeNet為代表的卷積神經(jīng)網(wǎng)絡(luò),在應(yīng)用到各種不同的圖像識(shí)別任務(wù)時(shí)都取得了不錯(cuò)效果,被認(rèn)為是通用圖像識(shí)別系統(tǒng)的代表之一;Google 借助模擬神經(jīng)網(wǎng)絡(luò)“DistBelief”通過(guò)對(duì)數(shù)百萬(wàn)份YouTube 視頻的學(xué)習(xí)自行掌握了貓的關(guān)鍵特征,這是機(jī)器在沒(méi)有人幫助的情況下自己讀懂了貓的概念。值得一提的是,負(fù)責(zé)這個(gè)項(xiàng)目的Andrew Ng后來(lái)轉(zhuǎn)投百度領(lǐng)導(dǎo)百度(現(xiàn)已離職),其一個(gè)重要的研究方向就是人工智能和圖像識(shí)別,這也能看出國(guó)內(nèi)科技公司對(duì)圖像識(shí)別技術(shù)以及人工智能技術(shù)的重視程度。
未來(lái)
機(jī)器視覺(jué)領(lǐng)域的應(yīng)用將呈現(xiàn)了爆發(fā)式的增長(zhǎng)態(tài)勢(shì)。剛才已經(jīng)提到在安防監(jiān)控、高度的自動(dòng)化駕駛、增強(qiáng)現(xiàn)實(shí)、醫(yī)療圖像、機(jī)器人工業(yè)視覺(jué)、移動(dòng)互聯(lián)網(wǎng)等領(lǐng)域都有眾多的計(jì)算機(jī)視覺(jué)應(yīng)用產(chǎn)生。CV芯片的成熟量產(chǎn)將使得人類(lèi)生活在一個(gè)無(wú)所隱藏的時(shí)代,每個(gè)帶有CV芯片的攝像頭就是視力遠(yuǎn)遠(yuǎn)高于5.0的眼睛,并且超強(qiáng)的分析判斷能力;當(dāng)然人工智能的有序應(yīng)用,最終將造福人類(lèi)。
下圖是對(duì)2014年至2018年全球機(jī)器視覺(jué)系統(tǒng)及部件機(jī)器視覺(jué)市場(chǎng)規(guī)模預(yù)測(cè),圖中折線(xiàn)為年增長(zhǎng)率,由圖根據(jù)復(fù)合增長(zhǎng)率可以計(jì)算出2014-2018年的復(fù)合增長(zhǎng)率為8.39%。
圖三:全球機(jī)器視覺(jué)市場(chǎng)規(guī)模預(yù)測(cè)
國(guó)內(nèi)外CV芯片公司與特點(diǎn)
國(guó)內(nèi)的機(jī)器視覺(jué)相關(guān)公司有一些,大部分都是屬于視覺(jué)芯片產(chǎn)品應(yīng)用型公司,而半導(dǎo)體芯片制造公司比較少。
視覺(jué)芯片產(chǎn)品應(yīng)用型公司如杭州海康機(jī)器人技術(shù)有限公司,起步于全球安防排名首位——??低?/u>成立的機(jī)器視覺(jué)業(yè)務(wù)部,依托??低曉谝曇纛l、成像采集與核心算法等領(lǐng)域技術(shù)積累,??禉C(jī)器人主攻智能制造,業(yè)已開(kāi)拓機(jī)器視覺(jué)、移動(dòng)機(jī)器人以及行業(yè)級(jí)無(wú)人機(jī)等業(yè)務(wù)領(lǐng)域。其中,機(jī)器視覺(jué)產(chǎn)品覆蓋全系列工業(yè)面陣、線(xiàn)陣、立體相機(jī),鏡頭,視覺(jué)軟件平臺(tái),視覺(jué)控制器及工業(yè)智能相機(jī)等。
廣州云從信息科技有限公司 (簡(jiǎn)稱(chēng)云從科技) 是一家專(zhuān)注于計(jì)算機(jī)視覺(jué)與人工智能的高科技企業(yè),核心技術(shù)源于四院院士、計(jì)算機(jī)視覺(jué)之父——Thomas S.Huang (黃煦濤) 教授。核心團(tuán)隊(duì)曾于2007年到2011年6次斬獲智能識(shí)別世界冠軍,得到上市公司佳都科技與香港杰翱資本的戰(zhàn)略投資。公司主要技術(shù)團(tuán)隊(duì)來(lái)自中國(guó)科學(xué)院重慶分院,是中科院研發(fā)實(shí)力最雄厚的人臉識(shí)別團(tuán)隊(duì),并作為中科院戰(zhàn)略性先導(dǎo)科技專(zhuān)項(xiàng)的唯一人臉識(shí)別團(tuán)隊(duì),代表參與了***喀什等地安防布控。
格靈深瞳是一家將計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)技術(shù)應(yīng)用于商業(yè)領(lǐng)域的科技公司,自主研發(fā)的深瞳技術(shù)在人和車(chē)的檢測(cè)、跟蹤與識(shí)別方面居于世界領(lǐng)先水平。公司借助海量數(shù)據(jù),讓計(jì)算機(jī)像人一樣看懂這個(gè)世界,實(shí)時(shí)獲取自然世界正在發(fā)生的一切,打造自然世界的搜索引擎。華為海思在機(jī)器視覺(jué)這塊也積極布局,但是目前還沒(méi)有成熟量產(chǎn)CV芯片推出。
中星微電子
中星微電子是國(guó)內(nèi)為數(shù)不多的一家機(jī)器視覺(jué)芯片設(shè)計(jì)公司,其芯片的主要功能在人臉識(shí)別領(lǐng)域的應(yīng)用。2016年6月20日,中星率先推出中國(guó)首款嵌入式神經(jīng)網(wǎng)絡(luò)處理器(NPU)芯片中星微,這是全球首顆具備深度學(xué)習(xí)人工智能的嵌入式視頻采集壓縮編碼系統(tǒng)級(jí)芯片,并取名“星光智能一號(hào)”。這款基于深度學(xué)習(xí)的芯片運(yùn)用在人臉識(shí)別上,最高能達(dá)到98%的準(zhǔn)確率,超過(guò)人眼的識(shí)別率。該芯片于2016年3月6日實(shí)現(xiàn)量產(chǎn),目前出貨量為十幾萬(wàn)件。該NPU采用了“數(shù)據(jù)驅(qū)動(dòng)”并行計(jì)算的架構(gòu),單顆NPU(28nm)能耗僅為400mW,極大地提升了計(jì)算能力與功耗的比例,可以廣泛應(yīng)用于高清視頻監(jiān)控、智能駕駛輔助、無(wú)人機(jī)、機(jī)器人等嵌入式機(jī)器視覺(jué)領(lǐng)域。
圖四:中星微NPU框架
NEXTCHIP
韓國(guó)NEXTCHIP公司1997年成立,2007年在韓國(guó)已經(jīng)上市,是一個(gè)以圖像處理技術(shù)為主的公司。公司的產(chǎn)品設(shè)計(jì)視頻監(jiān)控、DVR、SOC、自動(dòng)駕駛系統(tǒng)中的核心芯片,均是以圖形處理、傳輸為主的半導(dǎo)體芯片廠(chǎng)家。公司涉及機(jī)器視覺(jué)領(lǐng)域芯片是在自動(dòng)駕駛系統(tǒng)的應(yīng)有中,主打產(chǎn)品APACHE4是瞄準(zhǔn)下一代的ADAS體系的SOC芯片。
APACHE4加入了專(zhuān)用檢測(cè)引擎,支持行人檢測(cè)、車(chē)輛檢測(cè)、車(chē)道檢測(cè)和移動(dòng)物體檢測(cè)四種監(jiān)測(cè)類(lèi)型。嵌入其中的CEVA-XM4圖像和視覺(jué)平臺(tái)可讓APACHE4的客戶(hù)使用高階軟件編程來(lái)開(kāi)發(fā)差異化的ADAS應(yīng)用,具體應(yīng)有如下圖,在車(chē)輛系統(tǒng)的前后左右都有圖像采集系統(tǒng),搭配一顆APACHE4,并將采集數(shù)據(jù)送入到圖像分析系統(tǒng)ECU,并將分析結(jié)果送入汽車(chē)操控系統(tǒng)。
圖五:APACHE4在汽車(chē)自動(dòng)駕駛中應(yīng)用
Movidius
Movidius是一家無(wú)晶圓半導(dǎo)體公司,2016年9月英特爾宣布將收購(gòu)計(jì)算機(jī)視覺(jué)創(chuàng)業(yè)公司Movidius,這家公司也是谷歌Project Tango 3D傳感器技術(shù)背后的功臣。Movidius的使命是“為機(jī)器賦予視覺(jué)能力”,同時(shí)也將與英特爾的RealSense技術(shù)配合。該公司主要產(chǎn)品為低功耗視覺(jué)處理器:Myriad 系列 VPU,而且已經(jīng)與谷歌、聯(lián)想和大疆等公司簽訂了協(xié)議。
DJI大疆宣布推出最新的無(wú)人機(jī)產(chǎn)品Phantom 4。這款飛行器采用計(jì)算機(jī)視覺(jué)來(lái)實(shí)現(xiàn)自主飛行,核心的機(jī)器視覺(jué)芯片就是采用了Movidius的Myriad 2芯片。早在2014年,Movidius推出的首顆芯片Myriad 1就應(yīng)用到了谷歌的第一代Project Tango平板中。
2017年8月28日,INTEL宣布推出Movidius Myriad X視覺(jué)處理器(VPU),該處理器是一款低功耗SoC,主要用于基于視覺(jué)的設(shè)備的深度學(xué)習(xí)和AI算法加速,比如無(wú)人機(jī)、智能相機(jī)、VR/AR頭盔。
圖六:Myriad X視覺(jué)處理器
Myriad X的推出并不會(huì)取代Myriad 2。Movidius稱(chēng),Myriad X能在同一功率范圍內(nèi)的深度神經(jīng)網(wǎng)絡(luò)DNN推理中,提供10倍于Myriad 2的性能。Myriad X擁有Movidius稱(chēng)之為神經(jīng)計(jì)算引擎(Neural Compute Engine)的功能,這是一種集成在芯片上的DNN加速器。
Movidius稱(chēng),有了它,Myriad X的DNN推理吞吐量能達(dá)到每秒超過(guò)一萬(wàn)億次運(yùn)算(TOPS)。除了神經(jīng)計(jì)算引擎,SoC 16還具有可編程矢量處理器,可配置MIPI通道和Vision Accelerator。矢量處理器使您能夠一起運(yùn)行多個(gè)成像和視覺(jué)應(yīng)用。
此外,MIPI通道確保您可以將多達(dá)8個(gè)HD-RGB攝像機(jī)直接連接到Myriad X.該芯片可以處理高達(dá)每秒7億像素的圖像信號(hào)。最后,Vision Accelerator可以讓您執(zhí)行光流量和立體聲深度等任務(wù),而無(wú)需額外的計(jì)算能力。與人類(lèi)相媲美的視覺(jué)智能設(shè)備構(gòu)成了計(jì)算的下一步, 隨著低功耗的CV芯片的逐漸發(fā)展,真正的AI離我們?cè)絹?lái)越近了。
Ambarella
美國(guó)安霸(Ambarella)是高清視頻業(yè)界的技術(shù)領(lǐng)導(dǎo)者,主要提供低功耗、高清視頻壓縮與圖像處理的解決方案。2015年安霸收購(gòu)意大利公司VisLab,計(jì)劃借此進(jìn)入計(jì)算機(jī)視覺(jué)芯片市場(chǎng)。
安霸收購(gòu)VisLab后,包括“計(jì)算機(jī)視覺(jué)算法、傳感器融合以及基于算法的感知、探測(cè)和決斷”等在內(nèi)的多項(xiàng)核心技術(shù)也將一并納入安霸麾下,同時(shí)安霸的汽車(chē)軌跡記錄芯片以及基于攝像頭的系統(tǒng)級(jí)芯片解決方案也是吸引VisLab加入的重要原因。
安霸本身是圖像處理芯片公司,同時(shí)一直在汽車(chē)行業(yè)也有出色的芯片應(yīng)用,有了機(jī)器視覺(jué)芯片后,安霸在汽車(chē)自動(dòng)駕駛領(lǐng)域?qū)?huì)起到更大作用。業(yè)界消息反饋,目前安霸的機(jī)器視覺(jué)芯片CV1將在今秋送樣。安霸的CV1未來(lái)取決于算法和軟件,最終是有沒(méi)有可能投入到龐大的車(chē)隊(duì)和達(dá)到LEVEL4的自動(dòng)駕駛水平。
摩根士丹利證券分析師 Joseph Moore 指出,“電腦視覺(jué)(computer vision)”蘊(yùn)藏極大商機(jī),將創(chuàng)造出許多贏家,安霸在影像處理領(lǐng)域的深厚專(zhuān)業(yè)知識(shí)使其處于獨(dú)特的地位。安霸首款電腦視覺(jué)芯片將自今年秋季起開(kāi)始送樣并進(jìn)行必要的車(chē)用認(rèn)證程序。如果一切進(jìn)行順利,安霸的電腦視覺(jué)芯片可望自明年起開(kāi)始拉高產(chǎn)量。
Inuitive
Inuitive是一家先進(jìn)的3D計(jì)算機(jī)視覺(jué)和圖像處理器設(shè)計(jì)廠(chǎng)家,利用CEVA-XM4智慧視覺(jué)DSP的授權(quán)許可,運(yùn)行復(fù)雜的即時(shí)深度感測(cè)、特征跟蹤、目標(biāo)識(shí)別、深度學(xué)習(xí)和其它以各種行動(dòng)設(shè)備為目標(biāo)的視覺(jué)相關(guān)之演算法。
CEVA圖像和視覺(jué)DSP滿(mǎn)足最復(fù)雜計(jì)算攝影和電腦視覺(jué)應(yīng)用對(duì)極端處理的需求,比如視頻分析、擴(kuò)增實(shí)境和先進(jìn)駕駛輔助系統(tǒng)(ADAS)。透過(guò)從CPU和GPU卸載下這些性能密集型的任務(wù),這些高效的DSP可大幅降低整體系統(tǒng)的功耗,同時(shí)還可提供完整的靈活性。這些行動(dòng)設(shè)備包括擴(kuò)增實(shí)境和虛擬實(shí)境頭戴耳機(jī)、無(wú)人機(jī)、消費(fèi)機(jī)器人、360度相機(jī)和深度感測(cè)器等。
圖七:Inuitive視覺(jué)處理器NU3000
目前該公司在機(jī)器視覺(jué)的芯片有NU3000和NU4000 兩款。NU4000是Inuitive在其N(xiāo)U3000多核影像處理器成功的基礎(chǔ)之上所推出的新款產(chǎn)品;NU3000以第三代的CEVA-MM3101圖像和視覺(jué)DSP來(lái)提供立體視覺(jué)功能,現(xiàn)在是Google Project Tango生態(tài)系統(tǒng)中的一部分,開(kāi)發(fā)人員能夠利用它來(lái)開(kāi)發(fā)需要即時(shí)深度產(chǎn)生、映射、定位、導(dǎo)航和其它復(fù)雜信號(hào)處理演算法的應(yīng)用。
小結(jié)
從目前的數(shù)據(jù)看,機(jī)器視覺(jué)領(lǐng)域目前是一個(gè)巨大的市場(chǎng),如下圖預(yù)測(cè),預(yù)計(jì)在2018年市場(chǎng)容量將達(dá)到50.43億美元的規(guī)模。面對(duì)如此巨大的市場(chǎng),并且核心的硬件芯片占了整套視覺(jué)系統(tǒng)大概35%的成本的情形下,半導(dǎo)體行業(yè)各個(gè)大公司都對(duì)此領(lǐng)域虎視眈眈。但是因其技術(shù)壁壘較高,需要有成熟的圖像算法方面積累,半導(dǎo)體公司也不敢貿(mào)然進(jìn)入。
中國(guó)國(guó)內(nèi)大部分是在視覺(jué)產(chǎn)品中下游公司,設(shè)計(jì)生產(chǎn)專(zhuān)用機(jī)器視覺(jué)芯片公司鳳毛麟角。從中國(guó)國(guó)內(nèi)機(jī)器視覺(jué)專(zhuān)利申請(qǐng)數(shù)量看,在二十年前,幾乎沒(méi)有任何的專(zhuān)利創(chuàng)新,2011年,我國(guó)機(jī)器視覺(jué)專(zhuān)利申請(qǐng)數(shù)為267個(gè);2012年,我國(guó)機(jī)器視覺(jué)專(zhuān)利申請(qǐng)數(shù)量為298個(gè);2013年為101個(gè),說(shuō)明國(guó)內(nèi)也在不斷重視機(jī)器視覺(jué)這個(gè)領(lǐng)域,試圖在產(chǎn)業(yè)的高端有所突破。
放眼全球,INTEL、安霸等半導(dǎo)體巨頭在CV領(lǐng)域早有研究,并且目前有成熟可量產(chǎn)的CV芯片上市,在高端控制了整個(gè)機(jī)器視覺(jué)領(lǐng)域,同時(shí),這些國(guó)際大公司也通過(guò)自己本身在行業(yè)的影響地位,不斷推動(dòng)CV的各個(gè)行業(yè)的具體應(yīng)用,大力推動(dòng)了整個(gè)CV行業(yè)的高速發(fā)展。
CV芯片未來(lái)發(fā)展趨勢(shì)
從目前CV芯片的現(xiàn)狀和機(jī)器視覺(jué)系統(tǒng)的應(yīng)用來(lái)看,芯片領(lǐng)域是一個(gè)非常巨大的市場(chǎng),是計(jì)算機(jī)視覺(jué)未來(lái)大規(guī)模應(yīng)用的重要一環(huán),筆者認(rèn)為未來(lái)的CV芯片有下面三大發(fā)展趨勢(shì)。
趨勢(shì)一:CV芯片的集成度進(jìn)一步提高。隨著半導(dǎo)體加工工藝向6nm邁進(jìn),單顆CV的集成度將大大提升。更高效的大卷積解構(gòu)與復(fù)用機(jī)制成熟,在超大神經(jīng)網(wǎng)絡(luò)中可以進(jìn)一步減少總線(xiàn)上的數(shù)據(jù)通信,可以適當(dāng)深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)IP更加容易集成;同時(shí),各種圖形處理算法IP直接固化在CV芯片中,降低了對(duì)GPU的計(jì)算能力依賴(lài)。未來(lái)的單顆CV芯片,將會(huì)標(biāo)配深度學(xué)習(xí)功能、神經(jīng)網(wǎng)絡(luò)功能和機(jī)器視覺(jué)處理、分析功能。
趨勢(shì)二:機(jī)器視覺(jué)芯片出現(xiàn)細(xì)分。CV芯片將隨著應(yīng)用領(lǐng)域不同而出現(xiàn)細(xì)分,如分為專(zhuān)用的自動(dòng)駕駛CV芯片、無(wú)人機(jī)導(dǎo)航CV芯片、AR/VR應(yīng)用CV芯片等。因?yàn)樵谀硞€(gè)特殊領(lǐng)域,隨著機(jī)器視覺(jué)算法應(yīng)用需求越來(lái)越多,必然帶來(lái)成本的需求,以增加產(chǎn)品的利潤(rùn),所以,在CV芯片上做costdown,裁減非本領(lǐng)域的應(yīng)用功能,并不斷深化該領(lǐng)域應(yīng)用是必然的。
趨勢(shì)三:低功耗,SOC方式。云+端的方式,通過(guò)端完成關(guān)鍵的機(jī)器視覺(jué)功能,把處理結(jié)果傳回云,利用云端做分析判斷。這種方式優(yōu)勢(shì)是減少網(wǎng)絡(luò)帶寬,把視頻處理運(yùn)算由中心分散到前端,這個(gè)筆者一定是未來(lái)的一個(gè)重要趨勢(shì)。因此,作為端的CV芯片必須是低功耗并且?guī)в幸欢ǖ腃PU功能,需要做到單顆電池續(xù)航能力持久,并且具備一定的數(shù)據(jù)通信、任務(wù)調(diào)度功能。
-
芯片
+關(guān)注
關(guān)注
455文章
50851瀏覽量
423984 -
機(jī)器視覺(jué)
+關(guān)注
關(guān)注
162文章
4375瀏覽量
120366 -
人工智能
+關(guān)注
關(guān)注
1791文章
47314瀏覽量
238648 -
視覺(jué)算法
+關(guān)注
關(guān)注
0文章
31瀏覽量
5570
原文標(biāo)題:一文看懂機(jī)器視覺(jué)芯片
文章出處:【微信號(hào):www_51qudong_com,微信公眾號(hào):機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論