在移動機(jī)器人領(lǐng)域,2018年最大的技術(shù)進(jìn)展莫過于VSLAM技術(shù)在該領(lǐng)域的應(yīng)用突破了,它將讓移動機(jī)器人自主行駛有更廣闊的空間。
目前市面上移動機(jī)器人自主行駛都是以激光雷達(dá)導(dǎo)航為主,雙目視覺只是作為輔助使用,原因是現(xiàn)階段視覺導(dǎo)航存在太多的問題。
如今,上海詮視傳感技術(shù)有限公司(以下簡稱:詮視科技)在VSLAM應(yīng)用技術(shù)上取得了重大的進(jìn)展,把雙目攝像頭、RGB攝像頭、TOF攝像頭等視覺傳感器進(jìn)行深度融合,輔之以AI的邊緣計算,讓機(jī)器視覺變得更加的智能。
詮視傳感CEO林瓊說:“有了詮視的RobotVision模組之后,移動機(jī)器人在行駛過程中,可實現(xiàn)定位、避障、導(dǎo)航、空間測量、物體識別等功能,解決了如前面的通道,機(jī)器人是否可以通過?或前面的物體和人,距離機(jī)器人還有多遠(yuǎn)等問題?通過對人的識別,當(dāng)人與機(jī)器人同時行走在一條通道上,機(jī)器人可以更好進(jìn)行自主避障?!?/p>
更重要的是詮視科技把幾個傳感器進(jìn)行集成后,對機(jī)器人企業(yè)而言是大大降低了投入成本和開發(fā)時間。
機(jī)器人的視覺系統(tǒng)不是簡單去采購幾個鏡頭和傳感器產(chǎn)品進(jìn)行組裝就可以實現(xiàn),機(jī)器視覺是一個非常復(fù)雜、嚴(yán)密的系統(tǒng)工程?,F(xiàn)在有一家企業(yè)把最令人頭疼的事情做好了,對其它企業(yè)而言,就沒必要再重復(fù)做投入,直接拿過來用最省事。
1號機(jī)器人網(wǎng)記者:2018年機(jī)器人領(lǐng)域最大的進(jìn)展就是VSLAM技術(shù)在該領(lǐng)域的應(yīng)用突破,可否談?wù)勗徱昖SLAM系統(tǒng)方案有哪些亮點?
林瓊:
圖:詮視雙目視覺3D XR Vision
在移動機(jī)器人領(lǐng)域,目前是以激光雷達(dá)為主的導(dǎo)航方案,因為二維激光雷達(dá)可實時更新位置信息,本身運(yùn)算成本比較低,對平臺的要求不高,所以比較容易上手,因此,現(xiàn)階段很多機(jī)器人企業(yè)都是采用激光雷達(dá)導(dǎo)航為主的方案。而VSLAM有著局限性,它受光線的影響很大,因此,過去幾年制約著它的發(fā)展。
我們現(xiàn)在的方案是通過多傳感器的融合彌補(bǔ)VSLAM先天性的不足(接下來的問題會詳細(xì)談到)。在多傳感器的彌補(bǔ)下,VSLAM從空間可以獲取更加豐富的信息,這是二維激光雷達(dá)所不能比擬的。
比如機(jī)器人如何避障問題?二維激光雷達(dá)只能獲取一條線上的信息,而VSLAM可以獲取更加立體的信息,這就是VSLAM區(qū)別于激光導(dǎo)航的優(yōu)勢所在。
1號機(jī)器人網(wǎng)記者:你們的雙目視覺主要在VR/AR和移動機(jī)器人等領(lǐng)域應(yīng)用,它在VR/AR領(lǐng)域可以充當(dāng)什么?它解決了哪些問題?
林瓊:VR/AR是我們兩大應(yīng)用之一,VSLAM在VR/AR領(lǐng)域已經(jīng)被證明是唯一有效的技術(shù)。
VSLAM在VR/AR領(lǐng)域可以對自己位置和姿態(tài)進(jìn)行追蹤,比如在VR虛擬世界,你向前走了多少米?向左邊看,看到的物體離你有多少距離?等等這些數(shù)據(jù)都是可以清晰的呈現(xiàn)出來。
過去VR世界呈現(xiàn)的是3個自由度,即3DOF,只能實現(xiàn)角度變化的呈現(xiàn), 無法實現(xiàn)平移的檢出,在VR世界里是沒有移動感,你也不知道你看到的物體離你有多近?所以它具備一定的沉浸感,但不是深度的沉浸感。
VR想要達(dá)到深度的沉浸感需要具備6個自由度的感知能力,即6DOF,用戶能感知上下左右前后的移動和相應(yīng)轉(zhuǎn)角的變化,甚至你能知道你看到的物體離你有多遠(yuǎn)?以及你往左邊看,這個轉(zhuǎn)角是多少度?左邊眼睛所看到的物體離你有多近?等等這些信息都是可以呈現(xiàn)出來。
AR也是一樣,比如桌子上有一個虛擬的杯子,我要把這顆珠子放進(jìn)去,那你就要知道這個杯子的具體位置,你才能瞄準(zhǔn)把珠子放進(jìn)去,VSLAM的作用就是把杯子具體位置確定下來,知道了它的具體位置,你才能把珠子放進(jìn)去。
所以在VR/AR領(lǐng)域,VSLAM可以講是解決了人與環(huán)境的最基本的交互問題。
1號機(jī)器人網(wǎng)記者:在國內(nèi)移動機(jī)器人領(lǐng)域,目前主流的導(dǎo)航方案都是以激光雷達(dá)為主,現(xiàn)階段視覺導(dǎo)航問題不少,在移動機(jī)器人領(lǐng)域,你們可以提供怎樣的VSLAM解決方案?
林瓊:我們提供的是以視覺導(dǎo)航為主的多傳感器融合方案,它對空間特征的提取更加的豐富,還具備物體識別的能力。
比如它可以識別這是桌子或椅子,還可以識別人臉、人體、人形,這樣當(dāng)人走過來的時候,它就可以有不同的交互方式,知道如何進(jìn)行避讓。
在移動機(jī)器人領(lǐng)域,我們以邊緣計算平臺為基礎(chǔ),算法為核心,再進(jìn)行多傳感器的融合,讓機(jī)器人自主行駛更加有保障。
移動機(jī)器人搭載我們的雙目RobotVision產(chǎn)品后,在行走的過程中,可以對前面的空間進(jìn)行測量,反饋給機(jī)器人做出相應(yīng)的判斷,這是過去的激光導(dǎo)航所不具備的能力。
我們在一個端設(shè)備上集成了TOF攝像頭、RGB攝像頭、雙目攝像頭、IMU乃至激光雷達(dá)等,實現(xiàn)了多傳感器融合的一站式解決方案。
如果機(jī)器人企業(yè)自己去做的話,需要采購多臺設(shè)備進(jìn)行數(shù)據(jù)的融合,投入將是巨大的,而我們把多個傳感器集成于一個設(shè)備上,大大節(jié)省了機(jī)器人企業(yè)的投入和開發(fā)周期。
1號機(jī)器人網(wǎng)記者:看你們的官網(wǎng),詮視雙目視覺產(chǎn)品的單價還是太高了,單價高阻礙推行,你們認(rèn)為2019年內(nèi)產(chǎn)品降價的空間存不存在?
林瓊:當(dāng)然存在。我們現(xiàn)在單價高是因為把雙目攝像頭、TOF攝像頭、RGB攝像頭集成到一起,所以整體單價就高。那也好過機(jī)器人企業(yè)自己去買這些設(shè)備,如果把所有的產(chǎn)品都匯集,產(chǎn)品價格將會更高。
我們現(xiàn)在預(yù)售價399美元/個,是一個整體方案,包含軟件技術(shù)支持、硬件設(shè)備支持等,是一整套的服務(wù)。如果機(jī)器人企業(yè)自己去買一個攝像頭,那單價是低很多,但是也是需要采購多種傳感器進(jìn)行融合,而且在算法上的投入將是巨大的。
最重要的是,我們團(tuán)隊有在這個領(lǐng)域深耕了10年的技術(shù)積累,機(jī)器人企業(yè)自己去做會面臨很高的技術(shù)門檻。
1號機(jī)器人網(wǎng)記者:如果我們撇開價格不談,你認(rèn)為未來視覺導(dǎo)航是否會替代激光雷達(dá)導(dǎo)航?你們對視覺與激光未來的發(fā)展如何判斷?
林瓊:我認(rèn)為兩者一定會融合;因為不管是視覺導(dǎo)航還是激光導(dǎo)航,各自都有短板,當(dāng)然,融合還要看使用場景。
視覺導(dǎo)航的短板是受光線的影響很大,視覺對環(huán)境的依賴性非常強(qiáng);二維激光導(dǎo)航的短板是信息過于簡單,完全依賴光線的反射,會存在信息偏差,在復(fù)雜場景下存在定位失效等問題。
所以對移動機(jī)器人而言,要進(jìn)行自主行走光靠一個傳感器是不行的,必須是多傳感器的融合解決方案。因為我們是做視覺導(dǎo)航的,站在我們的角度來看,強(qiáng)調(diào)是以視覺為主的多傳感器融合方案,視覺所獲取的信息比二維激光要更加豐富,除非用多線激光雷達(dá)方案,但價格會更加昂貴,所以未來一兩年多模態(tài)融合的視覺導(dǎo)航將會逐漸凸顯優(yōu)勢。
1號機(jī)器人網(wǎng)記者:從技術(shù)的角度去看,你認(rèn)為未來三年雙目視覺的技術(shù)發(fā)展方向會是怎樣?
林瓊:雙目視覺的發(fā)展歷史非常的長,它的弱點是精度不夠高,目前雙目視覺最佳的探測距離是10米,在低速機(jī)器人領(lǐng)域,這個距離已經(jīng)足夠了。那未來的方向就是提高精度。
現(xiàn)在大家統(tǒng)一的做法就是雙目視覺+結(jié)構(gòu)光的方案,這也是未來三年的技術(shù)發(fā)展方向,也是目前提高精度的最佳方案。
1號機(jī)器人網(wǎng)記者:縱觀國內(nèi),現(xiàn)在技術(shù)的發(fā)展都非常的快,按照目前的技術(shù)發(fā)展速度,你認(rèn)為雙目視覺最終的方案是怎樣?
林瓊:我認(rèn)為機(jī)器視覺最終的方案一定是超越人眼,比如子彈從你眼前飛過,你是看不見子彈的軌跡,但是機(jī)器視覺可以,它可以重放,鏡頭慢到你可以清晰的看到子彈從你眼前飛過。
而且未來所有的智能硬件產(chǎn)品都可以具備眼睛的功能,比如自動加油機(jī),當(dāng)汽車開過來的時候,它可以知道汽車離自己還有多少米等等。當(dāng)所有的智能硬件產(chǎn)品都具備眼睛的功能時,整個社會都將會是翻天覆地的變化。
1號機(jī)器人網(wǎng)記者:最后一個問題,你們判斷雙目視覺會在哪些領(lǐng)域率先爆發(fā)應(yīng)用?以及你們下一步的戰(zhàn)略如何布局?
林瓊:從目前的應(yīng)用場景去分析,我們認(rèn)為雙目視覺會在VR/AR和移動機(jī)器人等領(lǐng)域率先爆發(fā)應(yīng)用。在VR/AR領(lǐng)域,VSLAM已被證明是唯一有效的技術(shù);在移動機(jī)器人領(lǐng)域,VSLAM多傳感器融合的方案基本上可以解決室內(nèi)80%左右的機(jī)器人自主行走問題。
我們現(xiàn)在的公司戰(zhàn)略就是在這兩條路線上去深耕,并做垂直的整合,我們不但輸出核心技術(shù),未來還會參與制作VR/AR眼鏡或機(jī)器人整體解決方案。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28570瀏覽量
207732 -
VSLAM
+關(guān)注
關(guān)注
0文章
23瀏覽量
4333
原文標(biāo)題:詮視科技:VSLAM的技術(shù)進(jìn)展讓移動機(jī)器人自主行駛有了更廣闊的空間
文章出處:【微信號:robot-1hjqr,微信公眾號:1號機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論