在工業(yè)界,傳統(tǒng)自動化方案均是將知識灌入機(jī)器人系統(tǒng),通過編程的形式實(shí)現(xiàn)自動批量處理事務(wù)的功能。因此誕生了一系列計(jì)算機(jī)視覺的任務(wù)和機(jī)器人控制的任務(wù),比如一個完整的抓取分揀操作,包含了3D感知、配準(zhǔn)、點(diǎn)云分割、抓取點(diǎn)估計(jì)、任務(wù)重排、規(guī)劃、2D校準(zhǔn)等任務(wù),通過強(qiáng)大的工業(yè)軟件將這些技術(shù)點(diǎn)耦合在一起,這樣催生了工業(yè)上的絕大部分應(yīng)用。
這樣的應(yīng)用具有可控、重復(fù)性高的特點(diǎn),但是整個方案實(shí)施成本高、柔性低、換線復(fù)雜,并且每個方案都是獨(dú)特的,缺乏基準(zhǔn)和技術(shù)一致性,非常不利于整體技術(shù)的進(jìn)步,因此“解決方案”這四個字是整個行業(yè)的痛。
人類經(jīng)常被物化為工業(yè)流水線中最柔性的執(zhí)行機(jī)構(gòu),是因?yàn)槿擞^察和學(xué)習(xí)周圍的環(huán)境,使用自己的大腦充分的利用自己的身體完成各種復(fù)雜的任務(wù),并且在執(zhí)行中不斷受到更新自己的認(rèn)知,這種以身體為舟,性命為本,在塵世航行的模式,正是智能化追求的一種理想形式。這正是1950 年圖靈論文中提到的具身智能。
工業(yè)機(jī)器人的智能化發(fā)展始于具身智能。具身智能是指人工智能具有身體,需要與真實(shí)世界進(jìn)行交互。這種交互不僅涉及視覺上的高維特征提取,還包括其他感官信息,例如聽覺、嗅覺、味覺和觸覺。通過這種交互,智能體可以獲取物理世界的真實(shí)反饋,并通過反饋來學(xué)習(xí)并進(jìn)化。具身智能是一種重要的發(fā)展方向,可以幫助機(jī)器人更好地完成任務(wù)。
而在具身智能執(zhí)行步驟一般為多傳感器的real to sim,然后sim to real的過程,具體的過程如下:
Real to Sim
通過多種感知設(shè)備和算法,盡量將現(xiàn)實(shí)世界的信息能夠還原到虛擬環(huán)境中
Sim to Real
在經(jīng)過模擬和規(guī)劃后,將算法和規(guī)劃應(yīng)用到實(shí)際機(jī)器人上
以前為什么不能提具身智能,是因?yàn)榧夹g(shù)復(fù)雜,各個技術(shù)點(diǎn)發(fā)展不成熟,但是目前2023年,很多工作已經(jīng)發(fā)展到一定的階段,尤其是大語言模型徹底改變了語義理解和頂層規(guī)劃的困難。
大語言模型的發(fā)展為高級規(guī)劃層鋪平了道路
隨著chatgpt證明了大語言模型具有較強(qiáng)的綜合思考、邏輯能力、數(shù)理能力,大語言模型越來越被證明,其作為機(jī)器人的上層邏輯規(guī)劃器是非常有希望的,一舉改變了機(jī)器人系統(tǒng)不智能的缺點(diǎn)。尤其值得注意的是最近c(diǎn)hain of thought配合LLMs的一些研究表明,通用AGI似乎并不遙遠(yuǎn)了。
大語言模型的發(fā)展
Chain of thought在無害化方向的作用
多模態(tài)模型的發(fā)展
Transformer等結(jié)構(gòu)帶來的多模態(tài)模型的發(fā)展,對統(tǒng)一圖像、行為理解、語音、動作等提供了技術(shù)基礎(chǔ)。2023年3月6日,來自谷歌和德國林工業(yè)大學(xué)的一組人工智能研究人員公布了史上最大視覺語言模型 PaLM-E( Pathways Language Model with Embodied)。機(jī)器人可以通過圖片理解現(xiàn)狀,并根據(jù)文字指令完成任務(wù)。
CVPR2023的best paper,UniAD工作可以端到端的處理多個自動駕駛任務(wù),并實(shí)現(xiàn)了一個自動駕駛的任務(wù)的全局最優(yōu)化方案,這意味者模型可以統(tǒng)一的理解所有的關(guān)鍵信息并作出決策。
Nerf-based 模型的發(fā)展為2D感知和重建
提供了豐富的手段
NeRF(Neural Radiance Fields神經(jīng)輻射場)最早是在2020年ECCV會議上的最佳論文中提出的概念,其將隱式表達(dá)推上了一個新的高度,僅用2D的posed images作為監(jiān)督,即可表示復(fù)雜的三維場景。
Nerf的出現(xiàn)改變了2D估計(jì)3D的方案,基于Nerf的slam工作、重建工作等都獲得了極大的發(fā)展,改變了模型認(rèn)知世界的方法。
Nerf-based slam技術(shù)在稠密建圖導(dǎo)航中大放異彩,以NICE-SLAM為代表的模型在精度上有了較大的進(jìn)步。CVPR2023的UniSim工作實(shí)現(xiàn)了高度逼真、閉環(huán)測試(closed-loop simulation)、可擴(kuò)展 (scalable), 只需要采集一次數(shù)據(jù), 就能重建并仿真測試。
基于當(dāng)前智能技術(shù)的發(fā)展,微億智造又是如何塑造其技術(shù)路線,朝向工業(yè)智能化發(fā)展的呢?
微億智造提出了獨(dú)特的工業(yè)智能機(jī)器人的漸進(jìn)式路線:以“眼手腦云”的實(shí)施架構(gòu)為基礎(chǔ),聚焦于可累積數(shù)據(jù)場景和通用關(guān)鍵技術(shù),打造虛實(shí)結(jié)合的應(yīng)用產(chǎn)品,漸進(jìn)式的實(shí)現(xiàn)機(jī)器人智能化。
“眼”指的是微億智造自研的圖像感知技術(shù)與可組合光學(xué)成像系統(tǒng);“手”即是機(jī)器人智能控制,所有的技術(shù)都要通過“手”來實(shí)現(xiàn)工程化落地;“腦”是更貼合離散制造需求的多任務(wù)學(xué)習(xí)和小樣本訓(xùn)練技術(shù);“云”則是一個既能為“腦”提供算力支撐,又能鏈接政府與企業(yè)的云平臺。
下面拆解一下我們?nèi)ツ昴甑淄瞥龅?strong>數(shù)字工人——工小匠產(chǎn)品是如何踐行這個理念的。
針對碎片化的缺陷檢測工藝
建立統(tǒng)一的硬件載體和軟件系統(tǒng)
傳統(tǒng)的外觀缺陷工作分為光、機(jī)、電、算、軟五部分工作,而相關(guān)技術(shù)經(jīng)驗(yàn)和工作流都是散落在不同的工作流中。比如如果用到了機(jī)械臂,所有的機(jī)械臂程序都會在機(jī)械臂廠家定義的軟件空間里,那么相關(guān)的角度、打光方案、算法效果就無法被記錄,從而缺少了改進(jìn)的機(jī)會。微億智造將機(jī)臺標(biāo)準(zhǔn)化、集成化,一體式的完成從方案到實(shí)施的全過程,這就將所有的技術(shù)工作串聯(lián)了起來。這樣統(tǒng)一工程化的形式,一是可改進(jìn),二是可量化,三是減少了閉環(huán)的回路長度。
全棧自研算法加持
加速實(shí)現(xiàn)全鏈條應(yīng)用落地
工小匠集成了運(yùn)動控制算法、缺陷檢測算法和光學(xué)智能推薦算法,加速全鏈條的應(yīng)用速度。其中運(yùn)動控制算法采用自研六軸機(jī)械臂位姿計(jì)算和三階約束的最優(yōu)時間軌跡規(guī)劃,可以穩(wěn)定快速的解算出機(jī)械臂的最優(yōu)運(yùn)動軌跡。而缺陷檢測方面,基于知識注入和缺陷生成的全流程缺陷檢測系統(tǒng),在數(shù)據(jù)注入后馬上生成模型方案,并且在多條產(chǎn)線上實(shí)際驗(yàn)證能夠2周內(nèi)達(dá)到檢測標(biāo)準(zhǔn)。本系統(tǒng)中同時集成了對光學(xué)方案的智能推薦,并且把經(jīng)驗(yàn)源源不斷的注入到模型里,實(shí)現(xiàn)了光學(xué)的智能調(diào)試,這也是專機(jī)系統(tǒng)無法完成和持續(xù)進(jìn)步的。如此強(qiáng)大的算法系統(tǒng)保證了速度最優(yōu)、上線迅速、可迭代,且賦予了系統(tǒng)更強(qiáng)大的執(zhí)行力。
踐行real2sim,sim2real的理念
在工小匠產(chǎn)品中,微億智造操作的對象是工件,工件的拍照點(diǎn)位、光學(xué)方案都可以在數(shù)字空間中設(shè)置和分析,優(yōu)化后的實(shí)施方案可以通過所謂的“工小匠”硬件機(jī)臺去實(shí)施,而用戶無需關(guān)心“工小匠”是一個什么樣的機(jī)臺,這就為數(shù)據(jù)記錄和工藝記錄鋪平了道路,實(shí)施的擴(kuò)展性和方便性非常高。比如更換了工裝,我們不用再調(diào)試機(jī)械臂了,復(fù)制100臺,我們也不用單獨(dú)去調(diào)試每個機(jī)械臂,機(jī)臺系統(tǒng)會自動適應(yīng)這個對象。這便是具備了具身智能的概念,使機(jī)器智能的思考如何執(zhí)行。
而相同的事情也發(fā)生在其他的工藝過程中,無論是缺陷檢測、尺寸量測、打磨、涂膠,都可以踐行相同的理念和系統(tǒng),從而讓整個工業(yè)現(xiàn)場變得可被優(yōu)化??v觀整個工業(yè)智能的發(fā)展,之所以遠(yuǎn)遠(yuǎn)比不上消費(fèi)端的發(fā)展速度,其根本原因是相關(guān)的基礎(chǔ)元素沒有被很好的數(shù)字化。而微億智造基于眼、手、腦、云的技術(shù)架構(gòu)將整個機(jī)器人工藝鏈條全部數(shù)字化,在產(chǎn)線上不斷地與AI協(xié)同進(jìn)化,可以預(yù)見這些工藝將會以前所未有的速度升級迭代。
在當(dāng)前的技術(shù)潮流下,感、知、控等技術(shù)都已經(jīng)飛速發(fā)展,實(shí)現(xiàn)工業(yè)智能化的要素逐漸齊備,微億智造這樣的公司正是推進(jìn)這個流程的排頭兵,希望早日看到大潮漫灌!
審核編輯:劉清
-
運(yùn)動控制器
+關(guān)注
關(guān)注
2文章
407瀏覽量
24767 -
人工智能
+關(guān)注
關(guān)注
1792文章
47514瀏覽量
239246 -
工業(yè)機(jī)器人
+關(guān)注
關(guān)注
91文章
3373瀏覽量
92767 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1699瀏覽量
46052 -
自動駕駛
+關(guān)注
關(guān)注
784文章
13899瀏覽量
166704
原文標(biāo)題:從工業(yè)的自動化走向智能化
文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論