四足機(jī)器人憑借其獨(dú)特的地面接觸方式和對(duì)復(fù)雜地形的出色適應(yīng)能力,已成為自動(dòng)化與機(jī)器人工程技術(shù)研究的焦點(diǎn)。近年來(lái),在結(jié)構(gòu)設(shè)計(jì)、運(yùn)動(dòng)規(guī)劃和平衡控制等關(guān)鍵方面,四足機(jī)器人已取得重要進(jìn)展。然而,如何進(jìn)一步提高四足機(jī)器人的動(dòng)態(tài)性能、環(huán)境適應(yīng)性和載重能力仍然是當(dāng)前研究面臨的重大挑戰(zhàn)。
本文系統(tǒng)回顧了四足機(jī)器人在結(jié)構(gòu)設(shè)計(jì)、步態(tài)規(guī)劃、傳統(tǒng)控制方法、智能控制策略以及自主導(dǎo)航等核心技術(shù)領(lǐng)域的最新成就,特別關(guān)注各領(lǐng)域內(nèi)的智能化發(fā)展趨勢(shì)和技術(shù)革新動(dòng)向。通過深入分析,本文不僅為四足機(jī)器人的未來(lái)發(fā)展提供了堅(jiān)實(shí)的理論依據(jù)和前沿的技術(shù)導(dǎo)向,還為相關(guān)領(lǐng)域的研究人員提供了重要的參考價(jià)值。
01||引言
隨著科技的發(fā)展,移動(dòng)機(jī)器人因其能夠在復(fù)雜或危險(xiǎn)的工作環(huán)境中替代人類而受到了越來(lái)越多的關(guān)注。一般而言,這類機(jī)器人可以分為三類:輪式、履帶式和足式機(jī)器人。輪式和履帶式機(jī)器人在平坦地面上表現(xiàn)出色,具有平穩(wěn)快速的移動(dòng)能力和相對(duì)簡(jiǎn)單的控制系統(tǒng)。然而,在穿越軟質(zhì)地表或不平地形時(shí),它們的效率會(huì)顯著下降,甚至可能無(wú)法移動(dòng)。相比之下,足式機(jī)器人憑借其離散的接觸點(diǎn)展現(xiàn)了出色的適應(yīng)性,能夠穿越復(fù)雜的地形,如障礙物、沼澤、沙漠和不平整的表面,同時(shí)保持身體穩(wěn)定。
此外,四足機(jī)器人還具備無(wú)限制的橫向移動(dòng)能力,實(shí)現(xiàn)全方位運(yùn)動(dòng)。這一特性在自然界中也有所體現(xiàn),例如羚羊可以在陡峭的懸崖上自由穿梭,獵豹能在草原上高速奔跑,雪橇犬則能輕松地在雪地上移動(dòng)。足式機(jī)器人在自然非鋪裝條件下具有較低的地表要求,展現(xiàn)出了巨大的應(yīng)用潛力。盡管如此,仿生足式機(jī)器人的結(jié)構(gòu)、運(yùn)動(dòng)速度、負(fù)載能力和環(huán)境適應(yīng)性仍然落后于它們的動(dòng)物原型。
目前,足式機(jī)器人的研究主要集中在雙足、四足和六足機(jī)器人上,對(duì)單足和八足機(jī)器人的關(guān)注較少。選擇合適的足數(shù)對(duì)于確保機(jī)器人高效移動(dòng)和穩(wěn)定性能至關(guān)重要。與雙足機(jī)器人相比,四足機(jī)器人擁有更強(qiáng)的承載能力和穩(wěn)定性。而且,相較于六足和八足機(jī)器人,四足機(jī)器人的結(jié)構(gòu)和控制系統(tǒng)更為簡(jiǎn)單。
四足機(jī)器人的軀干是一個(gè)浮動(dòng)基座,其腿部獨(dú)立于軀干操作。這種設(shè)計(jì)使得機(jī)器人即使在負(fù)重情況下也能順利穿越復(fù)雜地形。近年來(lái),許多研究團(tuán)隊(duì)專注于四足機(jī)器人的動(dòng)態(tài)步態(tài)、運(yùn)動(dòng)穩(wěn)定性、平衡能力和高負(fù)載特性等方面的研究,旨在提高其動(dòng)態(tài)穩(wěn)定性、運(yùn)動(dòng)速度和運(yùn)輸能力。
四足機(jī)器人對(duì)各種復(fù)雜地形的良好適應(yīng)性拓展了其應(yīng)用場(chǎng)景。在現(xiàn)有的輪式和履帶式交通工具面臨挑戰(zhàn)的自然環(huán)境中,四足機(jī)器人在處理重型貨物運(yùn)輸任務(wù)時(shí)表現(xiàn)出更高的靈活性和效率。波士頓動(dòng)力公司的BigDog是世界上第一個(gè)能夠在野外行走并攜帶重物的四足機(jī)器人,它可用于戰(zhàn)場(chǎng)上的物資運(yùn)輸任務(wù)。
四足機(jī)器人比人類具有更強(qiáng)的機(jī)動(dòng)能力,因此在探索危險(xiǎn)或難以到達(dá)的區(qū)域(如地震災(zāi)區(qū)、狹窄管道和核電站檢查現(xiàn)場(chǎng))方面具有重要價(jià)值。值得一提的是,由蔚藍(lán)科技公司開發(fā)的四足機(jī)器人已在工廠生產(chǎn)基地、變電站和建筑行業(yè)中找到應(yīng)用,成功完成了巡檢任務(wù)。在礦產(chǎn)勘探中,機(jī)器人可以輔助工人并在高溫高壓環(huán)境下替代人類工作,保障人員安全。
此外,四足機(jī)器人在服務(wù)行業(yè)也有廣泛的應(yīng)用。隨著經(jīng)濟(jì)的快速發(fā)展,這些機(jī)器人可以陪伴人類,減輕孤獨(dú)感和焦慮情緒,通過情感交流帶來(lái)快樂,提升人們對(duì)精神需求的滿足度。同時(shí),無(wú)需擔(dān)心寵物的出生、衰老、疾病或死亡問題。
02||四足機(jī)器人的結(jié)構(gòu)
四足機(jī)器人是一種仿生自動(dòng)化裝置,其設(shè)計(jì)旨在精確模仿動(dòng)物的行走模式,并能夠在復(fù)雜環(huán)境中靈活移動(dòng)。要實(shí)現(xiàn)四足機(jī)器人的運(yùn)動(dòng),結(jié)構(gòu)設(shè)計(jì)是基礎(chǔ)任務(wù)。一個(gè)精心設(shè)計(jì)的結(jié)構(gòu)對(duì)于提升機(jī)器人的穩(wěn)定性、速度和靈活性至關(guān)重要。
目前,常見的四足機(jī)器人結(jié)構(gòu)設(shè)計(jì)靈感來(lái)源于多種動(dòng)物,包括仿狗型、仿羊型、仿鼠型、仿貓型和仿獵豹型等。四足機(jī)器人的基本結(jié)構(gòu)通常由軀干、大腿、小腿和腳爪組成,如圖1所示。這類機(jī)器人具有多個(gè)自由度(DoF),并且其動(dòng)力源可以分為液壓驅(qū)動(dòng)、電動(dòng)驅(qū)動(dòng)、氣動(dòng)驅(qū)動(dòng)等多種類型。
圖1 四足機(jī)器人結(jié)構(gòu)
2.1 驅(qū)動(dòng)方式
2.1.1 液壓驅(qū)動(dòng)
液壓驅(qū)動(dòng)系統(tǒng)采用液體(通常為液壓油)作為能量傳輸媒介,通過液壓缸和閥門控制液體的流量和壓力,以實(shí)現(xiàn)關(guān)節(jié)的運(yùn)動(dòng)。液壓系統(tǒng)的基本原理是利用密封管道內(nèi)的液體,在不同壓力的作用下產(chǎn)生力和運(yùn)動(dòng)??刂埔簤候?qū)動(dòng)的機(jī)器人需要精確管理液體流動(dòng)、壓力變化、閥門操作,并根據(jù)反饋信息動(dòng)態(tài)調(diào)整液體的流量和壓力,確保機(jī)器人按照預(yù)期的方式移動(dòng)。
液壓驅(qū)動(dòng)的四足機(jī)器人由于其高功率密度,能夠提供強(qiáng)大的驅(qū)動(dòng)力和扭矩。這使得它們不僅能承載更重的負(fù)載,還能在復(fù)雜多變的地形中自由穿行。典型的液壓驅(qū)動(dòng)四足機(jī)器人有波士頓動(dòng)力公司的大狗(BigDog)、LS3和 WildCat,以及意大利技術(shù)研究院(IIT)研發(fā)的HyQ系列電液混合驅(qū)動(dòng)四足機(jī)器人。這些機(jī)器人的特性總結(jié)見表1。
液壓驅(qū)動(dòng)的四足機(jī)器人在軍事、勘探、工業(yè)等多個(gè)領(lǐng)域有著廣闊的應(yīng)用前景。不過,由于液壓系統(tǒng)的重量較大、體積較龐大且噪音較高,限制了其在軍事領(lǐng)域的應(yīng)用范圍。目前,研究人員正在努力開發(fā)輕量化和高效能的液壓驅(qū)動(dòng)四足機(jī)器人。展望未來(lái),預(yù)計(jì)會(huì)有更多智能化和靈活性更高的液壓驅(qū)動(dòng)四足機(jī)器人出現(xiàn),它們將能夠適應(yīng)更廣泛的任務(wù)需求和應(yīng)用場(chǎng)景。
2.1.2 電機(jī)驅(qū)動(dòng)
電機(jī)驅(qū)動(dòng)的運(yùn)動(dòng)是通過調(diào)節(jié)電機(jī)的速度和扭矩來(lái)操縱關(guān)節(jié)的運(yùn)動(dòng),操作時(shí)通常需要電池或其他形式的電源。為了實(shí)現(xiàn)所需的運(yùn)動(dòng),電機(jī)驅(qū)動(dòng)機(jī)器人的控制經(jīng)常要涉及到電機(jī)速度、位置和電流的管理。
相較于液壓驅(qū)動(dòng)的四足機(jī)器人,電機(jī)驅(qū)動(dòng)的四足機(jī)器人在尺寸、噪音水平和操控便利性方面具有明顯優(yōu)勢(shì)。典型的電機(jī)驅(qū)動(dòng)四足機(jī)器人包括麻省理工學(xué)院的MiniCheetah、蘇黎世聯(lián)邦理工學(xué)院的ANYmal和波士頓動(dòng)力公司的SpotMini。此外,蔚藍(lán)科技的Laikago以及浙江大學(xué)的“赤兔”和“絕影”,均展現(xiàn)了卓越的運(yùn)動(dòng)能力。這些四足機(jī)器人的性能參數(shù)如表2所示。
2.1.3 氣動(dòng)驅(qū)動(dòng)
氣動(dòng)驅(qū)動(dòng)的四足機(jī)器人利用壓縮空氣或氣體來(lái)驅(qū)動(dòng)執(zhí)行器,如氣缸或氣動(dòng)肌肉,通過調(diào)節(jié)氣體的壓力實(shí)現(xiàn)運(yùn)動(dòng)??刂七@類機(jī)器人涉及到管理和監(jiān)測(cè)氣體壓力,以及執(zhí)行器的位置或力。氣動(dòng)系統(tǒng)的控制算法需考慮氣體的動(dòng)態(tài)響應(yīng)特性。
氣動(dòng)驅(qū)動(dòng)的主要優(yōu)勢(shì)包括制造成本低廉、設(shè)計(jì)輕便且靈活性強(qiáng)。然而,它也存在控制精度較低的問題,難以實(shí)現(xiàn)高精度控制和低能耗??紤]到四足機(jī)器人應(yīng)用場(chǎng)景的復(fù)雜性和對(duì)高動(dòng)態(tài)響應(yīng)及精度的要求,氣動(dòng)驅(qū)動(dòng)的應(yīng)用并未普及。氣動(dòng)驅(qū)動(dòng)的四足機(jī)器人因阻抗較低,容易在行走時(shí)產(chǎn)生不必要的震動(dòng)。
2.2 機(jī)身結(jié)構(gòu)設(shè)計(jì)
四足機(jī)器人的機(jī)身作為主要支撐結(jié)構(gòu),類似于四足動(dòng)物的軀干部分。它通常選用鋁合金和碳纖維等材料構(gòu)建,這些材料憑借其優(yōu)異的強(qiáng)度和剛性特性而被廣泛采用。機(jī)身上集成了多種傳感器和控制設(shè)備,用于實(shí)現(xiàn)自主行走、避障等關(guān)鍵功能。如圖5所示,四足機(jī)器人的機(jī)身結(jié)構(gòu)可以分為剛性和柔性兩大部分。
通過精心設(shè)計(jì)的機(jī)身結(jié)構(gòu),四足機(jī)器人不僅具備了良好的穩(wěn)定性和承載能力,還能夠靈活應(yīng)對(duì)復(fù)雜多變的環(huán)境需求。選擇適當(dāng)?shù)牟牧虾徒Y(jié)構(gòu)形式,對(duì)于提升機(jī)器人的整體性能至關(guān)重要。
2.2.1 剛性軀干
當(dāng)前對(duì)四足機(jī)器人的研究主要集中在剛性軀干設(shè)計(jì)上。剛性軀干具有較少的自由度(DoFs)和相對(duì)簡(jiǎn)單的結(jié)構(gòu),這使得它們的靈活性和穩(wěn)定性較低。因此,提升這類剛性軀干四足機(jī)器人的速度、穩(wěn)定性和能效對(duì)于優(yōu)化其運(yùn)動(dòng)性能至關(guān)重要。近期的研究進(jìn)展主要集中在驅(qū)動(dòng)系統(tǒng)優(yōu)化、腿部設(shè)計(jì)改進(jìn)以及控制算法的選擇上,以實(shí)現(xiàn)這些目標(biāo)。
盡管這些方法可以在某些方面改善剛性軀干四足機(jī)器人的性能,如速度、穩(wěn)定性和能效,但在分散或吸收沖擊力方面,它們的效果不如柔性軀干機(jī)器人。結(jié)合先進(jìn)的感知系統(tǒng)和智能控制策略,可以增強(qiáng)機(jī)器人對(duì)地形的適應(yīng)能力、負(fù)載能力和能效。然而,這也增加了系統(tǒng)的復(fù)雜性和能耗。
2.2.2 柔性軀干
四足機(jī)器人的脊柱對(duì)其靈活性、穩(wěn)定性和環(huán)境適應(yīng)性有著重要貢獻(xiàn)。以往的研究大多關(guān)注于剛性軀干的設(shè)計(jì),如圖5a所示。在四足哺乳動(dòng)物的運(yùn)動(dòng)中,脊柱在身體收縮和伸展過程中起著關(guān)鍵作用,從而提高了跑步速度、穩(wěn)定性和能量利用率。在仿生四足機(jī)器人領(lǐng)域,通過增加軀干的自由度或使用柔性材料(如圖5b-d所示),可以增強(qiáng)靈活性和移動(dòng)速度。
另一種方法是在軀干中加入彈簧,這是實(shí)現(xiàn)柔性的常見手段。柔性軀干能夠有效減少地面反作用力,增加步幅長(zhǎng)度,并提高移動(dòng)速度。然而,使用柔性材料雖然提高了地形適應(yīng)性和運(yùn)動(dòng)范圍,但也增加了機(jī)器人建模的復(fù)雜性。實(shí)際應(yīng)用中可能會(huì)遇到柔性材料磨損和老化的問題,需要定期維護(hù)和更換,從而增加了機(jī)器人的維護(hù)時(shí)間和成本。
2.3 腿部結(jié)構(gòu)
腿部結(jié)構(gòu)是四足機(jī)器人的關(guān)鍵組成部分,其設(shè)計(jì)對(duì)機(jī)器人的運(yùn)動(dòng)性能有著深遠(yuǎn)影響。良好的結(jié)構(gòu)設(shè)計(jì)可以減少諸如腿部驅(qū)動(dòng)沖擊和大慣量等問題,提高機(jī)器人的穩(wěn)定性和機(jī)動(dòng)性。根據(jù)腿部結(jié)構(gòu)的不同形式,四足機(jī)器人的腿部結(jié)構(gòu)大致可分為連桿式和比例式兩類。
2.3.1 連桿式腿部結(jié)構(gòu)
連桿式腿部結(jié)構(gòu)由多個(gè)鉸接的連桿組成,根據(jù)連接方式可以分為串聯(lián)型、并聯(lián)型和混合型。串聯(lián)型結(jié)構(gòu)簡(jiǎn)單,運(yùn)動(dòng)范圍大,易于控制;而并聯(lián)型則具備高剛性、強(qiáng)承載能力、高精度和低慣量的優(yōu)點(diǎn);混合型結(jié)合了兩者的優(yōu)勢(shì)。眾所周知,麻省理工學(xué)院的MiniCheetah和蔚藍(lán)科技的A1采用了串聯(lián)式腿部結(jié)構(gòu)。
蘇黎世聯(lián)邦理工學(xué)院的ANYmal則使用直接電機(jī)驅(qū)動(dòng)關(guān)節(jié),其中每個(gè)關(guān)節(jié)驅(qū)動(dòng)單元集成了驅(qū)動(dòng)器、傳感器和軸承,確保所有關(guān)節(jié)都能實(shí)現(xiàn)360度旋轉(zhuǎn),提供了四足機(jī)器人高度的機(jī)動(dòng)性。
斯坦福學(xué)生機(jī)器人俱樂部開發(fā)的Stanford Doggo是一款低成本、開源的四足機(jī)器人,它采用平面四連桿機(jī)構(gòu)(見圖6a),展示了出色的跳躍能力。Qi等人分析了四足機(jī)器人中3-UPU(三萬(wàn)向-棱柱-萬(wàn)向)和6-SPU(六球面-棱柱-萬(wàn)向)并聯(lián)腿機(jī)制的運(yùn)動(dòng)學(xué)性能(如圖6b,c所示)。
并聯(lián)腿的應(yīng)用減少了能耗并增強(qiáng)了承載能力。Park等人[39]受貓科動(dòng)物后腿骨骼和肌肉生理結(jié)構(gòu)的啟發(fā),設(shè)計(jì)了一個(gè)包含九個(gè)連桿和彈簧的單自由度腿部機(jī)制(見圖6d)。配備這種創(chuàng)新腿部機(jī)制的機(jī)器人可以在平地上以平均0.75米/秒的速度奔跑。這種類似貓的連桿機(jī)制實(shí)現(xiàn)了360度連續(xù)電機(jī)驅(qū)動(dòng)。
2.3.2 放大型腿部結(jié)構(gòu)
放大型腿部結(jié)構(gòu)通過放大驅(qū)動(dòng)元件至末端執(zhí)行器的位移,顯著增加了整個(gè)機(jī)構(gòu)的總位移,與其它結(jié)構(gòu)相比,效率更高。借鑒動(dòng)物運(yùn)動(dòng)的特點(diǎn),Cheetah Cub和 Oncilla 機(jī)器人在其腿部設(shè)計(jì)中采用了彈簧加載平行四邊形機(jī)構(gòu)(Spring-Loaded Pantograph, SLP,見圖7a)。
SLP機(jī)制不僅有效減輕了腿部的質(zhì)量和慣性,但也因?yàn)橄リP(guān)節(jié)的大范圍伸展而增加了機(jī)器人的整體重量,這對(duì)機(jī)器人在復(fù)雜地形中的導(dǎo)航性能和抵抗地面干擾的能力產(chǎn)生了不利影響。為了提升四足機(jī)器人輸出運(yùn)動(dòng)的效率,Nizami等人提出了一種改進(jìn)版的SLP機(jī)制——彈性負(fù)載剪刀機(jī)制(見圖7b)。這一新機(jī)制能夠放大輸入的角度變化,從而實(shí)現(xiàn)膝關(guān)節(jié)更大的輸出位移,進(jìn)一步優(yōu)化了機(jī)器人的運(yùn)動(dòng)表現(xiàn)。
總的來(lái)說(shuō),對(duì)不同腿部結(jié)構(gòu)的分析顯示,多桿且包含多個(gè)可優(yōu)化參數(shù)的連桿式腿部結(jié)構(gòu)有利于實(shí)現(xiàn)多樣化的足端軌跡。這一設(shè)計(jì)能夠有效地模擬生物運(yùn)動(dòng)模式,因此被廣泛應(yīng)用。不過,由于其運(yùn)動(dòng)范圍有限,這對(duì)控制算法提出了更高要求。
相比之下,放大型腿部結(jié)構(gòu)通過動(dòng)態(tài)調(diào)整腿長(zhǎng)來(lái)適應(yīng)不同地形和任務(wù)需求,成為近年來(lái)機(jī)器人設(shè)計(jì)的一個(gè)創(chuàng)新趨勢(shì)。這類結(jié)構(gòu)依賴于精密的機(jī)械縮放機(jī)制,這不僅增加了系統(tǒng)的成本,也提升了維護(hù)難度。此外,為實(shí)現(xiàn)縮放功能而增加的機(jī)械部件可能會(huì)提高機(jī)器人的重量和體積,從而在一定程度上影響其整體性能和能源效率。
2.4 腿部拓?fù)浣Y(jié)構(gòu)
四足機(jī)器人的機(jī)動(dòng)性、越障能力和關(guān)節(jié)奇異性取決于其拓?fù)浣Y(jié)構(gòu)。一個(gè)合理的拓?fù)浣Y(jié)構(gòu)是確保機(jī)器人在復(fù)雜環(huán)境中實(shí)現(xiàn)穩(wěn)定靈活運(yùn)動(dòng)的基礎(chǔ)。四足機(jī)器人的關(guān)節(jié)可以分為兩類:膝關(guān)節(jié)和肘關(guān)節(jié)。膝關(guān)節(jié)的特點(diǎn)是尖端指向前進(jìn)方向(俯仰),類似于人類的膝蓋;而肘關(guān)節(jié)則是尖端背離前進(jìn)方向,類似于人類的肘部。這兩種關(guān)節(jié)的不同配置直接影響了四足機(jī)器人的應(yīng)用情景和運(yùn)動(dòng)能力。
四足機(jī)器人的腿部拓?fù)浣Y(jié)構(gòu)大致可分為三種類型:昆蟲型、爬行類型和哺乳動(dòng)物型,如圖8至圖10所示。昆蟲型和爬行類型的四足機(jī)器人擁有較大的單腿工作空間,減少了腿部間的干擾和接觸。然而,它們的運(yùn)動(dòng)能力通常較為局限,多表現(xiàn)為靜態(tài)步態(tài)。與哺乳動(dòng)物型機(jī)器人相比,雖然它們具有較好的靜態(tài)穩(wěn)定性,但在保持身體平衡時(shí)需要更大的關(guān)節(jié)扭矩。
仿生四足哺乳動(dòng)物型機(jī)器人不僅具備較大的工作空間和強(qiáng)大的避障能力,而且在速度和動(dòng)態(tài)性能方面表現(xiàn)卓越。其腿部結(jié)構(gòu)主要分布在垂直平面上,提供了強(qiáng)大的承載能力和對(duì)不同負(fù)載的適應(yīng)性。因此,對(duì)于需要重載能力和快速移動(dòng)的四足機(jī)器人來(lái)說(shuō),這種拓?fù)浣Y(jié)構(gòu)更為適合。常見的哺乳動(dòng)物型行走腿拓?fù)浣Y(jié)構(gòu)包括四種主要類型:全肘關(guān)節(jié)型、全膝關(guān)節(jié)型、前膝后肘型以及前肘后膝型。
當(dāng)面對(duì)陡峭斜坡、樓梯或其他復(fù)雜地形時(shí),前膝后肘型配置中的前膝關(guān)節(jié)容易與前方地形發(fā)生碰撞,減少了腹部下方的空間,影響了移動(dòng)的穩(wěn)定性。相比之下,全肘關(guān)節(jié)型設(shè)計(jì)能夠避免這一問題,適用于有低矮垂直障礙物或連續(xù)樓梯的室內(nèi)或城市環(huán)境,因此被廣泛應(yīng)用于多數(shù)中小型電動(dòng)四足機(jī)器人。相反,全膝關(guān)節(jié)型配置盡管與全肘關(guān)節(jié)型對(duì)應(yīng),但在實(shí)際應(yīng)用中較少見。前膝后肘型配置采用的是完全對(duì)稱的設(shè)計(jì),其中前腿的膝關(guān)節(jié)更適合攀爬垂直障礙物,避免與障礙物接觸,適合戶外環(huán)境。而前肘后膝型配置以其對(duì)稱結(jié)構(gòu)有效減少了由于關(guān)節(jié)控制誤差導(dǎo)致的軀干重心波動(dòng),并且緊湊的結(jié)構(gòu)使得傳感器可以更方便地安裝在腳上,用于檢測(cè)地面障礙物。這種設(shè)計(jì)常見于如BigDog和HyQ等四足機(jī)器人。
2.5 腳部結(jié)構(gòu)
四足機(jī)器人的腳部設(shè)計(jì)通常包括圓柱形腳(包括半圓柱形腳)和球形腳(包括半球形腳)。圓柱形(或半圓柱形)腳是指具有水平圓柱或半圓柱形狀的四足機(jī)器人腳,在接觸地面時(shí)形成矩形平面。目前,圓形腳端是最常見的四足機(jī)器人設(shè)計(jì),通常為球形或半球形。這種設(shè)計(jì)允許機(jī)器人腳從各個(gè)方向接觸地面,增強(qiáng)了其對(duì)不同環(huán)境的適應(yīng)能力。
然而,當(dāng)遇到障礙物、斜坡或不平地形時(shí),配備平底或球形腳的四足機(jī)器人可能會(huì)面臨跌倒或難以穿越的風(fēng)險(xiǎn)。此外,傳統(tǒng)腳部結(jié)構(gòu)往往缺乏能夠提供環(huán)境信息及腳與周圍交互信息的傳感系統(tǒng),進(jìn)一步限制了四足機(jī)器人在復(fù)雜環(huán)境中的適應(yīng)性。
為了提升四足機(jī)器人的性能,研究人員提出了多種創(chuàng)新腳部設(shè)計(jì)。Catalano等人在ANYmal四足機(jī)器人上測(cè)試了一種可調(diào)節(jié)的自適應(yīng)腳部。真實(shí)的四足動(dòng)物擁有不規(guī)則的腳結(jié)構(gòu),如爪子和肉墊,這些結(jié)構(gòu)在接觸地面時(shí)提供了牢固的抓力。然而,仿生腳結(jié)構(gòu)的研究仍然不足。
眾所周知,蜥蜴具有非常靈活柔軟的身體,能夠在垂直墻壁上敏捷移動(dòng)。受此啟發(fā),Nishad等人設(shè)計(jì)了一種仿生蜥蜴四足機(jī)器人,每個(gè)腳上都配備了粘附和剝離機(jī)制,模仿真實(shí)蜥蜴的趾和爪。一些四足機(jī)器人還設(shè)計(jì)了獨(dú)特的腳部結(jié)構(gòu)以完成特定任務(wù)。
例如,Hooks等人在機(jī)器人腳部安裝了一個(gè)帶有被動(dòng)自由度的末端執(zhí)行器,以完成拾取任務(wù)。磁性吸附機(jī)器人MARVEL的腳部集成了電永磁體和磁流變彈性體,提供了增強(qiáng)的吸附力和牽引力,使機(jī)器人能夠在各種表面快速移動(dòng),包括墻壁、地板和天花板。
四足機(jī)器人的腳部通常由橡膠和海綿等彈性材料制成,但傳統(tǒng)材料很難同時(shí)滿足高摩擦系數(shù)、強(qiáng)減震性和堅(jiān)固柔韌性等需求。因此,在四足機(jī)器人腳部設(shè)計(jì)中應(yīng)用新材料將提升其環(huán)境適應(yīng)能力。使用特殊材料,如仿生壁虎腳材料,可以使四足機(jī)器人更好地應(yīng)對(duì)更復(fù)雜的環(huán)境。
03||四足機(jī)器人的控制
3.1 運(yùn)動(dòng)規(guī)劃
四足機(jī)器人的運(yùn)動(dòng)規(guī)劃涉及選擇合適的地面接觸點(diǎn)和規(guī)劃腿部軌跡,以防止機(jī)器人傾覆。通過生成適當(dāng)?shù)耐炔寇壽E,可以最小化機(jī)器人與地面之間的沖擊力。
3.1.1 步態(tài)生成方法
四足機(jī)器人的運(yùn)動(dòng)規(guī)劃包括步態(tài)生成方法和步態(tài)執(zhí)行。常用的步態(tài)生成方法有:中樞模式發(fā)生器(CPG)、彈簧加載倒立擺模型(SLIP)、零力矩點(diǎn)(ZMP)和貝塞爾曲線法。
1)中樞模式發(fā)生器(CPG)
CPG通過模擬生物體的低級(jí)神經(jīng)元來(lái)生成穩(wěn)定的周期性振蕩信號(hào),使機(jī)器人能夠進(jìn)行步態(tài)規(guī)劃。這種方法利用數(shù)學(xué)技術(shù)生成振蕩曲線,作為確定腿部關(guān)節(jié)位置和速度的輸入。CPG具有特定的自穩(wěn)定能力,可以通過這些振蕩曲線輕松調(diào)整四足機(jī)器人腿之間的相位關(guān)系。CPG結(jié)構(gòu)相對(duì)簡(jiǎn)單,計(jì)算負(fù)擔(dān)低。由于依賴已知振蕩器,雖然這種方法具備一定的自穩(wěn)能力,但在面對(duì)復(fù)雜地形時(shí),由于環(huán)境對(duì)機(jī)器人的巨大干擾而不再適用。
Fukuoka等人利用神經(jīng)振蕩器在關(guān)節(jié)空間生成扭矩控制或相位調(diào)制信號(hào),實(shí)現(xiàn)了四足機(jī)器人在不平地形上的運(yùn)動(dòng)穩(wěn)定性控制。為了確保四足機(jī)器人的穩(wěn)定性,需要調(diào)整CPG參數(shù)以生成適當(dāng)?shù)年P(guān)節(jié)控制信號(hào)。對(duì)于多自由度機(jī)器人,需要多個(gè)CPG單元滿足控制需求,這增加了參數(shù)調(diào)整的復(fù)雜性。Liu等人研究了四足機(jī)器人在工作空間中的軌跡生成方法,他們開發(fā)了一種將CPG網(wǎng)絡(luò)輸出信號(hào)映射到四足機(jī)器人三維工作空間軌跡的方法。這一方法使得AIBO機(jī)器人能夠在如斜坡和樓梯等不規(guī)則表面上自適應(yīng)移動(dòng),并通過修改少數(shù)CPG網(wǎng)絡(luò)參數(shù)實(shí)現(xiàn)步態(tài)轉(zhuǎn)換和改變行走模式。近年來(lái),強(qiáng)化學(xué)習(xí)(RL)在機(jī)器人領(lǐng)域得到了廣泛應(yīng)用和成功。Wang等人結(jié)合深度強(qiáng)化學(xué)習(xí)(DRL)與CPG方法,使機(jī)器人能夠產(chǎn)生節(jié)律性運(yùn)動(dòng),實(shí)現(xiàn)盲行并抵抗外部干擾。
2)彈簧加載倒立擺模型(SLIP)
SLIP模型將腿簡(jiǎn)化為一個(gè)有負(fù)載的無(wú)質(zhì)量彈簧,通過三要素方法實(shí)現(xiàn)跳躍控制。由于其原理簡(jiǎn)單且實(shí)用,該技術(shù)已被波士頓動(dòng)力學(xué)、杭州蔚藍(lán)科技有限公司和山東大學(xué)等多個(gè)機(jī)構(gòu)廣泛采用。Gong等人[3]規(guī)劃了機(jī)器人腳接觸地面時(shí)零速度和加速度的動(dòng)態(tài)步態(tài)軌跡,并基于3D-SLIP模型通過20個(gè)自由度的復(fù)雜機(jī)器人系統(tǒng)的仿真驗(yàn)證了動(dòng)態(tài)步態(tài)的有效性。SLIP模型可以解釋不同步態(tài)下的腿運(yùn)動(dòng)動(dòng)力學(xué)。Hayati等人使用SLIP模型研究了彈性地形對(duì)快速腿運(yùn)動(dòng)的影響。然而,SLIP模型無(wú)法直接調(diào)整時(shí)間相關(guān)參數(shù),如步頻和周期,限制了其不對(duì)稱步態(tài)(如奔跑)和步態(tài)轉(zhuǎn)換的能力。
3)零力矩點(diǎn)(ZMP)控制
ZMP控制假設(shè)在一個(gè)支撐多邊形內(nèi)的點(diǎn),機(jī)器人受到的地面反作用力與其重力和慣性力平衡?;谶@一穩(wěn)定性準(zhǔn)則,規(guī)劃?rùn)C(jī)器人的軌跡,在低速運(yùn)動(dòng)控制方面表現(xiàn)出色。Vukobratovi等人應(yīng)用ZMP方法生成機(jī)器人運(yùn)動(dòng)。此方法依賴于預(yù)定義的落腳點(diǎn),盡管解耦落腳點(diǎn)和身體運(yùn)動(dòng)軌跡的規(guī)劃降低了復(fù)雜度,但設(shè)計(jì)落腳點(diǎn)旨在幫助身體實(shí)現(xiàn)預(yù)期運(yùn)動(dòng),可能導(dǎo)致不自然的動(dòng)作。Winkler等人引入了基于頂點(diǎn)的ZMP約束,可以處理任意方向的點(diǎn)接觸、線接觸和面接觸。這種步態(tài)生成方法賦予了四足機(jī)器人行走、小跑、跳躍等多種功能。然而,ZMP方法需要精確的動(dòng)力學(xué)和環(huán)境模型,并且可能無(wú)法迅速響應(yīng)干擾。軌跡規(guī)劃過程耗時(shí)較長(zhǎng),此外,該方法可能不適合需要精確控制的柔性鏈接對(duì)象。
4)貝塞爾曲線
在四足機(jī)器人領(lǐng)域,貝塞爾曲線廣泛用于生成足端軌跡。這些曲線在所有點(diǎn)上都連續(xù)可微,非常適合模擬動(dòng)物的足端軌跡。Cheetah Cub四足機(jī)器人的足端軌跡由四個(gè)二次貝塞爾曲線生成,通過調(diào)整起跳和著陸時(shí)刻的腿角度改善了機(jī)器人的穩(wěn)定性。Manoonpong等人通過回放從狗的足端軌跡數(shù)據(jù)擬合出的四個(gè)三次貝塞爾曲線得到的參數(shù)化足端軌跡,實(shí)現(xiàn)了多種運(yùn)動(dòng)模式。MIT Cheetah 2機(jī)器人在擺動(dòng)階段的足端軌跡基于三個(gè)五次貝塞爾曲線。
Zhu等人應(yīng)用高階貝塞爾曲線設(shè)計(jì)了四足機(jī)器人擺動(dòng)階段的足端軌跡,確保在不熟悉的斜面上穩(wěn)定運(yùn)動(dòng)。目前,貝塞爾曲線被廣泛應(yīng)用于足端軌跡規(guī)劃。相比之前的橢圓曲線和旋輪線軌跡,貝塞爾曲線的導(dǎo)數(shù)也是貝塞爾曲線,這簡(jiǎn)化了起點(diǎn)和終點(diǎn)速度的確定。此外,曲線光滑且處處可微,允許機(jī)器人進(jìn)行平滑運(yùn)動(dòng)。
3.1.2 步態(tài)
四足哺乳動(dòng)物的四肢起落順序遵循一種特定模式,稱為步態(tài)。四足動(dòng)物通過協(xié)調(diào)四肢動(dòng)作展現(xiàn)出使用不同步態(tài)的能力,從而實(shí)現(xiàn)了更高的移動(dòng)效率和在復(fù)雜地形中的出色適應(yīng)性。借助仿生實(shí)驗(yàn)和步態(tài)分析,研究人員已經(jīng)確定了四足機(jī)器人可以采用的多種步態(tài)。一般而言,步態(tài)可分為對(duì)稱步態(tài)(如行走、小跑和跑步)和不對(duì)稱步態(tài)(如跳躍、騰躍和奔跑)。不同步態(tài)的相位關(guān)系圖見圖11。
在各種步態(tài)中,四足機(jī)器人的速度和強(qiáng)度各不相同,導(dǎo)致其姿態(tài)有顯著差異。在行走步態(tài)中,任何時(shí)候都有三條腿接觸地面,形成一個(gè)穩(wěn)定的三角支撐結(jié)構(gòu),因此也被稱作靜態(tài)步態(tài)。小跑步態(tài)則是一種低至中速的步態(tài),常用于從步行向跑步過渡,以實(shí)現(xiàn)更快的速度。其特點(diǎn)是在矢狀面內(nèi),四條腿按對(duì)角線模式交替移動(dòng)。當(dāng)速度提升時(shí),四條腿可能都會(huì)短暫離地。
四足動(dòng)物展現(xiàn)了豐富的奔跑步態(tài)。研究顯示,由于速度、穩(wěn)定性和效率的優(yōu)勢(shì),小跑步態(tài)和跑步步態(tài)是四足機(jī)器人常用的步態(tài)。跑步步態(tài)被廣泛應(yīng)用于機(jī)器人運(yùn)動(dòng)控制中,在此步態(tài)下,左前腿與左后腿的動(dòng)作同步,同樣,右前腿與右后腿也保持一致。
跳躍小跑是一種獨(dú)特的步態(tài),其特點(diǎn)是軀干的彈道式運(yùn)動(dòng)。在此步態(tài)中,一對(duì)對(duì)角線上的腿同步移動(dòng)并與另一對(duì)交替,導(dǎo)致一段時(shí)期內(nèi)所有腿均不接觸地面。不過,四足機(jī)器人很少能實(shí)現(xiàn)這種動(dòng)態(tài)步態(tài)?;谥鲃?dòng)柔順控制方法,HyQ機(jī)器人首次實(shí)現(xiàn)了無(wú)需機(jī)械結(jié)構(gòu)中的彈簧即可完成的小跑運(yùn)動(dòng)。
由蘇黎世聯(lián)邦理工學(xué)院開發(fā)的ANYmal機(jī)器人能夠執(zhí)行包括跳躍小跑、跳躍和騰躍在內(nèi)的多種動(dòng)態(tài)步態(tài)。MIT Cheetah 3和MiniCheetah通過將運(yùn)動(dòng)控制問題轉(zhuǎn)化為基于模型預(yù)測(cè)控制(MPC)的凸優(yōu)化問題來(lái)處理地面反作用力,實(shí)現(xiàn)了站立、小跑、奔跑、跳躍和行走等多種步態(tài)。
這些實(shí)現(xiàn)方法對(duì)機(jī)器人的結(jié)構(gòu)設(shè)計(jì)和動(dòng)力學(xué)建模提出了較高要求,尤其是在考慮到尺寸和輕量化(重量小于100公斤)的情況下。對(duì)于大型和重型四足機(jī)器人,關(guān)于跳躍小跑的研究相對(duì)較少。騰躍步態(tài)包括四個(gè)階段:飛行、前腿著地、后腿著地和四腿著地。作為一種高速步態(tài),騰躍不僅提升了機(jī)器人的速度,還有助于跨越障礙和溝壑,增強(qiáng)了環(huán)境適應(yīng)性。奔跑步態(tài)是一種快速跑步形式,四條腿周期性地移動(dòng),使機(jī)器人能夠達(dá)到最高速度。四足動(dòng)物展現(xiàn)出多樣化的步態(tài),而選擇何種移動(dòng)步態(tài)取決于機(jī)器人需要的穿越速度及最小化能量消耗的需求。
3.2 運(yùn)動(dòng)控制
運(yùn)動(dòng)控制指的是通過復(fù)雜算法調(diào)控機(jī)器人在動(dòng)態(tài)運(yùn)動(dòng)過程中的位置和關(guān)節(jié)扭矩,旨在實(shí)現(xiàn)動(dòng)態(tài)穩(wěn)定并提高系統(tǒng)的整體魯棒性。與傳統(tǒng)固定基座的機(jī)器人不同,四足機(jī)器人在控制運(yùn)動(dòng)速度和姿態(tài)穩(wěn)定性時(shí),極大地依賴于腳與地面的相互作用。因此,在考慮機(jī)器人自身動(dòng)力學(xué)特性的基礎(chǔ)上,四足機(jī)器人的控制還需特別關(guān)注腳與地面的接觸狀況,包括接觸反力和摩擦力的影響。四足機(jī)器人的運(yùn)動(dòng)控制策略主要分為兩大類:基于模型的控制方法和非基于模型的控制方法。常用的控制方法如圖12所示。
3.2.1 非基于模型的控制方法
四足機(jī)器人是一種相對(duì)復(fù)雜的欠驅(qū)動(dòng)系統(tǒng)。為了實(shí)現(xiàn)全方位移動(dòng),每條腿通常需要一個(gè)用于滾動(dòng)的自由度(DoF)和兩個(gè)用于俯仰的自由度。這意味著四條腿共有12個(gè)主動(dòng)自由度,再加上軀干的6個(gè)被動(dòng)自由度,總計(jì)18個(gè)自由度。非基于模型的控制方法無(wú)需依賴精確的動(dòng)力學(xué)模型,這使得機(jī)器人能更好地適應(yīng)復(fù)雜和不確定的環(huán)境,增強(qiáng)了其運(yùn)動(dòng)自主性。
1)中樞模式發(fā)生器(CPG)
CPG的概念是創(chuàng)建多個(gè)周期性振蕩器,模擬簡(jiǎn)單生物體內(nèi)的中樞神經(jīng)系統(tǒng)結(jié)構(gòu)。這些振蕩器相互連接,為機(jī)器人的關(guān)節(jié)生成節(jié)律性運(yùn)動(dòng)軌跡。CPG模型展現(xiàn)了出色的特性,如高參數(shù)化、低反饋影響、自我校正和自穩(wěn)定性。CPG模型通常分為兩類:非線性振蕩器模型和神經(jīng)振蕩器模型。
Wasista等人提出了基于CPG神經(jīng)原理的CPG控制器架構(gòu),通過配置控制器參數(shù),可以為四足機(jī)器人提供有效的步態(tài)控制信號(hào)。Xie等人利用Hopf非線性振蕩器模型,使四足機(jī)器人能夠適應(yīng)斜坡,實(shí)現(xiàn)平滑的步態(tài)轉(zhuǎn)換,并從平坦地面無(wú)縫過渡到斜坡。由于神經(jīng)振蕩器方程通常是線性的、多參數(shù)且多維的,參數(shù)調(diào)整和動(dòng)態(tài)分析可能較為復(fù)雜。非線性振蕩器由于其非線性和混沌特性,往往難以分析。
2)神經(jīng)網(wǎng)絡(luò)控制(NN)
鑒于神經(jīng)網(wǎng)絡(luò)在處理非線性問題上的卓越能力,它們成為解決機(jī)器人復(fù)雜非線性控制問題的理想選擇。Jin等人基于神經(jīng)網(wǎng)絡(luò)為四足機(jī)器人實(shí)現(xiàn)了一種新的小跑步態(tài),該控制系統(tǒng)展示了顯著的準(zhǔn)確性和對(duì)外部及內(nèi)部隨機(jī)干擾的強(qiáng)大抗擾能力。作為一種無(wú)監(jiān)督學(xué)習(xí)算法,強(qiáng)化學(xué)習(xí)(RL)近年來(lái)被廣泛應(yīng)用于機(jī)器人的運(yùn)動(dòng)控制和運(yùn)動(dòng)學(xué)。
Sheng等人引入了一種由RG和PF網(wǎng)絡(luò)構(gòu)成的新型RL控制架構(gòu),解決了RL對(duì)獎(jiǎng)勵(lì)函數(shù)敏感的問題,并提高了訓(xùn)練速度。Pei等人則利用新興的深度強(qiáng)化學(xué)習(xí)(DRL)技術(shù)探討了四足機(jī)器人在陌生和非結(jié)構(gòu)化地形中的運(yùn)動(dòng)挑戰(zhàn)。DRL結(jié)合了RL和深度學(xué)習(xí)(DL)的優(yōu)勢(shì),能夠在擁有最少先驗(yàn)知識(shí)的情況下處理高維控制空間中的復(fù)雜任務(wù)。
3.2.2 基于模型的控制方法
基于模型的控制方法遵循“建模-規(guī)劃-控制”的概念。這種方法首先對(duì)機(jī)器人及其所處環(huán)境建立數(shù)學(xué)模型,接著規(guī)劃出機(jī)器人的理想運(yùn)動(dòng)路徑,最后通過反饋控制使機(jī)器人的實(shí)際運(yùn)動(dòng)盡可能貼近理想路徑?;谀P偷目刂品椒ㄖ饕譃槿箢悾汉?jiǎn)化模型(如SLIP和虛擬模型控制VMC)、完整動(dòng)力學(xué)模型(如ZMP、MPC和WBC),以及逆動(dòng)力學(xué)模型(包括PID、自適應(yīng)控制和后退控制)。
1)彈簧加載倒立擺模型(SLIP)
SLIP模型是足式機(jī)器人運(yùn)動(dòng)控制中廣泛使用的近似建模方法。在這種模型中,單腿支撐狀態(tài)下的結(jié)構(gòu)被簡(jiǎn)化為一個(gè)彈簧倒立擺,其運(yùn)動(dòng)過程等同于倒立擺的擺動(dòng)和伸展過程[94]。對(duì)于四足機(jī)器人,SLIP算法通過近似等效的方法解耦了基座位置和姿態(tài)控制[3]。
例如,He等人基于兩棲球形四足機(jī)器人平臺(tái),利用SLIP模型實(shí)現(xiàn)了小跑和跑步步態(tài);Yu等人則設(shè)計(jì)了一款擁有柔性脊柱的12自由度四足機(jī)器人,采用了任務(wù)空間雙SLIP模型控制,通過兩個(gè)獨(dú)立的SLIP模型生成機(jī)器人質(zhì)心的期望軌跡,并設(shè)計(jì)相應(yīng)的控制器,使機(jī)器人能夠追蹤該軌跡,進(jìn)而實(shí)現(xiàn)穩(wěn)定的奔跑步態(tài)。盡管基于倒立擺模型的控制方法建模簡(jiǎn)單,無(wú)需高精度建模,但SLIP模型內(nèi)在的強(qiáng)非線性特征使得獲得精確解析解變得困難。
2)虛擬模型控制(VMC)
VMC方法最初由Jerry E. Pratt提出,用于雙足機(jī)器人的運(yùn)動(dòng)控制。該方法將機(jī)器人系統(tǒng)的空間運(yùn)動(dòng)簡(jiǎn)化為一個(gè)剛性浮動(dòng)體的位置和姿態(tài)變化。底座與地面的互動(dòng)可以用虛擬彈簧阻尼模型來(lái)模擬,用以調(diào)節(jié)底座體的運(yùn)動(dòng),當(dāng)忽略所有腿的支撐效果時(shí)。不論底座體的加速度影響,控制力均分配至支撐腿的腳端作為地面反作用力。各關(guān)節(jié)的控制力可根據(jù)每條腿的力雅可比矩陣計(jì)算得出。
在計(jì)算機(jī)器人控制力時(shí),通過調(diào)整虛擬彈簧的剛度和阻尼系數(shù),可以實(shí)現(xiàn)不同的跟蹤效果和抗干擾能力。VMC無(wú)需分層控制器,僅需關(guān)節(jié)扭矩即可實(shí)現(xiàn)四足機(jī)器人的速度和高度控制。此方法考慮了身體和腳的廣義坐標(biāo),包括它們的配置、位置和速度,而無(wú)需復(fù)雜的動(dòng)力學(xué)計(jì)算。該方法已在StarlETH機(jī)器人和HyQ機(jī)器人上成功應(yīng)用。VMC是一種直觀的基于模型的控制算法,通過調(diào)整控制參數(shù)來(lái)解耦機(jī)器人的運(yùn)動(dòng)變量,無(wú)需考慮動(dòng)力學(xué)計(jì)算的復(fù)雜關(guān)系,從而實(shí)現(xiàn)良好的力控特性。這種方法簡(jiǎn)單且計(jì)算效率高。虛擬彈簧的剛度和阻尼系數(shù)類似于PID控制的比例和微分參數(shù)。因此,當(dāng)機(jī)器人配置出現(xiàn)顯著偏差時(shí),需要較大的控制力矩。然而,在腳部摩擦錐的約束下,力矩可能會(huì)迅速飽和,影響機(jī)器人的穩(wěn)定性和持久性。VMC的主要缺點(diǎn)在于,虛擬物理組件無(wú)法充分描述系統(tǒng)的動(dòng)態(tài)特性,尤其是在快速動(dòng)態(tài)運(yùn)動(dòng)能力方面存在明顯局限。慣性和傳感器噪聲也會(huì)加重這些限制。此外,VMC僅關(guān)注系統(tǒng)當(dāng)前時(shí)刻的控制,與預(yù)測(cè)控制方法相比,在復(fù)雜地形(如樓梯)上的動(dòng)態(tài)性能和魯棒性較差。
3)零力矩點(diǎn)(ZMP)理論
ZMP理論確保了重力和慣性力作用于機(jī)器人身體的合力方向在運(yùn)動(dòng)過程中與地面相交于腳的支撐區(qū)域內(nèi),從而實(shí)現(xiàn)穩(wěn)定運(yùn)動(dòng)。最初,ZMP方法被應(yīng)用于分析人形機(jī)器人,特別是雙足機(jī)器人的穩(wěn)定性。隨后,該方法也被引入以確保四足機(jī)器人的穩(wěn)定性控制。
這種控制方法依靠腳部的穩(wěn)定區(qū)域?yàn)闄C(jī)器人提供控制力矩。因此,腳需要建立一個(gè)支撐多邊形,這是行走過程中常見的做法。基于ZMP的控制對(duì)于四足機(jī)器人而言顯得過于嚴(yán)格,使得機(jī)器人移動(dòng)速度相對(duì)較慢[106]。近年來(lái),隨著四足機(jī)器人技術(shù)的發(fā)展,人們?cè)絹?lái)越關(guān)注如何實(shí)現(xiàn)高動(dòng)態(tài)性能。
為了滿足四足機(jī)器人在速度和靈活性方面的需求,一種常用的方法是將ZMP方法與其他技術(shù)相結(jié)合。例如,Bellicoso等人將順序二次規(guī)劃(QP)框架用于解決非線性ZMP約束。盡管這種方法增加了計(jì)算復(fù)雜度,但它使四足機(jī)器人能夠?qū)崿F(xiàn)實(shí)時(shí)運(yùn)動(dòng)規(guī)劃,并以類似MPC的方式執(zhí)行任務(wù),從而實(shí)現(xiàn)諸如小跑、跑步和動(dòng)態(tài)側(cè)向行走等動(dòng)態(tài)步態(tài)。
此外,它還允許機(jī)器人執(zhí)行完全離地階段的動(dòng)作,如跳躍、推起和跳躍小跑。為了解決四足機(jī)器人在面對(duì)未知干擾時(shí)步態(tài)靈活性的問題,Xu等人提出了基于ZMP預(yù)覽控制的柔順控制策略,旨在建立腳與地面之間的軟接觸,減少對(duì)機(jī)器人身體的影響,使其即使在存在干擾的情況下也能穩(wěn)健且靈活地行走。Meng等人則通過結(jié)合ZMP方法和MPC方法,實(shí)現(xiàn)了小型四足機(jī)器人的小跑步態(tài)穩(wěn)定控制。
四足機(jī)器人的運(yùn)動(dòng)依賴于腳與地面之間的接觸力。然而,由于腳施加的推力特性,它們的移動(dòng)能力和精確跟蹤預(yù)定軌跡的能力受到了限制,特別是在存在干擾的情況下。當(dāng)在平坦地面上行走時(shí),機(jī)器人運(yùn)動(dòng)的穩(wěn)定性要求壓力中心保持在支撐多邊形內(nèi)。
模型預(yù)測(cè)控制(MPC)是一類專門設(shè)計(jì)來(lái)有效處理此類約束并生成穩(wěn)定運(yùn)動(dòng)的控制法則。這種控制方案通過最小化目標(biāo)函數(shù)、約束系統(tǒng)狀態(tài)在預(yù)測(cè)范圍結(jié)束時(shí)的狀態(tài),或者兩者結(jié)合來(lái)工作。MPC本質(zhì)上是一種最優(yōu)控制方法,現(xiàn)代方法通常通過線性、二次或非線性優(yōu)化問題來(lái)解決這些問題,以確定未來(lái)后向預(yù)測(cè)窗口內(nèi)的控制序列。盡管計(jì)算能力和優(yōu)化算法效率有了顯著進(jìn)步,但對(duì)于高動(dòng)態(tài)運(yùn)動(dòng)而言,計(jì)算需求仍然是廣泛應(yīng)用MPC的重要障礙。
當(dāng)將四足機(jī)器人系統(tǒng)視為空間浮動(dòng)的多體系統(tǒng)時(shí),研究主要集中在確定基座的位置和姿態(tài)以及每條腿的位置。狀態(tài)變量包括身體的配置和腿關(guān)節(jié)的角度。系統(tǒng)內(nèi)的控制力包括關(guān)節(jié)力矩和地面反作用力。身體和每條腿的期望軌跡可以通過預(yù)先規(guī)劃或約束條件生成。除了與地面接觸和摩擦相關(guān)的約束外,任務(wù)還可以描述為包含狀態(tài)變量或關(guān)節(jié)力矩的等式或不等式約束方程。
為了解決任務(wù)約束沖突的問題,在分層控制設(shè)計(jì)中必須采用適當(dāng)?shù)膬?yōu)化方程。這種分層控制器被稱為全身體控制器(WBC),它整合了所有機(jī)器人系統(tǒng)的任務(wù)。WBC大致可分為以下幾類:
1) 基于QP的WBC方法不區(qū)分任務(wù)優(yōu)先級(jí),對(duì)待每個(gè)任務(wù)平等;
2) 基于零空間投影(NSP)的WBC方法將低優(yōu)先級(jí)任務(wù)映射到高優(yōu)先級(jí)任務(wù)的零空間,以完成具有優(yōu)先級(jí)的多任務(wù)運(yùn)動(dòng),但此方法將接觸表示為等式約束,可能不適合快速移動(dòng)的機(jī)器人;
3) 具有任務(wù)優(yōu)先級(jí)權(quán)重的QP(分層二次編程[HQP])方法在確保高優(yōu)先級(jí)任務(wù)的同時(shí)處理低優(yōu)先級(jí)任務(wù),考慮到等式和不等式約束等多種任務(wù)約束;此方法可以集成多個(gè)約束和任務(wù),但實(shí)時(shí)應(yīng)用的計(jì)算成本較高;
4) 結(jié)合QP和NSP的WBC方法相比其他WBC方法提供了更高的計(jì)算效率。
與VMC和MPC中的簡(jiǎn)化方法不同,WBC對(duì)機(jī)器人模型的準(zhǔn)確性和控制精度有更高的要求。因此,WBC已成為高度動(dòng)態(tài)運(yùn)動(dòng)的強(qiáng)大候選方法。WBC基于完整的多體動(dòng)力學(xué),使系統(tǒng)能夠跟蹤軀干和腳尖的期望軌跡。隨著優(yōu)化變量和任務(wù)約束方程數(shù)量的增加,對(duì)更快硬件計(jì)算速度的需求也在增加。這種方法已成功應(yīng)用于StarlETH、ANYmal和HyQ等四足機(jī)器人?;谶@一控制方法,在步態(tài)規(guī)劃和切換、應(yīng)對(duì)外部力干擾以及在平滑表面或柔軟地形上導(dǎo)航等方面都取得了顯著改進(jìn)。
為了實(shí)現(xiàn)四足機(jī)器人的高動(dòng)態(tài)運(yùn)動(dòng)控制,通常需要通過關(guān)節(jié)力矩控制來(lái)達(dá)到所需的性能標(biāo)準(zhǔn)。然而,這種方法涉及解決逆運(yùn)動(dòng)學(xué)問題。在逆動(dòng)力學(xué)控制中,動(dòng)態(tài)建模方法通常是基于多剛體動(dòng)力學(xué)算法建立一個(gè)全面的動(dòng)力學(xué)方程,而不是依賴簡(jiǎn)化模型。因此,逆動(dòng)力學(xué)控制方法能夠提供更高的模型精度。
針對(duì)四足機(jī)器人,常見的逆動(dòng)力學(xué)控制方法包括力控制、力/位姿混合控制、阻抗控制和魯棒控制。不過,基于全面動(dòng)力學(xué)方程的控制系統(tǒng)也有其局限性。由于結(jié)構(gòu)的復(fù)雜性和運(yùn)動(dòng)過程的變化,計(jì)算全面動(dòng)力學(xué)方程需要大量的計(jì)算資源,這對(duì)系統(tǒng)的實(shí)際應(yīng)用構(gòu)成了一定挑戰(zhàn)。此外,除了接觸反力,四足機(jī)器人在運(yùn)動(dòng)時(shí)還可能遭遇未知力,這使得全面動(dòng)力學(xué)建模變得極為復(fù)雜,并給四足機(jī)器人的控制帶來(lái)了巨大的挑戰(zhàn)。
逆動(dòng)力學(xué)控制方法常見于固定基座的機(jī)器人運(yùn)動(dòng)控制,例如機(jī)械臂和平行平臺(tái)。近年來(lái),隨著建模技術(shù)和計(jì)算效率的改進(jìn),在浮動(dòng)基座機(jī)器人(如雙足和四足機(jī)器人)的逆動(dòng)力學(xué)控制方面也取得了顯著進(jìn)展。
04||自主運(yùn)動(dòng)
四足機(jī)器人的自主運(yùn)動(dòng)是一項(xiàng)關(guān)鍵的技術(shù)手段,它能夠獨(dú)立評(píng)估外部環(huán)境,并協(xié)助人類在復(fù)雜環(huán)境中完成任務(wù)。實(shí)現(xiàn)自主運(yùn)動(dòng)的核心在于路徑規(guī)劃和地形識(shí)別技術(shù)。
4.1 路徑規(guī)劃
路徑規(guī)劃是機(jī)器人從起始點(diǎn)到達(dá)目的地的基本策略,同時(shí)要避開環(huán)境中的靜態(tài)和動(dòng)態(tài)障礙物。根據(jù)路徑規(guī)劃方法的不同特點(diǎn),可以將它們分為傳統(tǒng)路徑規(guī)劃方法、智能仿生路徑規(guī)劃方法以及基于學(xué)習(xí)的路徑規(guī)劃方法。具體路徑規(guī)劃方法及其各自的優(yōu)缺點(diǎn)見表3。
4.1.1 傳統(tǒng)算法
1)人工勢(shì)場(chǎng)法
人工勢(shì)場(chǎng)法通過模擬引力和斥力的平衡,用于計(jì)算機(jī)器人在環(huán)境中的可行路徑。此方法通過模擬不同物體在各個(gè)位置上的力平衡,實(shí)現(xiàn)動(dòng)態(tài)環(huán)境中的實(shí)時(shí)運(yùn)動(dòng)控制,具有較短的規(guī)劃時(shí)間和高效的執(zhí)行特點(diǎn)。然而,它有可能陷入局部最優(yōu)解,導(dǎo)致路徑規(guī)劃失敗。Ge等人提出了一種針對(duì)動(dòng)態(tài)環(huán)境中機(jī)器人路徑規(guī)劃的勢(shì)場(chǎng)方法,解決了目標(biāo)和障礙物均在運(yùn)動(dòng)情況下的局部最優(yōu)值問題。Igarashi等人應(yīng)用人工勢(shì)場(chǎng)法增強(qiáng)了四足機(jī)器人的機(jī)動(dòng)性,使得機(jī)器人能順利通過復(fù)雜的地形,如跨越頭頂障礙物、穿過狹窄通道和臺(tái)階。Lee等人通過引入人工熱場(chǎng)概念,將障礙物穿越納入考量,并結(jié)合步態(tài)約束,確保了規(guī)劃路徑的可行性。
2)Dijkstra算法
Dijkstra算法是一種系統(tǒng)性的最短路徑搜索方法,從一個(gè)中心點(diǎn)開始,逐步向外擴(kuò)展直至找到最短路徑。不過,這種方法不太適合實(shí)時(shí)控制,在處理大規(guī)模數(shù)據(jù)時(shí)會(huì)消耗較多的時(shí)間和資源。Noto等人對(duì)傳統(tǒng)Dijkstra算法進(jìn)行了擴(kuò)展,能夠在規(guī)定時(shí)間內(nèi)找到接近最優(yōu)的路徑,實(shí)現(xiàn)了計(jì)算效率與路徑優(yōu)化的平衡。
面對(duì)不確定性環(huán)境中的最短路徑問題,Deng等人提出了模糊Dijkstra算法,通過模糊數(shù)表示弧長(zhǎng),簡(jiǎn)化了最短路徑的查找。Liu等人基于Dijkstra算法開發(fā)了一種適用于四足機(jī)器人全局地形自主導(dǎo)航的路徑規(guī)劃方法,并結(jié)合人工勢(shì)場(chǎng)理論實(shí)現(xiàn)了局部地圖內(nèi)的自主避障,確保了機(jī)器人在復(fù)雜環(huán)境下能夠精準(zhǔn)規(guī)劃路徑并自主導(dǎo)航。
3)A*算法
A算法是Dijkstra算法的一種改進(jìn)形式,它通過引入啟發(fā)式函數(shù)來(lái)提高搜索效率。啟發(fā)式搜索利用啟發(fā)式規(guī)則評(píng)估當(dāng)前位置與目標(biāo)位置的距離,優(yōu)先搜索接近目標(biāo)的方向,從而加快了搜索速度。波士頓動(dòng)力公司利用A算法為四足機(jī)器人BigDog在復(fù)雜環(huán)境中的自主運(yùn)動(dòng)進(jìn)行了路徑規(guī)劃。
盡管A算法在靜態(tài)網(wǎng)絡(luò)中是最有效的直接搜索方法之一,但它在動(dòng)態(tài)環(huán)境中遇到移動(dòng)障礙物時(shí)表現(xiàn)不佳。雖然A算法能夠捕捉完整的解決方案,但其復(fù)雜度相對(duì)較高。為此,Li等人提出了一種自適應(yīng)動(dòng)態(tài)螢火蟲算法,優(yōu)化現(xiàn)有路徑而不必從頭開始搜索,降低了計(jì)算負(fù)擔(dān),提高了動(dòng)態(tài)環(huán)境中的路徑搜索效率。
Fu等人提出的改進(jìn)A*算法比原始版本提高了搜索成功率,生成了更短且更平滑的路徑,顯著提升了機(jī)器人路徑規(guī)劃的成功率,并拓寬了機(jī)器人路徑的最優(yōu)選擇范圍。
4)快速探索隨機(jī)樹(RRT)
快速探索隨機(jī)樹(RRT)是一種基于樹狀結(jié)構(gòu)的隨機(jī)搜索方法,從非凸高維空間的根節(jié)點(diǎn)開始,通過創(chuàng)建分支迭代采樣新的狀態(tài),并連接接近樣本的現(xiàn)有節(jié)點(diǎn),最終構(gòu)建出從起點(diǎn)到目標(biāo)的最優(yōu)路徑圖。Aguilar等人利用RRT方法,通過形態(tài)學(xué)分割技術(shù)確定了障礙物環(huán)境中起始點(diǎn)與終點(diǎn)之間的路徑,實(shí)現(xiàn)了蜘蛛機(jī)器人的自主運(yùn)動(dòng)。
然而,RRT算法生成的路徑可能不夠平滑,特別是在窄通道或障礙物密集的環(huán)境中,這增加了路徑收斂的時(shí)間。因此,許多研究者致力于改進(jìn)RRT算法,經(jīng)典方法包括RRT-connect和RRT*。RRT-connect方法允許隨機(jī)樹快速向目標(biāo)區(qū)域擴(kuò)展,提高了算法的優(yōu)化效率;而RRT*算法則通過評(píng)估樹中新節(jié)點(diǎn)周圍的節(jié)點(diǎn),尋找更優(yōu)路徑,解決了不必要的迂回問題。
4.1.2 智能仿生算法
隨著學(xué)術(shù)界對(duì)智能優(yōu)化算法的深入研究,多種算法已在機(jī)器人路徑規(guī)劃問題中得到廣泛應(yīng)用。這些算法旨在根據(jù)特定的評(píng)估標(biāo)準(zhǔn)找到最優(yōu)路徑。常見的智能優(yōu)化算法包括神經(jīng)網(wǎng)絡(luò)算法、遺傳算法(GA)和蟻群算法。
1)神經(jīng)網(wǎng)絡(luò)算法
神經(jīng)網(wǎng)絡(luò)算法模仿了人腦中的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),模擬大腦的工作機(jī)制來(lái)進(jìn)行建模。因此,這種方法不僅靈活,還能處理連續(xù)或離散的輸入信息。盡管神經(jīng)網(wǎng)絡(luò)擁有出色的學(xué)習(xí)能力和魯棒性,但在利用現(xiàn)有先驗(yàn)知識(shí)方面存在不足。另外,隨著神經(jīng)元數(shù)量的增加,仿生神經(jīng)網(wǎng)絡(luò)中的計(jì)算量和時(shí)間成本也會(huì)急劇增加。為此,Wang等人提出了一種模糊神經(jīng)網(wǎng)絡(luò)算法用于移動(dòng)機(jī)器人的路徑規(guī)劃。
通過結(jié)合模糊理論與神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),該算法可以在完全未知和靜態(tài)環(huán)境中高效地確定從起點(diǎn)到終點(diǎn)的最優(yōu)路徑,并展示了高效的性能和快速的收斂速度,提升了移動(dòng)機(jī)器人的智能化水平。Luo等人通過引入多尺度地圖的方法改進(jìn)了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法,大大降低了路徑規(guī)劃算法的時(shí)間和復(fù)雜度。為了適應(yīng)多樣化的應(yīng)用場(chǎng)景,神經(jīng)網(wǎng)絡(luò)算法常常與其他傳統(tǒng)算法、群體智能算法和學(xué)習(xí)算法結(jié)合使用,以滿足收斂速度和計(jì)算成本等方面的性能需求。
2)遺傳算法(GA)
遺傳算法是一種基于自然遺傳進(jìn)化原理設(shè)計(jì)的自適應(yīng)算法,其優(yōu)化過程如圖13所示。該算法從隨機(jī)生成的初始種群出發(fā),通過多次交叉和變異操作生成具有不同基因組合和適應(yīng)度的新個(gè)體。當(dāng)種群的適應(yīng)度達(dá)到滿意水平時(shí),算法便收斂于最優(yōu)解。遺傳算法結(jié)合了隨機(jī)性和廣泛的搜索范圍,非常適合解決復(fù)雜的路徑規(guī)劃問題,因此在機(jī)器人路徑規(guī)劃中應(yīng)用廣泛。Ismail等人展示了如何利用遺傳算法解決非動(dòng)態(tài)環(huán)境下的路徑規(guī)劃問題,其實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法在不同靜態(tài)環(huán)境中的有效性。Tuncer等人則利用遺傳算法解決了動(dòng)態(tài)環(huán)境下的路徑規(guī)劃問題,并提出了新的變異算子來(lái)克服傳統(tǒng)隨機(jī)變異算子可能產(chǎn)生不可行路徑的問題。
遺傳算法被認(rèn)為是解決復(fù)雜且行為不良的目標(biāo)函數(shù)中最有力的搜索技術(shù)之一。其內(nèi)在的并行搜索特性使得它可以同時(shí)探索多個(gè)潛在解,從而更快速地識(shí)別出最優(yōu)路徑。為了在機(jī)器人路徑規(guī)劃中獲得更好的效果,研究人員對(duì)遺傳算法進(jìn)行了改進(jìn),或者將其與其他智能算法結(jié)合,形成混合策略。例如,模糊遺傳算法、神經(jīng)遺傳算法和遺傳-粒子群優(yōu)化算法等都是這類混合策略的具體實(shí)例。
3)蟻群算法
蟻群算法靈感來(lái)源于螞蟻覓食行為。即使不知曉食物的具體位置,螞蟻也能找到從巢穴到食物源的高效路徑。這一算法已在多個(gè)科學(xué)與工程領(lǐng)域得到應(yīng)用,包括車間調(diào)度、旅行商問題以及圖像著色等。此外,它也被廣泛應(yīng)用于機(jī)器人導(dǎo)航問題中,以實(shí)現(xiàn)避障和高效的路徑規(guī)劃。圖14展示了其優(yōu)化過程。
Brand等人研究了蟻群優(yōu)化(ACO)算法在機(jī)器人路徑規(guī)劃中的應(yīng)用,特別是如何在網(wǎng)格網(wǎng)絡(luò)中找到最短且無(wú)碰撞的路徑。他們利用各種形狀和尺寸的障礙物模擬動(dòng)態(tài)環(huán)境,并通過仿真驗(yàn)證了這種方法的可行性。對(duì)于未知?jiǎng)討B(tài)地形上的機(jī)器人路徑規(guī)劃,通常依賴于啟發(fā)式方法。Rajput等人則對(duì)傳統(tǒng)蟻群算法進(jìn)行了改進(jìn),通過將機(jī)器人在網(wǎng)格上的移動(dòng)方向歷史整合成一個(gè)向量作為概率乘數(shù)因子,這種方法不僅提高了算法的收斂速度,還減少了不必要的移動(dòng),增強(qiáng)了路徑規(guī)劃的效率。
4)改進(jìn)的蟻群優(yōu)化算法
為了克服傳統(tǒng)蟻群優(yōu)化(ACO)算法在室內(nèi)移動(dòng)機(jī)器人路徑規(guī)劃中存在的問題,如規(guī)劃時(shí)間長(zhǎng)、收斂速度慢、路徑非最優(yōu)和局部最優(yōu)等,Miao等人提出了一種改進(jìn)的自適應(yīng)蟻群優(yōu)化算法。他們引入了角度引導(dǎo)因子和障礙物排除因子到ACO的轉(zhuǎn)移概率中,以增強(qiáng)算法的探索與開發(fā)能力。此外,他們?cè)谛畔⒏乱?guī)則中加入了啟發(fā)式信息、自適應(yīng)調(diào)整因子和自適應(yīng)信息素蒸發(fā)因子。通過考慮路徑長(zhǎng)度、安全性和能耗等因素,將路徑規(guī)劃問題轉(zhuǎn)化為多目標(biāo)優(yōu)化問題,使機(jī)器人能夠?qū)崿F(xiàn)全局路徑優(yōu)化。蟻群算法是一種基于群體的方法,涉及自組織和正反饋機(jī)制,為復(fù)雜環(huán)境中的路徑規(guī)劃問題提供了一種獨(dú)特的解決方案。
4.1.3 基于學(xué)習(xí)的算法
經(jīng)典的路徑規(guī)劃算法已經(jīng)達(dá)到了相對(duì)成熟的發(fā)展階段。然而,它們依賴于建立環(huán)境模型,缺乏對(duì)環(huán)境的感知能力和自動(dòng)學(xué)習(xí)的能力。強(qiáng)化學(xué)習(xí)(RL)使得機(jī)器人可以通過自主探索獲取環(huán)境信息,從而適應(yīng)各種地理環(huán)境,并在多種場(chǎng)景下實(shí)現(xiàn)路徑規(guī)劃。解決路徑規(guī)劃問題的主要RL方法包括Q-learning、狀態(tài)-動(dòng)作-獎(jiǎng)勵(lì)-狀態(tài)-動(dòng)作(SARSA)、Q(λ)-learning和SARSA(λ)。其中,Q-learning是路徑規(guī)劃領(lǐng)域中最常用且有效的RL算法之一,它不需要建模且能保證收斂。Maoudj A等人通過對(duì)Q-learning算法引入新的獎(jiǎng)勵(lì)函數(shù)來(lái)初始化Q表并提供環(huán)境先驗(yàn)知識(shí)給機(jī)器人。他們還提出了一個(gè)新的高效選擇策略,以加速學(xué)習(xí)過程,該策略在減少搜索空間的同時(shí)確??焖偈諗康絻?yōu)化解。Q-learning算法中的Q值根據(jù)狀態(tài)、動(dòng)作和獎(jiǎng)勵(lì)值計(jì)算得出。與Q-learning類似,SARSA也是一種緊密相關(guān)的學(xué)習(xí)方法,但它是一個(gè)基于策略的學(xué)習(xí)算法,即SARSA根據(jù)當(dāng)前策略學(xué)習(xí)Q表值,而不是采用貪婪策略,這意味著SARSA在探索其他動(dòng)作方面有一定的局限性。Q-learning是一種無(wú)模型的方法,意味著它不需要顯式的環(huán)境模型,因此可以廣泛應(yīng)用于解決路徑規(guī)劃問題。Q(λ)算法是Q-learning的擴(kuò)展,它結(jié)合了資格跡,作為短期記憶存儲(chǔ)最近的動(dòng)作。
通過存儲(chǔ)狀態(tài)-動(dòng)作對(duì)的痕跡,可以同時(shí)采取多個(gè)步驟,相比Q-learning,這種方法實(shí)現(xiàn)了更高效的學(xué)習(xí)和更快地收斂到接近最優(yōu)路徑。RL在解決順序決策問題中起著關(guān)鍵作用,并通過與環(huán)境的互動(dòng)表現(xiàn)出色的自我學(xué)習(xí)能力。將基于RL的局部路徑規(guī)劃算法SARSA(λ)與RRT算法相結(jié)合,有助于減少采樣的隨機(jī)性,從而提高實(shí)時(shí)性能和可靠性。深度強(qiáng)化學(xué)習(xí)(DRL)也在路徑規(guī)劃任務(wù)中得到了廣泛應(yīng)用。深度學(xué)習(xí)(DL)擅長(zhǎng)感知任務(wù),而RL則擅長(zhǎng)決策制定。這兩種學(xué)習(xí)方法的結(jié)合在路徑規(guī)劃中可以產(chǎn)生顯著的效果。Lei等人應(yīng)用了DeepMind提出的雙Q網(wǎng)絡(luò)——一種2016年提出的DRL算法——用于未知環(huán)境中的動(dòng)態(tài)路徑規(guī)劃。
Yang等人通過結(jié)合深度Q網(wǎng)絡(luò)算法與Q-learning算法解決了機(jī)器人路徑規(guī)劃中收斂速度慢和隨機(jī)性過大的問題。Yu等人提出了一種基于神經(jīng)網(wǎng)絡(luò)和分層強(qiáng)化學(xué)習(xí)(HRL)的移動(dòng)機(jī)器人路徑規(guī)劃算法。該算法利用神經(jīng)網(wǎng)絡(luò)讓機(jī)器人感知環(huán)境并提取相關(guān)特征,HRL則將當(dāng)前狀態(tài)映射到特定動(dòng)作。與Q-learning算法相比,這種方法減少了收斂時(shí)間,提高了規(guī)劃路徑的平滑度,并在不同場(chǎng)景中展現(xiàn)了良好的泛化性能。
4.2 地形識(shí)別
地形識(shí)別是指機(jī)器人利用其平臺(tái)上安裝的傳感器來(lái)識(shí)別和分類未知的地形環(huán)境的能力。四足機(jī)器人與環(huán)境之間的交互非常復(fù)雜,地形特征對(duì)機(jī)器人的運(yùn)動(dòng)性能有重大影響。因此,機(jī)器人需要具備準(zhǔn)確的地形感知和分類能力,以便進(jìn)行適當(dāng)?shù)穆窂胶蛙壽E規(guī)劃,并設(shè)計(jì)合適的運(yùn)動(dòng)控制策略。這確保了機(jī)器人能夠有效地穿越地形,實(shí)現(xiàn)預(yù)期的運(yùn)動(dòng)軌跡,并保持運(yùn)動(dòng)穩(wěn)定性。機(jī)器人通過攜帶的硬件設(shè)備獲取地形信息。根據(jù)地形識(shí)別算法的不同發(fā)展階段,可以將其分為傳統(tǒng)的地形識(shí)別算法和基于深度學(xué)習(xí)的地形識(shí)別算法。具體的分類情況如圖15所示。
1)基于非視覺特征的地形識(shí)別算法
依賴非視覺特征的地形識(shí)別算法通常配備有諸如激光雷達(dá)(LiDAR)、紅外傳感器、慣性測(cè)量單元和振動(dòng)傳感器等。基于這些傳感器的特性,非視覺地形識(shí)別算法可以進(jìn)一步分為兩類:基于點(diǎn)云信息的地形識(shí)別算法和基于振動(dòng)的地形識(shí)別算法。
2)基于點(diǎn)云信息的地形識(shí)別算法
這類算法通過使用激光雷達(dá)掃描地形環(huán)境輪廓來(lái)獲取點(diǎn)云數(shù)據(jù),并構(gòu)建柵格地圖。隨后,算法計(jì)算柵格地圖中點(diǎn)云數(shù)據(jù)的最大值和最小值,以創(chuàng)建可達(dá)性地圖。例如,Jung等人利用單個(gè)激光測(cè)距儀跟蹤跑步的人,并在非結(jié)構(gòu)化戶外環(huán)境中避開動(dòng)態(tài)障礙物。Leigh等人設(shè)計(jì)了Smart Wheeler機(jī)器人,該機(jī)器人使用2D激光掃描器,在不同條件下幫助行動(dòng)不便的人進(jìn)行人員跟蹤和跟隨。
Meng等人提出了一種基于3D LiDAR點(diǎn)云數(shù)據(jù)的坡度檢測(cè)方法,通過根據(jù)變化的坡度角連續(xù)調(diào)整四足機(jī)器人的步態(tài),使機(jī)器人能夠避免潛在危險(xiǎn)并保持運(yùn)動(dòng)穩(wěn)定。相較于2D LiDAR點(diǎn)云數(shù)據(jù),3D LiDAR數(shù)據(jù)從感知單一平面進(jìn)化到了三維空間感知。Saputra等人提出了一個(gè)多行為生成模型,該模型能夠基于3D點(diǎn)云、地面觸覺傳感器和慣性測(cè)量單元生成合適的行為,適用于無(wú)扶手樓梯環(huán)境中的上下樓梯導(dǎo)航。所獲得的點(diǎn)云特征數(shù)據(jù)的準(zhǔn)確性受雷達(dá)探測(cè)范圍的影響,近距離時(shí)點(diǎn)云密度較高,生成的可通行性地圖也更準(zhǔn)確;但遠(yuǎn)距離時(shí)點(diǎn)云的準(zhǔn)確性較低。實(shí)際應(yīng)用中,往往需要對(duì)數(shù)據(jù)進(jìn)行校正,以實(shí)現(xiàn)更均衡的表現(xiàn)。
3)基于振動(dòng)的地形識(shí)別算法
基于振動(dòng)的地形識(shí)別算法利用集成在機(jī)器人上的振動(dòng)傳感器收集和分析機(jī)器人穿越未知地形環(huán)境時(shí)產(chǎn)生的振動(dòng),從而實(shí)現(xiàn)地形識(shí)別。Brooks等人提出了一種更為全面的基于振動(dòng)的地形分類方法。分類器離線訓(xùn)練使用標(biāo)記的振動(dòng)數(shù)據(jù),在線執(zhí)行線性分類識(shí)別。Weiss等人提出了一種基于車輛車身振動(dòng)的地形分類方法,他們使用支持向量機(jī)(SVM)進(jìn)行基于振動(dòng)的地形分類,采用徑向基函數(shù)(RBF)核和特征提取技術(shù)。根據(jù)識(shí)別出的地形,車輛可以調(diào)整其駕駛模式。Hoepflinger等人提出了一種用于識(shí)別地形形狀和屬性的算法,該算法從機(jī)器人運(yùn)動(dòng)期間產(chǎn)生的關(guān)節(jié)電機(jī)電流數(shù)據(jù)和地面振動(dòng)接觸力測(cè)量中提取特征,實(shí)現(xiàn)了94%的地形形狀識(shí)別率和73%的地形屬性識(shí)別率。
Bai等人提出了一種基于輪地交互的3D振動(dòng)地形識(shí)別算法,他們使用快速傅里葉變換光譜將三軸振動(dòng)矢量轉(zhuǎn)換到頻域,并通過對(duì)轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行歸一化處理,獲得了訓(xùn)練特征向量,并在五種不同的地形環(huán)境中進(jìn)行了算法分類測(cè)試。對(duì)于四足機(jī)器人而言,工作環(huán)境復(fù)雜、動(dòng)態(tài)且具有高度不確定性,這對(duì)傳感器的可靠性提出了挑戰(zhàn)。此外,體積、重量和成本的限制使得在機(jī)器人上攜帶整套傳感器變得不切實(shí)際。在這種情況下,視覺傳感器提供了若干優(yōu)勢(shì)。它們用途廣泛,能夠提供寶貴的地形信息,這對(duì)于預(yù)防意外的機(jī)器人跌落至關(guān)重要。
4)自主機(jī)器人運(yùn)動(dòng)與視覺地形識(shí)別
自主機(jī)器人的運(yùn)動(dòng)依賴于對(duì)周圍環(huán)境的感知和解釋。與非視覺方法相比,基于視覺的地形識(shí)別方法提供了豐富的信息,并且不受機(jī)器人自身影響,因此成為機(jī)器人地形識(shí)別的首選方案。為了進(jìn)一步分類基于視覺的地形識(shí)別方法,可以將其分為兩個(gè)子類別:結(jié)構(gòu)化視覺特征和抽象視覺特征。
5)結(jié)構(gòu)化視覺特征
如顏色和紋理等結(jié)構(gòu)化視覺特征,可以通過明確的數(shù)學(xué)或算法定義精確量化。這些特征不僅在計(jì)算機(jī)視覺任務(wù)中提供一致可靠的信息,還主要用于傳感器捕捉的具體視覺元素的選擇和提取。隨后,這些特征被輸入分類器進(jìn)行精確分類,如圖16所示。Cortes等人評(píng)估了紋理描述符,并結(jié)合了顏色描述符,選擇了以RBF作為核函數(shù)的支持向量機(jī)(SVM),并結(jié)合Gabor小波濾波器,這種方法達(dá)到了超過91%的識(shí)別精度。
Filitchkin等人提出了一個(gè)基于SURF(加速穩(wěn)健特征)和SVM分類器融合的詞袋視覺詞匯的地形識(shí)別算法,并在LittleDog平臺(tái)上實(shí)現(xiàn)了實(shí)時(shí)地形分類,提高了機(jī)器人地形識(shí)別的準(zhǔn)確性和步態(tài)速度。Wu等人結(jié)合堆疊去噪稀疏自動(dòng)編碼器和Fisher向量技術(shù),通過無(wú)監(jiān)督機(jī)器學(xué)習(xí)實(shí)現(xiàn)參數(shù)自調(diào)優(yōu)。他們?cè)诰哂袕澢鹊乃淖銠C(jī)器人上進(jìn)行了室外實(shí)驗(yàn),使用來(lái)自多種地形的數(shù)據(jù)集,在地形識(shí)別方面取得了有希望的結(jié)果。
結(jié)構(gòu)化視覺特征算法包括特征提取與分類兩部分,使用分類器完成任務(wù)。然而,因?yàn)樽R(shí)別過程是由離散步驟組成的,所以難以實(shí)現(xiàn)端到端的訓(xùn)練。這一限制妨礙了算法參數(shù)的全局反向傳播,使得參數(shù)更新變得更加困難,進(jìn)而導(dǎo)致算法訓(xùn)練復(fù)雜,影響了優(yōu)化效果。同時(shí),分類器的設(shè)計(jì)往往需要人類專家的介入,這種依賴人為因素的情況削弱了地形識(shí)別的效率與精確度。相比之下,卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種模擬人類大腦神經(jīng)網(wǎng)絡(luò)的生物啟發(fā)式模型,它能模擬大腦處理視覺信息的方式,即通過多層的感受野。借助多層卷積網(wǎng)絡(luò)結(jié)構(gòu),CNN可以逐步提取圖像的顏色、結(jié)構(gòu)和紋理等結(jié)構(gòu)化視覺特征。在各層之間的卷積過程中,這些特征相互交織并整合,最終生成帶有語(yǔ)義信息的抽象視覺特征。深度學(xué)習(xí)(DL)驅(qū)動(dòng)的地形識(shí)別算法主要依靠CNN來(lái)提取此類抽象特征,并通過諸如全連接層這樣的分類器將其轉(zhuǎn)化為可識(shí)別的標(biāo)簽。這種方法實(shí)現(xiàn)了從傳感器獲取特征到網(wǎng)絡(luò)內(nèi)部的端到端處理,采用端到端的方法后,在輸出端就能直接得到結(jié)果,不再需要單獨(dú)設(shè)計(jì)特征或挑選分類器。具體流程請(qǐng)參見圖17。例如,Abou-Nasr等人提出了一種基于遞歸神經(jīng)網(wǎng)絡(luò)的灰度圖像地形識(shí)別方案,用以區(qū)分草地、樹木以及道路上的落葉。當(dāng)圖像像素從頂部到底部被掃描時(shí),分類器會(huì)識(shí)別出相應(yīng)的地形類型。而Liu等人則提出了一種基于深度稀疏過濾網(wǎng)絡(luò)(DSFN)的地形識(shí)別方法,該網(wǎng)絡(luò)能夠自動(dòng)從未加工的數(shù)據(jù)中學(xué)習(xí)特征,這是一種突破性的深度學(xué)習(xí)技術(shù),僅需在預(yù)訓(xùn)練和微調(diào)階段調(diào)整少數(shù)參數(shù),區(qū)別于傳統(tǒng)的深度網(wǎng)絡(luò)。另外,Borijindakul等人開發(fā)了一種遞歸神經(jīng)網(wǎng)絡(luò),用于分類軟質(zhì)地形,以此擴(kuò)大四足機(jī)器人的活動(dòng)范圍,該方法成功地區(qū)分了六類不同的地形。
Sun等人開發(fā)了一種語(yǔ)義分割模型,該模型采用全卷積網(wǎng)絡(luò),用于戶外環(huán)境下足式機(jī)器人的地形感知。他們借助深度神經(jīng)網(wǎng)絡(luò)來(lái)辨識(shí)地面紋理,從而幫助機(jī)器人理解周圍的地形環(huán)境。Kong等人把視覺可通行性分析的問題轉(zhuǎn)化為圖像分類任務(wù)。通過訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)分類不同的地形片段,并實(shí)現(xiàn)實(shí)時(shí)動(dòng)態(tài)調(diào)整腿部姿態(tài),保證了機(jī)器人能根據(jù)環(huán)境條件靈活、穩(wěn)定地移動(dòng)。Junaid 等人設(shè)計(jì)了一種多特征視圖淺層卷積神經(jīng)網(wǎng)絡(luò)(MVS-CNN),它可以從輸入圖像的具體表征中抽取抽象特征。為了提升該深度學(xué)習(xí)結(jié)構(gòu)的學(xué)習(xí)效果,他們還引入了圖像梯度信息作為額外的數(shù)據(jù)通道。然后,這些多視角特征被輸入到全連接神經(jīng)網(wǎng)絡(luò)中,以精確劃分道路區(qū)域。相較于廣泛使用的語(yǔ)義分割網(wǎng)絡(luò)SegNet,這一新方法不僅在訓(xùn)練和評(píng)估階段表現(xiàn)出更好的性能,而且運(yùn)算效率也有所提高。對(duì)于機(jī)器人的地形識(shí)別而言,不論是以非視覺特征為基礎(chǔ)還是以視覺特征為基礎(chǔ),選擇快速且高效的分類方法至關(guān)重要。地形識(shí)別的精度和算法的高效性是提升分類方法實(shí)用性的兩大關(guān)鍵因素。不過,這兩類地形識(shí)別算法都存在各自的局限:比如,基于視覺特征的方法在強(qiáng)光條件下可能失效;而基于非視覺特征的方法則難以區(qū)分幾何特性相似的不同地形。因此,將兩者相結(jié)合,成為未來(lái)地形識(shí)別技術(shù)研究的發(fā)展方向。
05||結(jié)論
本文專注于四足機(jī)器人領(lǐng)域的前沿研究,特別關(guān)注結(jié)構(gòu)設(shè)計(jì)、運(yùn)動(dòng)控制和自主移動(dòng)這三個(gè)關(guān)鍵方面。作為先進(jìn)的自主智能系統(tǒng),四足機(jī)器人因其在自主導(dǎo)航、任務(wù)執(zhí)行和環(huán)境適應(yīng)性方面的潛力而受到了廣泛關(guān)注。本文旨在深入探討并總結(jié)當(dāng)前四足機(jī)器人的結(jié)構(gòu)形式,并探索推動(dòng)其智能化和高度自主性的運(yùn)動(dòng)控制方法、路徑規(guī)劃技術(shù)和地形識(shí)別技術(shù)。關(guān)于四足機(jī)器人的結(jié)構(gòu)設(shè)計(jì),當(dāng)前的研究集中在提高其靈活性和適應(yīng)性上,例如通過增加踝關(guān)節(jié)、尾巴和頭部等部件。同時(shí),一種日益增長(zhǎng)的趨勢(shì)是賦予四足機(jī)器人可重構(gòu)和多模態(tài)的移動(dòng)能力,以適應(yīng)不同的環(huán)境并完成多樣化的任務(wù)。
展望未來(lái),四足機(jī)器人可能會(huì)采用模塊化設(shè)計(jì)理念,使得腿部、機(jī)身和頭部等組件可以根據(jù)需要互換和重新配置,從而促進(jìn)機(jī)器人的可重構(gòu)性和擴(kuò)展性。這種模塊化設(shè)計(jì)不僅增強(qiáng)了機(jī)器人的靈活性和通用性,還降低了成本和維護(hù)復(fù)雜度。
在運(yùn)動(dòng)控制領(lǐng)域,四足機(jī)器人的研究已經(jīng)取得了顯著進(jìn)展。通過將先進(jìn)的傳感技術(shù)與實(shí)時(shí)控制算法相結(jié)合,機(jī)器人能夠更好地適應(yīng)不穩(wěn)定或復(fù)雜的地形,保持平衡,并實(shí)現(xiàn)更加自然高效的步態(tài)。未來(lái)的研究可以進(jìn)一步探索四足機(jī)器人的協(xié)同控制技術(shù),包括與機(jī)械臂集成以擴(kuò)展如抓取、搬運(yùn)和組裝等操作能力。與無(wú)人機(jī)的協(xié)作可以提升任務(wù)效率和安全性,提供地空協(xié)同效應(yīng),這在災(zāi)難響應(yīng)、軍事偵察和環(huán)境監(jiān)測(cè)等特殊場(chǎng)景中尤為重要。此外,引入人工皮膚技術(shù)可以增強(qiáng)機(jī)器人的觸覺和感知能力,比如觸摸感知、溫度感知和疼痛檢測(cè)等。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28593瀏覽量
207825 -
四足機(jī)器人
+關(guān)注
關(guān)注
1文章
92瀏覽量
15231
原文標(biāo)題:四足機(jī)器人的結(jié)構(gòu)、控制及運(yùn)動(dòng)控制
文章出處:【微信號(hào):indRobot,微信公眾號(hào):工業(yè)機(jī)器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論