近日,來自卡內(nèi)基梅隆大學(xué)、加州大學(xué)伯克利分校、Meta、英偉達(dá)、波士頓動(dòng)力以及豐田研究所的 6 家頂尖機(jī)構(gòu)的 7 位頂級位專家進(jìn)行了一場“關(guān)于生成式人工智能(AI)與機(jī)器人”的頂級討論。
討論的話題覆蓋了生成式 AI、人形機(jī)器人、家用機(jī)器人等等。討論的角度在于全面、深入解析現(xiàn)有的機(jī)器人技術(shù)以及未來技術(shù)。討論者發(fā)言的觀點(diǎn),貼近實(shí)際發(fā)人深省。例如:
“2023 年是生成式 AI 徹底改變機(jī)器人學(xué)的一年”; ? “生成式AI 對機(jī)器人技術(shù)的各個(gè)領(lǐng)域,從模擬到設(shè)計(jì),都產(chǎn)生革命性的影響”; ? “簡易的抓手比五指的機(jī)器人手更可靠、更經(jīng)濟(jì)”; ? “農(nóng)業(yè)領(lǐng)域超越了傳統(tǒng)的制造業(yè)和倉儲(chǔ)業(yè),為機(jī)器人技術(shù)提供了一個(gè)廣闊的應(yīng)用平臺(tái)”......
參與討論位專家分別是:卡耐基梅隆大學(xué)的Matthew Johnson-Roberson、Meta的Dhruv Batra、波士頓動(dòng)力公司的Aaron Saunders、加州大學(xué)伯克利分校的Ken Goldberg、英偉達(dá)的Deepu Talla、豐田汽車先進(jìn)AI研究所的Russ Tedrake、Max Bajracharya。
生成式 AI 與機(jī)器人技術(shù)中的未來
Matthew(CMU):通過生成新穎數(shù)據(jù)和解決方案,生成式 AI 將極大地提升機(jī)器人的能力。它不僅能使機(jī)器人更廣泛地泛化任務(wù)處理能力,還能增強(qiáng)它們對新環(huán)境的適應(yīng)性,并提升其自主學(xué)習(xí)與進(jìn)化的能力。
Dhruv (Meta):生成式 AI 在具身 AI 和機(jī)器人研究中扮演兩個(gè)獨(dú)特角色:
1.數(shù)據(jù)/經(jīng)驗(yàn)生成器:生成 2D 圖像、視頻、3D 場景或 4D(3D + 時(shí)間)等訓(xùn)練機(jī)器人所需的語料。鑒于現(xiàn)實(shí)世界中的機(jī)器人經(jīng)驗(yàn)(數(shù)據(jù))極為珍貴,生成式 AI可以被視作“學(xué)習(xí)型模擬器”。我堅(jiān)信,沒有模擬的訓(xùn)練和測試,機(jī)器人研究是無法大規(guī)模進(jìn)行的。
2.自監(jiān)督學(xué)習(xí)架構(gòu):生成機(jī)器人未來可能觀察到的感官數(shù)據(jù),與實(shí)際觀測進(jìn)行比較,作為一種無需標(biāo)注的學(xué)習(xí)信號。更多細(xì)節(jié)可參見 Yann 發(fā)表的關(guān)于 AMI 的論文。
AMI論文:A Path Towards Autonomous Machine Intelligence Version 0.9.2, 2022-06-27
地址:https://openreview.net/pdf?id=BZ5a1r-kVsf
Aaron(波士頓動(dòng)力):當(dāng)前變革的速度讓我們無法對未來做出精準(zhǔn)預(yù)測?;A(chǔ)模型標(biāo)志著機(jī)器學(xué)習(xí)模型創(chuàng)造方式的重大變革,不僅能夠創(chuàng)建與機(jī)器人的對話界面,提升現(xiàn)有計(jì)算機(jī)視覺功能的質(zhì)量,還可能開發(fā)出如視覺問題解答等新的能力。我們認(rèn)為,這些更加可擴(kuò)展的架構(gòu)和訓(xùn)練策略最終可能超越語言和視覺,擴(kuò)展到機(jī)器人的規(guī)劃和控制領(lǐng)域。
Russ(豐田汽車先進(jìn)AI研究所):生成式 AI 擁有給機(jī)器人技術(shù)帶來革命性新功能的潛力?,F(xiàn)在,我們不僅能夠用自然語言與機(jī)器人交流,而且通過連接至互聯(lián)網(wǎng)規(guī)模的語言和圖像數(shù)據(jù),機(jī)器人對世界的理解和推理能力也大幅增強(qiáng)。但目前還處于初級階段,還需進(jìn)一步研究:如何將圖像和語言知識(shí)與機(jī)器人所需的物理智能有效結(jié)合,從而使機(jī)器人變得真正實(shí)用。
Ken(加州大學(xué)伯克利分校):2023 年是生成式 AI 徹底改變機(jī)器人學(xué)的一年。像 ChatGPT 這樣的大語言模型讓機(jī)器人與人類之間的自然語言交流成為可能。機(jī)器人學(xué)家還發(fā)現(xiàn),大型的視覺-語言-動(dòng)作模型可以被訓(xùn)練用來增強(qiáng)機(jī)器人的感知能力,并控制其手臂和腿部的動(dòng)作。這種訓(xùn)練需要大量的數(shù)據(jù),因此全球?qū)嶒?yàn)室現(xiàn)在正合作分享數(shù)據(jù)。雖然關(guān)于泛化能力的問題尚未完全解決,但這些模型帶來的影響是深遠(yuǎn)的。
另一個(gè)激動(dòng)人心的話題是“多模態(tài)模型”,它有兩種含義:
1.結(jié)合不同輸入模式的多模態(tài):例如將視覺和語言結(jié)合起來?,F(xiàn)在這已經(jīng)擴(kuò)展到包括觸覺、深度感知以及機(jī)器人動(dòng)作。
2.對相同輸入狀態(tài)允許不同響應(yīng)的多模態(tài):這在機(jī)器人技術(shù)中相當(dāng)常見,例如用多種方式抓取同一個(gè)物體。標(biāo)準(zhǔn)的深度模型會(huì)將這些抓取動(dòng)作“平均化”,這可能導(dǎo)致非常糟糕的抓取效果。
Deepu(英偉達(dá)):我們已經(jīng)目睹了生成式 AI 如何提高生產(chǎn)力。顯然,生成式AI 對機(jī)器人技術(shù)的各個(gè)領(lǐng)域,從模擬到設(shè)計(jì),都將產(chǎn)生革命性的影響。
模擬:模型將通過構(gòu)建場景、創(chuàng)建環(huán)境和生成資產(chǎn)來加速模擬開發(fā),縮小 3D 技術(shù)藝術(shù)家和開發(fā)者之間的差距。生成式AI 生成的資產(chǎn)將被廣泛應(yīng)用于數(shù)據(jù)合成、機(jī)器人技能訓(xùn)練和軟件測試。
多模態(tài)人工智能:基于 Transformer 的模型將提升機(jī)器人理解其周圍世界的能力,使它們能在更多的環(huán)境中工作,并完成更復(fù)雜的任務(wù)。
機(jī)器人(重新)編程:機(jī)器人將具備更強(qiáng)大的能力來用簡單的語言定義任務(wù)和功能,使它們變得更加通用和多用途。
設(shè)計(jì):創(chuàng)新的機(jī)械設(shè)計(jì)將提升效率,例如在末端執(zhí)行器的設(shè)計(jì)上。
對人形機(jī)器人的看法
加州大學(xué)伯克利分校的Ken Goldberg
Ken(加州大學(xué)伯克利分校):我對類人機(jī)器人和腿式機(jī)器人一直持保留態(tài)度,認(rèn)為它們往往過于夸張并且效率不高。但在見識(shí)了波士頓動(dòng)力、Agility 和 Unitree 最新的人形機(jī)器人和四足機(jī)器人之后,我改變了看法。特斯拉在大規(guī)模開發(fā)低成本電機(jī)和齒輪系統(tǒng)方面擁有卓越的工程技能。相比于輪式機(jī)器人,腿式機(jī)器人在家庭和工廠等環(huán)境中更有優(yōu)勢,它們能夠跨越臺(tái)階、障礙物和地毯。雖然雙臂機(jī)器人對許多任務(wù)來說至關(guān)重要,但簡易的抓手比五指的機(jī)器人手更可靠、更經(jīng)濟(jì)。
Deepu(英偉達(dá)):設(shè)計(jì)自動(dòng)化機(jī)器人本就充滿挑戰(zhàn),要?jiǎng)?chuàng)建類人機(jī)器人更是難上加難。不同于大多數(shù)只需理解地面障礙物的自動(dòng)移動(dòng)機(jī)器人(AMR),類人機(jī)器人作為移動(dòng)操作平臺(tái),需要利用多模態(tài) AI 來深入理解它們周邊的環(huán)境。這涉及到大量的傳感器處理、高級控制技術(shù)以及技能執(zhí)行。
生成式 AI 在構(gòu)建基礎(chǔ)模型方面取得的突破,正讓類人機(jī)器人所需的技能更加廣泛適用。同時(shí),也看到模擬技術(shù)的進(jìn)步,這些技術(shù)能夠訓(xùn)練基于 AI 的控制系統(tǒng)和感知系統(tǒng)。
Matthew(CMU):人形的設(shè)計(jì)形態(tài)是一個(gè)極其復(fù)雜的工程與設(shè)計(jì)挑戰(zhàn)。它對模仿人類動(dòng)作和互動(dòng)設(shè)定了高度復(fù)雜的執(zhí)行器和控制系統(tǒng)標(biāo)準(zhǔn)。同時(shí),它也在平衡和協(xié)調(diào)方面提出了獨(dú)特的挑戰(zhàn)。盡管存在這些困難,但人形機(jī)器人在多種社會(huì)和實(shí)用環(huán)境中具有極高的潛在通用性和直觀可用性。
Max(豐田汽車先進(jìn)AI研究所):機(jī)器人被廣泛應(yīng)用于人類環(huán)境中,這些環(huán)境通常是以人為本設(shè)計(jì)的。因此,這些機(jī)器人需要具備適應(yīng)這些以人為中心的環(huán)境并在其中有效工作的能力。然而,適應(yīng)人類環(huán)境并不強(qiáng)求機(jī)器人必須擁有類人形態(tài),如兩臂、五指、兩腿和頭部等。更為關(guān)鍵的是,機(jī)器人應(yīng)設(shè)計(jì)得既緊湊又安全,并且能夠執(zhí)行與人類相似或相輔相成的任務(wù),以實(shí)現(xiàn)與人類的協(xié)作和互補(bǔ)。
Dhruv (Meta):我持有樂觀的看法。從根本上來說,人類的環(huán)境是圍繞人的形態(tài)和行為模式設(shè)計(jì)的。因此,如果期望通用機(jī)器人在這些環(huán)境中有效地工作,它們的形態(tài)至少在一定程度上需要模仿人類。這不僅僅是模仿人的外觀,機(jī)器人可能會(huì)配備有超出人類能力的傳感器或更多的附肢,以適應(yīng)和優(yōu)化其在人類環(huán)境中的性能和功能。
Aaron(波士頓動(dòng)力):類人形態(tài)并不是所有類型任務(wù)的理想選擇。以Stretch為例,最初受到Atlas機(jī)器人移動(dòng)箱子視頻的啟發(fā),對開發(fā)一種專門的箱子搬運(yùn)機(jī)器人產(chǎn)生了興趣。但是,僅僅因?yàn)槿祟惪梢园徇\(yùn)箱子,并不意味著人形就是執(zhí)行此類任務(wù)的最佳形態(tài)。因此,我們設(shè)計(jì)了Stretch,這款機(jī)器人專為搬運(yùn)箱子而生,它在完成這一任務(wù)時(shí)的效率和效果遠(yuǎn)超人類。盡管如此,我們依然對追求多功能通用機(jī)器人技術(shù)抱有長遠(yuǎn)的興趣,畢竟人形設(shè)計(jì)與我們的生活環(huán)境極為契合。
下一個(gè)機(jī)器人技術(shù)落地場景
Max(豐田汽車先進(jìn)AI研究所):農(nóng)業(yè)領(lǐng)域蘊(yùn)含巨大的潛力和需求,但同時(shí),許多農(nóng)業(yè)任務(wù)因其戶外執(zhí)行和非結(jié)構(gòu)化的環(huán)境特征,帶來了極大的挑戰(zhàn)。
Matthew(CMU):農(nóng)業(yè)領(lǐng)域超越了傳統(tǒng)的制造業(yè)和倉儲(chǔ)業(yè),為機(jī)器人技術(shù)提供了一個(gè)廣闊的應(yīng)用平臺(tái),這里面涉及到解決勞動(dòng)力短缺、提升作業(yè)效率和推動(dòng)可持續(xù)發(fā)展等多重挑戰(zhàn)。同時(shí),在運(yùn)輸和末端配送領(lǐng)域,機(jī)器人技術(shù)也被寄予厚望,它們有望極大提高效率、減少成本并提升整體服務(wù)質(zhì)量。隨著技術(shù)的不斷進(jìn)步和監(jiān)管環(huán)境的逐步優(yōu)化,預(yù)計(jì)這些領(lǐng)域?qū)?huì)加速采納機(jī)器人技術(shù),以應(yīng)對各種挑戰(zhàn)和需求。
Aaron(波士頓動(dòng)力):在考慮如何將客戶需求與前沿技術(shù)相結(jié)合時(shí),制造業(yè)和物流業(yè)依然是關(guān)注的重點(diǎn)。隨著視野的不斷擴(kuò)大,我預(yù)見我們將逐步進(jìn)入到更加復(fù)雜和不確定的環(huán)境中。繼制造業(yè)和物流業(yè)這些對自動(dòng)化極為友好的領(lǐng)域廣泛采用機(jī)器人技術(shù)之后,建筑業(yè)和醫(yī)療保健等行業(yè)可能會(huì)成為下一波機(jī)器人技術(shù)應(yīng)用的熱點(diǎn)。這些行業(yè)因其對大量勞動(dòng)力及對高技能勞動(dòng)力的強(qiáng)烈需求,在勞動(dòng)力供應(yīng)短缺的情況下,顯得尤為具有吸引力。將機(jī)器人技術(shù)應(yīng)用于這些位于高度結(jié)構(gòu)化工業(yè)環(huán)境和完全非結(jié)構(gòu)化消費(fèi)市場之間的領(lǐng)域,可能成為實(shí)現(xiàn)更廣泛應(yīng)用的自然而然的下一步。
隨著勞動(dòng)力短缺和人口結(jié)構(gòu)變化,對應(yīng)的機(jī)器人技術(shù)機(jī)遇也在持續(xù)增長。這影響了從農(nóng)業(yè)到最后一公里配送,再到零售等各行各業(yè)的機(jī)器人企業(yè)。
構(gòu)建適用于各類自主機(jī)器人的3D虛擬世界是一項(xiàng)關(guān)鍵挑戰(zhàn),這對于模擬和測試系統(tǒng)是至關(guān)重要的。同時(shí),生成式人工智能將為開發(fā)者快速構(gòu)建逼真模擬環(huán)境提供支持。將AI技術(shù)集成進(jìn)機(jī)器人技術(shù)將有助于提升在各種活躍的非傳統(tǒng)“機(jī)器人友好”環(huán)境中的自動(dòng)化水平。
Ken(加州大學(xué)伯克利分校):未來,制造業(yè)和倉庫中的機(jī)器人數(shù)量將遠(yuǎn)超今日。自動(dòng)駕駛出租車在舊金山等復(fù)雜的駕駛環(huán)境中取得的最新進(jìn)展,的確令人矚目。然而,對于其成本效益,我仍持謹(jǐn)慎觀望態(tài)度。在機(jī)器人輔助手術(shù)領(lǐng)域,研究人員正在探索“增強(qiáng)靈活性”技術(shù),通過這項(xiàng)技術(shù),機(jī)器人能在執(zhí)行縫合等低級輔助任務(wù)中增強(qiáng)外科手術(shù)技能。
真正的通用機(jī)器人還有多遠(yuǎn)?
Dhruv (Meta):預(yù)計(jì)通用人工智能的實(shí)現(xiàn)還需要三十年時(shí)間。目前,我們所處的階段超出了任何有意義預(yù)測的范圍。實(shí)際上,對于那些宣稱“通用人工智能即將到來”的聲音,我們應(yīng)該保持一定的懷疑態(tài)度,并對此類過于樂觀的觀點(diǎn)持警惕心態(tài)。
Deepu(英偉達(dá)):我們持續(xù)見證機(jī)器人在智能化道路上的進(jìn)步,并能夠在特定環(huán)境中執(zhí)行更多種類的任務(wù)。我們的目標(biāo)是不斷解決特定任務(wù)的問題,同時(shí)提高機(jī)器人在各個(gè)領(lǐng)域的應(yīng)用性。然而,要達(dá)到真正全面自主的通用機(jī)器人,仍有漫長的路要走。
Matthew(CMU):能夠在多種環(huán)境下執(zhí)行廣泛任務(wù)的通用機(jī)器人,目前看來仍然是一個(gè)遙遠(yuǎn)的夢想。這不僅需要在人工智能、機(jī)器學(xué)習(xí)、材料科學(xué)以及控制系統(tǒng)等眾多領(lǐng)域取得突破,而且是一個(gè)逐漸演進(jìn)的過程。機(jī)器人技術(shù)將從專注于特定任務(wù)逐漸演化,最終擁有更廣泛的功能和通用性。
Russ(豐田汽車先進(jìn)AI研究所):對于我們的機(jī)器人從現(xiàn)有的專用模式向更加通用型的轉(zhuǎn)變,我持樂觀態(tài)度。盡管難以預(yù)測具體需要多長時(shí)間,但靈活的自動(dòng)化技術(shù)、多樣化的高混合制造、農(nóng)業(yè)機(jī)器人、前端服務(wù)機(jī)器人以及其他我們尚未預(yù)見的新興領(lǐng)域,都將從不斷增長的自主性和擴(kuò)展能力中受益。
Ken(加州大學(xué)伯克利分校):我不認(rèn)為我們在近期內(nèi)就能看到真正的通用人工智能(AGI)或通用機(jī)器人的出現(xiàn)。據(jù)我所知,目前沒有哪位機(jī)器人學(xué)家真正擔(dān)心機(jī)器人會(huì)在短期內(nèi)取代人類工作或主宰人類。
Aaron(波士頓動(dòng)力):在通用機(jī)器人的實(shí)現(xiàn)之路上,我們正面臨諸多挑戰(zhàn)。雖然專用機(jī)器人已在工業(yè)自動(dòng)化中成為常規(guī)配置,但真正多功能機(jī)器人的發(fā)展才剛剛起步。要成為真正的通用機(jī)器人,它們必須能夠自主地在非結(jié)構(gòu)化環(huán)境中導(dǎo)航,并能解決前所未有的問題。此外,這些進(jìn)步需要建立在獲得用戶信任和滿足其需求的基礎(chǔ)上,同時(shí)還必須以有競爭力的價(jià)格提供相應(yīng)的價(jià)值。然而,令人鼓舞的是,我們正見證這個(gè)領(lǐng)域的重要性日益增長,以及公眾興趣的顯著提升。我們的孩子們從小便開始接觸機(jī)器人技術(shù),而新一代的畢業(yè)生們正致力于推動(dòng)技術(shù)革新。如今,我們面對的為工業(yè)客戶創(chuàng)造價(jià)值的挑戰(zhàn),正鋪就著通向明天消費(fèi)者市場機(jī)遇以及我們共同期待的通用機(jī)器人未來的道路。
家庭機(jī)器人(除了吸塵器之外)會(huì)在未來十年內(nèi)蓬勃發(fā)展嗎?
Matthew(CMU):真正通用的機(jī)器人,能夠在多樣化環(huán)境中執(zhí)行廣泛任務(wù),可能尚處于遙遠(yuǎn)的未來。要達(dá)成這一目標(biāo),我們需要在人工智能、機(jī)器學(xué)習(xí)、材料科學(xué)以及控制系統(tǒng)等多個(gè)領(lǐng)域取得關(guān)鍵突破。機(jī)器人的演進(jìn),從執(zhí)行專門的特定任務(wù)到擁有多功能乃至達(dá)到通用性,是一個(gè)漸進(jìn)的演化過程。
Deepu(英偉達(dá)):未來,家庭將迎來更多實(shí)用的機(jī)器人,如個(gè)人助理、自動(dòng)割草機(jī)和輔助老年人的機(jī)器人等。然而,家用機(jī)器人的普及主要受限于成本與價(jià)值的平衡——消費(fèi)者愿意為這些機(jī)器人支付多少,以及它們能否提供等值的服務(wù)。例如,機(jī)器人吸塵器之所以流行,是因?yàn)樗鼈兙哂休^好的性價(jià)比。隨著技術(shù)進(jìn)步,機(jī)器人變得更加智能,擁有用戶友好的界面是其被廣泛采用的關(guān)鍵因素。相比于需要復(fù)雜編程的機(jī)器人,能夠自主繪制環(huán)境地圖和通過語音指令操作的機(jī)器人將更易被家庭用戶接受。
而在家用機(jī)器人的下一波普及浪潮中,我們可能首先看到的是那些專注于戶外活動(dòng)的機(jī)器人,如自動(dòng)草坪護(hù)理機(jī)器人。同時(shí),個(gè)人/健康護(hù)理助手等其他類型的家用機(jī)器人雖展現(xiàn)出潛力,但要真正進(jìn)入千家萬戶,它們還需要克服家庭環(huán)境中動(dòng)態(tài)且非結(jié)構(gòu)化的復(fù)雜挑戰(zhàn)。
Max(豐田汽車先進(jìn)AI研究所):家庭環(huán)境對于機(jī)器人來說構(gòu)成了巨大的挑戰(zhàn),因?yàn)槊總€(gè)家庭都擁有其獨(dú)特性,缺乏統(tǒng)一的結(jié)構(gòu)化環(huán)境,同時(shí)消費(fèi)者對價(jià)格極為敏感。盡管未來的發(fā)展難以精確預(yù)測,機(jī)器人技術(shù)正以驚人的速度不斷進(jìn)步。
Aaron(波士頓動(dòng)力):在接下來的十年里,我們可能會(huì)看到更多專注于特定任務(wù)的家用機(jī)器人進(jìn)入家庭,如Roomba這樣的清潔機(jī)器人,我們將發(fā)現(xiàn)更多具有明確價(jià)值的應(yīng)用場景。然而,真正能夠滿足廣泛消費(fèi)市場需求的多功能家用機(jī)器人普及還需時(shí)日。想象一下,在什么情況下你會(huì)愿意為一個(gè)機(jī)器人支付與汽車相當(dāng)?shù)膬r(jià)格?這可能會(huì)在機(jī)器人能夠提供與當(dāng)前交通工具相同的可靠性和價(jià)值時(shí)發(fā)生。
Ken(加州大學(xué)伯克利分校):我預(yù)計(jì),未來十年中,我們將看到更多負(fù)擔(dān)得起的家用機(jī)器人,它們能夠協(xié)助我們進(jìn)行日常整理,比如撿起地上的衣服、玩具和垃圾,并將其放置到指定位置。正如現(xiàn)代的吸塵器,盡管這些機(jī)器人可能偶爾會(huì)出錯(cuò),但它們將為家庭提供的便利,尤其是對于父母和老年人,將大大超過它們的局限性。
Dhruv (Meta):盡管機(jī)器人技術(shù)發(fā)展迅速,但核心技術(shù)尚未達(dá)到使其在家庭環(huán)境中廣泛應(yīng)用所需的成熟度。
哪些機(jī)器人領(lǐng)域尚未得到足夠的關(guān)注?
Aaron Saunders,波士頓動(dòng)力公司:當(dāng)前,人工智能及其為機(jī)器人技術(shù)等眾多行業(yè)帶來的變革潛力正在引發(fā)廣泛關(guān)注。盡管人工智能在這些領(lǐng)域扮演著關(guān)鍵角色,希望開啟長期靜止不變的領(lǐng)域,但優(yōu)秀的機(jī)器人產(chǎn)品并非僅僅由簡單的二進(jìn)制代碼組成。為了讓人工智能在物理世界中實(shí)現(xiàn)其功能,與環(huán)境互動(dòng),我們需要不斷跟進(jìn)計(jì)算技術(shù)、感知傳感器、電源管理等所有構(gòu)成機(jī)器人系統(tǒng)的關(guān)鍵技術(shù)的最新發(fā)展。汽車行業(yè)近期向電氣化和高級駕駛輔助系統(tǒng)的轉(zhuǎn)變正在迅速改造龐大的供應(yīng)鏈,帶來前所未有的機(jī)遇。顯卡、計(jì)算機(jī)及越來越復(fù)雜的人工智能輔助消費(fèi)電子產(chǎn)品的進(jìn)步為整個(gè)行業(yè)注入了新的活力。這些深遠(yuǎn)且鮮為人知的技術(shù)變革是機(jī)器人技術(shù)中最令人興奮的發(fā)展趨勢之一,它使得許多創(chuàng)新型小公司能夠借助業(yè)界巨頭的支持,推出新穎且引人注目的產(chǎn)品。
Ken(加州大學(xué)伯克利分校):提及機(jī)器人運(yùn)動(dòng)規(guī)劃,它是機(jī)器人學(xué)領(lǐng)域中最古老而深入的研究課題之一,主要關(guān)注如何控制電機(jī)關(guān)節(jié)以實(shí)現(xiàn)機(jī)器人工具的精確移動(dòng)和避免障礙。雖然有些人可能認(rèn)為這個(gè)問題已經(jīng)被解決,但現(xiàn)實(shí)情況遠(yuǎn)非如此。機(jī)器人技術(shù)中的“奇點(diǎn)”問題是所有機(jī)器人手臂普遍面臨的一個(gè)核心挑戰(zhàn),它與人們所想象的機(jī)器人技術(shù)的極限大不相同。機(jī)器人奇點(diǎn)是指在特定的空間位置,機(jī)器人意外停止并需要人工重置的情況。這是由于將預(yù)期的直線移動(dòng)轉(zhuǎn)化為六個(gè)機(jī)器人關(guān)節(jié)電機(jī)各自動(dòng)作的復(fù)雜數(shù)學(xué)運(yùn)算導(dǎo)致的。在某些特定的空間位置,這種轉(zhuǎn)換可能變得不穩(wěn)定,需要機(jī)器人進(jìn)行重置。這個(gè)問題的復(fù)雜性和持續(xù)性表明了機(jī)器人運(yùn)動(dòng)規(guī)劃領(lǐng)域仍然有巨大的研究和改進(jìn)空間。
對于重復(fù)性的機(jī)器人動(dòng)作,可以通過繁瑣的手動(dòng)微調(diào)來避免奇點(diǎn),確保機(jī)器人的連貫性運(yùn)動(dòng)。一旦設(shè)定好,這些動(dòng)作可以持續(xù)準(zhǔn)確地重復(fù)執(zhí)行。然而,在機(jī)器人運(yùn)動(dòng)需求多樣化的新興領(lǐng)域,比如碼垛、抓取作業(yè)、訂單處理和包裹排序等,奇點(diǎn)問題變得更加常見。這些奇點(diǎn)在不可預(yù)測的時(shí)刻打斷機(jī)器人的操作,頻繁發(fā)生,成為了眾所周知的一個(gè)問題。為了解決這一挑戰(zhàn),我共同創(chuàng)立了Jacobi Robotics。我們采用高效算法,保證機(jī)器人避開奇點(diǎn),顯著提升了機(jī)器人的可靠性和生產(chǎn)效率。這一突破性進(jìn)展對所有采用機(jī)器人技術(shù)的行業(yè)來說,都意味著質(zhì)的飛躍,帶來了前所未有的穩(wěn)定性和效率。
Russ(豐田汽車先進(jìn)AI研究所):當(dāng)前,生成式人工智能以及硬件領(lǐng)域的顯著進(jìn)步和巨額投資頻頻成為話題。但在這些成就的背后,實(shí)際上是模擬技術(shù)領(lǐng)域一場靜默的革命。就在幾年前,大多數(shù)機(jī)器人學(xué)者還認(rèn)為在模擬環(huán)境中訓(xùn)練或測試計(jì)算機(jī)視覺系統(tǒng)是不切實(shí)際的;現(xiàn)在,這已經(jīng)成為了標(biāo)準(zhǔn)操作程序。盡管仍有一些研究者對完全在模擬中開發(fā)控制系統(tǒng)——例如靈巧手——并使其在現(xiàn)實(shí)世界中有效運(yùn)作持保留意見,但越來越多的趨勢和實(shí)踐正顯示出這一方向的發(fā)展?jié)摿?。Nvidia、Google DeepMind 和 TRI 等公司的大量投資正在推動(dòng)這一變革,我們有理由相信模擬技術(shù)的未來將更加廣闊,機(jī)器人技術(shù)的應(yīng)用也將因此變得更加高效和精確。
Dhruv (Meta):現(xiàn)在我們已經(jīng)能在真實(shí)的家庭環(huán)境中測試導(dǎo)航機(jī)器人,并且它們確實(shí)能夠有效地運(yùn)作!請注意,這些家庭導(dǎo)航機(jī)器人沒有自動(dòng)駕駛汽車在數(shù)百萬英里道路上構(gòu)建精確地圖的奢侈條件。我們簡單地將機(jī)器人置于一個(gè)新環(huán)境,并指導(dǎo)它尋找特定物品。
Deepu(英偉達(dá)):這突顯了對平臺(tái)方法的需求。許多機(jī)器人初創(chuàng)公司因?yàn)橹粚W⒂陂_發(fā)適用于特定任務(wù)或環(huán)境的解決方案而難以擴(kuò)展。為了商業(yè)化實(shí)現(xiàn)規(guī)模化并具有可行性,開發(fā)出能廣泛適用、快速學(xué)習(xí)新技能和適應(yīng)新環(huán)境的通用機(jī)器人是至關(guān)重要的。機(jī)器人學(xué)家需要一個(gè)集成了工具和庫的平臺(tái),以便訓(xùn)練和測試機(jī)器人AI,這個(gè)平臺(tái)應(yīng)當(dāng)提供模擬能力,以訓(xùn)練模型、生成合成數(shù)據(jù),并測試整個(gè)機(jī)器人軟件堆棧。同時(shí),它還應(yīng)當(dāng)能夠在機(jī)器人上實(shí)時(shí)運(yùn)行最新和新興的生成式人工智能模型。未來成功的初創(chuàng)公司和機(jī)器人企業(yè)將專注于開發(fā)新的機(jī)器人技能和自動(dòng)化任務(wù),并充分利用全面的端到端開發(fā)平臺(tái)。
Matthew(CMU):盡管機(jī)器人技術(shù)在某些特定細(xì)分市場和特定行業(yè)中取得了顯著進(jìn)步并且成功應(yīng)用,這些成就往往被那些更加具有未來感或廣泛適用性的機(jī)器人概念所遮蔽。在農(nóng)業(yè)、醫(yī)療保健或特定工業(yè)應(yīng)用等領(lǐng)域中,穩(wěn)步取得的成功案例同樣至關(guān)重要。它們代表了機(jī)器人技術(shù)在實(shí)際應(yīng)用中的真正和具體進(jìn)展,理應(yīng)受到更廣泛的關(guān)注和認(rèn)可。這些進(jìn)步不僅彰顯了技術(shù)的實(shí)用價(jià)值,也為機(jī)器人技術(shù)的未來發(fā)展和廣泛應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。
審核編輯:黃飛
?
評論
查看更多