0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

成都匯陽投資關(guān)于具身機(jī)器人將大大擴(kuò)展AI的生命力!

話說科技 ? 來源:話說科技 ? 作者:話說科技 ? 2023-06-12 17:16 ? 次閱讀

2023年5月,在ITF World 2023半導(dǎo)體大會上,英偉達(dá)創(chuàng)始人兼CEO黃仁勛介紹了英偉達(dá)的多模態(tài)具身智能系統(tǒng)NvidiaVIMA,能在視覺文本提示的指導(dǎo)下,執(zhí)行復(fù)雜任務(wù)、獲取概念、理解邊界、甚至模擬物理學(xué),標(biāo)志著AI能力的顯著進(jìn)步。

此外,在特斯拉召開2023年年度股東大會上,馬斯克展示了人形機(jī)器人Optimus的全新型號,和具身智能機(jī)器人幾乎劃等。馬斯克表示,人形機(jī)器人將是今后特斯拉主要的長期價值來源,他也認(rèn)為以具身智能機(jī)器人為代表的產(chǎn)品有望成為人工智能的下一浪潮。

具身智能涉及多學(xué)科

具身智能有望打開 AI 新空間,引領(lǐng)人工智能下一站浪潮。實現(xiàn)具身智能需要多個學(xué)科的交叉能力。當(dāng)前具身智能產(chǎn)業(yè)鏈中包括數(shù)字基礎(chǔ)設(shè)施、機(jī)器人制造、機(jī)器視覺、多模態(tài)大模型的廠商等相關(guān)環(huán)節(jié)投資機(jī)會值得重點(diǎn)關(guān)注。機(jī)器人制造:為具身智能提供了機(jī)械的身體和基本的運(yùn)動控制。

深度學(xué)習(xí):該學(xué)科中的神經(jīng)網(wǎng)絡(luò)仍然是具身智能中主要的工具。為具身智能提供推理能力;強(qiáng)化學(xué)習(xí),從環(huán)境反饋中,幫助具身智能調(diào)優(yōu)模型。

多模態(tài):計算機(jī)視覺,為具身智能提供處理視覺信號能力;語音與自然語言處理,為具身智能提供理解與對話能力,實現(xiàn)與人類交互。

計算機(jī)圖形學(xué):其開發(fā)的物理仿真環(huán)境給具身智能提供了真實物理世界的替代,大大加快了學(xué)習(xí)的速度并降低了成本。認(rèn)識科學(xué):幫助具身智能理解人類,構(gòu)建認(rèn)識與價值。

具身機(jī)器人技術(shù)架構(gòu)

具身智能的出現(xiàn)有望持續(xù)引領(lǐng)“大模型+機(jī)器人”潮流。具身智能機(jī)器人是具身智能的實體形態(tài),有望成為 AI 的最終載體。其整體架構(gòu)由感知層、交互層、運(yùn)動層組成。與工業(yè)機(jī)器人不同,具身智能機(jī)器人若能像人一樣與環(huán)境交互、感知、決策、完成任務(wù),將不得不提升感知層和認(rèn)知層的能力。因此,感知層和認(rèn)知層是工業(yè)機(jī)器人向具身智能機(jī)器人邁進(jìn)的門檻。

感知層類似人的五官,負(fù)責(zé)收集環(huán)境信息,在單一場景下機(jī)器或許可以通過感知來繞過決策控制。感知層中視覺的重要程度較高,視覺感知或是具身智能機(jī)器人的核心。

感知層需要與運(yùn)動層交互印證:首先視覺感知需要與物理實存進(jìn)行交互印證,是具身智能實現(xiàn)的基礎(chǔ);感知能力提升可使機(jī)器人運(yùn)動更加“擬人化”:視覺感知通過與運(yùn)動系統(tǒng)的執(zhí)行參量、信息數(shù)據(jù)交互修正,使具身機(jī)器人從傳統(tǒng)的僵化肢體運(yùn)動提升為為高自由度、高精密、多表現(xiàn)形式的運(yùn)動。

決策交互層作為核心處理樞紐,需要類似人類大腦的處理能力,滿足機(jī)器在理解指令、分解 任務(wù)、規(guī)劃子任務(wù)、識別物體完成人機(jī)交互和環(huán)境交互等方面的需求,多維度的人機(jī)交 互在傳統(tǒng)的機(jī)器人領(lǐng)域是一大難題。因而當(dāng)下的研究更多體現(xiàn)在特定指令下對于環(huán)境交互的探索,也即如何更智能地執(zhí)行特定物理任務(wù)上。

GPT-4 出現(xiàn)讓機(jī)器人對于現(xiàn)實世界中圖像、文字、數(shù)據(jù)的理解進(jìn)入新臺階。根據(jù)微軟最新的一項研究,將 GPT 拓展至機(jī)器人領(lǐng)域,實現(xiàn)語言控制機(jī)械臂、無人機(jī)等多個平臺。多模態(tài)的引入拓展了交互的豐富性,大幅提升人機(jī)交互和環(huán)境交互能力,助力機(jī)器人能 力再上新臺階。未來有望在更多場景落地應(yīng)用,包括自動駕駛、工業(yè)自動化、 醫(yī)療健康、家用服務(wù)、教育、娛樂等眾多領(lǐng)域,幫助人類實現(xiàn)極端環(huán)境作業(yè)、 多領(lǐng)域降本增效。

多模態(tài)大模型與機(jī)器的融合

具身智能作為人工智能重要應(yīng)用,需要多復(fù)合型的模型能力。阿里巴巴張勇表示制造業(yè)是 AI 大模型的重要戰(zhàn)場,未來 10 年最大的機(jī)會就在于云、AI 與物理世界機(jī)器的融合。

除了諸如視覺、自然語言處理等單領(lǐng)域模型的縱深發(fā)展,多模態(tài)大模型的加持或?qū)⒊蔀橄乱徊街匾膽?yīng)用方向。AIGC 為具身智能突破技術(shù)瓶頸提供新思路。AIGC的“智能”表現(xiàn)在能夠進(jìn)行上下文理解和情景感知,輸出文字、圖像、聲音。

進(jìn)入 AIGC 時代后,GPT 等大模型有望作為人類與機(jī)器人溝通的橋梁。即通過 將圖像、文字、具身數(shù)據(jù)聯(lián)合訓(xùn)練,并引入多模態(tài)輸入,增強(qiáng)模型對現(xiàn)實中對象的理 解,幫助機(jī)器人處理具身推理任務(wù)。AI 大模型浪潮下,谷歌、微軟、 阿里等巨頭均發(fā)力探索 AI大模型與具身智能的融合。目前,諸多大廠已在具身智能領(lǐng)域進(jìn)行布局,谷歌發(fā)布史上最大通才模型 PaLM-E;微軟探 索如何將 ChatGPT 擴(kuò)展到機(jī)器人領(lǐng)域;阿里巴巴-千問大模型正在實驗接入工業(yè)機(jī)器人等。

風(fēng)險揭示:信息出自公開數(shù)據(jù),內(nèi)容不做具體操作指導(dǎo),客戶 亦不應(yīng)將其作為投資決策的唯一參考因素。據(jù)此買入,責(zé)任自負(fù),股市有 風(fēng)險,投資需謹(jǐn)慎。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28607

    瀏覽量

    207865
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31399

    瀏覽量

    269787
收藏 人收藏

    評論

    相關(guān)推薦

    【「智能機(jī)器人系統(tǒng)」閱讀體驗】2.智能機(jī)器人的基礎(chǔ)模塊

    智能機(jī)器人的基礎(chǔ)模塊,這個是本書的第二部分內(nèi)容,主要分為四個部分:機(jī)器人計算系統(tǒng),自主機(jī)器人的感知系統(tǒng),自主
    發(fā)表于 01-04 19:22

    智能機(jī)器人系統(tǒng)》第10-13章閱讀心得之智能機(jī)器人計算挑戰(zhàn)

    閱讀《智能機(jī)器人系統(tǒng)》第10-13章,我對智能機(jī)器人的工程實踐有了全新認(rèn)識。第10章從實
    發(fā)表于 01-04 01:15

    【「智能機(jī)器人系統(tǒng)」閱讀體驗】+兩本互為支持的書

    最近在閱讀《智能機(jī)器人系統(tǒng)》這本書的同時,還讀了 《計算機(jī)視覺之PyTorch數(shù)字圖像處理》一書,這兩本書完全可以視為是互為依托的姊妹篇?!队嬎銠C(jī)視覺之PyTorch數(shù)字圖像處理》是介紹
    發(fā)表于 01-01 15:50

    【「智能機(jī)器人系統(tǒng)」閱讀體驗】2.智能機(jī)器人大模型

    近年來,人工智能領(lǐng)域的大模型技術(shù)在多個方向上取得了突破性的進(jìn)展,特別是在機(jī)器人控制領(lǐng)域展現(xiàn)出了巨大的潛力。在“智能機(jī)器人大模型”部分,作者研究并探討了大模型如何提升
    發(fā)表于 12-29 23:04

    【「智能機(jī)器人系統(tǒng)」閱讀體驗】1.初步理解智能

    的研發(fā)工作奠定了基礎(chǔ)。繼之而來,北京理工大學(xué)在2002年發(fā)布的“童”系列機(jī)器人,實現(xiàn)了無外接電纜的行走。 三、問題與挑戰(zhàn) 智能雖然取得了一定的進(jìn)展,但是也面臨著諸多的問題與挑戰(zhàn),
    發(fā)表于 12-28 21:12

    【「智能機(jī)器人系統(tǒng)」閱讀體驗】1.全書概覽與第一章學(xué)習(xí)

    景不確定性、產(chǎn)業(yè)鏈成本高企、系統(tǒng)集成難度大、數(shù)據(jù)瓶頸、倫理規(guī)范的挑戰(zhàn)。 其中系統(tǒng)集成難度大中,作者非常形象地智能機(jī)器人分解為“大腦”、“小腦”和“軀干”三個關(guān)鍵技術(shù),其中“大腦”
    發(fā)表于 12-27 14:50

    智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之智能機(jī)器人與大模型

    和經(jīng)驗積累,使機(jī)器人能夠自主發(fā)現(xiàn)工藝規(guī)律,優(yōu)化作業(yè)參數(shù)。家庭服務(wù)機(jī)器人則采用混合任務(wù)規(guī)劃策略:預(yù)訓(xùn)練的基礎(chǔ)技能與實時規(guī)劃相結(jié)合,靈活應(yīng)對開放環(huán)境中的各種情況。 第9章深入探討了元學(xué)習(xí)在
    發(fā)表于 12-24 15:03

    【「智能機(jī)器人系統(tǒng)」閱讀體驗】+初品的體驗

    智能機(jī)器人系統(tǒng)》 一書由甘一鳴、俞波、萬梓燊、劉少山老師共同編寫,其封面如圖1所示。 本書共由5部分組成,其結(jié)構(gòu)和內(nèi)容如圖2所示。 該書可作為高校和科研機(jī)構(gòu)的教材,為學(xué)生和研究人員提供系統(tǒng)
    發(fā)表于 12-20 19:17

    智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之智能機(jī)器人系統(tǒng)背景知識與基礎(chǔ)模塊

    要給AI這個聰明的“頭腦”裝上一副“身體”。這個“身體”可以是一部手機(jī),可以是一臺自動駕駛汽車。而人形機(jī)器人則是集各類核心尖端技術(shù)于一體的載體,是智能的代表產(chǎn)品。與傳統(tǒng)的軟件智能體
    發(fā)表于 12-19 22:26

    成都投資關(guān)于智能體時代來臨,智能有望成為最佳載體

    實際的執(zhí)行者,在物理或虛擬世界負(fù)責(zé)感知和執(zhí)行任務(wù),而智能體則是于本體之上的智能核心,負(fù)責(zé)感知、理解、決策、控制等核心工作。 區(qū)別于機(jī)器人
    的頭像 發(fā)表于 11-11 15:05 ?356次閱讀

    名單公布!【書籍評測活動NO.51】智能機(jī)器人系統(tǒng) | 了解AI的下一個浪潮!

    機(jī)器人全球供應(yīng)鏈的分布情況為例,智能機(jī)器人的核心元器件(包括 3D 視覺傳感器、六維傳感器、微型傳動系統(tǒng)、靈巧手與精密
    發(fā)表于 11-11 10:20

    智能在機(jī)器人技術(shù)中的發(fā)展

    智能(Embodied Intelligence)在機(jī)器人技術(shù)中的發(fā)展是人工智能領(lǐng)域的一個重要趨勢。以下是對智能在
    的頭像 發(fā)表于 10-27 09:48 ?795次閱讀

    控、柔性觸覺成為核心需要,機(jī)器人要打造怎樣的傳感系統(tǒng)

    機(jī)器人。 ? 業(yè)內(nèi)人士認(rèn)為,智能機(jī)器人是人工智能終極形態(tài)。智能
    的頭像 發(fā)表于 04-26 01:03 ?2558次閱讀
    <b class='flag-5'>力</b>控、柔性觸覺成為核心需要,<b class='flag-5'>機(jī)器人</b>要打造怎樣的<b class='flag-5'>具</b><b class='flag-5'>身</b>傳感系統(tǒng)

    廣和通發(fā)布基于高通高算芯片的智能機(jī)器人開發(fā)平臺Fibot

    3月29日,為助力機(jī)器人廠商客戶快速復(fù)現(xiàn)及驗證斯坦福Mobile ALOHA機(jī)器人的相關(guān)算法,廣和通發(fā)布智能機(jī)器人開發(fā)平臺Fibot。作
    發(fā)表于 03-29 14:17 ?364次閱讀
    廣和通發(fā)布基于高通高算<b class='flag-5'>力</b>芯片的<b class='flag-5'>具</b><b class='flag-5'>身</b>智能<b class='flag-5'>機(jī)器人</b>開發(fā)平臺Fibot

    廣和通發(fā)布基于高通高算芯片的智能機(jī)器人開發(fā)平臺Fibot

    3月29日,為助力機(jī)器人廠商客戶快速復(fù)現(xiàn)及驗證斯坦福Mobile ALOHA機(jī)器人的相關(guān)算法,廣和通發(fā)布智能機(jī)器人開發(fā)平臺Fibot。
    的頭像 發(fā)表于 03-29 11:16 ?733次閱讀