0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT已能操控機(jī)器人,工程師連代碼都不用寫(xiě)

新機(jī)器視覺(jué) ? 來(lái)源:量子位 ? 2023-03-27 11:13 ? 次閱讀

當(dāng)我還在跟ChatGPT吹牛尬聊時(shí),有人已經(jīng)在拿它操控機(jī)器人了。

不是別人,正是OpenAI的金主爸爸、不久前剛拿ChatGPT“重新發(fā)明搜索引擎”的微軟。

472743b0-cbdd-11ed-bfe3-dac502259ad0.png

到目前為止,開(kāi)發(fā)者調(diào)教機(jī)器人不僅技術(shù)門(mén)檻高,還道阻且長(zhǎng):

工程師需要在工作流程回路中,不斷手寫(xiě)新代碼和規(guī)范來(lái)糾正機(jī)器人行為;另外,操控不同的機(jī)器人可能需要不同的編程語(yǔ)言和環(huán)境。

4749d088-cbdd-11ed-bfe3-dac502259ad0.png

而在ChatGPT的幫助下,工程師甚至不用手寫(xiě)代碼——直接用人話(huà)描述想做什么,AI就能自動(dòng)翻譯成機(jī)器語(yǔ)言。

47859e56-cbdd-11ed-bfe3-dac502259ad0.png

這意味著,一方面專(zhuān)業(yè)人士與機(jī)器人的交互效率起飛;另一方面,技術(shù)門(mén)檻也降低一大截,外行人甚至也能參與調(diào)試,創(chuàng)造出更多使用方法。

舉個(gè)簡(jiǎn)單的例子:讓無(wú)人機(jī)自動(dòng)檢查貨架。

首先,操作者只需用自然語(yǔ)言給ChatGPT提出要求;然后,AI就能自動(dòng)翻譯成代碼,并指揮無(wú)人機(jī)行動(dòng)。(還可以規(guī)定無(wú)人機(jī)的飛行路徑。)

47ab8562-cbdd-11ed-bfe3-dac502259ad0.gif

難怪特斯拉前AI主管Andrej Karpathy會(huì)調(diào)侃:

最新的熱門(mén)編程語(yǔ)言是英語(yǔ)。

47f419f8-cbdd-11ed-bfe3-dac502259ad0.png

一個(gè)AI指揮多種機(jī)器人

實(shí)際上,ChatGPT會(huì)玩兒的花樣可多了。

比如,一位操作者跟AI說(shuō):“我渴了,請(qǐng)幫我找個(gè)喝的?!?/p>

此時(shí)AI并不會(huì)直愣愣地就去找水了,而是會(huì)很機(jī)靈地反問(wèn):

請(qǐng)問(wèn)你想喝哪種?這里有好幾種飲料,比如椰子水、可樂(lè)等等。

48077476-cbdd-11ed-bfe3-dac502259ad0.png

當(dāng)然操作者也不是吃素的,他并未直接告訴AI選哪個(gè),而是說(shuō):“我剛從健身房回來(lái),請(qǐng)幫我找個(gè)健康點(diǎn)兒的飲料?!?/p>

然后更神奇的操作就開(kāi)始了:

AI先是猜測(cè)他想喝椰子水,然后自己噼里啪啦寫(xiě)出一段代碼(甚至還有注釋?zhuān)?/p>

4827039a-cbdd-11ed-bfe3-dac502259ad0.gif

寫(xiě)完就自己指揮無(wú)人機(jī)去找椰子水:

483a13a4-cbdd-11ed-bfe3-dac502259ad0.gif

除了無(wú)人機(jī),ChatGPT還能輕松操控別的小機(jī)器人,包括攝像頭、機(jī)械臂等等。

比如讓攝像頭在房間里找出能加熱午飯的東西。

4878dddc-cbdd-11ed-bfe3-dac502259ad0.gif

還有指揮機(jī)械臂拼出一個(gè)微軟的Logo。(悄悄夾帶私貨)

48c23a7c-cbdd-11ed-bfe3-dac502259ad0.gif

看到這些,有網(wǎng)友腦洞大開(kāi),有人發(fā)問(wèn):

他們是不是正在建立無(wú)所不能的天網(wǎng)?

49382ade-cbdd-11ed-bfe3-dac502259ad0.png

還有人甚至調(diào)侃稱(chēng),AI可能連發(fā)射核彈的指令都會(huì)寫(xiě):

49512cc8-cbdd-11ed-bfe3-dac502259ad0.png

不過(guò)話(huà)說(shuō)回來(lái),其實(shí)離網(wǎng)友說(shuō)的這些還差得遠(yuǎn),畢竟現(xiàn)在還是需要人類(lèi)參與的。

怎么實(shí)現(xiàn)的?

從前文可以看出,這只靈活的AI不僅與人交流暢通無(wú)阻,而且和機(jī)器也能快速溝通。

這主要得益于微軟團(tuán)隊(duì)專(zhuān)門(mén)開(kāi)發(fā)的一系列API和高級(jí)函數(shù)庫(kù)。

49716844-cbdd-11ed-bfe3-dac502259ad0.png

他們沒(méi)有讓ChatGPT背后的語(yǔ)言大模型(LLM),生成某固定種類(lèi)的代碼;因?yàn)闄C(jī)器人是個(gè)多元化領(lǐng)域,這樣可能會(huì)在不同場(chǎng)景下涉及大量微調(diào)。

而在新穎的操作框架下,不同機(jī)器人,都有自己對(duì)應(yīng)的特定函數(shù)庫(kù)。

——一個(gè)AI,就能適應(yīng)不同的對(duì)象、不同的任務(wù)。

一方面,這些函數(shù)庫(kù),能夠連接到機(jī)器人控制系統(tǒng)中管理底層硬件,以及執(zhí)行基本運(yùn)動(dòng)的代碼和功能模塊。

另一方面,為了讓ChatGPT也能遵循函數(shù)庫(kù)的規(guī)則,預(yù)定義函數(shù)命名就很關(guān)鍵。清晰的函數(shù)名,能讓各API之間建立良好的功能連接,最終生成高質(zhì)量的回答。

其中一項(xiàng)要求,就是所有API名稱(chēng)必須描述整體功能行為。例如,detect_object(object_name) 函數(shù)可以在內(nèi)部鏈接到OpenCV函數(shù)或計(jì)算機(jī)視覺(jué)模型。

設(shè)計(jì)好庫(kù)和API后,微軟給ChatGPT編寫(xiě)了一個(gè)文本提示(prompt),描述目標(biāo)任務(wù),并明確說(shuō)明函數(shù)庫(kù)中哪些函數(shù)可用;另外,這還能規(guī)定ChatGPT生成代碼用哪種編程語(yǔ)言。

4995e1f6-cbdd-11ed-bfe3-dac502259ad0.png

值得一提的是,AI生成內(nèi)容效果,和人為提示的質(zhì)量呈正相關(guān)。為此,微軟還開(kāi)發(fā)了一個(gè)協(xié)作開(kāi)源平臺(tái)PromptCraft,任何人都能在此分享不同類(lèi)機(jī)器人的Prompt策略。

49bf6e4a-cbdd-11ed-bfe3-dac502259ad0.png

到此,幕后部署基本完成,然后用戶(hù)就能通過(guò)“說(shuō)人話(huà)”間接操控機(jī)器人了。

如果想要檢查AI生成的代碼是否有Bug,隨時(shí)都能在聊天框直接檢查,或通過(guò)模擬器測(cè)試,人類(lèi)可以用自然語(yǔ)言指導(dǎo)AI進(jìn)行修正。

另外,還能到等到用戶(hù)對(duì)解決方案滿(mǎn)意為止,再在將ChatGPT生成代碼部署到機(jī)器人上。

最后,如果是你,會(huì)想用ChatGPT操控機(jī)器人做些什么呢?

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28418

    瀏覽量

    207096
  • 編程語(yǔ)言
    +關(guān)注

    關(guān)注

    10

    文章

    1945

    瀏覽量

    34736
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1561

    瀏覽量

    7670

原文標(biāo)題:ChatGPT已能操控機(jī)器人,工程師連代碼都不用寫(xiě),網(wǎng)友:微軟在搞天網(wǎng)?

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    《具身智能機(jī)器人系統(tǒng)》第7-9章閱讀心得之具身智能機(jī)器人與大模型

    研讀《具身智能機(jī)器人系統(tǒng)》第7-9章,我被書(shū)中對(duì)大模型與機(jī)器人技術(shù)融合的深入分析所吸引。第7章詳細(xì)闡述了ChatGPT for Robotics的核心技術(shù)創(chuàng)新:它摒棄了傳統(tǒng)的分層控制架構(gòu),創(chuàng)造性地
    發(fā)表于 12-24 15:03

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    的快速發(fā)展,相關(guān)人才的需求也在不斷增加,通過(guò)閱讀該書(shū)可以幫助大家系統(tǒng)性地了解和分析當(dāng)前具身智能機(jī)器人系統(tǒng)的發(fā)展現(xiàn)狀和前沿研究,為未來(lái)的研究和開(kāi)發(fā)工作提供指導(dǎo)。此外,本書(shū)還可以為研究人員和工程師提供具體
    發(fā)表于 12-20 19:17

    《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    與環(huán)境持續(xù)互動(dòng)來(lái)優(yōu)化決策策略。書(shū)中還進(jìn)一步討論了強(qiáng)化學(xué)習(xí)的基本原理,包括狀態(tài)空間、動(dòng)作空間、獎(jiǎng)勵(lì)函數(shù)的設(shè)計(jì),以及策略網(wǎng)絡(luò)的訓(xùn)練方法。 具身智能機(jī)器人系統(tǒng)是一個(gè)多學(xué)科知識(shí)交叉的復(fù)雜工程體系。每個(gè)子系統(tǒng)都
    發(fā)表于 12-19 22:26

    鴻蒙機(jī)器人與鴻蒙開(kāi)發(fā)板聯(lián)動(dòng)演示

    鴻蒙機(jī)器人與鴻蒙開(kāi)發(fā)板聯(lián)動(dòng)演示,機(jī)器人的角色為迎賓機(jī)器人,開(kāi)發(fā)板負(fù)責(zé)人賓客出現(xiàn)監(jiān)聽(tīng)
    發(fā)表于 12-02 14:55

    特斯拉招募軟件工程師強(qiáng)化無(wú)人駕駛與機(jī)器人遠(yuǎn)程操作

    近日,據(jù)外媒最新報(bào)道,特斯拉正緊鑼密鼓地招募軟件工程師團(tuán)隊(duì),旨在加強(qiáng)其無(wú)人駕駛出租車(chē)及Optimus機(jī)器人的遠(yuǎn)程操作能力。這一舉措標(biāo)志著特斯拉在推動(dòng)自動(dòng)駕駛與人工智能領(lǐng)域邁出了重要一步。 特斯拉此次
    的頭像 發(fā)表于 11-27 10:26 ?553次閱讀

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個(gè)浪潮!

    的社會(huì)環(huán)境。 具身智能機(jī)器人在解決實(shí)際問(wèn)題中展現(xiàn)出巨大的潛力,例如,應(yīng)用在養(yǎng)老、醫(yī)療、災(zāi)害救援等領(lǐng)域。本書(shū)可以為研究人員和工程師提供具體的技術(shù)解決方案,幫助他們更好地應(yīng)用技術(shù),解決現(xiàn)實(shí)中的各種問(wèn)題。 申請(qǐng)
    發(fā)表于 11-11 10:20

    工程師組裝復(fù)合機(jī)器人 #智能機(jī)器人 #人工智能

    機(jī)器人
    fuweizn
    發(fā)布于 :2024年10月29日 18:07:20

    ChatGPT 與傳統(tǒng)聊天機(jī)器人的比較

    隨著人工智能技術(shù)的飛速發(fā)展,聊天機(jī)器人已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠?。從?jiǎn)單的客服助手到復(fù)雜的個(gè)人助理,這些虛擬助手正在逐漸改變我們與技術(shù)的互動(dòng)方式。在眾多聊天機(jī)器人中,ChatGPT無(wú)疑是
    的頭像 發(fā)表于 10-25 16:16 ?564次閱讀

    “0元購(gòu)”智元靈犀X1機(jī)器人,軟硬件全套圖紙和代碼全公開(kāi)!資料免費(fèi)下載!

    出定制化的運(yùn)動(dòng)控制策略。尤其是專(zhuān)業(yè)人士或初創(chuàng)團(tuán)隊(duì),基于智元提供的核心組件,可以輕松打造出個(gè)性化的人形機(jī)器人產(chǎn)品,并借助開(kāi)源代碼快速完成整機(jī)工程,極大地降低了研發(fā)成本和門(mén)檻。 智元靈犀X1的正式開(kāi)源,旨在
    發(fā)表于 10-25 15:20

    機(jī)器人仿真的類(lèi)型和優(yōu)勢(shì)

    機(jī)器人仿真使機(jī)器人工程師和研究人員能夠創(chuàng)建機(jī)器人及其環(huán)境的虛擬模型。這項(xiàng)技術(shù)支持在仿真的無(wú)風(fēng)險(xiǎn)環(huán)境中測(cè)試和驗(yàn)證機(jī)器人設(shè)計(jì)與控制算法以及與各種元素進(jìn)行交互。通過(guò)使用仿真軟件,可以預(yù)測(cè)和分
    的頭像 發(fā)表于 10-14 10:43 ?514次閱讀
    <b class='flag-5'>機(jī)器人</b>仿真的類(lèi)型和優(yōu)勢(shì)

    Meta人工智能聊天機(jī)器人進(jìn)軍新市場(chǎng),挑戰(zhàn)ChatGPT

    Meta近日宣布,其人工智能聊天機(jī)器人將進(jìn)軍21個(gè)新市場(chǎng),與OpenAI的ChatGPT展開(kāi)激烈競(jìng)爭(zhēng)。
    的頭像 發(fā)表于 10-11 16:29 ?309次閱讀

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說(shuō),薩科微Al大模型機(jī)器人有哪些的優(yōu)勢(shì)?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開(kāi)發(fā),與同行相比具有許多優(yōu)勢(shì):語(yǔ)言
    發(fā)表于 07-05 08:52

    NVIDIA發(fā)布幾項(xiàng)新功能來(lái)幫助機(jī)器人專(zhuān)家和工程師打造智能機(jī)器人

    ? 機(jī)器人技術(shù)在智能制造設(shè)施、商用廚房、醫(yī)院、倉(cāng)儲(chǔ)物流和農(nóng)業(yè)領(lǐng)域等各種環(huán)境中的應(yīng)用正在迅速擴(kuò)大。該行業(yè)正在向智能自動(dòng)化轉(zhuǎn)型,因此要求機(jī)器人具備更強(qiáng)的能力來(lái)執(zhí)行感知、測(cè)繪、導(dǎo)航、負(fù)載處理、物體抓取
    的頭像 發(fā)表于 06-29 15:14 ?1124次閱讀
    NVIDIA發(fā)布幾項(xiàng)新功能來(lái)幫助<b class='flag-5'>機(jī)器人</b>專(zhuān)家和<b class='flag-5'>工程師</b>打造智能<b class='flag-5'>機(jī)器人</b>

    嵌入式軟件工程師和硬件工程師的區(qū)別?

    、機(jī)器人等。 定義和工作職責(zé) 嵌入式軟件工程師的主要職責(zé)包括但不限于:設(shè)計(jì)、開(kāi)發(fā)、測(cè)試和調(diào)試嵌入式軟件應(yīng)用程序,以滿(mǎn)足特定硬件和軟件要求。他們需要理解并掌握嵌入式系統(tǒng)的基本原理,熟悉相關(guān)硬件接口
    發(fā)表于 05-16 11:00