0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開發(fā)者說 | AI操控機(jī)器人系列第三期——語(yǔ)音控制

地瓜機(jī)器人 ? 2022-08-17 11:25 ? 次閱讀

摘要:

AI操控機(jī)器人系列第二期的人體跟隨教程中,身為地平線資深程序員的奶爸朱靠,使用地平線發(fā)布的機(jī)器人開發(fā)平臺(tái)TogetherROS軟件棧,搭建了人體跟隨機(jī)器人。

同為開發(fā)者的梁雪,期待AI的世界,想讓自己的生活也AI一把,并且一向是個(gè)能動(dòng)口絕不動(dòng)手的懶人,于是熱衷于體驗(yàn)各類AI機(jī)器人,尤其是動(dòng)動(dòng)口就能操控的機(jī)器人,想著有朝一日過上“能只動(dòng)口絕不動(dòng)手”的生活,于是乎,就有了下面的這些體驗(yàn)。

產(chǎn)品A:說說話確實(shí)是能跟著走一走,but,我真的不想說完話之后還需要自己向右轉(zhuǎn)才能引導(dǎo)它右轉(zhuǎn)呀……

產(chǎn)品B:為什么還是得動(dòng)動(dòng)手,遙控來操控……噢,可達(dá)不到懶人預(yù)期呢。

難道就沒有動(dòng)動(dòng)口就能讓機(jī)器人運(yùn)動(dòng),達(dá)到控制機(jī)器人的目的嗎?答案必然是,有!下面地平線AI操控機(jī)器人系列——語(yǔ)音控制閃亮登場(chǎng)。

一、功能介紹

大家先看一下最終實(shí)現(xiàn)的功能。

20220815-190006.gif

從開始語(yǔ)音到機(jī)器人依據(jù)指令快速且準(zhǔn)確的運(yùn)動(dòng),得益于地平線旭日??X3派上5Tops算力的BPU,可以實(shí)現(xiàn)低延遲算法推理能力,以及語(yǔ)音算法模塊實(shí)現(xiàn)的遠(yuǎn)場(chǎng)(3~5米)降噪、回聲消除,高準(zhǔn)確率的asr識(shí)別功能。開始碼代碼前,先來簡(jiǎn)單分析一下人體跟隨機(jī)器人需要具備哪些基本模塊。

語(yǔ)音輸入——麥克風(fēng)

旭日X3派采用的是麥克風(fēng)陣列硬件拾音,通過麥克風(fēng)采集到音頻之后交給后面的智能語(yǔ)音分析模塊處理。

智能語(yǔ)音感知

智能語(yǔ)音算法對(duì)原始音頻進(jìn)行處理,對(duì)音頻進(jìn)行降噪并且識(shí)別出語(yǔ)音,同時(shí)還能輸出語(yǔ)音聲源定位的DOA角度。

交互

識(shí)別出語(yǔ)音之后,定義并且實(shí)現(xiàn)不同語(yǔ)音對(duì)應(yīng)的不同功能應(yīng)用,比如“向前走”語(yǔ)音控制機(jī)器人向前運(yùn)動(dòng)。

控制

根據(jù)“交互”模塊輸出的控制指令,實(shí)現(xiàn)對(duì)機(jī)器人的機(jī)械控制。

機(jī)器人本體

當(dāng)然還需要一個(gè)具備運(yùn)動(dòng)能力的機(jī)器人本體,接收控制指令并控制電機(jī)運(yùn)動(dòng),最終實(shí)現(xiàn)通過語(yǔ)音控制機(jī)器人運(yùn)動(dòng)的效果。

地平線發(fā)布的機(jī)器人開發(fā)平臺(tái)TogetherROS軟件棧內(nèi)置了豐富易用的機(jī)器人開發(fā)組件,包含搭建一個(gè)智能機(jī)器人應(yīng)用(如機(jī)器人語(yǔ)音控制)所涉及到的所有功能模塊,完全開源免費(fèi),并允許開發(fā)者二次開發(fā)。

二、準(zhǔn)備工作

準(zhǔn)備搭建機(jī)器人人體跟隨應(yīng)用案例的硬件設(shè)備和軟件包。

硬件

①旭日X3派

3.png


②麥克風(fēng)陣列及轉(zhuǎn)接板

640.jpg


③機(jī)器人

5.png


本次使用本末的輪足機(jī)器人來介紹,沒有的開發(fā)者們也不用擔(dān)心,文章后面會(huì)介紹自己搭建機(jī)器人的方式。

安裝系統(tǒng)
參考旭日X3派的用戶手冊(cè)的安裝系統(tǒng)章節(jié),安裝完成(或者已經(jīng)安裝過)需要更新系統(tǒng)。

系統(tǒng)配置
配置旭日X3派的無線網(wǎng)絡(luò),參考旭日X3派的用戶手冊(cè)的無線網(wǎng)絡(luò)章節(jié)。

安裝TogetherROS
使用apt命令通過DEB包安裝TogetherROS。登錄旭日X3派ssh root@192.168.1.147,執(zhí)行命令:

root@ubuntu:~# sudo apt install hhp
root@ubuntu:/userdata# ls /opt/
tros

可以看到TogetherROS已安裝在/opt目錄下,說明安裝成功。至此,準(zhǔn)備工作結(jié)束,下面開始使用這些硬件設(shè)備和軟件包搭建機(jī)器人人體跟隨App。

三、使用介紹

接下來開始操作各個(gè)功能模塊,再一步步組裝起來,分別驗(yàn)證其功能。

安裝音頻麥克風(fēng)

首先需要將旭日X3派與音頻轉(zhuǎn)接板連接起來,安裝好的旭日X3派以及音頻板圖如下:

接口.jpg


直接使用TogetherROS中的ROS package測(cè)試麥克風(fēng)陣列的功能,通過腳本加載麥克風(fēng)陣列驅(qū)動(dòng),并且啟動(dòng)智能語(yǔ)音識(shí)別模塊。登錄旭日X3派ssh root@192.168.1.147后,在終端(以下默認(rèn)終端都是通過ssh登錄)中輸入以下命令啟動(dòng):

# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
# 從TogetherROS的安裝路徑中拷貝出運(yùn)行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加載音頻驅(qū)動(dòng),設(shè)備啟動(dòng)之后只需要加載一次
bash config/audio.sh
#啟動(dòng)launch文件
ros2 launch hobot_audio hobot_audio.launch.py

智能語(yǔ)音識(shí)別模塊默認(rèn)發(fā)布的智能語(yǔ)音消息話題名為:/audio_smart, 在另一個(gè)終端執(zhí)行使用ros2 topic list命令可以查詢到此topic信息

$ ros2 topic list
/audio_smart

語(yǔ)音識(shí)別和命令詞控制小車運(yùn)動(dòng)功能

旭日X3派上打開一個(gè)終端,啟動(dòng)語(yǔ)音識(shí)別和控制的腳本

# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
# 從TogetherROS的安裝路徑中拷貝出運(yùn)行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加載音頻驅(qū)動(dòng),設(shè)備啟動(dòng)之后只需要加載一次
bash config/audio.sh
#啟動(dòng)launch文件
ros2 launch audio_control hobot_audio_control.launch.py

在當(dāng)前終端執(zhí)行ros2 topic echo /cmd_vel命令查詢旭日X3派上的話題信息,當(dāng)語(yǔ)音控制“向前走”,終端輸出如下:

linear:
  x: 0.30000001192092896
  y: 0.0
  z: 0.0
angular:
  x: 0.0
  y: 0.0
  z: 0.0

說明智能語(yǔ)音識(shí)別算法和交互功能的軟件包已安裝成功,并能夠通過/cmd_vel話題對(duì)外發(fā)布機(jī)器人運(yùn)動(dòng)控制消息。

將旭日X3派安裝在機(jī)器人上

首先,需要將音頻板安裝在旭日X3派上,其次,將安裝了線性四麥麥克風(fēng)陣列的旭日X3派直接固定在機(jī)器人上,并將機(jī)器人的USB控制接口插到旭日X3派上。安裝效果如下圖:

10 (3).jpg

安裝好后,可以通過控制機(jī)器人運(yùn)動(dòng)查看是否成功安裝。在旭日X3派上啟動(dòng)本末雙足機(jī)器人運(yùn)行控制Node,打開一個(gè)終端,執(zhí)行如下命令:

# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
#啟動(dòng)本末機(jī)器人運(yùn)動(dòng)控制package
ros2 run diablo_sdk ros_bridge_example

旭日X3派上重新打開一個(gè)終端,通過發(fā)布/cmd_vel話題消息控制機(jī)器人以0.3r/s的速度轉(zhuǎn)動(dòng):


# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
ros2 topic pub -r 10 /cmd_vel geometry_msgs/Twist '{linear: {x: 0, y: 0, z: 0}, angular: {x: 0, y: 0, z: 0.3}}'

機(jī)器人收到控制指令后轉(zhuǎn)動(dòng)的效果如下:

轉(zhuǎn).gif

四、完整的機(jī)器人語(yǔ)音控制效果

旭日X3派上打開一個(gè)終端,啟動(dòng)智能語(yǔ)音識(shí)別和語(yǔ)音控制腳本

# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
# 從TogetherROS的安裝路徑中拷貝出運(yùn)行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加載音頻驅(qū)動(dòng),設(shè)備啟動(dòng)只需要加載一次
bash config/audio.sh
#啟動(dòng)語(yǔ)音控制launch文件
ros2 launch audio_control hobot_audio_control.launch.py

旭日X3派上打開一個(gè)終端,啟動(dòng)機(jī)器人運(yùn)動(dòng)控制Node

# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
#啟動(dòng)本末機(jī)器人運(yùn)動(dòng)控制Node
ros2 run diablo_sdk ros_bridge_example

通過語(yǔ)音控制機(jī)器人運(yùn)動(dòng)

20220815-190006.gif

五、原理分析

對(duì)于一個(gè)復(fù)雜的機(jī)器人系統(tǒng),一般在機(jī)器人上配置上位機(jī)和下位機(jī)兩種處理器。語(yǔ)音控制機(jī)器人由兩部分組成,分為上位機(jī)和下位機(jī)。各部分詳細(xì)組成如下圖:

17.jfif

!

六、語(yǔ)音控制進(jìn)階

智能語(yǔ)音識(shí)別Node中,設(shè)備喚醒詞和命令詞默認(rèn)配置/opt/tros/lib/hobot_audio/config/hrsc/cmd_word.json文件下(當(dāng)然,若用戶將此config文件夾拷貝到了其他路徑,那以實(shí)際使用的配置路徑為準(zhǔn)):

{
    "cmd_word": [
        "地平線你好",
        "向前走",
        "向后退",
        "向左轉(zhuǎn)",
        "向右轉(zhuǎn)",
        "停止運(yùn)動(dòng)"
    ]
}

配置文件的第一項(xiàng)為喚醒詞,后面的是命令詞,用戶可以根據(jù)需要進(jìn)行配置,實(shí)現(xiàn)語(yǔ)音操作的自定義。

本文轉(zhuǎn)自地平線開發(fā)者社區(qū),完整文章內(nèi)容詳見:https://developer.horizon.ai/forumDetail/109609560406362625

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1742

    瀏覽量

    112692
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47352

    瀏覽量

    238779
  • 語(yǔ)音控制
    +關(guān)注

    關(guān)注

    5

    文章

    483

    瀏覽量

    28259
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    湯姆貓發(fā)布AI語(yǔ)音情感陪伴機(jī)器人研發(fā)進(jìn)展

    湯姆貓公司近日透露了其AI產(chǎn)品的研發(fā)進(jìn)展,其中AI語(yǔ)音情感陪伴機(jī)器人備受矚目。據(jù)官方介紹,這款機(jī)器人預(yù)計(jì)將于2024年12月底前正式發(fā)售,為
    的頭像 發(fā)表于 12-17 11:27 ?636次閱讀

    ROSCon China 2024 | RDK第一本教材來了!地瓜機(jī)器人與古月居發(fā)布新書《ROS 2智能機(jī)器人開發(fā)實(shí)踐》

    12月7日-8日,為期兩天的ROSCon China 2024在上海圓滿落幕,來自全球的ROS專家學(xué)者、開發(fā)者、企業(yè)代表齊聚一堂,共享機(jī)器人前沿技術(shù)成果。地瓜機(jī)器人攜手眾多RDK生態(tài)產(chǎn)品亮相,并聯(lián)手古月居共同推出首本基于RDK
    的頭像 發(fā)表于 12-10 18:48 ?411次閱讀
    ROSCon China 2024 | RDK第一本教材來了!地瓜<b class='flag-5'>機(jī)器人</b>與古月居發(fā)布新書《ROS 2智能<b class='flag-5'>機(jī)器人</b><b class='flag-5'>開發(fā)</b>實(shí)踐》

    云端AI開發(fā)者工具怎么用

    云端AI開發(fā)者工具通常包括代碼編輯器、模型訓(xùn)練平臺(tái)、自動(dòng)化測(cè)試工具、代碼管理工具等。這些工具不僅降低了AI開發(fā)的門檻,還極大地提高了開發(fā)效率
    的頭像 發(fā)表于 12-05 13:31 ?139次閱讀

    MagicLab開發(fā)第三代人形機(jī)器人,洽談字節(jié)豆包大模型合作

    人形機(jī)器人創(chuàng)業(yè)公司MagicLab近日宣布,正在積極開發(fā)第三代人形機(jī)器人產(chǎn)品,并聚焦于其實(shí)地應(yīng)用與落地。據(jù)悉,這款機(jī)器人已在某家電工廠的流水
    的頭像 發(fā)表于 12-03 17:38 ?615次閱讀

    機(jī)器人語(yǔ)音功能

    AI時(shí)代,“會(huì)說話”的機(jī)器人已經(jīng)十分常見,在許多酒店、餐廳、醫(yī)院、圖書館,我們都能碰到這些小個(gè)頭大智慧的服務(wù)機(jī)器人,它們開口的瞬間,你可能會(huì)聽到熟悉的聲音:櫻桃小丸子、蠟筆小新、哆啦A夢(mèng)...這些
    的頭像 發(fā)表于 12-02 10:50 ?399次閱讀

    【書籍評(píng)測(cè)活動(dòng)NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個(gè)浪潮!

    早就聽大佬們,具身智能是人工智能的下一波浪潮,也是AI未來的趨勢(shì)! 最近,具身智能的概念更是炙手可熱,備受矚目! 不論是這幾天稚暉君開源人形機(jī)器人全套圖紙+代碼,引發(fā)圈內(nèi)熱議。 還是各類具身智能
    發(fā)表于 11-11 10:20

    兆易創(chuàng)新亮相2024地平線地瓜機(jī)器人開發(fā)者

    日前,以“加速智能生長(zhǎng)”為主題的“2024地瓜機(jī)器人開發(fā)者日暨新品發(fā)布”活動(dòng)在深圳成功舉辦。兆易創(chuàng)新作為地瓜機(jī)器人優(yōu)質(zhì)生態(tài)合作伙伴,受邀出席大會(huì)。中央市場(chǎng)部王霄受邀參加議程中的DUP教育生態(tài)聯(lián)盟研討會(huì)并做了《“兆易創(chuàng)新+地瓜
    的頭像 發(fā)表于 10-17 09:47 ?405次閱讀

    軟通動(dòng)力云夢(mèng)山院第三期管理集訓(xùn)營(yíng)圓滿舉辦

    軟通動(dòng)力云夢(mèng)山院第三期管理集訓(xùn)營(yíng)在西安圓滿舉辦。本期集訓(xùn)營(yíng)以“聚戰(zhàn)略、耕業(yè)務(wù)”為主旨,通過優(yōu)秀產(chǎn)品實(shí)踐經(jīng)驗(yàn)分享、核心業(yè)務(wù)研討、政策與業(yè)務(wù)策略賦能、跨部門協(xié)作通路探討等形式,從理論知識(shí)到實(shí)戰(zhàn)結(jié)論,從
    的頭像 發(fā)表于 10-10 10:27 ?588次閱讀

    地瓜機(jī)器人發(fā)布一系列通用機(jī)器人套件

    在“機(jī)器人+”浪潮的推動(dòng)下,地瓜機(jī)器人近日隆重推出了一系列面向未來的軟硬件產(chǎn)品組合,旨在賦能新一代通用機(jī)器人的發(fā)展。此次發(fā)布的亮點(diǎn)包括旭日5智能計(jì)算芯片、RDK X5
    的頭像 發(fā)表于 09-25 15:56 ?348次閱讀

    地瓜機(jī)器人與廣和通深度合作,共驅(qū)智能機(jī)器人商用落地

    9月20日,2024地瓜機(jī)器人開發(fā)者日暨新品發(fā)布在深圳順利舉辦。廣和通作為地瓜機(jī)器人官方授權(quán)硬件IDH合作伙伴,受邀出席大會(huì)并展示了一系列基于地瓜旭日5的
    的頭像 發(fā)表于 09-23 16:27 ?296次閱讀
    地瓜<b class='flag-5'>機(jī)器人</b>與廣和通深度合作,共驅(qū)智能<b class='flag-5'>機(jī)器人</b>商用落地

    英偉達(dá)打造人形機(jī)器人訓(xùn)練平臺(tái),引領(lǐng)AI新紀(jì)元

    英偉達(dá)近日宣布了一項(xiàng)重大舉措,為全球機(jī)器人制造業(yè)與AI領(lǐng)域注入強(qiáng)勁動(dòng)力。公司推出了專為人形機(jī)器人設(shè)計(jì)的訓(xùn)練平臺(tái),旨在為行業(yè)領(lǐng)先的制造商、AI模型開發(fā)
    的頭像 發(fā)表于 08-05 11:45 ?746次閱讀

    ROS讓機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    。 ROS系統(tǒng)主要特點(diǎn)有哪些 (1) 提供豐富的機(jī)器人算法庫(kù) 機(jī)器人的各種控制以及通信離不開算法庫(kù)的支持,ROS系統(tǒng)提供豐富且功能強(qiáng)大的機(jī)器人算法庫(kù),如坐標(biāo)變換、運(yùn)動(dòng)
    發(fā)表于 07-09 11:38

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹,薩科微Al大模型機(jī)器人有哪些的優(yōu)勢(shì)?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)
    發(fā)表于 07-05 08:52

    NVIDIA將全球數(shù)百萬(wàn)開發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開發(fā)者

    開發(fā)者能夠輕松地為 copilots、聊天機(jī)器人等構(gòu)建生成式 AI 應(yīng)用,所需時(shí)間從數(shù)周縮短至幾分鐘。 NVIDIA 創(chuàng)始
    的頭像 發(fā)表于 06-03 18:21 ?1041次閱讀

    字節(jié)跳動(dòng)推出AI聊天機(jī)器人Coze扣子

    近日,字節(jié)跳動(dòng)正式推出了名為“Coze扣子”的AI聊天機(jī)器人開發(fā)平臺(tái)。自2月1日起,這一平臺(tái)已正式上線,為開發(fā)者和用戶提供了一個(gè)全新的交互體驗(yàn)。
    的頭像 發(fā)表于 02-03 09:31 ?1841次閱讀