個(gè)人機(jī)器人已經(jīng)從科幻變成現(xiàn)實(shí)——一部分已經(jīng)走向顧客,更多地蓄勢待發(fā)。我們現(xiàn)在的任務(wù)是讓它們變得更具競爭力。
我最近參加了上海MWC上。機(jī)器人在會(huì)展上獨(dú)占鰲頭。我看到有數(shù)十家公司在尋找客戶,他們的產(chǎn)品的應(yīng)用方式各不相同。以機(jī)器人護(hù)士Tug為例。它看起來并不像我們在科幻作品中見過的機(jī)器人,更接近《星球大戰(zhàn)》中的一些較實(shí)用的自動(dòng)機(jī)器。雖然它只是一個(gè)帶輪子的盒子,卻具有我們期待移動(dòng)機(jī)器人擁有的許多功能,包括導(dǎo)航和避障。它可以在醫(yī)院周圍活動(dòng),如果有人踩在它前面就它會(huì)停下,它還會(huì)繞過亂放的點(diǎn)滴支架;它也可以指揮電梯去另一層樓。 Tug的功能是向患者運(yùn)送藥物和食品,它已開始在美國37家退伍軍人醫(yī)院服役。想象一下,它們能夠?yàn)槊β档?a target="_blank">candy-striper(志愿者助手)減少多少工作量。此外還有為老年護(hù)理、教學(xué)支持、餐館和酒店行業(yè)應(yīng)用設(shè)計(jì)的機(jī)器人助手。你可以將其視為繼智能揚(yáng)聲器之后私人助理領(lǐng)域的下一個(gè)重要產(chǎn)品(亞馬遜的倉庫中已經(jīng)部署了10萬多個(gè)工作機(jī)器人,顯然他正在研究作為Echo接班人的家用機(jī)器人)。
這不是科幻小說;家庭助理機(jī)器人已經(jīng)開始走進(jìn)現(xiàn)實(shí)。
機(jī)器人健康助理
生產(chǎn)這種機(jī)器人存在明顯的技術(shù)挑戰(zhàn),這些挑戰(zhàn)與自動(dòng)駕駛問題沒有太大不同,但存在一些明顯的差異。導(dǎo)航和避障是常見挑戰(zhàn),但清晰的行車道和交通管理的概念不適用于這些助理機(jī)器人;它面對的難題是如何在建筑物內(nèi)避障和導(dǎo)航(通過地圖重測繪繞過臨時(shí)不可移動(dòng)的障礙物)。雖然自然語言界面對于汽車而言是一種額外優(yōu)勢,但對于機(jī)器人助手而言卻可能是必不可少的功能。當(dāng)藥房送錯(cuò)藥物或者當(dāng)餐館搞砸了你的訂單,誰能耐心的按按鈕?
Gartner最近列出了機(jī)器人需要的10大人工智能和感應(yīng)功能,其中包括:
計(jì)算機(jī)視覺—— 場景分析、物體識(shí)別等
機(jī)器人內(nèi)置AI功能 —— 不僅依靠云端
會(huì)話界面 —— 語音識(shí)別和自然語言處理
位置感應(yīng) —— 我在哪里、我附近有什么/誰
聲學(xué)場景分析—— 識(shí)別獨(dú)特的噪音,如狗吠或玻璃破碎聲
生物識(shí)別和身份驗(yàn)證—— 誰在與我交談,是否允許他們下達(dá)這些命令
自主運(yùn)動(dòng) —— 能夠移動(dòng)到建筑內(nèi)的其他目標(biāo)位置,而不會(huì)與物體或人員發(fā)生碰撞
構(gòu)建擁有這些功能的系統(tǒng)的默認(rèn)方法的第一步是以多核GPU平臺(tái)為基礎(chǔ)給機(jī)器人創(chuàng)造一個(gè)內(nèi)置AI系統(tǒng)。這不難理解—— 產(chǎn)品構(gòu)建者可以使用現(xiàn)成的平臺(tái)設(shè)計(jì)解決方案的原型,而無需擔(dān)心ASIC細(xì)節(jié),就像他們將CPU開發(fā)板用于更傳統(tǒng)的應(yīng)用一樣。但隨著產(chǎn)品數(shù)量的增加、成本和客戶滿意度/差異化變得越來越重要?,F(xiàn)成的解決方案價(jià)格昂貴、耗電量大,而且使用與其他人相同的平臺(tái)難以實(shí)現(xiàn)市場區(qū)分。這就是為什么大批量解決方案不可避免地轉(zhuǎn)向ASIC平臺(tái)的原因。你無需放棄對原型的所有投資,低成本的GPU平臺(tái)仍然可以構(gòu)成解決方案的一部分,但可以將大量的AI功能卸載到更具成本效益和集成度更高的平臺(tái)上。
在機(jī)器學(xué)習(xí)(ML)應(yīng)用中,DSP相對于GPU的每瓦特性能優(yōu)勢是眾所周知的,部分原因在于定點(diǎn)運(yùn)算取代浮點(diǎn)運(yùn)算、以及某些平臺(tái)的量化靈活性。而定制解決方案的價(jià)格優(yōu)勢(量產(chǎn)時(shí))是眾所周知的。這就是為什么你更有可能在數(shù)量/價(jià)格敏感的ML應(yīng)用中看到嵌入式DSP,而不是現(xiàn)成的GPU。
智能顯示器:一種不動(dòng)的機(jī)器人?
但它是否具備GPU的全部功能?事實(shí)證明,它能做相當(dāng)多的事情。以計(jì)算機(jī)視覺(定位、跟蹤、物體識(shí)別和手勢識(shí)別)為例。目前,在一些基于嵌入式DSP的平臺(tái)中,已經(jīng)可以完成這種級(jí)別的視覺處理?;蛞灾С直镜卦儆?xùn)練(無需前往云端)的自主運(yùn)動(dòng)為例。 DSP同樣具備支持這種智能的核心識(shí)別功能,在GPU上可以找到的相同功能。
語音識(shí)別/認(rèn)證和聲學(xué)場景分析的任務(wù)同樣可以轉(zhuǎn)移。這些例子(以及此處的其他示例)完美地說明了為什么轉(zhuǎn)移非常有必要。這些智能操作都可分割為多個(gè)步驟,例如從語音拾取和方向分辨到基本單詞識(shí)別、甚至自然語言處理(NLP)。最后一步很難,可能需要求助于云端。但是之前的步驟嵌入式解決方案就能非常輕松地處理。有些應(yīng)用只需要識(shí)別有限的詞匯或者只需要檢測非語言提示(例如窗戶破裂聲),在這些情況下,你可能根本不需要云端(或本地GPU)。已經(jīng)有跡象表明,在不久的將來,在邊緣就能處理有限的NLP。
CEVA在它的邊緣AI、前端語音處理和物聯(lián)網(wǎng)深度學(xué)習(xí)平臺(tái)中構(gòu)建了一系列廣泛的解決方案,用于支持這些使用AI的前端功能。在面臨擴(kuò)大規(guī)模難題時(shí),或者當(dāng)您想要繞過這些難題時(shí),請看看我們能提供什么幫助。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28423瀏覽量
207145 -
nlp
+關(guān)注
關(guān)注
1文章
488瀏覽量
22038
原文標(biāo)題:機(jī)器人私人助理距離我們比想象的更近
文章出處:【微信號(hào):CEVA-IP,微信公眾號(hào):CEVA】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論