在今年的國際消費電子展(CES 2018)上,語音(voice)、連接(connectivity)和人工智能(AI)成為最受關(guān)注的焦點。如果說今年的CES能為我們帶來什么指標(biāo),那么這三項建構(gòu)模塊將是組成2018年及未來消費電子設(shè)備缺一不可的神圣“三位一體”。
語音助理已經(jīng)準(zhǔn)備好進入可穿戴設(shè)備、耳機、嬰兒監(jiān)視器、燈具、電視遙控器和車輛。DSP Concepts創(chuàng)辦人兼首席技術(shù)官Paul Beckmann在接受《EE Times》時說:“我們似乎正見證著一場圍繞著語音的‘寒武紀(jì)大爆發(fā)’?!?br />
DSP Concepts首席技術(shù)官Paul Beckmann
在CES上,被稱為“中國Google”的百度大力向開發(fā)商展示并開放其基于Duer OS的平臺。無論是其聲控臺燈或掛在天花板上的投影機和屏幕,都不需要Alexa或Google Assist。就像百度常掛在嘴邊的“中國速度”,越來越多的廠商開始朝向語音發(fā)展。
百度展示了一款整合臺燈功能的聲控智能喇叭(來源:Baidu)
消費設(shè)備必須具備連接能力已經(jīng)是不爭的事實。Silicon Labs首席執(zhí)行官Tyson Tuttle強調(diào),接下來的必備功能是“混搭”不同的無線網(wǎng)絡(luò)。他解釋說,直接將原本為智能手機設(shè)計的連接芯片加進物聯(lián)網(wǎng)(IoT)設(shè)備,已經(jīng)無法滿足要求了。系統(tǒng)需要動態(tài)的多協(xié)議軟件,以及為不同的無線網(wǎng)絡(luò)劃分時間的能力。
盡管AI在高度自動化汽車中占據(jù)主導(dǎo)地位,但Ceva首席執(zhí)行官Gideon Wertheizer告訴我們:“我看到AI開始擺脫幻想世界?!惫?yīng)商如今正試著“設(shè)置參數(shù),在隨機環(huán)境中使用AI來解決特定問題?!?br /> Ceva首席執(zhí)行官Gideon Wertheizer
換句話說,許多公司開始學(xué)習(xí)在小規(guī)模應(yīng)用中導(dǎo)入AI,并將其用于特定任務(wù),而非依靠AI來解決世界上的問題。
語音隨車上路
無論是在家庭或開車行駛中,語音都將至關(guān)重要。
博世(Robert Bosch)在CES宣布計劃將其語音助理設(shè)計在方向盤后方。博世管理董事會成員Dirk Hoheisel表示:“我們正致力于讓駕駛艙內(nèi)的按鈕亂象劃下句點?!盓lektrobit在CES上承諾,該公司將成為亞馬遜(Amazon) Alexa的第一批汽車軟件整合商之一。
Bosch開發(fā)“自然語言”車內(nèi)語音輔助系統(tǒng)(來源:Bosch)
百度宣布其基于Duer OS的Apollo 2.0平臺被稱為“自動車輛的Android”,并稱語音輔助系統(tǒng)將成為該平臺的一部份。百度總裁兼COO陸奇表示:“家庭與車輛之間已經(jīng)不存在界限了。無論你在家中做什么,應(yīng)該也都可以在車子里實現(xiàn)?!?/p>
Wertheizer則指出,無論是在家中還是車內(nèi),隔離聲音以及直接向云端發(fā)送清晰的訊號都非常困難。 “我們的周遭充斥著噪音和噪聲著?!焙茏匀坏?,家庭和汽車的解決方案必須能夠因應(yīng)一連串完全不同的嘈雜環(huán)境。
語音算法缺少標(biāo)準(zhǔn)
讓問題變得更復(fù)雜的原因在于業(yè)界還沒有任何標(biāo)準(zhǔn)的語音算法。
Wertheizer表示:“每一家公司都有自家處理語音的專有算法?!?/p>
系統(tǒng)業(yè)者開始求助于學(xué)術(shù)界發(fā)表的技術(shù)論文,競相找出如何最有效隔離語音的解決之道。而當(dāng)他們使用不同的麥克風(fēng)和揚聲器類型時,還必須優(yōu)化其算法,以因應(yīng)不同的設(shè)置要求。
而在Ceva,Wertheizer說:“我們必須建立一個類似原子庇護所的工作室”,用于研究所有的選擇,并開發(fā)波束成形、遠(yuǎn)場和近場、回聲消除和環(huán)境降噪等算法。
Beckman也呼應(yīng)了這個觀點。就像人們喜歡語音作為自然的用戶接口一樣,他說:“遺憾的是,對于實際執(zhí)行的產(chǎn)品設(shè)計人員來說,它是最具挑戰(zhàn)的技術(shù)之一?!彼呀?jīng)看到了太多的語音項目出錯了,最終得回到草圖階段重新開始。
Beckman曾經(jīng)在Bose Corp.擔(dān)任研究工程師長達9年,在2000年初成立了他的咨詢業(yè)務(wù)。當(dāng)他與客戶討論語音項目時,他發(fā)現(xiàn)業(yè)界需要一套有效執(zhí)行的“完整軟件解決方案,以及能為其實現(xiàn)差異化的底層技術(shù)”。但是,最主要的關(guān)鍵在于賦予其能夠自行調(diào)整系統(tǒng)的能力。
隨著語音市場爆發(fā),Beckman的業(yè)務(wù)也隨之成長。DSP Concepts不再只是一家咨詢公司,現(xiàn)在還提供了一套完整的算法作為軟件庫和除錯工具,有助于客戶調(diào)整系統(tǒng)。Beckman說:“我們提供調(diào)整、整合和驗證工具?!?br />
語音UI解決方案需要一套完整的算法(來源:DSP Concepts)
DSP Concepts的語音用戶接口(UI)技術(shù)稱為Audio Weaver,它是第一家獲得亞馬遜(Amazon) Alexa產(chǎn)品認(rèn)證的第三方軟件公司。DSP Concepts共同創(chuàng)辦人兼首席執(zhí)行官Chin Beckmann展示一款A(yù)udio Weaver語音助理產(chǎn)品——相較于亞馬遜Echo使用了7支麥克風(fēng),Audio Weaver僅用了2支麥克風(fēng),據(jù)稱就能夠“聽”得比Echo或Google Home更清楚。
在邊緣實現(xiàn)AI
Wertheizer說,隔離語音是第一步,但接下來還有其他步驟:語音助理必須辨識語音的位置,而且必須能夠追蹤語音。而且,它必須能偵測以及辨識誰在房間里說話。
直到最近,云端才剛被認(rèn)為是處理和學(xué)習(xí)的地方。如今,這個假設(shè)將在2018年發(fā)生改變。
Wertheizer解釋說:“我看到人們對于AI的態(tài)度越來越務(wù)實。他們希望在邊緣設(shè)備執(zhí)行AI而非在云端進行,以避免隱私、延遲和成本等問題?!?/p>
聯(lián)發(fā)科技(MedaTek)首席財務(wù)官顧大為對此表示認(rèn)同。相較于亞馬遜在其Echo設(shè)備中推動云端到云端的服務(wù),聯(lián)發(fā)科看到了“邊緣和云端”融合模式的可能性。他在CES時告訴我們,語音助理競賽如今已經(jīng)著重于在本地增加“智慧”、區(qū)別人類與非人類的聲音分開、消除背景音樂、辨識聲音模式等。
Petcube Wi-Fi寵物照相在遠(yuǎn)程進行機監(jiān)測并與寵物互動(來源:Petcube)
Wertheizer說:“以Petcube設(shè)計的交互式Wi-Fi寵物相機為例,它能在主人不在家時,透過雙向音訊和1080p高分辨率(HD)視頻攝影機進行監(jiān)控,以及與狗或貓互動”。Wertheizer說:“我不確定Petcube是否意識到這是一家物聯(lián)網(wǎng)公司。但是,像這樣的連網(wǎng)產(chǎn)品中,語音識別系統(tǒng)顯然必須能夠辨識狗吠聲,并且確定狗是處于壓力還是處于危機之中。換句話說,系統(tǒng)需要有智能才能進行學(xué)習(xí)?!?/p>
Neupro低功耗AI處理器
雖然Ceva為語音系統(tǒng)的設(shè)計者提供了名為ClearVox的語音算法,但它也知道系統(tǒng)廠商需要的更多。系統(tǒng)制造商希望在其物聯(lián)網(wǎng)設(shè)備中整合學(xué)習(xí)和推論的能力,使其產(chǎn)品能夠持續(xù)變得更加智能化。
目前的市場上亟需AI處理器。為了滿足這一需求,Ceva在CES上推出了NuePro,這是一款“專用的低功耗AI處理器系列,用于在邊緣進行深度學(xué)習(xí)”。NuePro是一款獨立的專用AI處理器,可廣泛用于物聯(lián)網(wǎng)、智能手機、安全監(jiān)控、汽車、機器人、醫(yī)療和工業(yè)等市場。
Ceva推出AI處理器(來源:Ceva)
值得注意的是,Ceva并非深度學(xué)習(xí)領(lǐng)域的新手。據(jù)報導(dǎo),NeuPro是以Ceva在計算機視覺應(yīng)用深層神經(jīng)網(wǎng)絡(luò)方面的經(jīng)驗為基礎(chǔ)。
Wertheizer說,NeuPro AI處理器是Ceva從頭開始研發(fā)的第一款“非DSP”技術(shù)。他在發(fā)布Neupro時說:“我有點緊張。但是你必須知道AI并不是訊號處理方面的問題?!?/p>
NeuPro處理器搭載兩個硬件——NeuPro引擎和NeuPro VPU (向量處理單元)。Wertheizer指出,雖然引擎處理定義良好的人工智能算法,如CNN、啟動和規(guī)范層,但是,可編程的向量引擎NeuPro VPU是執(zhí)行專有AI算法的一種延伸。“我們選擇了這種硬聯(lián)機的建置方式,而不是使用GPU或CPU,讓我們能夠增加AI處理器的利用率?!?/p>
Ceva聲稱,這款新的專用AI處理器系列帶來了“相當(dāng)高的性能提升,從入門級處理器的2TOPS到為最高階配置的12.5TOPS”。
NeuPro硬件模塊;Ceva首席執(zhí)行官Gideon Wertheizer強調(diào),“NeuPro VPU和NeuPro引擎之間的無縫切換至關(guān)重要”。 (來源:Ceva)
Ceva表示,NeuPro AI處理器將于2018年第二季向客戶提供授權(quán),并計劃在第三季全面發(fā)布。
同樣地,聯(lián)發(fā)科準(zhǔn)備推出一款由意騰科技(Intelligo Technology)設(shè)計的AI處理器和算法。Intelligo是2016年時從聯(lián)發(fā)科獨立而出的新創(chuàng)公司。
Intelligo設(shè)計的這款A(yù)I SoC被稱為“智能DNN語音處理器”應(yīng)用范圍較有限。聯(lián)發(fā)科表示,該處理器提供“可配置的深度神經(jīng)網(wǎng)絡(luò)和高效率推論引擎(每秒每瓦特1 TOPS運算性能)”。
顧大為表示,聯(lián)發(fā)科正在尋找一種小型的AI加速器,為辨識20到30個關(guān)鍵詞而設(shè)計。另一方面,聯(lián)發(fā)科也正推廣其“分布式處理”的觀念,期望語音和AI功能不只是整合于像Echo或Google Home的智能音箱,而是更落實于廣泛的小型設(shè)備——如電燈開關(guān)。
-
CES
+關(guān)注
關(guān)注
4文章
1123瀏覽量
70842 -
語音
+關(guān)注
關(guān)注
3文章
385瀏覽量
38081 -
人工智能
+關(guān)注
關(guān)注
1792文章
47514瀏覽量
239232
原文標(biāo)題:語音和人工智能應(yīng)用在CES 2018上的爆發(fā)
文章出處:【微信號:gh_bee81f890fc1,微信公眾號:面包板社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論