SoundHound 是一家位于硅谷的初創(chuàng)公司。通過將AI技術(shù)應(yīng)用于其服務(wù),它革新了傳統(tǒng)的語音搜索。隨著產(chǎn)品規(guī)模的不斷擴(kuò)大,該公司目前已獲得1億美元的戰(zhàn)略投資。NVIDIA GPU Ventures是其早期投資者之一,它致力于支持從事深度學(xué)習(xí)研究的初創(chuàng)公司。
除了同名的音樂識別應(yīng)用程序外,SoundHound 還提供 Hound 語音搜索應(yīng)用程序和 Houndify 語音平臺,以幫助企業(yè)創(chuàng)建基于 AI 的語音服務(wù)。即使在亞馬遜、蘋果、谷歌和微軟等巨頭云集的市場中,該公司的技術(shù)也已成為語音搜索領(lǐng)域最具競爭力的方案之一。
加入研發(fā) Collective AI
該公司正在迅速推出自己的語音領(lǐng)域,以實(shí)現(xiàn)更流暢和快速的自然語言處理。其領(lǐng)域范圍已經(jīng)從 50 個發(fā)展到了 200 個,這些領(lǐng)域的語音服務(wù)質(zhì)量也在兩年內(nèi)實(shí)現(xiàn)迅速提升。
與此同時,SoundHound 還在持續(xù)推動各領(lǐng)域相互“交流”的能力,以此為消費(fèi)者提供更出色的搜索功能。該公司將此項(xiàng)工作稱為Collective AI,并表示這會讓使用相關(guān)架構(gòu)的產(chǎn)品更智能、更強(qiáng)大。
Collective AI 旨在幫助人們提出復(fù)雜的請求或問題,并獲得回復(fù)。例如:請找到舊金山 4 星級以上最好的意大利餐廳,要適合兒童就餐,不能是連鎖餐廳,且在周三晚上 9 點(diǎn)以后仍然營業(yè)。
該公司的 Collective AI 聯(lián)盟企業(yè)包括 NVIDIA、Yelp、AccuWeather.com、Sportstrader、Xignite、FlightStats、Onkyo、Sharp、Uber 和 Samsung ARTIK。
此外,SoundHound 還希望借助 Houndify 語音平臺脫穎而出。這項(xiàng)白標(biāo)簽授權(quán) (white-label licensed) 服務(wù)允許公司在產(chǎn)品中使用自己的名稱來定制語音助手,并保留生成的客戶數(shù)據(jù)。這使公司能夠打造自己的語音搜索品牌,同時透過客戶數(shù)據(jù)發(fā)現(xiàn)其他商機(jī)。
Houndify 開發(fā)人員數(shù)量增至三倍
去年年初,SoundHound 有 2 萬多名開發(fā)人員注冊使用 Houndify,而如今這一數(shù)字已增至 6 萬多。
SoundHound 也在不斷為 Houndify 吸引客戶。目前,該公司的合作伙伴包括 11 家汽車制造商,以及從事機(jī)器人、聯(lián)網(wǎng)揚(yáng)聲器、電器、增強(qiáng)現(xiàn)實(shí)和智能家居設(shè)備行業(yè)的公司。
現(xiàn)代集團(tuán)正在為未來汽車中的新一代語音系統(tǒng)配置 Houndify。汽車制造商的智能助手旨在預(yù)測駕駛員對信息的需求(例如提供會議提醒)。它還支持免提通話、發(fā)送信息、搜索目的地和音樂,以及查詢天氣和管理日歷等功能。此外,語音的應(yīng)用范圍還將擴(kuò)展至對空調(diào)、門鎖及其他車輛的控制功能。
NVIDIA DRIVE和Jetson TX2平臺幫助 SoundHound 分別在汽車和機(jī)器人應(yīng)用領(lǐng)域?qū)崿F(xiàn)了"Speech-to-Meaning"技術(shù)。
適用于機(jī)器人的 Jetson TX2 開發(fā)者工具包
雙重語音識別方法
SoundHound 采用了一種全新方法來提供快速的語音識別服務(wù)。該公司的系統(tǒng)采用的是本地識別模型和遠(yuǎn)程識別引擎雙重語音識別方法,并已獲得專利。SoundHound 的混合工程設(shè)計利用 NVIDIA Drive 的 GPU 來更快地處理語音查詢。
SoundHound 提供的雙重方法實(shí)現(xiàn)了對車輛中語音查詢的實(shí)時響應(yīng),改變了傳統(tǒng)語音系統(tǒng)的“蝸”速問題。
正是這種獨(dú)創(chuàng)性使得 AI 應(yīng)用到了網(wǎng)絡(luò)終端產(chǎn)品中。過去,嵌入式技術(shù)只能識別少量詞匯,并且速度和準(zhǔn)確性較低。然而,SoundHound 通過利用 NVIDIA GPU 運(yùn)行大量詞匯來快速、準(zhǔn)確地識別語音和理解自然語言。
SoundHound 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Keyvan Mohajer 說:“我們利用 NVIDIA DRIVE 平臺創(chuàng)建了嵌入式版本系統(tǒng),從而將可識別自然語言的字?jǐn)?shù)增加到了一百多萬字。它的速度非常快,而且可擴(kuò)展?!?/p>
在機(jī)器人領(lǐng)域,Mayfield Robotics 正在開發(fā)可使用 Houndify 的 Kuri 機(jī)器人以實(shí)現(xiàn)語音交互,從而使人們可以與機(jī)器人互動并向其發(fā)號施令。
在電器領(lǐng)域,開發(fā)人員利用 Houndify 在 Sure Immersion 咖啡機(jī)上展示了一個參考模型,通過“好的,咖啡師”這一語音提示可喚醒咖啡機(jī)。客戶可以使用語音指令來操作機(jī)器制作咖啡,還可以在等待咖啡沖泡時搜索天氣、體育和其他信息。
SoundHound 使用 NVIDIA GPU 訓(xùn)練神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí),并基于 GPU 運(yùn)行著自己的數(shù)據(jù)中心。該公司在數(shù)千臺服務(wù)器上進(jìn)行自然語言處理,并且可以處理數(shù) TB 的數(shù)據(jù)。
Mohajer 說:“曾經(jīng)可能需要幾個月才能完成的工作,現(xiàn)在只需幾天便可完成,這都要?dú)w功于 GPU。如果沒有 GPU,這個行業(yè)將無法前行。”
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5063瀏覽量
103442 -
gpu
+關(guān)注
關(guān)注
28文章
4764瀏覽量
129172 -
語音識別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112778
原文標(biāo)題:NVIDIA GPU 助力 SoundHound 深耕語音 AI 市場
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論