(文章來源:雷科技)
? ? ?? 從2011年蘋果在iPhone 4S上集成Siri開始算起,語音助手在智能手機上已經出現(xiàn)快十年了。隨著語音識別、AI技術的日益成熟,如今這項功能在手機已經完全普及,并且延展到了智能電視、智能家居等領域中,它的未來前景也被無限看好。實際上,語音AI技術帶來的功能也不再局限于簡單的虛擬助理,發(fā)展出了語音輸入、語音翻譯等更多實用的應用,它對我們生活的滲透進了方方面面。
蘋果語音助手Siri剛剛推出時,曾經引起過一陣不小的熱潮。當時甚至有民間開發(fā)者制作出了相應的Cydia插件,讓沒有得到官方支持的iOS設備,也能在越獄后用上語音助手功能。語音助手通過語音來實現(xiàn)人機交互,并且具備虛擬助理的功能,這種形式當時顯得非常新穎,一下子引起了很多用戶的好奇心。
蘋果開了頭,加上市場需求的強烈驅動下,其他科技廠商也紛紛發(fā)力語音助手功能。2011年,谷歌在Chrome瀏覽器的搜索引擎中加入了語音搜索功能,以滿足廣大使用者語音輸入的需求。2013年,微軟的語音助手Cortana在Windows Phone系統(tǒng)上線。Cortana展現(xiàn)出了微軟在語音識別領域多年累積的技術優(yōu)勢,就使用體驗而言,“小娜”的語音效果極為接近真人發(fā)聲,幾乎能達到以假亂真的效果,一下子擁有了無數(shù)擁躉。
與此同時,國內的語音AI公司也在積極推出類似的產品。例如科大訊飛就推出過語音助手App,而且它也是魅族、OPPO等國產手機廠商的合作商,很多用戶手機上的語音助手或智能助理都在用科大訊飛的語音識別技術。
不過,當語音助手在手機上快速普及并且日漸成熟時,大家對它的熱情卻似乎在慢慢退卻。就我個人的體驗而言,在公開場合極少能看到有人用手機的語音助手功能,盡管越來越多的廠商在大幅度地提升語音助手的優(yōu)先級,比如增加獨立的AI實體按鍵,把AI語音助理的開關放在桌面顯眼的位置等。
很多人包括我自己在內,不喜歡用語音助手,原因要么是不好用要么是不方便用?,F(xiàn)在主流語音助手的語音識別能力普遍比較強,但仍然會有翻車的情況發(fā)生,尤其當環(huán)境比較嘈雜、語音語義存在歧義(也可能是普通話發(fā)音不準)的情況下。很多時候,直接手動操作,會比呼出語音助手幫忙方便不少。
不方便用,就很好理解了。在公開場合下用語音助手,一方面要克服在大庭廣眾下對著手機說話的羞恥感,另一方面要可能要顧及自己的隱私不被暴露。就現(xiàn)在來說,智能手機相當普及,我們對這種必需品的操作熟練度已經非常高,很多時候不太需要語音這種交互形式來實現(xiàn)各項功能。這種情況下,手機上的語音功能有時候的確會給人一種比較雞肋的感覺。
語音AI技術并沒有止步于智能手機,而是拓展到了其他產品上?,F(xiàn)在,不管是智能音箱,還是智能電視,以及各類層出不窮的智能硬件產品,只要被冠于“智能”這個頭銜,就少不了語音控制的功能。有意思的是,到了家庭環(huán)境中,語音AI技術的優(yōu)勢似乎被更加充分地釋放出來了。更加私密的場景下,我們使用語音交互的意愿被大大增強。在相對封閉的環(huán)境下,用戶不用擔心隱私的問題,心理防備也會降低,自然嘗試語音交互的可能性也會增加。
像電視音箱這類產品,傳統(tǒng)的操控工具無非是實體按鍵或者遙控器。相比之下,語音的優(yōu)勢在于解放了使用者的雙手。家庭環(huán)境里,用戶在做家務等騰不開手的場景下,直接用語音命令來實現(xiàn)影音播放、家居控制等功能,無疑極大地提升了效率,使用體驗也更進一步。
近年,不管是智慧屏還是部分品牌的高端電視,都增強了大屏設備的拾音效果,通過增加收音麥克風等方式,讓用戶隨時隨地都能喚醒作為智能控制中樞的電視設備。目前業(yè)界普遍認為,未來5G、大寬帶的普及,以及AI技術的進一步發(fā)展,會把我們帶入到一個萬物互聯(lián)的時代。
當所有我們能接觸到的電器、設備都能連上網并且具有智能功能后,如何方便地操控它們,會成為最關鍵的問題。目前來看,語音是學習成本最低、使用最為便捷的交互方式。5G、AI、IoT、萬物互聯(lián)……關于未來,有點野心的科技廠商都不想錯過,蘋果、谷歌、小米等公司,不斷加強語音AI技術在手機系統(tǒng)中的存在感,很大程度上是在提前布局,持續(xù)培養(yǎng)用戶習慣,讓目標群體在不知不覺中,融入廠商建立的生態(tài)圈中。
另外,不可否認的是,對部分特定人群而言,語音AI相關技術在推動移動互聯(lián)網和智能生活上,發(fā)揮著舉足輕重的作用。對很多“高齡”用戶來說,在手機上用虛擬鍵盤打字,學習成本太高、難度太大。也正因為如此,很多長輩在聊微信時,非常喜歡發(fā)送一長段一長段的語音信息,這讓很多人不勝其煩,恨不得讓微信砍掉語音功能。
但現(xiàn)在,微信等社交應用,以及部分第三方輸入法,已經支持語音輸入功能,可以把語音轉成文字。以目前的技術水平來看,主流語音輸入的識別準確率和可用性已經相當高。像智能手表等小屏設備,語音控制很多時候也比觸控操作要方便得多。
此外,對部分視覺障礙人群而言,語音AI技術的發(fā)展,很大程度上降低了他們使用智能設備、享受移動互聯(lián)網生活的門檻。我們之前曾經測試過一些日常生活中的主流應用,通過語音和實體按鍵交互,盲人群體也能比較方便地完成很多操作、使用不少功能。
不管你愿不愿意接受,近年互聯(lián)網技術的發(fā)展,是一個不斷侵占用戶隱私空間的過程。即使是向來標榜尊重用戶隱私的蘋果,也在2019年被曝出隱私問題,Siri上傳的用戶語音數(shù)據(jù),可能會被人工獲取和分析。隱私和技術之間的平衡,對研發(fā)語音AI的公司來說也是一個難題。理論上來說,想讓語音功能變得更加好用和智能,必然需要對用戶的語音數(shù)據(jù)進行分析和優(yōu)化。而關鍵問題在于,這些被收集的信息,被泄露、非法利用的可能性有多大。
去年,咨詢公司埃森哲曾對中國用戶進行過一次調查。數(shù)據(jù)顯示,中國用戶對語音助手的滿意度高達97%,但信任度依然不高。中國用戶對語音助手的最主要的擔憂分別為安全顧慮、用戶需求不被理解和隱私。而且,在發(fā)生過網絡攝像頭被竊取、開房數(shù)據(jù)被販賣等負面事情后,國內消費者對隱私問題的警惕性并不低。
2018年,歐盟通過了史上最嚴苛的個人數(shù)據(jù)保護條例GDPR,明確了用戶對個人數(shù)據(jù)擁有絕對的掌控權,對企業(yè)違規(guī)的懲罰也極重,最低罰款1000億歐元。站在用戶角度來看,這可能是好事,能遏制住企業(yè)對用戶數(shù)據(jù)濫用和對隱私的侵犯行為。但是,過于嚴格的限制,也會讓科技公司在推動語音AI等需要用到大數(shù)據(jù)的技術進步上,面臨更大的困難。
如果把眼光放得更加長遠的話,我們相信,未來科技生活中,語音在人機交互中的重要性將會大大增強,在智能家居等場景下,甚至會成為最主要的操作方式。只是,在這個過程中,我們希望自己的個人數(shù)據(jù),也能得到更加妥善的處理。
? ?? (責任編輯:fqj)
評論
查看更多