2012年5月蘋果發(fā)布SIRI,帶來(lái)了一種全新的交互方式——人機(jī)自然語(yǔ)言交互。SIRI帶來(lái)了截然不同的用戶體驗(yàn),加上蘋果公司的夸大宣傳,很多人驚呼人工智能時(shí)代要來(lái)了。
然而很多年過(guò)去了,人機(jī)自然語(yǔ)言交互依然不是主流的交互方式。
2016年3月谷歌機(jī)器人阿爾法狗戰(zhàn)勝人類圍棋大師李世石,又一次讓人們對(duì)人工智能充滿了希望。2016年國(guó)內(nèi)很多人工智能和機(jī)器人企業(yè)拿到了投資。
我們看到機(jī)器學(xué)習(xí)技術(shù)的廣泛應(yīng)用確實(shí)為我們帶來(lái)了很多改變。比如語(yǔ)音識(shí)別和圖像識(shí)別的準(zhǔn)確率更高了。
盡管投資人、用戶以及政府都對(duì)人工智能充滿了期望,應(yīng)該看到目前的進(jìn)步都還只是量變,并沒(méi)有達(dá)到質(zhì)變。
于是我們看到很多拿到投資的企業(yè)很快就變得平庸了,不再能讓我們眼前一亮。
人工智能時(shí)代,終究還沒(méi)有到來(lái)。
我以前在我的朋友圈討論過(guò)這個(gè)話題:什么是人工智能時(shí)代的正確打開方式?
我認(rèn)為唯有人機(jī)交互方式的變革才能帶來(lái)行業(yè)的質(zhì)變,唯有鍵盤和觸摸屏的交互變成全自然語(yǔ)言的交互,人工智能時(shí)代才會(huì)到來(lái)。
最初的電腦沒(méi)有操作系統(tǒng),各家的軟硬件不兼容。有了操作系統(tǒng),才形成了軟硬件相互協(xié)作的格局,讓更多企業(yè)參與到IT行業(yè)中來(lái)了。
但最初的操作系統(tǒng)是命令化操作,只有專業(yè)人士才能記住那些復(fù)雜的命令,于是電腦成了“奢侈品”,普及困難。
后來(lái)有了視窗操作系統(tǒng),電腦成了辦公工具,很快進(jìn)入了各個(gè)企業(yè)、政府、學(xué)校,成了辦公室必不可少的裝備。后來(lái)互聯(lián)網(wǎng)普及后,電腦開始進(jìn)入家庭,成了游戲工具。
最初的手機(jī)是按鍵操作的。后來(lái)有廠商造出來(lái)可以替代計(jì)算機(jī)辦公和打游戲的智能手機(jī)。當(dāng)時(shí)的諾基亞和黑莓手機(jī)都非常棒,能支持移動(dòng)辦公,帶來(lái)了很多便利。
但直到觸摸屏手機(jī)出現(xiàn),移動(dòng)互聯(lián)網(wǎng)時(shí)代才到來(lái)了,才達(dá)到了質(zhì)變。
那么有沒(méi)有什么能替代移動(dòng)互聯(lián)網(wǎng)的東西呢?我認(rèn)為只有新的交互方式產(chǎn)生了,新的互聯(lián)網(wǎng)時(shí)代才會(huì)來(lái)臨。這種新的交互方式就是人機(jī)自然語(yǔ)言交互。
觸摸屏交互和鼠標(biāo)鍵盤交互存在的問(wèn)題主要有以下幾點(diǎn):
第一、菜單式操作,能容納的功能有限。大多數(shù)人在手機(jī)上安裝的APP不會(huì)多于100個(gè),大多數(shù)人即便在電腦上安裝的軟件數(shù)量也不會(huì)多于100個(gè)。因?yàn)樘嗔瞬檎移饋?lái)就很困難。我們大多數(shù)人手機(jī)里的電話號(hào)碼不會(huì)多于1000個(gè),微信里的好友很多人連5000個(gè)都沒(méi)有加滿。這都是受限于操作系統(tǒng)需要通過(guò)菜單展示信息。
第二、需要人理解機(jī)器。過(guò)去計(jì)算機(jī)要輸入漢字是件很困難的事情。我們上學(xué)時(shí)最流行的是五筆字型輸入。需要參加培訓(xùn)才能學(xué)會(huì)這種輸入法?,F(xiàn)在也需要通過(guò)各種輸入法去解決漢字輸入的問(wèn)題。這就需要我們理解輸入法的規(guī)則。過(guò)去很多軟件操作都很復(fù)雜,需要經(jīng)過(guò)培訓(xùn)成為專業(yè)人士用戶才能使用。現(xiàn)在盡管軟件都智能了很多,但一些軟件還是需要人們?nèi)W(xué)習(xí)才能掌握它的使用方法。
第三、需要近距離操作,占用手和眼。無(wú)論鍵盤鼠標(biāo)還是觸摸屏,都需要近距離操作,需要手眼配合。因此在用計(jì)算機(jī)和電腦的時(shí)候,我們就不能干別的事情。另外,也因?yàn)榻嚯x操作,限制了人們的使用場(chǎng)景。例如,必須有電源,有辦工桌安放電腦等等。
SIRI讓我們看到了一個(gè)新的機(jī)會(huì),就是人機(jī)交互方式變革的機(jī)會(huì)。如果可以語(yǔ)音和機(jī)器交互,那鍵盤鼠標(biāo)觸摸屏就都不需要了。我們可以通過(guò)語(yǔ)音交互讓機(jī)器為我們服務(wù)。手和眼被解放了出來(lái),而且我們不再需要理解機(jī)器的規(guī)則。機(jī)器有成千上萬(wàn)的功能,它根據(jù)我們說(shuō)的話去理解我門的意圖,提供令我們滿意的服務(wù)。我們可以語(yǔ)音告訴機(jī)器人我們要買的東西,它幫我們完成購(gòu)買和支付。我們可以語(yǔ)音告訴機(jī)器人出差的時(shí)間和目的地,機(jī)器人幫我們訂票和訂酒店,然后反饋結(jié)果給我們。我們可以告訴機(jī)器人我們要吃什么東西,機(jī)器人自動(dòng)幫忙叫外賣并完成付款。我們可以語(yǔ)音駕駛汽車,只要告訴汽車我要去哪里就可以了。我們不需要知道機(jī)器有哪些功能,我們只需要按自己的習(xí)慣表達(dá),機(jī)器人會(huì)自動(dòng)去匹配它的功能。這樣,即便機(jī)器有千千萬(wàn)萬(wàn)的功能,也不會(huì)讓我們使用上感到困難。
為什么SIRI不能實(shí)現(xiàn)以上功能呢?很多時(shí)候,那些SIRI一類機(jī)器人更像個(gè)智障。
其實(shí)人機(jī)自然語(yǔ)言交互需要的不僅僅是自然語(yǔ)言處理,而是一個(gè)系統(tǒng),一個(gè)大腦。語(yǔ)言處理的過(guò)程就是思辨的過(guò)程。我說(shuō)“吃”,你不知道我說(shuō)的啥意思,但我說(shuō)話的對(duì)象就能聽得懂。因?yàn)樗麖奈疫@里獲得的信息比你多,他能綜合各個(gè)信息通過(guò)思辨來(lái)理解我的意圖。語(yǔ)言本身是模糊的,甚至矛盾的。說(shuō)“是”也許表達(dá)的是否定,說(shuō)“快樂(lè)”也許表達(dá)的是傷心。只有通過(guò)思辨才能理解一句話。機(jī)器要理解人就需要機(jī)器具備思辨能力,思辨能力就是智慧。如果像寫普通程序那樣寫人工智能程序,不會(huì)讓機(jī)器擁有思辨能力。
其次,只有機(jī)器擁有了相應(yīng)的知識(shí)才能解決相應(yīng)問(wèn)題。但人類的知識(shí)是個(gè)無(wú)限集,是非常非常龐大的。只有通過(guò)UGC的模式,讓每個(gè)參與者都為機(jī)器人提供知識(shí),才能保證機(jī)器人擁有無(wú)限多的知識(shí)。如果需要通過(guò)訓(xùn)練來(lái)讓機(jī)器人擁有知識(shí),那普通用戶是無(wú)法參與的。
另外,語(yǔ)言是流動(dòng)的是模糊的。一個(gè)詞在現(xiàn)代包含的意思和在古代不一定完全相同。一句話在不同的場(chǎng)合含義都不一樣。要理解語(yǔ)言,不是理解字面,而應(yīng)當(dāng)去理解文字背后的語(yǔ)義。如果把語(yǔ)言當(dāng)成處理對(duì)象,那就錯(cuò)了。
最后,很多人用菜單式的系統(tǒng)結(jié)構(gòu)做人機(jī)自然語(yǔ)言交互的系統(tǒng),這就錯(cuò)了。人機(jī)自然語(yǔ)言交互的系統(tǒng)是平行結(jié)構(gòu)的。如果有菜單,用戶就要去理解菜單,那就不是智能了。應(yīng)該是機(jī)器人理解人,根據(jù)人的意圖去平行調(diào)用各種功能模塊。對(duì)于平行結(jié)構(gòu),我們的定義是所有功能都在第一級(jí)別。想進(jìn)入一個(gè)功能就進(jìn)入,不想進(jìn)入不能進(jìn)入,想退出就退出,不想退出就不能退出。
我們氖星智能經(jīng)過(guò)很多年的研究,我們的DSA-nlp算法已經(jīng)相對(duì)成熟了,我們能讓機(jī)器在最大程度上理解用戶意圖,能理解上下文,能讓對(duì)話變得自然流暢。
我們的目標(biāo)是成為新的流量入口,人機(jī)自然語(yǔ)言交互時(shí)代的流量入口。各家大廠都在推智能音箱,都是在爭(zhēng)這個(gè)入口。但能取勝的,一定是交互最流暢的。我們擁護(hù)先進(jìn)的人機(jī)自然語(yǔ)言交互技術(shù),一定能在這個(gè)市場(chǎng)擁有自己的地位。
因?yàn)槲覀冄芯苛耸嗄甑腘LP技術(shù),我們能處理上下文,我們的系統(tǒng)結(jié)構(gòu)是平行結(jié)構(gòu),我們提出了人機(jī)自然語(yǔ)言交互的四個(gè)標(biāo)準(zhǔn):差異性、同一性、模糊性、一致性。差異性就是機(jī)器人能理解語(yǔ)言之間的細(xì)微差異,比如“你干嘛”和“你干嘛的”。同一性就是能理解兩句話語(yǔ)義是相同的,比如“你公司在哪里”和“貴司地址是什么地方”。模糊性是指當(dāng)語(yǔ)音識(shí)別把“甲硝唑是什么”識(shí)別成了“早上做是什么”的時(shí)候也能正確處理。一致性是指機(jī)器真正理解了語(yǔ)義,前后說(shuō)的話不矛盾。我們嚴(yán)格按照這四個(gè)標(biāo)準(zhǔn)在建設(shè)我們的系統(tǒng)。我們可以保證我們的機(jī)器人對(duì)用戶輸入理解的準(zhǔn)確率可以很高,保證人機(jī)對(duì)話可以自然流暢。
我們推出了氖星智能平臺(tái)www.neonstar.cn,能讓每個(gè)用戶建立自己的機(jī)器人。比如,你是個(gè)醫(yī)院,你建個(gè)機(jī)器人回答健康問(wèn)題。你是個(gè)律師事務(wù)所,你建個(gè)機(jī)器人回答用戶法律問(wèn)題。你是個(gè)駕校,你建個(gè)機(jī)器人回答關(guān)于汽車駕駛問(wèn)題。我們平臺(tái)已經(jīng)有不少機(jī)器人了。他們一起為用戶解答各種各樣的問(wèn)題。我們開發(fā)了氖星知道APP(以下是氖星知道下載地址:http://www.naistar.com/download/zhidao-release-signed.apk),用戶提問(wèn),機(jī)器人搶答。未來(lái)幾年我們氖星知道的用戶數(shù)會(huì)突破1億。
快來(lái)我們平臺(tái)建立自己的機(jī)器人,在人工智能時(shí)代提前布局吧!這里才是通往人工智能時(shí)代的真正入口。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28582瀏覽量
207818 -
觸摸屏
+關(guān)注
關(guān)注
42文章
2313瀏覽量
116540 -
人工智能
+關(guān)注
關(guān)注
1793文章
47539瀏覽量
239393
原文標(biāo)題:快來(lái)看!這里才是通往人工智能時(shí)代的真正入口!
文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論