2016年,我們說,機(jī)器人模式的轉(zhuǎn)變將比過去十年從網(wǎng)絡(luò)向移動(dòng)應(yīng)用的轉(zhuǎn)變更具破壞性和趣味性。我們相信,聊天機(jī)器人是下一個(gè)即將發(fā)生的大事件。
當(dāng)時(shí),我們的期望很高,并認(rèn)為這個(gè)行業(yè)已經(jīng)成熟,并且翹首以待迎接新的創(chuàng)新時(shí)代:是時(shí)候開始與機(jī)器進(jìn)行社交了。
那人類又何樂而不為呢?所有的預(yù)測都表示未來將會(huì)非常成功。
? ? ? ? 在2017年的世界移動(dòng)通信大會(huì)上,聊天機(jī)器人是主要的頭條新聞。會(huì)議組織者引用在“品牌和企業(yè)對聊天機(jī)器人的關(guān)注不可避免地轉(zhuǎn)移”的情況下,“壓倒性的認(rèn)可”。
事實(shí)上,關(guān)于聊天機(jī)器人的唯一重要問題是誰會(huì)壟斷這個(gè)領(lǐng)域,而不是聊天機(jī)器人是否會(huì)首先突然成功。 一個(gè)單一的平臺(tái)是否將會(huì)出現(xiàn)并占領(lǐng)聊天機(jī)器人以及個(gè)人助理生態(tài)系統(tǒng)中呢?
一年過去了,我們對這個(gè)問題有了答案嗎?
然而并沒有,因?yàn)闆]有一個(gè)生態(tài)系統(tǒng)可以使一個(gè)平臺(tái)占據(jù)主導(dǎo)地位。
被另一個(gè)炒作周期愚弄
聊天機(jī)器人并不是第一個(gè)被堂而皇之談?wù)摱笸蝗槐┑募夹g(shù)性發(fā)展。這個(gè)古老的炒作周期以熟悉的方式展開。
一些意見領(lǐng)袖在寫了一些非常嚴(yán)肅的文章,稱硅谷十分看好與智能自動(dòng)化對話的前景,各種信息也開始充斥聊天機(jī)器人。Slack經(jīng)歷了指數(shù)級增長,甚至還推出一個(gè)面向聊天機(jī)器人投資的基金。
期望逐漸建立,建立,然后……一切都失敗了。預(yù)測并沒有成為現(xiàn)實(shí)。
? ? ? ?我們回顧了我們令人窒息的樂觀情緒,然后向彼此求助,如今有點(diǎn)困惑:“是嗎?這就是我們所期待的聊天機(jī)器人革命嗎?”
Digit的伊桑?布洛赫總結(jié)了普遍的共識(shí):“我甚至不確定我們是否可以說‘聊天機(jī)器人已經(jīng)走到盡頭’,因?yàn)槲疑踔敛恢浪鼈兪欠裨?jīng)活過?!?/span>
Heap負(fù)責(zé)產(chǎn)品設(shè)計(jì)的副總裁戴夫?費(fèi)爾德曼說,聊天機(jī)器人不僅僅是遇到一個(gè)問題但失敗了:它們承擔(dān)了幾個(gè)任務(wù),而且都失敗了。
文本vs語言vs.GUI:一段顯著的歷史
機(jī)器人可以通過不同的方式與用戶交互。最大的區(qū)別是文本和語言。在(計(jì)算機(jī)接口)開始的時(shí)候是(書面的)單詞,用戶必須手動(dòng)輸入命令才能完成任何操作。然后,圖形用戶界面(GUI)出現(xiàn)并挽救了局面。我們被窗戶、鼠標(biāo)點(diǎn)擊和圖標(biāo)所吸引。嘿,我們最終也提取到了顏色!
與此同時(shí),一群研究科學(xué)家正忙著開發(fā)與數(shù)據(jù)庫發(fā)的自然語言(NL)接口,而不是必須學(xué)習(xí)一種晦澀難懂的數(shù)據(jù)庫查詢語言。另一群科學(xué)家正在開發(fā)語音處理軟件,這樣你就可以直接和你的電腦說話,而不必打字。
事實(shí)證明,這比任何人最初意識(shí)到的要困難得多,有這么多不同的口音,人們可能說話太快或太慢,只是喃喃自語。
你說過“recognise speech”或“wreck a nice beach”嗎?
議程上的下一個(gè)項(xiàng)目是與一臺(tái)機(jī)器進(jìn)行雙向?qū)υ挕_@里有一個(gè)示例對話框(可以追溯到20世紀(jì)90年代)和VCR安裝系統(tǒng):
用戶:“你好?!?/p>
機(jī)器人:“你好,你叫什么名字?”
用戶:“Candy?!?/p>
機(jī)器人:“你好,Candy!”
用戶:“讓我們設(shè)定時(shí)鐘。”
機(jī)器人:“現(xiàn)在幾點(diǎn)了?”
用戶:“時(shí)間是上午11點(diǎn)?!?/p>
機(jī)器人把時(shí)鐘撥到上午11點(diǎn)。
很酷,對吧?系統(tǒng)以協(xié)作的方式進(jìn)行轉(zhuǎn)換,并且以聰明的方式確定用戶需求。它是精心制作的,用來處理涉及錄像機(jī)的談話,而且只能在嚴(yán)格的限制下進(jìn)行操作。
現(xiàn)代的機(jī)器人,不管它們需要打字還是語音輸入,都必須面對所有這些挑戰(zhàn),但也要在各種平臺(tái)上以一種高效、彈性的方式工作?;旧?,我們?nèi)栽谂?shí)現(xiàn)類似30年之前的突破創(chuàng)新。
然而,以下是我們出現(xiàn)偏差的地方:
從機(jī)器人與應(yīng)用的角度思考問題
一個(gè)超大的假設(shè)是,APP已經(jīng)“結(jié)束”,將被機(jī)器人取代。通過將兩個(gè)截然不同的概念相互對立(而不是將它們看作是為不同目的而設(shè)計(jì)的獨(dú)立實(shí)體),我們鼓勵(lì)機(jī)器人開發(fā)。你可能還記得十年前當(dāng)應(yīng)用首次出現(xiàn)時(shí),類似的戰(zhàn)斗口號(hào):但你還記得當(dāng)應(yīng)用程序(APP)取代互聯(lián)網(wǎng)的時(shí)候嗎?據(jù)說,一種新產(chǎn)品或新服務(wù)需要滿足以下兩個(gè)要求:更好、更便宜或更快。聊天機(jī)器人比應(yīng)用程序更便宜或者更快嗎?不,至少現(xiàn)在還沒有。
他們是否“更好”是主觀的,但我認(rèn)為更合理地來講,當(dāng)今最好的機(jī)器人無法與當(dāng)今最好的應(yīng)用相提并論。此外,沒有人認(rèn)為使用Lyft過于復(fù)雜,或者在應(yīng)用程序上訂購食物或購買裙子太難。太復(fù)雜的是嘗試讓機(jī)器人完成這些任務(wù)——并且讓機(jī)器人失敗。
一個(gè)偉大的機(jī)器人可以和普通的應(yīng)用程序一樣有用。當(dāng)涉及到豐富、復(fù)雜、多層次的應(yīng)用程序時(shí),就沒有競爭了。這是因?yàn)闄C(jī)器讓我們能夠訪問龐大而復(fù)雜的信息系統(tǒng),早期的圖形信息系統(tǒng)在幫助我們定位這些系統(tǒng)方面取得了革命性的進(jìn)步?,F(xiàn)代的應(yīng)用程序受益于數(shù)十年的研究和實(shí)驗(yàn)。那我們?yōu)槭裁匆阉鼇G掉呢?
但是,如果我們把“替換”這個(gè)詞換成“擴(kuò)展”,事情就會(huì)變得有趣多了。今天最成功的機(jī)器人體驗(yàn)采用了一種混合工藝的方式,將聊天融入更廣泛的戰(zhàn)略之中,同時(shí)包含更多的傳統(tǒng)元素。
從以上圖片中看出,佩妮在傳統(tǒng)的賬戶控制面板和交易列表旁邊提供了一些很好的建議和提醒。
HubSpot對話系統(tǒng)將Facebook Messenger、現(xiàn)場聊天、社交媒體、電子郵件和其他消息渠道統(tǒng)一為一個(gè)共享收件箱。
Layer給開發(fā)者提供了工具,從而可以在移動(dòng)網(wǎng)絡(luò)和桌面web以及原生應(yīng)用上創(chuàng)建個(gè)性化的消息傳遞體驗(yàn)。
下一波將是多模式應(yīng)用,你可以在這里說出你想要的(比如Siri),然后通過地圖、文本,甚至是語音回復(fù)的方式收到信息。
為機(jī)器人而出現(xiàn)的機(jī)器人
我的產(chǎn)品需要機(jī)器人嗎?現(xiàn)有的平臺(tái)是否能夠支持其功能?我是否有足夠的耐心去建造一個(gè)能夠做我想做的事情的機(jī)器人?
大肆宣傳的另一個(gè)問題是,它往往會(huì)繞過像這樣的基本問題。對于很多公司來說,機(jī)器人并不是一個(gè)正確的解決方案。在過去的兩年里,機(jī)器人被盲目地應(yīng)用于沒必要的問題之上。為了建造機(jī)器人而建造機(jī)器人,讓它自由進(jìn)展,并期待最好的結(jié)果永遠(yuǎn)不會(huì)有好結(jié)果。
圖:完全必要的Maroon 5聊天機(jī)器人
絕大多數(shù)的機(jī)器人都是使用決策樹邏輯構(gòu)建的,在這個(gè)邏輯中,bot的響應(yīng)依賴于在用戶輸入中發(fā)現(xiàn)特定的關(guān)鍵字。這種方法的優(yōu)點(diǎn)是,很容易列出它們被設(shè)計(jì)用來覆蓋所有的情況。這也是他們的劣勢所在。這是因?yàn)檫@些機(jī)器人純粹是對他們設(shè)計(jì)者的能力、一絲不茍以及耐心的反映,以及對他們能夠預(yù)見到的用戶需求和投入的反映。當(dāng)生活拒絕使用它們時(shí),問題就出現(xiàn)了。
根據(jù)最近的報(bào)道,在Facebook Messenger上的10萬個(gè)機(jī)器人中,70%不能完成簡單的用戶請求。這在一定程度上是由于開發(fā)人員無法將他們的機(jī)器人專注于一個(gè)優(yōu)勢的焦點(diǎn)領(lǐng)域。當(dāng)我們在建造“咆哮機(jī)器人”時(shí),盡管人們可能會(huì)對潛在的資本問題感到過度擔(dān)憂,但是我們決定專門針對銷售和市場營銷人員進(jìn)行設(shè)計(jì):而不是使其成為一個(gè)“全能選手”。
記住:能很好完成一件事的機(jī)器人比一個(gè)能做多件事的機(jī)器人更有幫助。
不可接近性
一個(gè)有能力的開發(fā)人員可以在幾分鐘內(nèi)構(gòu)建一個(gè)基本的機(jī)器人——但是一個(gè)可以進(jìn)行對話的機(jī)器人呢?這是另一個(gè)故事。盡管圍繞人工智能的炒作不斷,但我們要做出任何類似人類的東西還有很長的路要走。在一個(gè)理想的世界中,NLP(自然語言處理)的技術(shù)應(yīng)該幫助聊天機(jī)器人理解它所接收到的消息。但是NLP只是剛剛從研究實(shí)驗(yàn)室起步,而且還處于起步階段。有些平臺(tái)提供了一些NLP,但即使是最好的平臺(tái)也能達(dá)到“孩子的水平”(例如,想想Siri理解單詞,但是不理解他們的意思)。正如Matt Asay概述的那樣,這導(dǎo)致了另一個(gè)問題的出現(xiàn):未能抓住開發(fā)人員的注意力和創(chuàng)造力。
“除非機(jī)器智能能夠接近人類智能,否則消費(fèi)者的興趣永遠(yuǎn)不會(huì)實(shí)現(xiàn)。”用戶的興趣取決于人工智能,這使得與機(jī)器人對話對消費(fèi)者來說是有值得的?!?/p>
今天基于規(guī)則的對話系統(tǒng)過于脆弱,無法應(yīng)對這種不可預(yù)測性,而使用機(jī)器學(xué)習(xí)的統(tǒng)計(jì)方法也同樣有限。人工智能對話所需的人工智能水平目前來說還不具備。與此同時(shí),很少有高質(zhì)量的機(jī)器人引領(lǐng)潮流。就如戴夫費(fèi)爾德曼評論道:
“Slack、Facebook、谷歌、微軟、Kik和其他公司是否應(yīng)該打造自己的內(nèi)置機(jī)器人來引領(lǐng)這一發(fā)展?”他們是否應(yīng)該更積極地利用他們的機(jī)器人基金和孵化器,雇傭?qū)焷斫逃齾⑴c者,或者提供工程和設(shè)計(jì)資源?在高知名度的合作伙伴中資助戰(zhàn)略機(jī)器人計(jì)劃呢?在我看來絕對是的。當(dāng)涉及到平臺(tái)時(shí),開發(fā)人員是用戶;我們不依賴于用戶來理解為為何或如何使用我們的產(chǎn)品。我們必須向他們展示?!?/p>
GUI不應(yīng)該被忽略
曾幾何時(shí),與計(jì)算機(jī)交互的唯一方法就是在終端上輸入晦澀的命令。使用Windows、圖標(biāo)或鼠標(biāo)的可視化界面是我們操作信息的一場革命。計(jì)算從基于文本的到圖形用戶界面(GUI)的轉(zhuǎn)換是有原因的。在輸入端,點(diǎn)擊比輸入更容易,也更快捷。點(diǎn)擊或選擇顯然比輸入整句話更可取,即使是具有預(yù)測性(通常容易出錯(cuò))的文本也是如此。在輸出端,有句老話說,一張圖片值一千個(gè)字,這句話通常是正確的。
由于我們是高度可視化的生物,所以我們可以看到信息的光學(xué)顯示。孩子們喜歡觸屏,這并非偶然。構(gòu)思圖形界面的先驅(qū)者們受到了認(rèn)知心理學(xué)以及關(guān)于大腦如何處理溝通研究的啟發(fā)。對話式的用戶界面是為了復(fù)制人類喜愛的交流方式,但最終需要額外的認(rèn)知努力。從本質(zhì)上講,我們將一些簡單的東西替換為更復(fù)雜的選擇。
當(dāng)然,有些概念是我們只能用語言表達(dá)的(“向我展示通往博物館的所有方法,讓我走2000,但不需要超過35分鐘”),但是大多數(shù)任務(wù)可以使用GUI更高效、更直觀地完成,而不是使用對話式的UI來完成。
人類喜歡與人交談
在業(yè)務(wù)交互中,針對人的維度是有意義的。如果有一件事是將銷售和市場營銷分裂的,那就是缺乏人性:在彩票號(hào)碼、反饋表格、“不回復(fù)郵件”、“自動(dòng)回復(fù)”和“聯(lián)系我們”的表格后面所隱藏的是品牌。Facebook的目標(biāo)是,他們的機(jī)器人應(yīng)該通過所謂的圖靈測試,這意味著你無法判斷你是在和機(jī)器人還是人類對話。但是機(jī)器人和人類是不一樣的。它永遠(yuǎn)不會(huì)。對話所包含的不僅僅是文本。人類可以理解字里行間的寓意,利用語境信息,理解深層次含義,比如諷刺。但是,機(jī)器人很快就會(huì)忘記它們在說什么,這意味著它有點(diǎn)像和一個(gè)短期記憶或幾乎沒有記憶的人交談。
正如HubSpot團(tuán)隊(duì)所指出的:
機(jī)器人提供了一種可擴(kuò)展的方式,可以與買家進(jìn)行一對一的互動(dòng)。然而,當(dāng)他們沒能提供一種高效、令人愉快的體驗(yàn)時(shí),他們就會(huì)失敗,因?yàn)槿藗兞?xí)慣于在消息應(yīng)用中與他人進(jìn)行復(fù)雜的、多層次的對話。
人們不容易上當(dāng)受騙,同時(shí),假裝機(jī)器人是人類,肯定會(huì)減少回報(bào)(更不用說你對用戶撒謊的情況了)。而且,即使是那些稀有的機(jī)器人是由最先進(jìn)的NLP驅(qū)動(dòng)、擅長處理并生產(chǎn)內(nèi)容,相比之下也會(huì)相形見絀。
這是另一件事。對話式的交互界面是為了復(fù)制人類喜歡與他人進(jìn)行交流的方式——并應(yīng)用于與其他人類的交流之中。但這是人類更喜歡與機(jī)器互動(dòng)的方式嗎?不一定。在一天結(jié)束的時(shí)候,沒有多少機(jī)智的妙語或類似于人類習(xí)慣可以將機(jī)器人從失敗的對話中拯救出來。
我們目前會(huì)朝什么方向發(fā)展?
在某種程度上,那些早期采用者并不是完全錯(cuò)誤的。人們在家里要求谷歌播放他們最喜歡的歌曲,從Domino的機(jī)器人上訂購披薩,并從絲芙蘭那里得到一些化妝提示。但就消費(fèi)者的反應(yīng)和開發(fā)者的參與度而言,聊天機(jī)器人并沒有達(dá)到2015或2016年左右所宣揚(yáng)的宣傳效果。甚至連接近都達(dá)不到。
計(jì)算機(jī)的功能沒有問題。搜索數(shù)據(jù),分析數(shù)據(jù),分析觀點(diǎn),壓縮信息。計(jì)算機(jī)不擅長理解人類的情感。NLP的狀態(tài)意味著他們?nèi)匀粵]有得到我們所想要的東西,更沒有將我們的感受考慮進(jìn)去。這就是為什么我們?nèi)匀粺o法想象有效的客戶支持、銷售或營銷,而不需要人類基本接觸,即移情和情商的情景是什么樣子的。
目前,機(jī)器人可以繼續(xù)幫助我們處理自動(dòng)化、重復(fù)、低層次的任務(wù)和查詢工作;同時(shí),在一個(gè)更大、更復(fù)雜的系統(tǒng)中承擔(dān)銷售成本的作用。由于我們期待太多,要求過急,對他們以及我們都造成了傷害。但這并不是故事的全部。是的,我們的行業(yè)嚴(yán)重高估了聊天機(jī)器人的初始影響效應(yīng)。
正如比爾蓋茨曾經(jīng)說過的:
我們總是高估接下來兩年將要發(fā)生的變化,同時(shí)低估接下來10年將要發(fā)生的變化。
不要讓自己陷入一種不作為的境地。
炒作已經(jīng)結(jié)束。這是一件好事?,F(xiàn)在,我們可以開始檢查中間的灰色區(qū)域,而不是那些過度膨脹、瘋狂的黑白極端區(qū)域。我相信我們正處于爆炸性增長的開端。這種反高潮的感覺對于轉(zhuǎn)換技術(shù)來說是完全正常的。消息傳遞將繼續(xù)吸引用戶。聊天機(jī)器人不會(huì)消失。NLP和人工智能每天都在變得越來越復(fù)雜。開發(fā)人員、應(yīng)用程序和平臺(tái)將持續(xù)試驗(yàn),并大量投資于會(huì)話式營銷。我迫不及待地想看看接下來會(huì)發(fā)生什么。
評論
查看更多