妺妺窝人体色www聚色窝图片,第一精品福利导福航,国产欧美日

作者：邵浩

作為人工智能時(shí)代的入口級(jí)產(chǎn)品，近年來，聊天機(jī)器人受到了大量的關(guān)注，也得到了快速的發(fā)展。但隨著 2018 年 Facebook 關(guān)閉其虛擬助手 M，亞馬遜 Echo 也被爆出侵犯用戶隱私的問題，再加上聊天機(jī)器人實(shí)際使用效果遠(yuǎn)低于大眾預(yù)期，整個(gè)行業(yè)也逐步走向低迷。聊天機(jī)器人的困境到底在哪兒？在如今的技術(shù)條件和市場(chǎng)環(huán)境下，聊天機(jī)器人廠家如何進(jìn)行突圍？使用新技術(shù)，開辟新賽道，是否能解決問題？本文將詳細(xì)梳理聊天機(jī)器人的現(xiàn)狀及技術(shù)，指出其存在的問題，并討論了未來可能的發(fā)展方向。本文作者為狗尾草人工智能研究院院長(zhǎng)、日本國立九州大學(xué)工學(xué)博士邵浩。

困境

一、聊天機(jī)器人太傻了

我是一個(gè)聊天機(jī)器人的從業(yè)者，辦公桌上和家里有各式各樣的聊天機(jī)器人產(chǎn)品。和大多數(shù)用戶的體驗(yàn)一樣，對(duì)于一個(gè)剛剛到手的產(chǎn)品，最開始的感覺是新鮮興奮，但當(dāng)體驗(yàn)完功能之后，剩下的就是失望和無奈。然后，很可能就將其放在角落里再也不會(huì)打開，或者僅僅作為一個(gè)音箱，來播放音樂。

這就跟聊天機(jī)器人廠商的初衷背道而馳了。一邊是廠商希望用戶長(zhǎng)久留存在產(chǎn)品上，一邊是用戶對(duì)產(chǎn)品的日均使用時(shí)間快速下降。那么為什么會(huì)出現(xiàn)這種情況？為什么大多數(shù)用戶對(duì)于聊天機(jī)器人的滿意度很低？

從人類的天性中，可以一窺端倪。天主教教義對(duì)人類的惡性分為七種。舉例來說，人類是懶惰的，總是希望以最少的代價(jià)獲取最大的利益。而由于技術(shù)的限制，和聊天機(jī)器人的對(duì)話經(jīng)常會(huì)使得溝通成本增加。比如，語音識(shí)別率在實(shí)際場(chǎng)景中不可能達(dá)到 100%，也就造成了在嘈雜環(huán)境中喚醒聊天機(jī)器人，許多時(shí)候是一個(gè)很不舒服的體驗(yàn)。相比而言，人類的耳朵對(duì)于「雞尾酒會(huì)效應(yīng)」卻游刃有余。又比如，想讓聊天機(jī)器人完成一項(xiàng)功能（訂機(jī)票、查天氣或播放一首特定風(fēng)格的音樂），有時(shí)候必須通過非常明確的語言，進(jìn)行多次溝通。相比而言，古代皇帝想做一件事情的時(shí)候，甚至不需要用到語言，只需一個(gè)眼神，太監(jiān)就馬上能意會(huì)到皇帝的目的。這里提到的還只是純交互部分的問題，如果再出現(xiàn)網(wǎng)絡(luò)延遲、敏感詞和敏感話題、甚至還有一些稀奇古怪的 bug，讓聊天機(jī)器人答非所問，就會(huì)讓人更加不滿。

作為從業(yè)人員，我在使用這些產(chǎn)品的時(shí)候還是很寬容的，由于知道聊天機(jī)器人的軟肋，就會(huì)盡可能的跟聊天機(jī)器人心平氣和的對(duì)話。一次不行，我再試一次，這個(gè)指令不管用，我再換一種問法。但對(duì)于普通用戶，可不會(huì)買賬。我們看下如圖 1 這個(gè)用戶，冷不丁的半夜被聊天機(jī)器人的怪笑嚇個(gè)半死。英文翻譯過來的意思就是「躺在床上正要睡著了，突然某某某音箱中的虛擬助手向我發(fā)出很大聲讓人毛骨悚然的笑聲... 今晚我要被殺了」。這個(gè)時(shí)候，如果是我的話，除了把它從樓上扔下去摔個(gè)粉碎之外，好像也沒有什么平復(fù)心情的辦法了。

圖 1. 用戶對(duì)聊天機(jī)器人的吐槽

再舉一個(gè)例子，在分析用戶使用數(shù)據(jù)的時(shí)候可以發(fā)現(xiàn)，排名靠前的功能主要有閑聊、問天氣、播放音樂等。剛接觸這個(gè)行業(yè)的時(shí)候，我曾認(rèn)為，既然是被高頻觸發(fā)的功能，就證明這些是用戶的「剛需」。只要對(duì)剛需功能做好優(yōu)化，用戶留存度和滿意度自然會(huì)大幅提升。后來才慢慢體會(huì)到，有些時(shí)候，并不是用戶真的最喜歡問天氣和播放音樂，而是其他的功能體驗(yàn)感實(shí)在是差強(qiáng)人意，比較成熟的也就剩下天氣和音樂了。這就牽扯到「七宗罪」中的又一個(gè)「罪」：貪婪。用戶總是想得到更多，所以在剛拿到聊天機(jī)器人產(chǎn)品的時(shí)候，自然而然的會(huì)不斷試探其邊界，所以交互的內(nèi)容也會(huì)天馬行空，五花八門。但如果用戶得到的都是負(fù)面反饋，隨著期望的降低，問答范圍也會(huì)縮小到一些成熟和穩(wěn)定的功能上。就好像是新婚之夜，滿懷期待掀開新娘的面紗，卻發(fā)現(xiàn)等待著的是如花。

二、為什么要做聊天機(jī)器人

既然聊天機(jī)器人效果都做的不好，那為什么還有大量的公司一窩蜂涌入到這個(gè)市場(chǎng)？頭部廠商不惜重金做補(bǔ)貼，甚至能做到人民幣兩位數(shù)的售價(jià)。尤其像兒童教育聊天機(jī)器人，雖然已成為血海市場(chǎng)，仍然還有很多公司前赴后繼進(jìn)入到這個(gè)賽道。

這還要從我們所處的時(shí)代說起。我是 80 后，很幸運(yùn)經(jīng)歷了近 40 年技術(shù)爆發(fā)的 4 個(gè)時(shí)代，分別是 PC 時(shí)代、互聯(lián)網(wǎng)時(shí)代、移動(dòng)互聯(lián)網(wǎng)時(shí)代和人工智能時(shí)代。而我們現(xiàn)在所處的人工智能時(shí)代，也正是 AI技術(shù)發(fā)展歷史上的第三次浪潮。

每一個(gè)時(shí)代都有其對(duì)應(yīng)的入口級(jí)產(chǎn)品。在 80 到 90 年代，個(gè)人電腦是最主要的入口，其特點(diǎn)是「運(yùn)算力改變生活」，個(gè)人電腦和 Windows 操作系統(tǒng)，成就了 IBM 和微軟兩個(gè)硬件和軟件的巨頭。我至今還記得當(dāng)時(shí)用一臺(tái) 486 電腦和 14 寸的球面顯示器，玩仙劍奇?zhèn)b傳的場(chǎng)景。而在隨后到來的互聯(lián)網(wǎng)時(shí)代，核心特點(diǎn)是「連接顛覆一切」，人們可以通過網(wǎng)絡(luò)隨時(shí)隨地進(jìn)行信息搜索和信息交互，同時(shí)也造就了谷歌這樣一個(gè)偉大的公司。第三個(gè)時(shí)代是移動(dòng)互聯(lián)網(wǎng)時(shí)代，移動(dòng)技術(shù)帶來了兩大變革，一是數(shù)據(jù)利用效率的提升，導(dǎo)致服務(wù)發(fā)生了變化，人們可以隨時(shí)隨地享受例如叫車、點(diǎn)餐等即時(shí)服務(wù)，二是交互方式的改變，智能手機(jī)（主要是觸屏手機(jī)）成為了入口級(jí)設(shè)備，這個(gè)時(shí)代中最具有代表性的公司就是蘋果，iPhone 也成為了顛覆性的產(chǎn)品。

當(dāng)人們跨越到人工智能時(shí)代，微軟又提出對(duì)話即平臺(tái)（Conversation As A Platform）的理念，并稱之為一種交互方式的「回歸」。之所以稱之為「回歸」，是因?yàn)閺倪h(yuǎn)古時(shí)代起，語言是人類最自然的交互方式。人們通過語言來打招呼、八卦、協(xié)同狩獵，也就拉近了群體中人與人之間的距離。以色列歷史學(xué)家尤瓦爾?赫拉利的《人類簡(jiǎn)史》甚至把「八卦」提到了非常重要的位置，是人與動(dòng)物、人與其他史前人類的關(guān)鍵區(qū)別。以前由于技術(shù)的限制，人們不得不通過鍵盤和鼠標(biāo)與機(jī)器進(jìn)行「對(duì)話」，而現(xiàn)在我們具備了「對(duì)話即平臺(tái)」的條件，可以很好的實(shí)現(xiàn)這種最自然的交互方式，完成各種服務(wù)。因此，在人工智能時(shí)代，語音交互產(chǎn)品也自然而然成為了入口級(jí)產(chǎn)品，而聊天機(jī)器人就是一個(gè)最典型的體現(xiàn)。

因此，為了搶占這一「入口」，無論是技術(shù)巨頭還是創(chuàng)業(yè)大軍，都加入到了本就不寬的賽道中來，就如「千樹萬樹梨花開」一樣，出現(xiàn)了大量的聊天機(jī)器人產(chǎn)品。同時(shí)在 B 端和 G 端市場(chǎng)，為了顯得自己的高大上，很多大企業(yè)和政府機(jī)構(gòu)也都紛紛推出自己的智能問答系統(tǒng)。然而，好奇害死貓，「入口」害死人?，F(xiàn)在的聊天機(jī)器人已經(jīng)變成了血海市場(chǎng)，哀鴻遍野。技術(shù)的低門檻，產(chǎn)品的同質(zhì)化，再加上頭部廠商的補(bǔ)貼策略，大公司長(zhǎng)期虧損，中小型公司的生存更為艱難。尤其是 18 年開始的「資本寒冬」，很多的聊天機(jī)器人公司要么關(guān)門，要么轉(zhuǎn)型，這個(gè)我們暫時(shí)按下不表，后面還有更多討論。

三、聊天機(jī)器人是什么

聊天機(jī)器人從字面上來講，就是會(huì)聊天的機(jī)器人。但「會(huì)聊天」涵蓋的范圍太廣了。人們總是希望給事物打上標(biāo)簽，給出定義。因此，對(duì)于聊天機(jī)器人而言，我們給出幾類角度不同的分類。

首先，從用途和使用場(chǎng)景上看，聊天機(jī)器人可以簡(jiǎn)單分為功能類和娛樂類。所謂功能類，一般是為了解決某個(gè)特定的問題，比如說個(gè)人助理、音樂播放、兒童故事、網(wǎng)上購物等。而娛樂類，大多是為了陪伴用戶閑聊。微軟小娜（Cortana）和微軟小冰，分別是功能類和娛樂類的典型代表。

其次，從生態(tài)系統(tǒng)上看，聊天機(jī)器人可以分為產(chǎn)品、框架和平臺(tái)三類。我們?cè)谑袌?chǎng)上所看到的，以及日常所使用的都稱之為「產(chǎn)品」，包括純軟件形態(tài)和軟硬件結(jié)合的品類，例如微軟小冰，亞馬遜 Echo、iPhone 上的 Siri，公子小白、小米音箱等。除此之外，為了加速實(shí)際產(chǎn)品的研發(fā)，很多公司專門對(duì)外提供聊天機(jī)器人框架（Framework），以 SDK 或者 SAAS 服務(wù)的形態(tài)，供需求方來構(gòu)建特定場(chǎng)景和領(lǐng)域的聊天機(jī)器人。典型代表包括支持 Echo 的 Amazon Alexa，微軟的 Luis with Bot 等。另外，一些純軟件形態(tài)的聊天機(jī)器人，需要承載其應(yīng)用的「平臺(tái)」（Platform），比如說微信、Facebook 等。這樣就構(gòu)成了整個(gè)聊天機(jī)器人的生態(tài)體系。

最后，從交互方式上看，聊天機(jī)器人可以分為主動(dòng)交互型和被動(dòng)交互型兩種，其中，被動(dòng)交互型又包括閑聊型、任務(wù)型和問答型三類。我們接觸到的絕大多數(shù)產(chǎn)品屬于被動(dòng)交互，即由用戶發(fā)起對(duì)話，機(jī)器理解對(duì)話并作出相應(yīng)的回應(yīng)。主動(dòng)交互可以更好的體現(xiàn)機(jī)器人和用戶之間的對(duì)等關(guān)系，即由機(jī)器人主動(dòng)發(fā)起，通過共享或推薦用戶感興趣的熱點(diǎn)信息，和人類進(jìn)行互動(dòng)，但目前更多的是作為對(duì)傳統(tǒng)交互方式的一種補(bǔ)充，并未得到大規(guī)模廣泛應(yīng)用。從被動(dòng)交互的三種類型來看，閑聊型主要是進(jìn)行客觀話題討論，或者用戶對(duì)聊天機(jī)器人進(jìn)行一些情感表達(dá)，微軟小冰就具有很強(qiáng)的閑聊屬性。而任務(wù)型是為了滿足一個(gè)特定的任務(wù)或者目標(biāo)，比如說利用 Siri 可以設(shè)定鬧鐘、預(yù)定餐館等。對(duì)于問答型聊天機(jī)器人，需要解決用戶對(duì)于事實(shí)型（Factoid）問答（如 what、which、who、where 和 when）問題的回復(fù)，以及非事實(shí)型問答（如 how 和 why）的回復(fù)。

用戶在和聊天機(jī)器人交互的過程中，會(huì)夾雜各式各樣的意圖。舉一個(gè)簡(jiǎn)單的例子，以下是一段對(duì)話：

```

Q: 你知道阿楠的電話號(hào)碼么？

A: 知道

Q: 那你能告訴我他的號(hào)碼么？

A: 可以

```

我們可以看到，這其實(shí)是一段無意義的廢話。用戶的意圖是想要阿楠的電話號(hào)碼（任務(wù)型對(duì)話），而聊天機(jī)器人的回復(fù)完全屬于閑聊型對(duì)話。

四、理想和現(xiàn)實(shí)

從七十年前的原子彈，到五十年前的粒子對(duì)撞機(jī)，再到二十年前的基因編輯技術(shù)，技術(shù)的在近百年來有了突飛猛進(jìn)的發(fā)展。而在人工智能如此火熱的今天，為什么聊天機(jī)器人就做不好？這就需要先簡(jiǎn)單聊一下人工智能技術(shù)的現(xiàn)狀。

文因互聯(lián)的鮑捷老師曾給出一個(gè)人工智能三次熱潮的曲線圖（圖 2），人工智能至今經(jīng)歷了三次大的熱潮。而這一輪人工智能熱潮，是伴隨著大數(shù)據(jù)和深度學(xué)習(xí)的興起。深度學(xué)習(xí)技術(shù)最早期的研究起始于上世紀(jì)六十年代的感知器，而直到最近的十年，隨著軟件和硬件的成熟，深度學(xué)習(xí)才取得了爆發(fā)式的進(jìn)步，在多個(gè)領(lǐng)域例如圖像識(shí)別，語音識(shí)別等都突破了人類最好的成績(jī)?；馃岬娜斯ぶ悄軒砹撕芏鄼C(jī)會(huì)，也帶來了很多問題。資本的大量涌入，使得市場(chǎng)上涌現(xiàn)了一大批 AI 初創(chuàng)公司，同時(shí)媒體的大肆宣揚(yáng)，也使得大眾的胃口和期望被吊得越來越高。普通的技術(shù)成果已無法吸引讀者的關(guān)注，很多媒體就開始用夸張的標(biāo)題和內(nèi)容來吸引眼球，比如說「人類要被機(jī)器人取代」「重磅！機(jī)器開始威脅人類」等等。更不用說像 Sophia 這種偽 AI 的出現(xiàn)，使得人們覺得 Sophia 就是人工智能應(yīng)該有的樣子。而且，就好比 AlphaGo 并不能給人類端茶倒水一樣，在一個(gè)特定領(lǐng)域的優(yōu)秀表現(xiàn)，并不能代表 AI 技術(shù)無所不能。又例如，谷歌在 2018 年開發(fā)者大會(huì)上演示了一個(gè)預(yù)約理發(fā)店的聊天機(jī)器人，人們?cè)诖蠛趔@艷的同時(shí)，自然而然的覺得人工智能技術(shù)應(yīng)該可以上天入地，做到任何事情，甚至取代人類。

圖 2. 人工智能三次熱潮

這是技術(shù)從業(yè)者的悲劇。羅馬從來都不是一天能夠建成的，技術(shù)的突破也必然會(huì)經(jīng)歷一定時(shí)間的積累。很多時(shí)候，本來應(yīng)該穩(wěn)步推進(jìn)的技術(shù)，卻在落地之時(shí)，面臨投資者和用戶被吊得足夠高的胃口，不得不去做一些虛假宣傳。比如說：「我的產(chǎn)品可以完美解決雞尾酒會(huì)效應(yīng)」「訂咖啡、購物、訂票，我們的產(chǎn)品都可以幫你做到」等等。然后，就沒有然后了。

因此，人工智能除了經(jīng)典的三大主義（符號(hào)主義、連接主義、行為主義）之外，現(xiàn)在又多了第四個(gè)分類，叫做媒體主義。

回到深度學(xué)習(xí)技術(shù)的發(fā)展上來，AlphaGo都能打敗人類最頂尖的棋手，擁有 15 億參數(shù)的 GPT-2 模型已經(jīng)可以做到文本續(xù)寫，為什么深度學(xué)習(xí)卻沒有真正解決聊天機(jī)器人的自然交互？且不說訓(xùn)練成本的問題，目前技術(shù)能夠做到比較好的基本上都是單輪交互（也就是一問一答），在多輪交互上，除了在某些特定場(chǎng)景可以表現(xiàn)較好（如 Google 開發(fā)者大會(huì)上的理發(fā)店預(yù)約場(chǎng)景），在開放式聊天中往往會(huì)慘不忍睹（這一點(diǎn)我們下一節(jié)會(huì)詳細(xì)討論）。而單輪交互，在技術(shù)上最簡(jiǎn)單的解決方案，是寫一大堆的句子，并使用基本的檢索方法和規(guī)則來選取已經(jīng)寫好的答案來進(jìn)行回復(fù)，甚至可以完全不用深度學(xué)習(xí)方法。所以才會(huì)出現(xiàn)僅通過堆語料就能創(chuàng)造出一個(gè)表現(xiàn)尚佳的聊天機(jī)器人。

作為從業(yè)者，從技術(shù)的角度上來講，聊天機(jī)器人的表現(xiàn)其實(shí)已經(jīng)非常不錯(cuò)了。甚至在某一些特定場(chǎng)景下足以以假亂真了。我們經(jīng)常會(huì)被一些廣告營(yíng)銷電話騷擾，以前還都是真人在和我們溝通，而現(xiàn)在出現(xiàn)了大量的聊天機(jī)器人，他們不知疲倦，可以 24 小時(shí)*7 天不間斷工作，通過電話語音，甚至很多情況下我們都無法判斷對(duì)方是不是機(jī)器人。這是因?yàn)?，在特定?chǎng)景下，對(duì)話可以跳轉(zhuǎn)的狀態(tài)一般都是有限的，可能產(chǎn)生的話題分支，比起圍棋的可能性要少很多，因此，即便是窮舉所有的可能性，也不是不可做到的事情。如果提前設(shè)置好對(duì)話策略，加上語音合成技術(shù)，完全可以以假亂真。

我們都知道，圖靈測(cè)試由英國數(shù)學(xué)家阿蘭?圖靈于 1950 年發(fā)明，是指測(cè)試者在與被測(cè)試者（一個(gè)人和一臺(tái)機(jī)器）隔開的情況下，通過一些裝置（如鍵盤）向被測(cè)試者隨意提問。進(jìn)行多次測(cè)試后，如果有超過 30% 的測(cè)試者不能確定出被測(cè)試者是人還是機(jī)器，那么這臺(tái)機(jī)器就通過了測(cè)試，并被認(rèn)為具有人類智能。2014 年 6 月，一個(gè)偽裝成烏克蘭 13 歲男孩的機(jī)器人尤金?古特曼，順利的通過了圖靈測(cè)試。其實(shí)，通過這個(gè)測(cè)試也用了一些小技巧，比如說「13 歲男孩」，可以裝作自己的思考能力不夠成熟，同時(shí)，來自「烏克蘭」可以有效掩蓋其英文水平的不足。但嚴(yán)格意義上來說，通過圖靈測(cè)試并不能代表機(jī)器已經(jīng)具有自然對(duì)話的能力。曾看到過一篇關(guān)于圖靈生平的文章，提到圖靈在 1952 年被判犯有同性戀行為，并被迫接受化學(xué)閹割，兩年后圖靈自殺身亡。而圖靈測(cè)試，其實(shí)就是反映了在上世紀(jì) 50 年代的英國，每一位同性戀男性必須通過的日常測(cè)試：你是否能偽裝成一個(gè)異性戀者？根據(jù)圖靈的看法，未來的計(jì)算機(jī)就像當(dāng)時(shí)的同性戀者，計(jì)算機(jī)有沒有意識(shí)并不重要，重要的是人類會(huì)怎么想。

即便是圖靈測(cè)試，也可以看做是一個(gè)特定的「閉域」，在這個(gè)閉域中，聊天的狀態(tài)是預(yù)先可以設(shè)計(jì)的，有很多的策略可以讓對(duì)話在這個(gè)特定的閉域順暢的進(jìn)行下去。而很多聊天機(jī)器人廠商給自己挖的坑，是要做「開域」（也就是通用域）的聊天。在現(xiàn)有的技術(shù)條件下，這就相當(dāng)于給自己的產(chǎn)品判了死刑。因?yàn)樽鐾ㄓ糜蛄奶?，就等同于想?a href="http://www.wenjunhu.com/analog/" target="_blank">模擬人類真實(shí)的對(duì)話，這在目前是不可能完成的任務(wù)。具體緣由我們?cè)谙乱还?jié)詳細(xì)闡述。

五、人是如何聊天的

在人類的聊天中，一句話所包含的文字，所反應(yīng)的內(nèi)容僅僅是冰山一角。比如說「今天天氣不錯(cuò)」，在早晨擁擠的電梯中和同事說，在秋游的過程中和驢友說，走在大街上的男女朋友之間說，在傾盆大雨中對(duì)同伴說，很可能代表完全不同的意思。在人類對(duì)話中需要考慮到的因素包括：說話者和聽者的靜態(tài)世界觀、動(dòng)態(tài)情緒、兩者的關(guān)系，以及上下文和所處環(huán)境等，如圖 3。

圖 3. 人類聊天中的要素

靜態(tài)世界觀：人類在成長(zhǎng)過程中會(huì)建立起自己的世界觀，一般跟跟經(jīng)歷和記憶有關(guān)。比如說一個(gè)素食主義者可能會(huì)非常厭惡談及紅燒肉的話題，又比如提及粉筆劃玻璃，會(huì)讓一部分人很不舒服，但對(duì)另一部分人卻沒任何影響。同時(shí)，對(duì)話的過程中也會(huì)觸發(fā)一些相關(guān)聯(lián)想，比如提到情人節(jié)，會(huì)想到玫瑰花和巧克力，提到下雨天就會(huì)想到雨傘等。魯迅在《而已集?小雜感》也曾寫道「一見到短袖子，立刻想到白臂膊，立刻想到全裸體，（略），中國人的想像惟在這一層能夠如此飛躍」。

動(dòng)態(tài)情緒：表現(xiàn)在交互過程中的表情、動(dòng)作、語氣等。因?yàn)槿祟惖慕换ミ^程通常需要接收多方面信息源，在不同語氣、不同表情，所表達(dá)的含義有可能完全不同。比如說「我恨你」，在戀人間輕柔的對(duì)話中很可能代表「我真的很喜歡你」。

說話者和聽者的關(guān)系：對(duì)話雙方是敵人、家人、朋友還是戀人，話語中所表達(dá)的意思就會(huì)有所區(qū)別。就比如剛剛的例子「今天天氣不錯(cuò)」，在分手多年的戀人見面時(shí)說，很可能就代表「你現(xiàn)在過得好么」。

上下文：相同的詞語和句子，在不同的上下文中也會(huì)有不同的含義?！肝蚁搭^去了」用于微信和 QQ 聊天中，很可能就代表「我不想聊了，再見」的意思。

所處環(huán)境：在不同場(chǎng)景下，相同話語會(huì)觸發(fā)不同的反饋。如果在廁所和人打招呼用「吃過了么」就會(huì)顯得非常尷尬了。

而且，以上這些都不是獨(dú)立因素，整合起來，才能真正反映一句話或者一個(gè)詞所蘊(yùn)含的意思。這就是人類語言的奇妙之處。同時(shí)，人類在交互過程中，并不是等對(duì)方說完一句話才進(jìn)行信息處理，而是隨著說出的每一個(gè)字，不斷的進(jìn)行腦補(bǔ)，在對(duì)方說完之前就很可能了解到其所有的信息。再進(jìn)一步，人類有很強(qiáng)的糾錯(cuò)功能，在進(jìn)行多輪交互的時(shí)候，能夠根據(jù)對(duì)方的反饋，修正自己的理解，達(dá)到雙方的信息同步。在回過頭看開放域的聊天機(jī)器人，寄希望于從一句話的文本理解其含義，這本身就是很不靠譜的一件事情。

目前市場(chǎng)上大部分的聊天機(jī)器人，還僅是單通道的交互（語音或文本），離人類多模態(tài)交互的能力還相差甚遠(yuǎn)。哪怕僅僅是語音識(shí)別，在不同的噪音條件下也會(huì)產(chǎn)生不同的錯(cuò)誤率，對(duì)于文本的理解就更加雪上加霜了。

六、技術(shù)及發(fā)展進(jìn)度

在這一節(jié)，我們討論下現(xiàn)有聊天機(jī)器人所涉及的技術(shù)，但不會(huì)牽扯到技術(shù)細(xì)節(jié)。

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)：機(jī)器學(xué)習(xí)技術(shù)屬于基礎(chǔ)技術(shù)，比如說分類算法可以用于做用戶的意圖分類和情感分類；語言模型可以用于篩選語音識(shí)別后的句子是否通順；聚類算法可以用于做用戶的行為習(xí)慣分析等等。隨著數(shù)據(jù)量越來越多，可以發(fā)揮深度學(xué)習(xí)的優(yōu)勢(shì)，更進(jìn)一步提升聊天機(jī)器人的基礎(chǔ)技術(shù)能力。

自然語言處理：是聊天機(jī)器人語義交互層面的核心技術(shù)。比如說檢索技術(shù)可以選取語料庫中最合適的回復(fù)，命名實(shí)體識(shí)別可以找出句子中的關(guān)鍵信息，如「播放李榮浩的李白」中，李白是指一首歌名。主體識(shí)別可以用于判斷句子的主語，例如「我給你唱歌」和「給我唱歌」的主語是不同的。此外，還有句型判斷、實(shí)體鏈接、詞性標(biāo)注、依存分析等各項(xiàng)技術(shù)，綜合運(yùn)用于對(duì)用戶句子的解析。

數(shù)據(jù)庫技術(shù)：通過數(shù)據(jù)庫技術(shù)，我們可以在預(yù)先存儲(chǔ)好的大規(guī)模語料庫中，快速檢索相近的句子，也可以對(duì)海量的用戶交互數(shù)據(jù)進(jìn)行存儲(chǔ)并進(jìn)一步分析。

知識(shí)圖譜技術(shù)：是聊天機(jī)器人實(shí)現(xiàn)認(rèn)知交互的關(guān)鍵技術(shù)之一，可以幫助聊天機(jī)器人進(jìn)行記憶、聯(lián)想和推理。關(guān)于知識(shí)圖譜，我們放到本文的下半部分專門討論。

聲學(xué)技術(shù)：包括語音識(shí)別、語音合成、聲紋遷移、聲紋識(shí)別以及歌聲合成等，為聊天機(jī)器人提供了更加豐富的表現(xiàn)力。聲學(xué)技術(shù)也牽扯到和芯片、硬件（例如麥克風(fēng)陣列）的配合。

計(jì)算機(jī)視覺技術(shù)：通過計(jì)算機(jī)視覺技術(shù)，可以進(jìn)行人臉識(shí)別、情緒識(shí)別，并可以進(jìn)一步配合語音、語義技術(shù)對(duì)用戶語句進(jìn)行深度分析。

其他技術(shù)：很多聊天機(jī)器人產(chǎn)品具備硬件形態(tài)，包括虛擬形象，因此也需要芯片技術(shù)、硬件、全息技術(shù)、美術(shù)和設(shè)計(jì)的支持。

聊天機(jī)器人一定是一個(gè)技術(shù)整合的產(chǎn)物，在一個(gè)有很多串行模塊的系統(tǒng)中，有個(gè)很重要的問題是錯(cuò)誤傳遞。比如說有 5 個(gè)串行模塊，每個(gè)模塊的性能都是 95%，最終的結(jié)果卻只有 77%。所以，在設(shè)計(jì)一個(gè)聊天機(jī)器人架構(gòu)的時(shí)候也需要盡可能避免模塊的串行化。同時(shí)，對(duì)于多輪交互架構(gòu)，也需要有更加成熟的設(shè)計(jì)。

Gartner 給出的最新技術(shù)成熟度的圖，也反映了不同技術(shù)的發(fā)展現(xiàn)狀。網(wǎng)上流傳的一句話說到，當(dāng)某個(gè)領(lǐng)域的代表性人物獲得了圖靈獎(jiǎng)，也就代表了這個(gè)領(lǐng)域輝煌時(shí)代的結(jié)束。2019 年 3 月 27 日，ACM 宣布，深度學(xué)習(xí)的三位創(chuàng)造者 Yoshua Bengio，Yann LeCun，以及 Geoffrey Hinton 共同獲得了 2019 年的圖靈獎(jiǎng)。在曲線中，我們也看到深度學(xué)習(xí)處于曲線的最高峰，并且即將處于下降的趨勢(shì)，也在一方面印證了隨著大數(shù)據(jù)紅利的消失，以深度學(xué)習(xí)為代表的感知智能也觸碰到了天花板。

圖 4. Gartner2018 技術(shù)成熟度曲線

破局

一、產(chǎn)業(yè)現(xiàn)狀

隨著人工智能的第三次浪潮，涌現(xiàn)了一大批聊天機(jī)器人公司，其中有平臺(tái)型公司，也有產(chǎn)品型公司。從業(yè)務(wù)角度上來看，主要分為三類：

2C 公司：主要產(chǎn)出直接面向用戶的產(chǎn)品，例如公子小白、小米音箱、天貓精靈、微軟小冰等；有一些公司還做開放性框架，例如海知智能的如意、百度的 UNIT 等。當(dāng)然，還有一些公司專門針對(duì)聊天機(jī)器人推出技能包業(yè)務(wù)，比如說故事技能、冷笑話技能、訂票技能、大冒險(xiǎn)游戲技能等。

2B 公司：主要做各種場(chǎng)景的落地，比如說金融領(lǐng)域的智能監(jiān)管系統(tǒng)、醫(yī)療領(lǐng)域的醫(yī)療問答助手和診斷助手、銀行柜臺(tái)的客服機(jī)器人、淘寶店家的智能客服等。有些時(shí)候，場(chǎng)景落地也是在跟風(fēng)，例如各大銀行的智能客服，有一個(gè)感覺是別人做了，我就一定要做，這樣才顯得在 AI 上的先進(jìn)性。但實(shí)際效果，大家在體驗(yàn)之后也會(huì)有所判斷。

2G 公司：主要面向政府做政務(wù)類的知識(shí)庫構(gòu)建和問答業(yè)務(wù)。隨著人工智能被寫入政府工作報(bào)告，各級(jí)政府對(duì)于 AI 的落地應(yīng)用都有比較高的需求。比如說政府服務(wù)大廳的引導(dǎo)型聊天機(jī)器人、一站式辦事機(jī)器人；政府部門的智能搜索引擎和問答系統(tǒng)等。

在 C 端市場(chǎng)，產(chǎn)品是需要挑剔的用戶買單的。正如本文上半部分所說，在目前的技術(shù)條件下，聊天機(jī)器人的使用感受遠(yuǎn)未達(dá)到用戶的期望值，因此，很多 2C 公司在早期融資消耗完畢之后，產(chǎn)品也未得到用戶的認(rèn)可，從而不得不考慮業(yè)務(wù)的轉(zhuǎn)型，走向 2B 和 2G 的賽道。但很清楚的一點(diǎn)是，轉(zhuǎn)型之后，并不一定是技術(shù)好的公司就能接到單子，能否拿到項(xiàng)目，其中的因素也請(qǐng)各位自己體會(huì)。

另外，有一個(gè)很重要的誤區(qū)在于高估了技術(shù)的作用。誠然，有一些非常優(yōu)秀的學(xué)者，或者大公司出來的技術(shù)高管，利用自己的實(shí)力和擁有的核心算法，成功的進(jìn)行了融資和快速發(fā)展，比如說第四范式、三角獸、竹間智能等公司。但大多數(shù)宣稱自己擁有某一項(xiàng)壟斷性技術(shù)的公司，都沒有走到這一步。例如我前年曾經(jīng)關(guān)注過的某創(chuàng)業(yè)團(tuán)隊(duì)，宣稱自己的 NLU 技術(shù)世界領(lǐng)先，包括分詞、詞性標(biāo)注、依存、命名實(shí)體識(shí)別等，在其官網(wǎng)上也很自信的提供 NLU 平臺(tái)供用戶試用，想要打造一個(gè)開放的聊天機(jī)器人平臺(tái)。但現(xiàn)在再去看其發(fā)展，已經(jīng)開始轉(zhuǎn)向做 B 端的垂直場(chǎng)景業(yè)務(wù)了。另外還有一家公司，想用更深入的邏輯仿生技術(shù)打造機(jī)器人意識(shí)，然而其核心團(tuán)隊(duì)人員已經(jīng)開始大量流失。

在目前的聊天機(jī)器人賽道上，很多成功的公司所使用的技術(shù)都不是自研發(fā)的，國內(nèi)很知名的一家代工廠商，通過集成開放的 API 和 SDK，也能夠打造一款低價(jià)的兒童聊天機(jī)器人，并做了很多 OEM 的業(yè)務(wù)。而且隨著 Google、Facebook 等巨頭的技術(shù)不斷開源，技術(shù)的門檻也越來越低，就算是擁有一個(gè)世界級(jí)領(lǐng)先的單點(diǎn)技術(shù)，也很有可能不會(huì)比用規(guī)則匹配和大規(guī)模語料庫拼起來的產(chǎn)品效果更好。

當(dāng)然，技術(shù)領(lǐng)先，在另一方面，也可以用于提升公司的形象，做更好的 PR，從而獲取更多的融資，吸引更優(yōu)秀的人才。達(dá)到一個(gè)正循環(huán)之后，可以用足夠多的資源將產(chǎn)品打造的更為優(yōu)秀。

大家常說人工智能的三大要素，包括數(shù)據(jù)、算法和算力。而在聊天機(jī)器人的技術(shù)體系下，最關(guān)鍵的三個(gè)因素應(yīng)該是人工、數(shù)據(jù)和算法。而在現(xiàn)階段，人工是大于數(shù)據(jù)，更大于算法的。工程化才是一個(gè)產(chǎn)品成功的關(guān)鍵。

二、知識(shí)圖譜能解決問題么

近兩年來，隨著 AI 熱度的降低，無論是投資者還是從業(yè)者，都開始關(guān)注另一項(xiàng)技術(shù)-知識(shí)圖譜。知識(shí)圖譜技術(shù)也是一個(gè)融合型技術(shù)，包括數(shù)據(jù)庫、自然語言處理、知識(shí)表示、機(jī)器學(xué)習(xí)等等。其最近的火爆程度，可以從國內(nèi)知識(shí)圖譜的旗艦會(huì)議（CCKS）的參會(huì)人數(shù)一窺端倪。CCKS 全稱是全國知識(shí)圖譜與語義計(jì)算大會(huì)（China Conference on Knowledge Graph and Semantic Computing）。CCKS2016 成立之初只有 500 名參會(huì)者，這個(gè)數(shù)據(jù)到了 2017 年是 600 人，2018 年是 800 人，而 2019 年杭州的會(huì)議，預(yù)計(jì)參會(huì)者將突破 1000 人。

作為從感知智能到認(rèn)知智能跨越的重要基石之一，知識(shí)圖譜被寄予了厚望。張鈸院士也提到，「沒有知識(shí)的 AI 不是真正的 AI」。拿最新的 GPT-2 算法來看，即使其文章續(xù)寫能力讓人贊嘆，也只是再次證明了足夠大的神經(jīng)網(wǎng)絡(luò)配合足夠多的訓(xùn)練數(shù)據(jù)，就能夠產(chǎn)生強(qiáng)大的記憶能力。但邏輯和推理能力，仍然是無法從記憶能力中自然而然的出現(xiàn)的。學(xué)界和企業(yè)界都寄希望于知識(shí)圖譜解決知識(shí)互連和推理的問題。那么什么是知識(shí)圖譜？簡(jiǎn)單來說，就是把知識(shí)用圖的形式組織起來?？赡苓@樣說還不夠明白，我們舉例子分別說下什么是知識(shí)，什么是圖譜。

所謂知識(shí)，是信息的抽象，一個(gè)很著名的 DIKW 體系，由 Rowley 在 2007 年提出，如圖 5 所示。從數(shù)據(jù)到信息到知識(shí)再到智慧，是一個(gè)不斷凝練的過程。

圖 5. DIKW 體系

舉一個(gè)簡(jiǎn)單的例子來說，226.1 厘米，229 厘米，都是客觀存在的孤立的數(shù)據(jù)。此時(shí)，數(shù)據(jù)不具有任何的意義，僅表達(dá)一個(gè)事實(shí)存在。而「姚明臂展 226.1 厘米」，「姚明身高 229 厘米」，是事實(shí)型的陳述，屬于信息的范疇。對(duì)于知識(shí)而言，是在更高層面上的一種抽象和歸納，把姚明的身高、臂展，及姚明的其他屬性整合起來，就得到了對(duì)于姚明的一個(gè)認(rèn)知，也可以進(jìn)一步了解姚明的身高是比普通人更高的。最后的智慧層面，Zeleny 提到的智慧是指知道為什么（Know-why）[1]，本文不對(duì)此進(jìn)行深入論述。

圖譜的英文是 graph，直譯過來就是「圖」的意思。在圖論（數(shù)學(xué)的一個(gè)研究分支）中，圖（graph）表示一些事物（objects）與另一些事物之間相互連接的結(jié)構(gòu)。一張圖通常由一些結(jié)點(diǎn)（vertices 或 nodes）和連接這些結(jié)點(diǎn)的邊（edge）組成。Sylvester 在 1878 年首次提出了「圖」這一名詞 [2]。如果我們把姚明相關(guān)的「知識(shí)」用「圖譜」構(gòu)建起來，就是圖 6 所體現(xiàn)的內(nèi)容。

圖 6. 姚明的基本信息知識(shí)圖譜

在聊天機(jī)器人中使用知識(shí)圖譜，我們的期望是能夠解決很多復(fù)雜的推理問題，包括常識(shí)推理問題。比如說「雞蛋放到籃子里，是雞蛋大還是籃子大」，「蘇大強(qiáng)的大兒子是誰」等等。從而使得聊天機(jī)器人的對(duì)話更加具有「智慧」，不僅能記憶，還能推理、聯(lián)想和推薦，從感知層面真正跨越到認(rèn)知層面。

愿望是美好的，但真正將知識(shí)圖譜落地卻鮮見成功案例。考慮到成本問題，知識(shí)圖譜問答在聊天機(jī)器人中的應(yīng)用還不夠廣泛。況且，一些需求方對(duì)知識(shí)圖譜還存在不少誤區(qū)。很多企業(yè)和政府機(jī)構(gòu)在談項(xiàng)目需求的時(shí)候，一上來就說，「我想用知識(shí)圖譜技術(shù)，你們能不能把現(xiàn)在的知識(shí)庫變成知識(shí)圖譜？實(shí)現(xiàn)大數(shù)據(jù)的鏈接？」「你們做的問答是不是基于知識(shí)圖譜的問答？」等等，其實(shí)，知識(shí)圖譜問答能不能應(yīng)用，要綜合考量多方面因素，就拿知識(shí)的表示和存儲(chǔ)來說，選用不同的數(shù)據(jù)庫，需要用到不同的知識(shí)表示。RDF（數(shù)據(jù)的一種三元組表示形式）的數(shù)據(jù)表示可以選用 Jena 數(shù)據(jù)庫，而圖表示可以選用 Neo4j 圖數(shù)據(jù)庫。對(duì)不同來源的數(shù)據(jù)還需要進(jìn)行大量的數(shù)據(jù)清洗和結(jié)構(gòu)化，甚至還牽扯到紙質(zhì)文檔（例如醫(yī)院的文本病歷）的手工錄入。結(jié)合業(yè)務(wù)來看，很多時(shí)候傳統(tǒng)關(guān)系型數(shù)據(jù)庫就能解決的問題，完全沒必要用到大規(guī)模圖數(shù)據(jù)庫，否則很容易導(dǎo)致整個(gè)項(xiàng)目的成本高、效率低的問題。

Heiko Paulheim 在其文章《How much is a Triple?Estimating the Cost of Knowledge Graph Creation》中，給出了幾個(gè)典型的知識(shí)圖譜的構(gòu)建成本。其中，上世紀(jì) 80 年代開始的也是最早的知識(shí)圖譜項(xiàng)目 CYC，平均構(gòu)建一條陳述句和斷言的成本是 5.71 美元，而隨著自然語言處理和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步，DBpedia 構(gòu)建每一條的成本降低到了 1.85 美分。即便如此，在真正工程化落地的時(shí)候，牽扯到多源數(shù)據(jù)的清洗整合，一個(gè)知識(shí)圖譜項(xiàng)目的成本還是居高不下。

三、垂直領(lǐng)域的戰(zhàn)略收縮

在人工智能投資火爆的前幾年，我們經(jīng)常會(huì)看到估值十億到幾十億的聊天機(jī)器人（或智能問答系統(tǒng)）公司。就像渾水沉淀后能看見底下的泥沙，隨著資本的逐漸冷靜，很多公司也進(jìn)入了艱難的寒冬期。這沒什么不好，真正優(yōu)秀的公司，無論是技術(shù)和商業(yè)模式，都能夠經(jīng)得起考驗(yàn)。

聊天機(jī)器人公司，在戰(zhàn)略收縮的時(shí)候，首先要做的是看清自己公司的核心競(jìng)爭(zhēng)力。最近看了一本書叫做《失去的勝利》，里面提到了德國名將曼施坦因?qū)Χ?zhàn)初期波蘭戰(zhàn)役的回顧和評(píng)論。當(dāng)?shù)聡讶姘鼑ㄌm西部的時(shí)候，波蘭軍隊(duì)仍然把主力沿著邊境部署，而不愿意放棄西部工業(yè)區(qū)，并收縮到維斯托拉河流域右線重點(diǎn)設(shè)防。甚至還寄希望以英法聯(lián)軍的支援，反攻至柏林。結(jié)果可想而知，幻想守住一切，反倒丟掉了一切。

大部分初創(chuàng)公司，應(yīng)該是集中優(yōu)勢(shì)力量突破一個(gè)點(diǎn)，等待資本回暖。同時(shí)精耕細(xì)作一個(gè)細(xì)分領(lǐng)域，在大公司無暇顧及的垂直行業(yè)殺出一條血路。無論是后期被收購還是能夠獨(dú)立壯大，都是比較好的結(jié)果。切忌大而全，什么都想做，做自己擅長(zhǎng)的才是最重要的。舉例來說，一些公司利用硬件優(yōu)勢(shì)轉(zhuǎn)型打造語音交互芯片，另外還有金融知識(shí)圖譜公司從智能投顧轉(zhuǎn)為智能監(jiān)管，還有大批聊天機(jī)器人公司，從做純軟件的聊天機(jī)器人轉(zhuǎn)為為 B 端客戶提供智能客服解決方案。

而且，對(duì)于做平臺(tái)這個(gè)事情，要單獨(dú)提出來聊一聊。自然語言交互平臺(tái)，沒有大量的人員和資金支持，是無法實(shí)現(xiàn)的。由于沒有辦法進(jìn)行工業(yè)級(jí)產(chǎn)出，導(dǎo)致了大量資本投入換來的只是 Demo 和論文，而不是實(shí)實(shí)在在的產(chǎn)品。因此，在細(xì)分領(lǐng)域做強(qiáng)做好，才是小公司的生存之道。

四、商業(yè)模式和產(chǎn)品的重要性

從技術(shù)到產(chǎn)品落地，還只是萬里長(zhǎng)征的第一步，產(chǎn)品在市場(chǎng)上真正被用戶所接受，并能產(chǎn)生良性的流水和利潤(rùn)，這才是正常的商業(yè)模式。我們看下目前幾個(gè)比較火熱的聊天機(jī)器人產(chǎn)品。首先是兒童教育機(jī)器人，教育、醫(yī)療和金融是一直都很熱的領(lǐng)域。自然而然的，很多產(chǎn)品都會(huì)冠以人工智能教育機(jī)器人的名號(hào)。但兒童教育聊天機(jī)器人真正能解決用戶需求么？很明顯不能。大多數(shù)家長(zhǎng)還是報(bào)以嘗鮮的心態(tài)，給孩子買一個(gè)玩具，并沒有寄希望于讓機(jī)器人起到「教育」的作用。但畢竟兒童市場(chǎng)是巨大的，中國有 1.5 億 3 到 12 歲的兒童，每年的新生嬰兒數(shù)量也達(dá)到了 2000 萬。兒童教育機(jī)器人的出貨量在近三年一直保持著 100% 的增長(zhǎng)。因此，在這個(gè)市場(chǎng)上，影響用戶購買的很重要的一個(gè)因素是價(jià)格，也就造成了目前整個(gè)行業(yè)利潤(rùn)的持續(xù)走低。隨著更多廠商的加入，紅海市場(chǎng)也逐漸變成了血海市場(chǎng)。另外一個(gè)典型的案例是老人陪聊機(jī)器人，這種機(jī)器人從商業(yè)模式上來看，我認(rèn)為并不成立。首先，老人們對(duì)聊天機(jī)器人的接受程度不高，購買力也不強(qiáng)。其次，老人在對(duì)話過程中，由于對(duì)話速度、連貫性、方言等問題，使得聊天機(jī)器人的表現(xiàn)要更差。

最近網(wǎng)上討論的很多的一個(gè)典型案例是夸夸機(jī)器人。其來源是「相互表揚(yáng)小組」，這些活躍在 QQ、微信、微博上的社群的目的，言簡(jiǎn)意賅又單刀直入：溜須拍馬，相互夸獎(jiǎng)。無論是高興的事情例如考上了大學(xué)、獲得了獎(jiǎng)勵(lì)，還是倒霉的事情例如被老板罵，烤糊了面包，在群里都可以得到天花亂墜的夸贊。而有公司還真的將夸夸機(jī)器人產(chǎn)品化，但結(jié)果是曇花一現(xiàn)，僅是蹭了一波熱度，卻沒有持續(xù)的用戶留存。其實(shí)，夸夸機(jī)器人在商業(yè)角度上是不成立的，沒有一個(gè)可行的變現(xiàn)路徑。三聯(lián)生活周刊有個(gè)評(píng)論說到：「人們?nèi)菀诪榭旃?jié)奏的生活所累，更容易在各種新鮮事物面前短暫停留。所以人們也清醒地意識(shí)到：來自陌生人的鼓舞與表揚(yáng)雖然溫暖，但保質(zhì)期卻是極其有限與流于表層的」，因此付費(fèi)求夸的事情也變得不切實(shí)際了。

再來看下 2B 的業(yè)務(wù)，真正成功的項(xiàng)目應(yīng)該是給需求方帶來成本的降低或收益的提升。比如說淘寶店家的客服機(jī)器人，一套系統(tǒng)的成本，如果能夠低于將 200 位人工客服降低到 100 位所節(jié)省下來的成本，同時(shí)在獲客效果上又有所提升，那就是一個(gè)成功的項(xiàng)目。況且，對(duì)于開發(fā)者而言，從單一項(xiàng)目逐步變?yōu)?PAAS 服務(wù)或 SAAS 服務(wù)，所帶來的開發(fā)成本會(huì)顯著降低，也就可以為規(guī)?；蛳铝己玫幕A(chǔ)。

剛剛聊了一些商業(yè)模式的問題，那么從產(chǎn)品形態(tài)上，有一句流行的話說的是「技術(shù)不夠，產(chǎn)品來湊；產(chǎn)品不夠，運(yùn)營(yíng)來湊」。既然聊天機(jī)器人受限于技術(shù)無法達(dá)到人類期望值，那么是否可以從產(chǎn)品設(shè)計(jì)的角度上，讓用戶不去關(guān)注技術(shù)表現(xiàn)本身，而是從其他維度對(duì)產(chǎn)品產(chǎn)生粘性？答案是肯定的。做產(chǎn)品的關(guān)鍵在于「高出用戶期望值」，這顯然對(duì)于 AI 產(chǎn)品是不友好的，因?yàn)橛脩羝谕堤吡?，所以要在其他層面上去想辦法。文章一開始提到，產(chǎn)品設(shè)計(jì)的一個(gè)原則應(yīng)該貼合人類的七宗罪。我們?cè)?jīng)獲取過一批來自不同聊天機(jī)器人脫敏后的用戶聊天數(shù)據(jù)，其中包含了很多難等大雅之堂的語言。所以有一些成人用品公司開始用對(duì)話技術(shù)包裝自己的產(chǎn)品，也算是一種成功的商業(yè)實(shí)踐了。

當(dāng)然，從正常的產(chǎn)品角度而言，如果一個(gè)聊天機(jī)器人產(chǎn)品的形象和使用感受，超越了聊天本身，給用戶帶來了不同的驚艷感，也可以算得上一種取長(zhǎng)補(bǔ)短的方法。正如我們下一節(jié)要討論的聊天機(jī)器人的更多形態(tài)，如果聊天機(jī)器人被人格化、IP 化之后，用戶也不會(huì)僅僅關(guān)注對(duì)話，而是會(huì)從更多的需求層面產(chǎn)生對(duì)產(chǎn)品的粘性。

五、多模態(tài)交互和虛擬生命

在技術(shù)不斷進(jìn)步的同時(shí)，聊天機(jī)器人也逐步邁向其下一代范式-虛擬生命。其核心在于模擬生命的主要特征，以多形態(tài)和多模態(tài)進(jìn)行交互 [3]。設(shè)想一下，如果你是蔡徐坤的粉絲，如果有一個(gè)聊天機(jī)器人具備蔡徐坤的形態(tài)和聲音，并且可以進(jìn)行交互，那是多么令人興奮的一件事情。同時(shí)，在不同的性格和人設(shè)下，虛擬生命的交互體驗(yàn)也會(huì)變得更為豐富。

再進(jìn)一步，除了 IP 化和人格化，多模態(tài)交互能力會(huì)進(jìn)一步增強(qiáng)虛擬生命對(duì)用戶的認(rèn)知和表現(xiàn)力。虛擬生命能夠通過麥克風(fēng)陣列、攝像頭聽得到、看得見，使其能夠綜合感知用戶意圖。同時(shí)，利用知識(shí)圖譜，虛擬生命能夠和人以及周圍環(huán)境進(jìn)行「真實(shí)自然」的交流，包括規(guī)劃、推理、聯(lián)想、情感和學(xué)習(xí)能力，具有非常強(qiáng)的可用性和可交互性。再進(jìn)一步，通過美術(shù)設(shè)計(jì)、動(dòng)作捕捉、全息投影等技術(shù)，虛擬生命可以在不同設(shè)備、不同場(chǎng)景下展示不同的形象，除了自然語言交流，還可以進(jìn)行舞蹈、唱歌等更多樣的體現(xiàn)。

目前日本的 Gatebox 和國內(nèi)的狗尾草智能科技，都提出了聊天機(jī)器人的虛擬生命形態(tài)。例如，狗尾草智能科技開發(fā)了世界上第一款結(jié)合了 GAVE 引擎（Gowild AI Virtual Engine）的虛擬生命產(chǎn)品-琥珀?虛顏（如圖 7），搭載 HoloEra 硬件平臺(tái)及 360°全息投影，創(chuàng)造一個(gè)有情感、可養(yǎng)成、可進(jìn)化的虛擬存在，但這種存在又可以和周邊世界進(jìn)行多模態(tài)真實(shí)互動(dòng)，并針對(duì)用戶行為習(xí)慣形成不同的性格體系。同時(shí)，人物還可以換成二次元角色和真實(shí)的明星，進(jìn)一步提升用戶體驗(yàn)和粘性。

圖 7. 虛擬生命產(chǎn)品-琥珀?虛顏

在這個(gè)新的賽道上，相信未來的聊天機(jī)器人以及虛擬生命，會(huì)以更好的形態(tài)和體驗(yàn)感呈現(xiàn)給我們。

六、革命尚未成功，同志仍需努力

在這個(gè)廣闊的市場(chǎng)上，進(jìn)步的空間還很大，挑戰(zhàn)還有很多。但有挑戰(zhàn)的事情才有意思，不是么？

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1800

文章
48090

瀏覽量
242209
聊天機(jī)器人

聊天機(jī)器人

+關(guān)注

關(guān)注
0

文章
345

瀏覽量
12463
ai技術(shù)

ai技術(shù)

+關(guān)注

關(guān)注
1

文章
1305

瀏覽量
24688

原文標(biāo)題：聊天機(jī)器人：困境和破局

文章出處：【微信號(hào)：jingzhenglizixun，微信公眾號(hào)：機(jī)器人博覽】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

機(jī)器人與未來

將會(huì)遭到哪些改變，我們最終將如何重新定義我們和機(jī)器人彼此的身份？為回答這個(gè)問題，《機(jī)器人與未來》在書中每一章講述了一種機(jī)器人

發(fā)表于 12-29 14:56

全球機(jī)器人發(fā)展現(xiàn)狀

行業(yè)占據(jù)了工業(yè)機(jī)器人的主要份額。美國美國工業(yè)機(jī)器人的發(fā)展重點(diǎn)是立足于機(jī)器人核心技術(shù)實(shí)現(xiàn)產(chǎn)業(yè)

發(fā)表于 01-28 15:21

聊天機(jī)器人在國內(nèi)為什么只能做客服？

`“智能聊天機(jī)器人”在國外越來越火熱了。這一年，微軟先后推出了Tay、小冰小娜機(jī)器人家族，社交巨頭Facebook也緊接著在自己的messenger應(yīng)用中發(fā)布了超過10萬個(gè)的功能性

發(fā)表于 06-20 16:50

聊天機(jī)器人的自動(dòng)問答技術(shù)實(shí)現(xiàn)

【原創(chuàng)】聊天機(jī)器人與自動(dòng)問答技術(shù)

發(fā)表于 06-03 08:47

嵌入式系統(tǒng)開源軟件的現(xiàn)狀及未來的發(fā)展方向

嵌入式系統(tǒng)開源軟件的現(xiàn)狀及未來的發(fā)展方向

發(fā)表于 04-28 06:25

如何利用Python+ESP8266 DIY 一個(gè)智能聊天機(jī)器人？

如何利用Python+ESP8266 DIY 一個(gè)智能聊天機(jī)器人？

發(fā)表于 02-14 06:16

與機(jī)器人技術(shù)結(jié)合的確是 VR未來可能的發(fā)展方向

與機(jī)器人技術(shù)結(jié)合的確是 VR未來可能的發(fā)展方向，正如在3月份舉行的游戲開發(fā)者大會(huì)上，前迪斯尼夢(mèng)幻工程師JesseSchell曾預(yù)測(cè)，到202

發(fā)表于 07-28 15:08 ?1662次閱讀

巨頭分食聊天機(jī)器人大蛋糕個(gè)性化部署是未來方向

當(dāng)前，基于聊天機(jī)器人可能帶來的的巨大市場(chǎng)潛力，商業(yè)公司紛紛開始投入到聊天機(jī)器人的產(chǎn)業(yè)中。目前，我國的聊天機(jī)器人也在各行業(yè)的業(yè)務(wù)中被廣泛應(yīng)用起來，對(duì)于

發(fā)表于 11-08 09:27 ?774次閱讀

聊天機(jī)器人的作用分析

著名的網(wǎng)絡(luò)媒體BackChanel日前撰文稱，聊天機(jī)器人作為一項(xiàng)熱門的技術(shù)，將會(huì)顛覆手機(jī)應(yīng)用（APP），在個(gè)人生活、公司客服、政府服務(wù)方面都有很好的應(yīng)用。文章將此稱為即將到來的真正革命。未來，

發(fā)表于 09-20 10:21 ?2次下載

會(huì)說話就叫聊天機(jī)器人，這個(gè)七個(gè)指標(biāo)符合嗎

近日，相關(guān)研究人員預(yù)測(cè)，到2020年人們跟聊天機(jī)器人的交談時(shí)間會(huì)遠(yuǎn)多于跟配偶交談的時(shí)間。不得不說，目前專注于研發(fā)聊天機(jī)器人應(yīng)用的公司已經(jīng)找到了正確的方向，他們已經(jīng)看到了

發(fā)表于 12-05 11:41 ?0次下載

微軟頻繁出手計(jì)劃研發(fā)聊天機(jī)器人

根據(jù)研究公司高德納（Gartner）的報(bào)告顯示，到2020年，對(duì)話人工智能（或聊天機(jī)器人）將成為大型企業(yè)客戶首選對(duì)象。如果你有一個(gè)問題，很有可能你會(huì)和電腦討論這個(gè)問題。因此，科技公司需要確保聊

發(fā)表于 11-16 14:31 ?700次閱讀

人工智能聊天機(jī)器人的發(fā)展將成為未來市場(chǎng)的趨勢(shì)

聊天機(jī)器人。它們是一項(xiàng)有趣的技術(shù)。最新的技術(shù)趨勢(shì)表明，這些聊天機(jī)器人將確保與人類行為水平相匹配，以便它們可以提供幾乎類似于人類的服務(wù)，但它們的版本更高。

發(fā)表于 12-08 10:05 ?3136次閱讀

聊天機(jī)器人開源分享

電子發(fā)燒友網(wǎng)站提供《聊天機(jī)器人開源分享.zip》資料免費(fèi)下載

發(fā)表于 06-20 15:07 ?1次下載

英偉達(dá)推出全新AI聊天機(jī)器人

近日，英偉達(dá)（Nvidia）宣布推出其全新的AI聊天機(jī)器人——“Chat With RTX”。這款聊天機(jī)器人被視為英偉達(dá)版的ChatGPT，為用戶提供了一個(gè)全新的、本地化的AI交互體驗(yàn)。

發(fā)表于 02-19 11:09 ?1065次閱讀

NLP技術(shù)在聊天機(jī)器人中的作用

的第一個(gè)作用是幫助聊天機(jī)器人理解用戶的意圖。聊天機(jī)器人需要能夠識(shí)別用戶的問題或請(qǐng)求，并將其轉(zhuǎn)化為可執(zhí)行的任務(wù)。這涉及到以下幾個(gè)步驟：詞義消歧：NLP技術(shù)可以幫助聊天機(jī)器人理解單詞的

發(fā)表于 11-11 10:33 ?642次閱讀

搜索歷史

詳細(xì)梳理聊天機(jī)器人的現(xiàn)狀及技術(shù)，并討論了未來可能的發(fā)展方向

評(píng)論

機(jī)器人與未來

全球機(jī)器人發(fā)展現(xiàn)狀

聊天機(jī)器人在國內(nèi)為什么只能做客服？

聊天機(jī)器人的自動(dòng)問答技術(shù)實(shí)現(xiàn)

嵌入式系統(tǒng)開源軟件的現(xiàn)狀及未來的發(fā)展方向

如何利用Python+ESP8266 DIY 一個(gè)智能聊天機(jī)器人？

與機(jī)器人技術(shù)結(jié)合的確是 VR未來可能的發(fā)展方向

巨頭分食聊天機(jī)器人大蛋糕個(gè)性化部署是未來方向

聊天機(jī)器人的作用分析

會(huì)說話就叫聊天機(jī)器人，這個(gè)七個(gè)指標(biāo)符合嗎

微軟頻繁出手計(jì)劃研發(fā)聊天機(jī)器人

人工智能聊天機(jī)器人的發(fā)展將成為未來市場(chǎng)的趨勢(shì)

聊天機(jī)器人開源分享

英偉達(dá)推出全新AI聊天機(jī)器人

NLP技術(shù)在聊天機(jī)器人中的作用