相信很多朋友在嘗試調(diào)戲Siri、小冰等AI助手時,應(yīng)該都獲得過令人捧腹大笑的回答,Siri甚至一度榮獲“最佳段子手”稱號。但是當(dāng)你嘗試對它們使用一些連人類都得思考一會兒的雙關(guān)語時,他們往往就只能無奈回答“抱歉請您再說一遍”了。創(chuàng)造性語言,尤其是具備基本的幽默感,是人工智能目前仍難以逾越的瓶頸之一。有些研究者認(rèn)為無法理解幽默感是人工智能與人類在自然交互上面臨的最大障礙。近日,斯坦福大學(xué)的一個華人研究團(tuán)隊結(jié)合神經(jīng)網(wǎng)絡(luò)與心理語言學(xué),提出了以surprise為核心的神經(jīng)網(wǎng)絡(luò)雙關(guān)語訓(xùn)練方法。
神經(jīng)網(wǎng)絡(luò)作為一項自帶模仿屬性的技術(shù),通過大量文本來學(xué)習(xí)人類的語言模式,對于一致性問題,這種方法比較行得通。不過問題來了,學(xué)得好并不意味著有意思。舉個栗子,“該不該在新聞內(nèi)容生產(chǎn)方面大量使用AI”一直是個比較熱議的話題。但即使AI可以通過學(xué)習(xí)產(chǎn)生令人信以為真的新聞,由此產(chǎn)生的內(nèi)容基本就會和訓(xùn)練它們的維基百科、嚴(yán)肅文學(xué)一樣令人索然無味,拋開“AI撰寫新聞”的噱頭,其內(nèi)容本身可能未必能夠抓住人們的眼球。也就是說,神經(jīng)網(wǎng)絡(luò)遵守規(guī)則,但卻不太擅長講笑話、抖包袱。
所以,斯坦福大學(xué)的研究團(tuán)隊的目標(biāo)是創(chuàng)造出一款真實自然、生動有趣的機(jī)器人,不僅是可以播報新聞、預(yù)報天氣的“播音員”,還能成為既會get到笑點、又會寫詩的“文藝青年”,甚至還能講述一個引人入勝的故事。
不過這并不容易。
先來看看下面這句話:
The greyhound stopped to get a hare cut.
Google把它翻譯成“灰狗停下來砍兔子”???沒看懂這句話不要緊,這不是你的問題,要怪就怪計算機(jī)還沒完全理解人類語言中的雙關(guān)語。
該研究團(tuán)隊認(rèn)為一個精心設(shè)計的笑話在把握一個巧勁兒,會在一致性與合理性之間達(dá)到平衡,又不會完全無厘頭。此外,創(chuàng)造性語言的核心是新穎,而不是循規(guī)蹈矩。如何賦予神經(jīng)網(wǎng)絡(luò)創(chuàng)意?這就對研究人員提出了更高的要求,“即使我們有一長串的雙關(guān)語供它學(xué)習(xí)模仿,但終究比不過具有獨創(chuàng)性的內(nèi)容生產(chǎn) 。”上面的例子就說明了這一點。
如何走出這個死循環(huán)呢?斯坦福的研究團(tuán)隊試圖利用有關(guān)“幽默”的理論賦予他們的AI一些創(chuàng)造性的智慧,即教會AI什么是“幽默感”。大多數(shù)研究者都認(rèn)為幽默的產(chǎn)生和理解都與感知到的失諧(Incongruity)有關(guān),即有別于心理常規(guī),出現(xiàn)和期望不同或相反的因素,也就是讓感受者感到驚訝的因素(surprise)。
為了使雙關(guān)語起作用,斯坦福的研究團(tuán)隊認(rèn)為應(yīng)該在具體的語言環(huán)境(local context)中制造出其不意的效果。上面那個例子中stopped to get a hare cut就其本身來說沒有太大意義,團(tuán)隊決定借鑒一些學(xué)術(shù)理論來解決這個難題:關(guān)于驚訝的“局部-全局原理”(local-global surprisal principle)。為了生成雙關(guān)語,神經(jīng)網(wǎng)絡(luò)被賦予一對同音異義詞(hair頭發(fā)/hare野兔),基于第一個單詞hair生成一個句子,但是當(dāng)?shù)诙€單詞hare替換掉hair時會讓人摸不著頭腦,之后它會插入另一個帶有hare的句子,使整個句子更加邏輯。
為了驗證這種方法是否可行,研究團(tuán)隊還舉行了一場雙關(guān)語競賽,讓AI與人類幽默大師PK,大眾評委對其進(jìn)行評分。按人類的標(biāo)準(zhǔn)來說,機(jī)器人的表現(xiàn)不算很好。雖然這個AI系統(tǒng)生成的雙關(guān)語比以往的更加“幽默”,但在比賽中它戰(zhàn)勝人類的機(jī)率只有10%。有時它生成的雙關(guān)語會卡在一個基本結(jié)構(gòu)中,語法還會發(fā)生錯亂。比如說:
That’s because negotiator got my car back to me in one peace.
Even from the outside, I could tell that he’d already lost some wait.
Well, gourmet did it, he thought, it’d butter be right.
(下劃線處是我們認(rèn)為有bug的地方,歡迎大家在評論區(qū)施展拳腳一起debug)
盡管研究人員稱暫時無法解決這個問題,麻省理工學(xué)院計算心理語言學(xué)實驗室主任Roger Levy表示,構(gòu)建雙關(guān)語神經(jīng)網(wǎng)絡(luò)對于建立更人性化的AI來說是很振奮人心的一步?!氨M管賦予機(jī)器人類的幽默感非常具有挑戰(zhàn)性,但這也是我們之所以成為人類的基礎(chǔ)?!?/p>
四年前,Levy嘗試了用一種計算方法來表示并判斷雙關(guān)語是否有趣,這也是斯坦福研究團(tuán)隊笑話生成方法(joke-generation)的基礎(chǔ)。他也希望可以借鑒local-global surprisal principle的概念,來完成比他論文更精確的測試,雖然目前還沒有數(shù)據(jù)證明這一概念的可行性,但“如果真的可以用這個思路成功實現(xiàn)雙關(guān)語的測試,想想就是一件很酷的事情!”
從更大的層面來看,幽默感研究的困境恰恰也強調(diào)了為神經(jīng)網(wǎng)絡(luò)賦予更多人類智慧的必要性。最近,他嘗試用“surprise”作為研究AI如何理解語言的方法。Levy認(rèn)為,不論在人工智能還是認(rèn)知科學(xué)領(lǐng)域,surprise都是核心的概念之一。對于人類來說,surprise反映為我們遇到事情的反應(yīng),這是可以測量的,比如跟蹤我們在閱讀時的眼球運動。在機(jī)器中,surprise的程度可以用概率測量:在給定的上下文中出現(xiàn)概率較低的詞更令人感到驚訝。
這就使得surprise成為一種比較人類大腦和機(jī)器如何通過語言推理的有效指標(biāo)——探索各自黑盒子內(nèi)部運作的方式。Levy也發(fā)現(xiàn),當(dāng)把神經(jīng)網(wǎng)絡(luò)放到研究人類如何處理模棱兩可的語言的一系列心理語言學(xué)(psycholinguistic)測試中時,對計算機(jī)以非人類的方式“出人意料”展現(xiàn)出來的內(nèi)容進(jìn)行調(diào)整,這些差異可能也會是設(shè)計具有更人性化行為的AI的關(guān)鍵。
與此同時,斯坦福的研究團(tuán)隊還希望將其研究的雙關(guān)語方法應(yīng)用于更復(fù)雜的場景,讓AI完成更具創(chuàng)造性的任務(wù),比如編故事。這個想法是讓神經(jīng)網(wǎng)絡(luò)做它擅長的事情,然后再結(jié)合人類的智慧二次加工。打個比方,訓(xùn)練神經(jīng)網(wǎng)絡(luò)先生成一連串完美連貫的句子,然后再根據(jù)人類的敘事理論進(jìn)一步寫出一部具有一定創(chuàng)意的短篇小說?!拔覀兊哪繕?biāo)倒不至于一定要求訓(xùn)練神經(jīng)網(wǎng)絡(luò)具備理解和生產(chǎn)雙關(guān)語的能力,我們更希望讓AI擺脫我們固有的套路和框框,寫出更具創(chuàng)意和趣味的故事?!?/p>
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28467瀏覽量
207332 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4772瀏覽量
100845 -
人工智能
+關(guān)注
關(guān)注
1791文章
47352瀏覽量
238777
原文標(biāo)題:下一屆喜劇大師會是機(jī)器嗎?Stanford研究員在努力訓(xùn)練神經(jīng)網(wǎng)絡(luò)理解人類的俏皮話和雙關(guān)語
文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論