IBM人工智能與人類辯手唇槍舌戰(zhàn),雖敗猶榮
據(jù)外媒報道, IBM 開發(fā)了一個名為Debater的機器人,近日它在一場辯論賽中與一名人類辯手唇槍舌戰(zhàn),辯論的主題是政府是否應(yīng)該給幼兒園提供補貼。當(dāng)然大家真正想知道的是,人工智能(AI)是否能在辯論中戰(zhàn)勝人類。
Debater的辯論對手名為哈里什·納塔拉揚(Harish Natarajan),是2016年世界辯論錦標(biāo)賽的決賽選手。數(shù)百名觀眾觀看這場辯論賽后,更加傾向于贊同他的觀點,而不是IBM Debater的。可見在知識、說服力和辯論技巧上,人類(至少是那些擁有牛津大學(xué)和劍橋大學(xué)學(xué)位的人)仍然能夠占據(jù)上風(fēng)。
相較于1997年IBM的計算機深藍在國際象棋中擊敗人類,以及2017年人工智能在圍棋中戰(zhàn)勝最優(yōu)秀的棋手,這次人類辯手獲得的勝利可能并不是那么吸引眼球。但IBM的這個機器人顯示,在存在歧義的場景下,以及進行辯論時,AI仍然可以派上用常這和僅僅通過計分來判斷誰贏誰輸?shù)那闆r有很大的不同。
“真正令我印象深刻的,是IBM Debater與人類合作時可能發(fā)揮出來的價值,” 納塔拉揚在辯論后表示。他說,IBM的人工智能能夠挖掘大量的信息,并為這些知識提供有用的背景。
這是IBM Debater第二次和人類進行公開辯論賽。它在第一次公開比賽中,它擊敗了一位辯手,但卻落敗于另一位辯手。不過這一次,它的對手納塔拉揚的實力遠遠更強 —— IBM研究人員本來也預(yù)計Debater這次會輸。
計算機的說服力
IBM Debater這次雖然失敗了,但毫無疑問,在某個角度上它仍然是贏家:你會認真聽它在說什么,并不僅僅是因為它是一臺計算機。它很好地將自己的論點分解為幾個部分,并利用各種研究數(shù)據(jù)來支持它們。雖然它做得不算完美,但也沒有出現(xiàn)牛頭不對馬嘴的情況。
并且,它好像還有點喜歡說教人類?!盀槿鮿萑后w提供機會,這是所有人的道德義務(wù),”IBM Debater說。
Debater以 IBM云計算基礎(chǔ)架構(gòu)為依托,使用了一組功能強大的機器。
在這場辯論中,雙方都有15分鐘的時間做準(zhǔn)備——不過IBM Debater可以利用新聞文章和學(xué)術(shù)研究論文中的100億個句子。雙方輪流發(fā)言,反駁另一方的論點,最后還要總結(jié)自己的論點。
比賽的計分規(guī)則是看看有多少人改變了想法。在辯論之前,79%的人贊成政府為幼兒園提供補貼,但觀看了辯論之后,該數(shù)字下降了17個百分點,為62%。
在如今這個時代,蘋果的Siri、亞馬遜的Alexa和谷歌Assistant都能很好地理解我們的問題,并用語音進行回答,所以我們常常忘記可以與計算機交談是一件多么了不起的事情。 IBM Debater則更進一步,可以一次連講幾分鐘。
“它非常迷人,聽起來很人性化,”辯論賽的主持人約翰·唐納(John Donvan)說。
但是,你的筆記本電腦上可能不會很快就能安裝類似 Debater這樣的東西。它主要是在功能強大的服務(wù)器上運行的——這個服務(wù)器擁有28個處理核心和768GB的內(nèi)存,大約是高端筆記本電腦的50倍。而且還有四個服務(wù)器提供支持,其中每個都有64GB的內(nèi)存和2TB硬盤。
政府應(yīng)該給幼兒園提供補貼嗎?
在這場辯論中,Debater是正方,贊成給幼兒園提供補貼。人類辯手納塔拉揚是反方。
Debater表示,幼兒園“為整個社會帶來利益。我們有責(zé)任支持幼兒園?!比绻⒆觽兡苓M入好的幼兒園,他們以后會生活得更好,特別是來自貧困家庭的孩子。
納塔拉揚則反駁說,幼兒園補貼“只不過是政治作秀,獲得好處的是中產(chǎn)階級,而不是最弱勢群體?!彼€找出了Debater的假設(shè)中的一些漏洞,例如,Debater的一個假設(shè)是補貼真的可以改善窮人的教育狀況。
Debater在這場辯論中的表現(xiàn)比以前有所提高。它掌握的一個新能力是進行平行論證 —— 比如,對醫(yī)療系統(tǒng)提供補貼可能是有益的。另外,它的反駁能力也更強了。當(dāng)納塔拉揚表示,有些孩子可能無法從3歲或4歲的學(xué)齡前競爭活動中受益之后,IBM抓住了這一觀點進行反駁?!皩Ψ睫q手認為,幼兒園是有害的?!彼f。
“從去年6月以來,我們一直在努力改進這個AI系統(tǒng),”該項目的首席研究員諾姆·斯洛尼姆(Noam Slonim)說。 Debater的源材料是學(xué)術(shù)出版物和新聞文章,現(xiàn)在已經(jīng)擴展到了2018年底的最新資料。
大家在討論IBM的人工智能辯論技術(shù)。從左到右:首席研究員諾姆·斯洛尼姆、IBM Debater項目的屏幕、項目經(jīng)理倫特·阿霍諾夫,以及人類辯手納塔拉揚。
迄今為止最具挑戰(zhàn)性的比賽
對于IBM的辯論AI來說,這場比賽的難度是迄今為止最大的。
“與我們之前面對的辯手相比,納塔拉揚的水平高得多,他獲勝的場數(shù)刷新過世界紀(jì)錄?!边@個AI項目的經(jīng)理倫特·阿霍諾夫(Ranit Aharonov)表示。
這場辯論賽是在IBM Think大會上舉行的?!癆I表現(xiàn)得很棒,這也是一個很好的展示,但我們應(yīng)該專注于如何利用這種技術(shù),開發(fā)出具有商業(yè)可行性的東西出來,” 阿霍諾夫說。
他們的設(shè)想是用它來幫助公司理解員工或客戶的觀點,或幫助媒體和政府吸引公眾討論有爭議的問題?!拔覀兛煲瓿傻谝粋€用例了,” 阿霍諾夫說。
這是因為Debater項目背后的技術(shù),看重的是現(xiàn)實生活世界中的復(fù)雜和細微差別,而不是棋類游戲中的那種非贏即輸。
“我們正走出AI的舒適區(qū),進入更加說不清道不明的地帶,”斯洛尼姆說。
評論
查看更多