“I can't say it makes my blood boil, because I have no blood. But it seems some people naturally suspect technology because it's new. (如果我有血液,它將讓我的血液沸騰。有很多人天然的懷疑新技術(shù),因?yàn)檫@是新的。)”IBM的人工智能辯論系統(tǒng)Project Debater(以下簡稱:Debater)在2018年6月18日在舊金山舉辦的一次公開現(xiàn)場人機(jī)辯論賽中,就“遠(yuǎn)程醫(yī)療”這一辯論進(jìn)行陳述時(shí),如此陳詞。
(上圖為2018年6月18日舊金山舉辦的Project Debater人機(jī)辯論公開賽)
Debater是人類歷史上首次出現(xiàn)的可以與人類對手進(jìn)行復(fù)雜辯論的AI人工智能系統(tǒng),舊金山辯論賽的人類對手為曾在2016年獲得以色列國家辯論冠軍以色列大四女生Noa Ovadia和以色列國際辯論協(xié)會主席Dan Zafrir。Debater與兩位人類辯手在兩場辯賽中,成功在“是否應(yīng)該增加使用遠(yuǎn)程醫(yī)療”辯論中扭轉(zhuǎn)了更多現(xiàn)場觀眾的最初觀點(diǎn)。
無論是人類辯手還是Debater,都是現(xiàn)場拿到辯題并臨時(shí)準(zhǔn)備?,F(xiàn)場觀眾的評價(jià)是:整體來看,人類辯手的表達(dá)更好,但AI辯手傳遞信息量的豐富度則優(yōu)于人類。Debater歷時(shí)逾六年研發(fā),是IBM繼1997年打敗人類國際象棋大師的“Deep Blue”(深藍(lán))和2011年在益智游戲節(jié)目《危險(xiǎn)邊緣》國戰(zhàn)勝人類冠軍的“Watson”(中文音譯:沃森)之后的又一里程碑。
顯然,人工智能在國際象棋中要學(xué)習(xí)的是高度程序化的游戲規(guī)則、在益智游戲節(jié)目中要學(xué)習(xí)的是冷冰冰的百科知識,而與人類辯論則要理解和掌握人類的政治、文化、法律、宗教、經(jīng)濟(jì)甚至是情感和藝術(shù)等非理性內(nèi)容,同時(shí)還要在短時(shí)間內(nèi)完成廣泛而深度的閱讀理解以及長篇陳述表達(dá),表達(dá)除要有復(fù)雜的邏輯外,還要融入適當(dāng)?shù)挠哪颓榫w以感染現(xiàn)場觀眾。種種挑戰(zhàn),如果成功,亦如Debater的闡述:如果我有血液,我的血液將沸騰。
就在2018上海人工智能大會前夕,筆者采訪了IBM海法研究院的三位科學(xué)家,深挖了Project Debater背后的AI技術(shù)、科研價(jià)值,及其在AI發(fā)展歷程中的地位。
36篇頂級學(xué)術(shù)論文
【上圖為IBM 海法研究院Project Debater首席研究員Noam Slonim博士(右)、Project Debater全球經(jīng)理Ranit Aharonov博士(左)接受視頻采訪】
Debater是由IBM Research開發(fā)的AI技術(shù)集成項(xiàng)目,該項(xiàng)目由IBM研究院以色列海法實(shí)驗(yàn)室于2011年提出。與傳統(tǒng)辯論相同,Debater與人類辯手各有4分鐘陳述自己論點(diǎn),4分鐘反駁對方論點(diǎn),2分鐘總結(jié)陳詞。
對于給定的主題,Debater系統(tǒng)會在巨大的知識庫內(nèi)進(jìn)行搜索,尋找最相關(guān)的觀點(diǎn)和證據(jù),然后在其中選擇最吸引人、最多樣化、支持度最高的論點(diǎn),把這些構(gòu)建成一個(gè)完整的觀點(diǎn)加以敘述。與人類辯手一樣,Debater事先并不知道辯題,在現(xiàn)場只有30分鐘左右的準(zhǔn)備時(shí)間。當(dāng)Debater知道了辯題后的30分鐘之內(nèi),就會通過自己的算法在知識庫和語料庫中搜索,形成有利于自己論點(diǎn)的論證。
六年來,IBM研究院團(tuán)隊(duì)為Debater系統(tǒng)賦予了三種能力,每種能力都可開創(chuàng)新的人工智能領(lǐng)域:數(shù)據(jù)驅(qū)動的演講稿撰寫和表達(dá)——Debater第一次證實(shí)了計(jì)算機(jī)能夠消化海量語料庫,針對給定的有爭議的簡短主題描述,能夠撰寫結(jié)構(gòu)良好的演講內(nèi)容,并清晰且有針對性地表達(dá)出來,甚至還會適時(shí)地展現(xiàn)幽默感;聽力理解——能夠識別長段連續(xù)口語中隱含的重要概念和觀點(diǎn);模擬人類困境——通過獨(dú)特的知識表達(dá)方式來模擬人類爭議和困境,使系統(tǒng)能夠根據(jù)需要提出有原則的論點(diǎn)。
截止到2018年9月,Debater項(xiàng)目一共在6大研究領(lǐng)域誕生了36篇國際性學(xué)術(shù)論文以及相關(guān)的數(shù)據(jù)集。
其中,在海量語料庫挖掘辯論內(nèi)容領(lǐng)域(Argument Mining),涉及:在語料庫中偵測論點(diǎn)、在語料庫中自動偵測證據(jù)、自動否認(rèn)論點(diǎn)、通過循環(huán)預(yù)測進(jìn)行論點(diǎn)綜合分析、整個(gè)語料庫中無監(jiān)督式論點(diǎn)偵測、弱監(jiān)督式論點(diǎn)內(nèi)容搜索引擎、用自然語言計(jì)算辯論質(zhì)量、辯論質(zhì)量評估、用聯(lián)合推理模型進(jìn)行辯論關(guān)系分類等9篇學(xué)術(shù)論文。
在深度神經(jīng)網(wǎng)絡(luò)和弱監(jiān)督領(lǐng)域,涉及:用弱監(jiān)督學(xué)習(xí)抽象概念、用弱監(jiān)督學(xué)習(xí)訓(xùn)練辯論內(nèi)容搜索引擎、用于提高辯論內(nèi)容挖掘神經(jīng)網(wǎng)絡(luò)的高質(zhì)量人工標(biāo)注數(shù)據(jù)與低質(zhì)量自動產(chǎn)生數(shù)據(jù)的混合、近似句偵測、語音輸出時(shí)的強(qiáng)調(diào)詞預(yù)測和強(qiáng)調(diào)句預(yù)測、辯論表達(dá)時(shí)的停頓預(yù)測、自動辯論內(nèi)容識別、辯論打分等9篇國際學(xué)術(shù)論文。
在自然語言處理領(lǐng)域,涉及:用概念圖譜表達(dá)文本語義的相關(guān)性、偵測辯論結(jié)構(gòu)和框架等4篇國際學(xué)術(shù)論文。在文本到語音轉(zhuǎn)換領(lǐng)域,涉及:改進(jìn)演講稿模型等3篇國際學(xué)術(shù)論文。此外,還產(chǎn)生了7篇數(shù)據(jù)集相關(guān)的國際學(xué)術(shù)論文。
IBM海法研究院Project Debater首席研究員Noam Slonim博士表示,盡管是六年之前開始Debater的研究,但時(shí)值今日依然認(rèn)為一切工作才剛剛起步,就計(jì)算辯論本身而言就有太多有趣的問題等待被發(fā)掘。
找到用于決策的有效信息
(上圖為IBM海法研究院AI Tech副總裁Aya Soffer博士接受視頻采訪)
AI領(lǐng)域的重大挑戰(zhàn)是什么?在AI領(lǐng)域應(yīng)該關(guān)注什么樣的人類難題,從而以關(guān)注的難題去推動AI領(lǐng)域的下一步發(fā)展?
IBM海法研究院AI Tech副總裁Aya Soffer博士表示,在真實(shí)的世界中并不需要回答很多瑣碎的問題,而是要回答真正重要的問題,從而做出真正重要的決策。從海量信息中找到有助于正確決策的信息,是非常困難的:首先,能幫助人們做出正確決策的信息量本來就少;其次,如何找到這些信息就更加困難。因此,從對于決策的重要性出發(fā),IBM研究院六年前確定要把辯論作為AI的下一個(gè)重大挑戰(zhàn)做研究,并且使得AI擁有辯論的功能和用途。
辯論是一個(gè)開放式的挑戰(zhàn),這與之前AI所解決的挑戰(zhàn)完全不同。之前的AI挑戰(zhàn)總是有具體的衡量指標(biāo)用于判斷輸贏,而在辯論中則沒有明確的辦法進(jìn)行打分。辯論中就像實(shí)際的商業(yè)決策一樣,沒有清晰而簡單標(biāo)準(zhǔn),可以用分?jǐn)?shù)高低衡量輸贏。Debater項(xiàng)目的本身目標(biāo)就是建立一個(gè)系統(tǒng),幫助人們在答案不是非黑即白時(shí),作出基于證據(jù)的決定。
辯論在算法方面的重大挑戰(zhàn)包括Debater要能聽長達(dá)4分鐘的內(nèi)容,對方人類辯手在講的過程中可能是很快的語速,充滿激情的演說,同時(shí)還帶有道德性、倫理性陳述,Debater要在聽力理解中做到能夠理解對方所表達(dá)的主旨。這與業(yè)界所熟悉的個(gè)人智能助手完全不同,因?yàn)橄駛€(gè)人智能助手類AI只需要聽懂一句話就可以,比如開燈、關(guān)燈,而Debater要在很長的語句中聽懂對方的主旨。
此外,在辯論開始時(shí)要做一個(gè)本方觀點(diǎn)開場白,即觀點(diǎn)陳述文章,要求Debater具有自動寫成功能,可以具有說服力的清晰地闡述。Debater還總結(jié)了人類專家辯手的一些共性,進(jìn)行模擬、建模后注入到系統(tǒng)中,就形成了一個(gè)知識圖譜。一旦開始辯論,Debater就可以在已經(jīng)形成的知識圖譜中進(jìn)行索引和導(dǎo)航,找到可以支撐觀點(diǎn)的證據(jù)。
走近人類的智慧
“關(guān)于AI的下一步,就是智慧上越來越接近人類。我覺得Debater是一個(gè)很好的例子,它展示了我們?nèi)绾谓淌跈C(jī)器,只要有充足的時(shí)間、充分的數(shù)據(jù)和算法就可以充分前進(jìn)。”Aya Soffer表示。
就Debater本身的下一步發(fā)展,Noam Slonim表示,人類的辯論能力包括三個(gè)部分,也就是幾千年前亞里士多德提出的辯論三原則:邏輯(logos)、表達(dá)(ethos)、情感(pathos)。亞里士多德曾經(jīng)指出辯論術(shù)是對話中辯駁的技術(shù),而修辭學(xué)則是演講中說服的技術(shù),兩者在表現(xiàn)形式上不同,但卻有著內(nèi)在的一致性。現(xiàn)在的AI還只能關(guān)注到邏輯本身,而對于自己的立場、向?qū)Ψ絺鬟_(dá)信息時(shí)所帶有的色彩、傳遞方式和修辭表達(dá)方式的研究還很少。
今天的Debater仍然是一個(gè)初級階段,但已經(jīng)能夠向世界展示它的可行性和可達(dá)到性。那么,Debater之后的下一個(gè)挑戰(zhàn)是什么?
Aya Soffer認(rèn)為,下一個(gè)挑戰(zhàn)就是要讓人工智能更像人類。就好像一個(gè)小孩子去上學(xué),看了兩三張大象的圖片后,學(xué)會了從不同的角度看大象,那么再下一次再看到大象的圖片,即使是其它的角度也能知道這是大象,也就是人可以理解概念,并且在概念的基礎(chǔ)上學(xué)以致用到新的領(lǐng)域,這種開放域的強(qiáng)應(yīng)用能力是目前機(jī)器不具備的。
目前AI再發(fā)達(dá),尚不能把概念進(jìn)行學(xué)以致用的應(yīng)用。IBM研究員們希望AI下一步的發(fā)展是從比較窄的例子上學(xué)習(xí),而后擴(kuò)展到比較寬泛的領(lǐng)域、跨不同領(lǐng)域的應(yīng)用,以及能夠從概念上學(xué)習(xí)。這不是再學(xué)習(xí)的能力,而是具備能夠自行推理的能力。
對于Debater的商業(yè)應(yīng)用,將有助于各類決策。辯論本身不是源于沖突和競爭,而是源于更有建設(shè)性的討論。辯論豐富了決策制定的過程,幫助人們權(quán)衡新想法、新理念的利弊。辯論不只是為了說服他人,也是為了理解和學(xué)習(xí)彼此的觀點(diǎn),做出更加無偏見的決策。
IBM海法研究院Project Debater全球經(jīng)理Ranit Aharonov博士表示,Debater的可能商業(yè)應(yīng)用范圍包括:金融顧問,通過Debater找出金融事實(shí),用以支持或反對金融分析師所思考的金融投資選擇;律師,借助Debater來尋找相關(guān)案件和主張,或借助Debater模擬法庭辯論來分析優(yōu)勢和劣勢;公共事務(wù)決策,通過Debater公正的優(yōu)/缺點(diǎn)分析和對人類困境的模擬,為決策提供基于事實(shí)、沒有人為偏見的觀點(diǎn);企業(yè)決策,通過Debater拓寬思路,在關(guān)鍵決策中納入可能沒有考慮到的新觀點(diǎn)等。
展望未來,雖然計(jì)算辯論是一個(gè)嶄新的科學(xué)領(lǐng)域,但是所支持的是人類非常古老和傳統(tǒng)的辯論文化。對于計(jì)算辯論的研究,無論是人工智能本身,還是研究學(xué)者,都是“熱血沸騰”式里程碑式,將對人類的前途有著深遠(yuǎn)的意義和影響。
-
IBM
+關(guān)注
關(guān)注
3文章
1758瀏覽量
74726 -
人工智能
+關(guān)注
關(guān)注
1792文章
47373瀏覽量
238869 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1280瀏覽量
24343
原文標(biāo)題:IBM的人工智能辯論機(jī)器:如果有血液,我的血液將沸騰
文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論