本周二我們在知乎平臺發(fā)起了“AI新知挑戰(zhàn)”活動,精選了知乎平臺四大AI經(jīng)典問題與大家交流。以下是IBM對于其中一個問題:“如何向人類同伴證明自己不是一個人工智能?”的回答,在這里與大家分享。
證明自己不是一個機(jī)器人這件事兒,我們每天都在干。登錄網(wǎng)站時需要輸入數(shù)字驗(yàn)證碼,在“我不是機(jī)器人”的條款上打勾,還有最近經(jīng)常使用的“滑動驗(yàn)證”,這些都是人類被懷疑是機(jī)器的時刻。
向同伴證明自己不是機(jī)器人,并不是這兩年的“新玩法”,早在68年前,人們就想讓還很笨拙的計算機(jī)騙過人類,并為此發(fā)明了復(fù)雜的方法……
圖靈的新想法:讓計算機(jī)來冒充人!
1950年,圖靈提出了最早的人機(jī)測試。在圖靈測試中,測試者(人類)可以通過打字、說話等形式向被測試者(機(jī)器)進(jìn)行提問,既包括人腦無法瞬時計算的復(fù)雜數(shù)學(xué)難題,也包括比如像“今天的天氣怎樣”這樣的日常對話。當(dāng)進(jìn)行多次測試后,如果有超過30%的測試者在聽到回答后不能確定被測試者是人還是機(jī)器,那么這臺機(jī)器就被認(rèn)為具備了人工智能。
長久以來,圖靈測試都被認(rèn)為是檢驗(yàn)人工智能的終極測試,直到在英國皇家學(xué)會舉行的“2014圖靈測試”大會上,“聊天男孩”尤金·古斯特曼被33%評委認(rèn)定為人類,作為第一位“人工智能”通過了圖靈測試。但仔細(xì)觀察尤金與人類的對話,我們不難發(fā)現(xiàn)其中的破綻——在被問及常識性問題時,尤金都是通過“避而不答“這一手段來誤導(dǎo)人類的判斷:
計算機(jī)科學(xué)家 SCOTT AARONSON:鞋盒子與珠穆朗瑪峰,那個更大?
>> EUGENE:現(xiàn)在我還不確定,我得再想想。對了,我忘記問你來自哪兒了?
SCOTT AARONSON:一只千足蟲有多少條腿?
>> EUGENE:只有 2 條。但考慮到切爾諾貝利事故,它有可能增加到 5 條。我知道你在對我說腦筋急轉(zhuǎn)彎。
SCOTT AARONSON:沒有,我需要知道你不是一個聊天機(jī)器人。請直接回答這個問題:一只螞蟻有幾只腿?
>> EUGENE:2 至 4 條吧,也許,3 條?哦,這是一次多么富有成果的對話。
這項(xiàng)”富有成果“的對話充分揭示了圖靈測試的漏洞,只要掌握了”回避“這一手段,越來越多的機(jī)器都能輕而易舉地“欺騙”人類,但這并不意味著人工智能實(shí)質(zhì)性的進(jìn)步,這樣的“欺騙”也無法幫助人類實(shí)現(xiàn)更多價值。那么什么樣的測試才能辨別出真正智能的機(jī)器呢?
聽得懂人話,會思考
“說人話”是電腦從機(jī)器向人工智能發(fā)展的第一步,但想要邁好這一步,不僅需要高級的人工智能技術(shù),還要讓“聽懂并組織語言”這種能力為人類的生產(chǎn)生活創(chuàng)造價值。
2011年,IBM Watson在美國最受歡迎的智力競猜電視節(jié)目《危險邊緣》(Jeopardy?。┲袚魯×嗽摴?jié)目歷史上兩位最成功的選手Ken Jennings和Brad Rutter,成為第一位在電視節(jié)目中獲得冠軍的人工智能,一舉讓人們記住了這個“聰明”的機(jī)器。
Watson在《危險邊緣》中獲勝
通過不斷的機(jī)器學(xué)習(xí),Watson將機(jī)器的自然語義處理帶入新境界,它可以充分理解人類語言中微妙和復(fù)雜的含義、諷刺口吻、雙關(guān)語及謎語等,打破了“人類擅長”的邊界。用Jennings在賽后采訪的話來說,Watson的奪冠意味著計算機(jī)在自然語言處理方面的一次巨大飛躍——計算機(jī)已有能力理解和回應(yīng)日常對話。
然而,故事遠(yuǎn)遠(yuǎn)沒有結(jié)束?!罢f人話”僅僅是人工智能發(fā)展的第一步。IBM將AI的核心能力定義為以自然語言為基礎(chǔ)的URLI,即理解,推理,學(xué)習(xí)和交互。這就意味著,IBM在研發(fā)AI時從輸入到輸出全方位賦予AI更高級的本領(lǐng),讓AI在“觀點(diǎn)表達(dá)”方面也能有出色的表現(xiàn)。
URLI解釋示意圖
巧識邏輯破綻,犀利幽默辯駁
在智力游戲節(jié)目中,AI要學(xué)習(xí)的是冰冷冷的百科知識,而要與人類辯論,則要在短時間理解人類的政治、文化、法律甚至是情感和藝術(shù)等非理性內(nèi)容,同時根據(jù)對方辯手的陳述,組織論據(jù),陳述富有邏輯的觀點(diǎn),并帶點(diǎn)適當(dāng)?shù)挠哪瑏砀腥粳F(xiàn)場觀眾。
由IBM Research研發(fā)的AI系統(tǒng)Project Debater分別在2016、2018年與以色列國家辯論冠軍Noa Ovadia和以色列國際辯論協(xié)會主席Dan Zafrir進(jìn)行辯論,還連續(xù)拿了辯論冠軍。
Project Debater拿到辯題后,它會迅速掃描其龐大的語料庫文檔中與主題相關(guān)的數(shù)百萬篇新聞和論文等材料,找出與辯題相關(guān)性最高的觀點(diǎn),通過算法剔除多余且重復(fù)的信息,提取出一個最具說服力的觀點(diǎn)。同時,在人類辯手4分鐘的觀點(diǎn)陳述時,邊聽邊“想”,不僅準(zhǔn)確地回應(yīng)人類對手的論點(diǎn),還指出了對手所犯的事實(shí)錯誤,同時不失時機(jī)地展現(xiàn)了一個機(jī)器人的幽默。
這意味著機(jī)器不再只是對非黑即白的問題做出正確回答,而面對沒有標(biāo)準(zhǔn)答案的問題,也能對觀點(diǎn)或論據(jù)進(jìn)行決策,并權(quán)衡其相關(guān)性比重。如果通過機(jī)器學(xué)習(xí)讓Project Debater擁有更廣的“知識面”,那么它將在商業(yè)應(yīng)用場景中,幫助人類豐富決策過程,權(quán)衡新想法和新理念的利弊。
Project Debater與人類辯論
人工智能的“獨(dú)立思考”能力不僅僅可以用于知識競賽或辯論,IBM力求讓機(jī)器思維賦能更多行業(yè)專業(yè)領(lǐng)域
金融顧問:AI系統(tǒng)可以幫助金融顧問從海量數(shù)據(jù)中找出金融事實(shí),用以支持或反對金融分析師所思考的金融投資選擇。
律師:律師可以借助AI系統(tǒng)來尋找相關(guān)案件和主張,或模擬法庭辯論來分析優(yōu)勢和劣勢。
公共事務(wù)決策:通過AI系統(tǒng)公正的優(yōu)/缺點(diǎn)分析和對人類困境的模擬,可以就需要進(jìn)行決策的問題,為決策者提供基于事實(shí)、沒有人為偏見的觀點(diǎn)。
學(xué)生助手:AI系統(tǒng)可以幫助各個年齡段的學(xué)生改進(jìn)他們的批判性思維和溝通技巧,或幫助他們找出更多信息以改進(jìn)報告和論文。
CEO 和高管:高層領(lǐng)導(dǎo)常常因擁有強(qiáng)烈的“直覺本能”而感到自豪,但是他們也必須避免所謂的“錨定偏見”。錨定偏見是指,我們在潛意識中有著兩三個會不太客觀地影響決策的事實(shí)時,就會將不適合這些觀點(diǎn)的有價值信息排除在外不予考慮。像Project Debater一樣的AI系統(tǒng)可以拓寬高層領(lǐng)導(dǎo)的思路,在關(guān)鍵決策中納入他們可能沒有考慮到的新觀點(diǎn)。
看完這些,是不是感覺后背微微發(fā)涼,有沒有在懷疑這篇稿子也是人工智能完成的呢?AI時代下,人與機(jī)器不該是相互懷疑、對立的存在,而是需要協(xié)同發(fā)展、不可分割的整體。是不是機(jī)器并不重要,能不能無礙交流、相輔相成,共同完成各項(xiàng)任務(wù),才是我們應(yīng)該討論的人機(jī)測試的關(guān)鍵。
-
計算機(jī)
+關(guān)注
關(guān)注
19文章
7525瀏覽量
88331 -
人工智能
+關(guān)注
關(guān)注
1792文章
47525瀏覽量
239257 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132850
原文標(biāo)題:你該如何向人類同伴證明自己不是人工智能?
文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論