現(xiàn)在,大小型高科技公司都在競相使這成為現(xiàn)實(shí)。你看看新聞就會(huì)聽說過這些行話:AI、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、自然語言處理。
也許這一切都有點(diǎn)疑惑。因此,以下是關(guān)于這些概念的基本知識(shí),以及它們之間是如何關(guān)聯(lián)的。
什么是人工智能(AI)?
簡單地說,AI是試圖讓計(jì)算機(jī)變得智能,甚至比人類更聰明。這是讓電腦擁有類人類的行為、思維過程和推理能力。
有兩種人工智能:
狹義的AI(弱AI)
這種AI只專注于一種狹義的任務(wù)?,F(xiàn)在我們的身邊已經(jīng)處處都是弱AI了。它已經(jīng)在國際象棋,電視競賽節(jié)目《危險(xiǎn)邊緣》,還有最近的圍棋比賽中擊敗了我們?nèi)祟悺?br /> 像Siri和Cortana這樣的數(shù)字助手可以給我們提供天氣信息以及在路上自動(dòng)駕駛汽車。但是,它們有很大的局限性。自動(dòng)駕駛汽車不會(huì)下國際象棋。Siri也無法讀取和刪除不重要的郵件。弱AI有一個(gè)狹隘的范圍:它不能超越最先為其設(shè)置的功能。
Cortana就是一個(gè)弱AI的例子
通用AI(強(qiáng)AI)
下面我們進(jìn)入科幻小說的王國。薩曼莎毫無疑問被定義成一個(gè)強(qiáng)AI。她可以學(xué)到新的東西,并修改自己的代碼庫。她可以在國際象棋和開車上都打敗人類。
AI的分析
現(xiàn)在我們知道通用AI是我們的終極目標(biāo),那么我們怎么才能實(shí)現(xiàn)它呢?這里列出5個(gè)需要精通的領(lǐng)域:
感知:像我們?nèi)祟愐粯樱慌_(tái)電腦也需要五官來與世界進(jìn)行互動(dòng)。但它并不僅僅局限于這五個(gè)方面。它可以有人不具備的感覺。透視眼?聲納探測?所有的可能。
自然語言處理(NLP):超越感知世界,AI需要懂得解釋語言和寫字。他們需要解析句子和理解它們之間的細(xì)微差別、口音和含義。同一個(gè)句子根據(jù)上下文不同可以有不同的含義,所以這個(gè)任務(wù)的難度是眾所周知的。
知識(shí)表達(dá):既然它可以感知到東西 - 物體,人,概念,詞語和數(shù)學(xué)符號(hào) - 它需要一種方式來表示它們大腦中的世界。
推理:一旦它通過其感官收集到數(shù)據(jù)并和概念連起來,它就可以使用該數(shù)據(jù)來按照邏輯解決問題。例如,一個(gè)象棋軟件檢測到棋盤上的棋子走動(dòng),就可以計(jì)算出應(yīng)對的策略。
規(guī)劃和導(dǎo)航:要想做到真正像人類一樣,AI不僅要像人類一樣思考。還應(yīng)該在我們中間生活。因此,研究人員的一個(gè)大問題就是幫助人工智能在三維世界中移動(dòng)和規(guī)劃最佳路徑。自主意識(shí)的交通工具必須做好這一點(diǎn),因?yàn)橐粋€(gè)錯(cuò)誤就會(huì)出人命。
新加坡***乘坐自動(dòng)駕駛汽車兜風(fēng)。圖片來源:Kenji Soon, MCI 。
你可以看到這些方面是如何在一起協(xié)調(diào)工作的,諸如機(jī)器視覺,它是利用成像和圖像分析來解決問題。舉個(gè)例子,F(xiàn)acebook解析你上傳到社交網(wǎng)絡(luò)上的照片來建議你應(yīng)該標(biāo)記誰,并且這已相當(dāng)?shù)臏?zhǔn)確。
自動(dòng)駕駛汽車也許是目前最復(fù)雜的機(jī)器視覺處理任務(wù)了。它需要認(rèn)清路標(biāo),遵守車道,注意車輛、物體和人。它在能見度惡劣的天氣條件下,不管白天黑夜,是在破舊的路上還是全新的路上,都要能正常工作。
實(shí)現(xiàn)工具
這些概念并不是新的。他們早在1956年就在達(dá)特矛斯會(huì)議(Dartmouth Conferences)上被提出,這次會(huì)議是人工智能領(lǐng)域的開創(chuàng)性事件。
讓技術(shù)跟上我們的想象要花幾十年的時(shí)間,我們似乎也馬上就要最終站在AI革命的風(fēng)口浪尖上,隨著更多的風(fēng)險(xiǎn)資本投資,更多的大型科技企業(yè)投入到AI的研發(fā)中來,我們在日常的生活越來越多地使用到AI。
促進(jìn)AI崛起的重要因素包括摩爾定律,這讓我們可以在更小、更高效的芯片上注入更多的計(jì)算能力。計(jì)算能力到達(dá)一定程度后,AI就將會(huì)變得既實(shí)用又劃算。
谷歌在貓的識(shí)別上取得重大突破。圖片來源:zbeads
大數(shù)據(jù)是導(dǎo)致AI崛起的另一個(gè)趨勢:當(dāng)谷歌在2012年為神經(jīng)網(wǎng)絡(luò)輸入了海量的數(shù)據(jù)之后,取得了突破性進(jìn)展,這其中包括1000萬張YouTube的視頻劇照。
其結(jié)果是,神經(jīng)網(wǎng)絡(luò)在沒人教它的情況下學(xué)會(huì)了辨識(shí)貓,取得了75%的準(zhǔn)確率。沒有這1000萬個(gè)視頻資料庫是不可能實(shí)現(xiàn)的。
當(dāng)機(jī)器會(huì)學(xué)習(xí)
現(xiàn)在,讓我們理清幾個(gè)常常容易相互混淆的概念。機(jī)器學(xué)習(xí)是一個(gè)專注于從數(shù)據(jù)里學(xué)習(xí)insights并利用它們來預(yù)言世界的AI技術(shù)。
決策樹算法。 圖片來源:Wikipedia
機(jī)器學(xué)習(xí)已經(jīng)用算法實(shí)現(xiàn)了。一個(gè)任務(wù)是通過一系列算法來完成的。這種算法的例子包括決策樹學(xué)習(xí)和關(guān)聯(lián)規(guī)則學(xué)習(xí)。
機(jī)器學(xué)習(xí)算法使整個(gè)世界閃耀了起來,但是,它只是人工神經(jīng)網(wǎng)絡(luò),一個(gè)由我們大腦的神經(jīng)如何運(yùn)作而得到啟發(fā)的技術(shù)。
它甚至進(jìn)入了流行文化:在喜劇系列《硅谷》中,創(chuàng)業(yè)公司Pied Piper就是在神經(jīng)網(wǎng)絡(luò)上運(yùn)行其壓縮服務(wù)。
視頻:https://youtu.be/E2YcOV5C2x4
這里有一個(gè)簡單的解釋:神經(jīng)網(wǎng)絡(luò)是由好幾層的神經(jīng)元組成的。輸入被傳遞到第一層上。單個(gè)神經(jīng)元接收輸入,給每個(gè)輸入值一個(gè)權(quán)重值,并在這個(gè)權(quán)重值的基礎(chǔ)上產(chǎn)生一個(gè)輸出。
輸出從第一層被傳遞到第二層來進(jìn)行處理,以此類推。最終的輸出就這樣生成了。
然后,奇跡就發(fā)生了。運(yùn)行網(wǎng)絡(luò)的人定義了“正確”的最終輸出應(yīng)該是什么。每次數(shù)據(jù)通過網(wǎng)絡(luò)傳遞,最終的結(jié)果都是與“正確”的值比較,每次它都會(huì)調(diào)整權(quán)重值直至其創(chuàng)建正確的最終輸出。這個(gè)網(wǎng)絡(luò)實(shí)際上是在進(jìn)行自我訓(xùn)練。
舉個(gè)例子,這個(gè)人造大腦可以學(xué)習(xí)如何從照片中識(shí)別椅子。隨著時(shí)間的推移,它會(huì)學(xué)會(huì)什么是椅子的特性,來提高他們識(shí)別出椅子的概率。
Facebook的AI負(fù)責(zé)人Yann LeCun用類推法來解釋神經(jīng)網(wǎng)絡(luò):
模式識(shí)別系統(tǒng)就像個(gè)一端帶有攝像頭的黑盒子,在頂部有一個(gè)綠燈和一個(gè)紅燈,前面則有一大堆的旋鈕。學(xué)習(xí)算法就是試圖調(diào)整旋鈕,當(dāng)在鏡頭前是一條狗時(shí),使紅燈亮起;當(dāng)鏡頭前有一輛汽車的時(shí)候,使綠燈亮起。
在你給機(jī)器展示一只狗的時(shí)候。就把紅燈亮起,不要做任何事情。如果它是暗的,就調(diào)整旋鈕使燈光變亮。如果綠色指示燈亮起,調(diào)整旋鈕,使其變暗。然后,顯示汽車的時(shí)候,調(diào)整旋鈕使紅燈變暗,綠燈變亮。
如果你展示了很多汽車和狗的案例,而你每次都是不斷一點(diǎn)點(diǎn)地調(diào)整旋鈕,最終,機(jī)器每一次都會(huì)得到正確的答案。
圖片來源:a16z
現(xiàn)在我們來談?wù)勆疃葘W(xué)習(xí),這是一套簡單的訓(xùn)練多層人工神經(jīng)網(wǎng)絡(luò)的方法。它已被證明從數(shù)據(jù)中識(shí)別圖案是特別有效的。不論何時(shí)媒體談到神經(jīng)網(wǎng)絡(luò),很可能指的都是深度學(xué)習(xí)。
關(guān)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的一個(gè)偉大解釋:How Does Your Phone Know This Is A Dog?
深度學(xué)習(xí)對于AI的促進(jìn)作用是顯而易見的。它現(xiàn)在在軟件行業(yè)之外的許多行業(yè)都已經(jīng)使用。
Facebook M,一個(gè)人工智能驅(qū)動(dòng)的虛擬助手,正在使用深度學(xué)習(xí)來幫助用戶完成各種任務(wù)-包括做研究、預(yù)訂機(jī)票以及買咖啡等。
谷歌正在使用一個(gè)名為RankBrain的深度學(xué)習(xí)系統(tǒng)來過濾搜索結(jié)果,來和更多的傳統(tǒng)搜索結(jié)果進(jìn)行比較。據(jù)彭博社描述:
該系統(tǒng)每天幫谷歌處理15%的之前系統(tǒng)沒有遇到過的查詢請求。它善于處理模棱兩可的查詢請求,比如“在食物鏈頂端的消費(fèi)者怎么稱呼?”
該系統(tǒng)現(xiàn)在已經(jīng)是谷歌搜索結(jié)果的第三大信號(hào),位居反鏈接和內(nèi)容之后。
神經(jīng)網(wǎng)絡(luò)可以識(shí)別貓?這就是深度學(xué)習(xí)。
從Siri到薩曼莎
深度學(xué)習(xí)可能是建立更智能、更類人類AI的一個(gè)關(guān)鍵拼圖。
谷歌掃描貓的大腦需要1.6萬臺(tái)計(jì)算機(jī)處理器來運(yùn)行。擊敗圍棋世界冠軍李世石的程序AlphaGo,運(yùn)行在48個(gè)處理器上。在未來,神經(jīng)網(wǎng)絡(luò)能在廉價(jià)的移動(dòng)電話上運(yùn)行。
深度學(xué)習(xí)可以提高AI的各個(gè)方面,從自然語言處理到機(jī)器視覺,可以看成是一個(gè)能夠提高計(jì)算機(jī)學(xué)習(xí)能力的更好的一個(gè)大腦。
它可以提高虛擬助手例如Siri或谷歌處理不熟悉請求的能力。它可以處理視頻和生成總結(jié)內(nèi)容的短片。
或許有一天它還會(huì)贏得奧斯卡獎(jiǎng),誰知道呢?
評論
查看更多