機(jī)器學(xué)習(xí)使計算機(jī)能夠處理迄今為止僅由人執(zhí)行的任務(wù)。從駕駛汽車到翻譯語言,機(jī)器學(xué)習(xí)正在推動人工智能爆炸式的增長,幫助軟件理解混亂而不可預(yù)知的真實(shí)世界。
但究竟什么是機(jī)器學(xué)習(xí),又是什么讓機(jī)器學(xué)習(xí)現(xiàn)在如此繁榮呢?
什么是機(jī)器學(xué)習(xí)?
在很高的水平上,機(jī)器學(xué)習(xí)是教授計算機(jī)系統(tǒng)如何在饋入數(shù)據(jù)時做出準(zhǔn)確預(yù)測的過程。
這些預(yù)測可以回答一張照片中的水果是香蕉還是蘋果,發(fā)現(xiàn)在自動駕駛汽車前橫過馬路的人,電子郵件是否是垃圾郵件,或足夠準(zhǔn)確的識別語音以生成YouTube視頻的標(biāo)題。
與傳統(tǒng)計算機(jī)軟件的主要區(qū)別在于,人類開發(fā)人員沒有編寫代碼來指導(dǎo)系統(tǒng)如何區(qū)分香蕉和蘋果之間的區(qū)別。相反,機(jī)器學(xué)習(xí)模式通過對大量數(shù)據(jù)進(jìn)行訓(xùn)練來準(zhǔn)確地區(qū)分果實(shí),在這種情況下會有大量標(biāo)記為香蕉或蘋果的圖像。
AI和機(jī)器學(xué)習(xí)有什么不同?
機(jī)器學(xué)習(xí)可能已取得了巨大成功 ,但那只是實(shí)現(xiàn)人工智能的方式之一。在20世紀(jì)50年代人工智能領(lǐng)域誕生之時,人工智能被定義為任何能夠執(zhí)行具有人類智慧任務(wù)的機(jī)器。
人工智能系統(tǒng)通常至少會展示以下特征中的一部分:規(guī)劃,學(xué)習(xí),推理,解決問題,知識表達(dá),感知,動作和操縱,以及社交智能和創(chuàng)造力。
除了機(jī)器學(xué)習(xí)外,還有其他各種用于構(gòu)建AI系統(tǒng)的方法,包括進(jìn)化計算,其中算法經(jīng)歷隨機(jī)變異和代之間的組合以試圖“演變”為最優(yōu)解決方案。以及專家系統(tǒng),其中計算機(jī)按規(guī)則進(jìn)行編程允許它們模仿特定領(lǐng)域的專家,例如駕駛飛機(jī)的自動駕駛系統(tǒng)。
機(jī)器學(xué)習(xí)有哪些主要類型?
機(jī)器學(xué)習(xí)分為兩大類:有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。
什么是監(jiān)督學(xué)習(xí)?這種方法基本上都是通過例子來學(xué)習(xí)。
在監(jiān)督學(xué)習(xí)訓(xùn)練期間,系統(tǒng)暴露于大量被標(biāo)記的數(shù)據(jù),例如標(biāo)明了對應(yīng)數(shù)字的手寫數(shù)字圖像。給出足夠的例子,監(jiān)督學(xué)習(xí)系統(tǒng)將學(xué)會識別與每個數(shù)字相關(guān)的像素和形狀,并且最終能夠識別手寫數(shù)字,能夠可靠地區(qū)分?jǐn)?shù)字9和4或6和8。
但是,對這些系統(tǒng)進(jìn)行訓(xùn)練通常需要大量標(biāo)記數(shù)據(jù),有些系統(tǒng)甚至需要暴露于數(shù)百萬個示例才能掌握任務(wù)。
因此,用于培訓(xùn)這些系統(tǒng)的數(shù)據(jù)集可能非常龐大,Google的開放圖像數(shù)據(jù)集包含大約900萬個圖像,其帶有標(biāo)簽的視頻存儲庫YouTube-8M可鏈接到700萬個帶標(biāo)簽的視頻,ImageNet是這類早期數(shù)據(jù)庫之一,擁有超過1400萬個分類圖像。培訓(xùn)數(shù)據(jù)集的規(guī)模繼續(xù)增長,F(xiàn)acebook最近宣布已經(jīng)編輯了35億張在Instagram上公開發(fā)布的圖片,并使用每張圖片的標(biāo)簽作為標(biāo)簽。在ImageNet的基準(zhǔn)測試中,使用10億張這些照片來訓(xùn)練圖像識別系統(tǒng)的記錄準(zhǔn)確率達(dá)到了85.4%。
標(biāo)記訓(xùn)練中使用的數(shù)據(jù)集的繁瑣過程通常使用群集服務(wù)進(jìn)行,例如亞馬遜機(jī)械土耳其人,它提供了遍布全球的大量低成本勞動力的訪問。例如,ImageNet由兩年近5萬人組成,主要通過Amazon Mechanical Turk招募。然而,F(xiàn)acebook使用公開可用的數(shù)據(jù)來訓(xùn)練系統(tǒng)的方法可以提供另一種使用數(shù)十億個數(shù)據(jù)集的訓(xùn)練系統(tǒng)的方法,而無需手動標(biāo)記的開銷。
什么是無監(jiān)督學(xué)習(xí)?
相比之下,無監(jiān)督學(xué)習(xí)任務(wù)算法在數(shù)據(jù)中識別模式,試圖將相似性的數(shù)據(jù)進(jìn)行分類。例如愛彼迎將鄰居可租用的房屋聚集在一起,或Google新聞每天將類似主題的故事分組在一起。
該算法不是為了挑選特定類型的數(shù)據(jù)而設(shè)計,它只是查找可以按照其相似性進(jìn)行分組的數(shù)據(jù),或?qū)ふ彝怀霎惓5臄?shù)據(jù)。
什么是深度學(xué)習(xí)和深層神經(jīng)網(wǎng)絡(luò)?
機(jī)器學(xué)習(xí)的一個子集是深度學(xué)習(xí),其中神經(jīng)網(wǎng)絡(luò)被擴(kuò)展到具有大量數(shù)據(jù)訓(xùn)練龐大網(wǎng)絡(luò)中。正是這些深度神經(jīng)網(wǎng)絡(luò)推動了計算機(jī)執(zhí)行語音識別和計算機(jī)視覺方面能力的飛躍發(fā)展。
各種類型的神經(jīng)網(wǎng)絡(luò),有不同的優(yōu)勢和劣勢。遞歸神經(jīng)網(wǎng)絡(luò)是特別適用于語言處理和語音識別的一類神經(jīng)網(wǎng)絡(luò),而卷積神經(jīng)網(wǎng)絡(luò)更常用于圖像識別。神經(jīng)網(wǎng)絡(luò)的設(shè)計也在不斷發(fā)展,研究人員最近為有效類型的深度神經(jīng)網(wǎng)絡(luò)設(shè)計了一種更高效的設(shè)計,稱為長期短期記憶或LSTM,使其能夠快速運(yùn)行,例如Google翻譯。
進(jìn)化算法的AI技術(shù)甚至被用于優(yōu)化神經(jīng)網(wǎng)絡(luò)。該方法最近由優(yōu)步人工智能實(shí)驗(yàn)室展示,該實(shí)驗(yàn)室發(fā)布了關(guān)于使用遺傳算法訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)以強(qiáng)化學(xué)習(xí)問題的論文。
機(jī)器學(xué)習(xí)用來干什么?
機(jī)器學(xué)習(xí)系統(tǒng)一直在我們身邊使用,是現(xiàn)代互聯(lián)網(wǎng)的基石。用于為您推薦在亞馬遜上想要購買的產(chǎn)品或想要在Netflix上觀看的視頻。
每個Google搜索都使用多個機(jī)器學(xué)習(xí)系統(tǒng),通過個性化搜索結(jié)果來了解查詢中的語言,因此搜索“低音”的釣魚愛好者不會被吉他的結(jié)果所淹沒。同樣,Gmail的垃圾郵件和網(wǎng)絡(luò)釣魚識別系統(tǒng)也使用經(jīng)過機(jī)器學(xué)習(xí)的訓(xùn)練模型,讓您的收件箱避開流氓信息。
虛擬助手如蘋果的Siri,亞馬遜的Alexa,谷歌助理和微軟Cortana是機(jī)器學(xué)習(xí)最典型的例子。
除此之外,在許多其它行業(yè)中也有許多用處,包括:無人駕駛汽車,無人駕駛飛機(jī)的計算機(jī)視覺;聊天機(jī)器人和服務(wù)機(jī)器人的語音識別;人臉識別;幫助放射科醫(yī)生在X射線中挑選腫瘤,幫助研究人員發(fā)現(xiàn)與疾病相關(guān)的基因序列,并找出可能導(dǎo)致醫(yī)療保健中更有效藥物的分子;通過分析物聯(lián)網(wǎng)傳感器數(shù)據(jù),允許對基礎(chǔ)設(shè)施進(jìn)行預(yù)測性維護(hù)等等。
本文由自興動腦人工智能學(xué)員:柯斌斌提供
借助此文,接下來我們會一步步講到深度學(xué)習(xí),本文做為一個跳板。
-
AI
+關(guān)注
關(guān)注
87文章
30947瀏覽量
269216 -
人工智能
+關(guān)注
關(guān)注
1791文章
47314瀏覽量
238653 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8420瀏覽量
132687 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5503瀏覽量
121207
發(fā)布評論請先 登錄
相關(guān)推薦
評論