我們經(jīng)??吹竭@幾個(gè)熱詞: 人工智能( ArtificialIntelligence )、機(jī)器學(xué)習(xí)( MachineLearning )和深度學(xué)習(xí) (DeepLearning) ,但是它們之間究竟有什么 區(qū)別和聯(lián)系呢?
人工智能(AI)的根本在于智能,即如何為機(jī)器賦予人的智能,這是一個(gè)非常大的范圍。
機(jī)器學(xué)習(xí)(ML)是指通過數(shù)據(jù)訓(xùn)練出能完成一定功能的模型,是實(shí)現(xiàn)人工智能的手段之一,也是目前最主流的人工智能實(shí)現(xiàn)方法。人工智能是科學(xué),機(jī)器學(xué)習(xí)是讓機(jī)器變得更加智能的方法或算法。
深度學(xué)習(xí)(DL)是機(jī)器學(xué)習(xí)的一個(gè)分支。深度即層數(shù),超過 8 層的神經(jīng)網(wǎng)絡(luò)模型就叫深度學(xué)習(xí)。深度學(xué)習(xí)也是當(dāng)下最流行的機(jī)器學(xué)習(xí)的一種。目前在語音、圖像等領(lǐng)域取得了很好的效果。
三者之間是從大到小的包含關(guān)系。
今天重點(diǎn)介紹一下機(jī)器學(xué)習(xí)ML。
機(jī)器學(xué)習(xí)直接來源于早期的人工智能領(lǐng)域。
機(jī)器學(xué)習(xí)為什么如此重要?機(jī)器學(xué)習(xí)之所以成為人工智能背后的強(qiáng)勁動(dòng)力是在于一個(gè)重大突破--互聯(lián)網(wǎng)的發(fā)明?;ヂ?lián)網(wǎng)有大量的數(shù)字信息被生成存儲(chǔ)和分析。機(jī)器學(xué)習(xí)算法在這些大數(shù)據(jù)方面是最有效的。
機(jī)器學(xué)習(xí)最基本的做法,是使用算法來解析數(shù)據(jù)、從中學(xué)習(xí),然后對真實(shí)世界中的事件做出決策和預(yù)測。與傳統(tǒng)的為解決特定任務(wù)、硬編碼的軟件程序不同,機(jī)器學(xué)習(xí)是用大量的數(shù)據(jù)來“訓(xùn)練”,通過各種算法從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù)。機(jī)器學(xué)習(xí)則是機(jī)器通過大數(shù)據(jù)的輸入,從中主動(dòng)尋求規(guī)律,驗(yàn)證規(guī)律,最后得出結(jié)論,機(jī)器據(jù)此結(jié)論來自主解決問題,如果出現(xiàn)了偏差,會(huì)自主糾錯(cuò)。
什么是機(jī)器學(xué)習(xí)呢?
機(jī)器學(xué)習(xí)ML(Machine Learning)是一門人工智能的學(xué)科,一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。
機(jī)器學(xué)習(xí)ML是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域,它主要使用歸納、綜合而不是演繹。
ML defined byLangley(1996) - Machine learning is a science of the artificial. Thefield‘s main objects of study are artifacts, specifically algorithms that improvetheir performance with experience.
ML defined byTom Mitchell (1997)- Machine Learning is the study of computeralgorithms that improve automatically through experience.
ML defined byAlpaydin(2004) - Machine learning is programming computers to optimize aperformance criterion using example data or past experience.
機(jī)器學(xué)習(xí)的本質(zhì)是空間搜索和函數(shù)的泛化。無論使用哪種機(jī)器學(xué)習(xí)模型,都要經(jīng)歷要經(jīng)歷“建立模型”,“訓(xùn)練模型”,“反饋”,“應(yīng)用”的過程。而這個(gè)過程,跟一個(gè)嬰兒認(rèn)識世界,獲取知識的過程是一樣的。培養(yǎng)機(jī)器建立人的認(rèn)識的過程,就是“機(jī)器學(xué)習(xí)”。
機(jī)器學(xué)習(xí)常見分類:
1)有監(jiān)督學(xué)習(xí)(supervised learning):從給定的訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)出一個(gè)函數(shù),當(dāng)新的數(shù)據(jù)到來時(shí),可以根據(jù)這個(gè)函數(shù)預(yù)測結(jié)果。主要應(yīng)用于分類和預(yù)測。監(jiān)督學(xué)習(xí)的訓(xùn)練集要求是包括輸入和輸出,也可以說是特征和目標(biāo)。訓(xùn)練集中的目標(biāo)是由人標(biāo)注的。常用算法包括人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network)、貝葉斯(Bayesian) 、決策樹(Decision Tree)和線性分類(Linear classifier)等 。
2)無監(jiān)督學(xué)習(xí)(unsupervised learning):與監(jiān)督學(xué)習(xí)相比,訓(xùn)練集沒有人為標(biāo)注的結(jié)果。又稱歸納性學(xué)習(xí)(clustering)利用K方式(Kmeans),建立中心(centriole),通過循環(huán)和遞減運(yùn)算(iteration&descent)來減小誤差,達(dá)到分類的目的。常用算法包括人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network)、關(guān)聯(lián)規(guī)則學(xué)習(xí)(Association rule learning)、分層聚類 Hierarchical clustering 和異常檢測(Anomaly detection) 等 。
3)半監(jiān)督學(xué)習(xí)(semi- supervised learning):介于監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)之間。結(jié)合了大量未標(biāo)記的數(shù)據(jù)和少量標(biāo)簽數(shù)據(jù)。常用算法包括包括生成模型(Generative models)、低密度分離(Low-density separation)和聯(lián)合訓(xùn)練Co-training等。
4)強(qiáng)化學(xué)習(xí)(Reinforcement learning):在這種學(xué)習(xí)模式下,輸入數(shù)據(jù)作為對模型的反饋,不像監(jiān)督模型那樣,輸入數(shù)據(jù)僅僅是作為一個(gè)檢查模型對錯(cuò)的方式,在強(qiáng)化學(xué)習(xí)下,輸入數(shù)據(jù)直接反饋到模型,模型必須對此立刻作出調(diào)整。常見的應(yīng)用場景包括動(dòng)態(tài)系統(tǒng)以及機(jī)器人控制等。常見算法包括Q-Learning、時(shí)間差學(xué)習(xí)(Temporal difference learning)和學(xué)習(xí)自動(dòng) Learning Automata等。
機(jī)器學(xué)習(xí)研究內(nèi)容主要包括三個(gè)方面:
(1)面向任務(wù)的研究:研究和分析改進(jìn)一組預(yù)定任務(wù)的執(zhí)行性能的學(xué)習(xí)系統(tǒng)。
(2)認(rèn)知模型:研究人類學(xué)習(xí)過程并進(jìn)行計(jì)算機(jī)模擬。
(3)理論分析:從理論上探索各種可能的學(xué)習(xí)方法和獨(dú)立于應(yīng)用領(lǐng)域的算法。
機(jī)器學(xué)習(xí)研究領(lǐng)域集中于兩個(gè)范疇:
(1)分類任務(wù)要求系統(tǒng)依據(jù)已知的分類知識對輸入的未知模式作分析,以確定輸入模式的類屬。相應(yīng)的學(xué)習(xí)目標(biāo)就是學(xué)習(xí)用于分類的準(zhǔn)則(如分類規(guī)則)。
(2)問題求解任務(wù)要求對于給定的目標(biāo)狀態(tài),尋找一個(gè)將當(dāng)前狀態(tài)轉(zhuǎn)換為目標(biāo)狀態(tài)的動(dòng)作序列;機(jī)器學(xué)習(xí)在這一領(lǐng)域的研究工作大部分集中于通過學(xué)習(xí)來獲取能提高問題求解效率的知識(如搜索控制知識,啟發(fā)式知識等)。
機(jī)器學(xué)習(xí)應(yīng)用廣泛,如:計(jì)算機(jī)視覺、自然語言處理、生物特征識別、數(shù)據(jù)挖掘、搜索引擎、自動(dòng)駕駛、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、專家系統(tǒng)、認(rèn)知模擬、規(guī)劃和問題求解、戰(zhàn)略游戲和機(jī)器人等。
機(jī)器學(xué)習(xí)各種方法的應(yīng)用范圍不斷擴(kuò)大,一部分已形成商品。歸納學(xué)習(xí)的知識獲取工具已在診斷分類型專家系統(tǒng)中廣泛使用。連接學(xué)習(xí)在聲圖文識別中占優(yōu)勢。分析學(xué)習(xí)已用于設(shè)計(jì)綜合型專家系統(tǒng)。遺傳算法與強(qiáng)化學(xué)習(xí)在工程控制中有較好的應(yīng)用前景。與符號系統(tǒng)耦合的神經(jīng)網(wǎng)絡(luò)連接學(xué)習(xí)將在企業(yè)的智能管理與智能機(jī)器人運(yùn)動(dòng)規(guī)劃中發(fā)揮作用。
機(jī)器學(xué)習(xí)是繼專家系統(tǒng)之后人工智能應(yīng)用的又一重要研究領(lǐng)域,也是人工智能和神經(jīng)計(jì)算的核心研究課題之一?,F(xiàn)有的計(jì)算機(jī)系統(tǒng)和人工智能系統(tǒng)沒有什么學(xué)習(xí)能力,至多也只有非常有限的學(xué)習(xí)能力,因而不能滿足科技和生產(chǎn)提出的新要求。對機(jī)器學(xué)習(xí)的討論和機(jī)器學(xué)習(xí)研究的進(jìn)展,必將促使人工智能和整個(gè)科學(xué)技術(shù)的進(jìn)一步發(fā)展。
結(jié)語
機(jī)器學(xué)習(xí)是一門人工智能的科學(xué),該領(lǐng)域的主要研究對象是人工智能,特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能。機(jī)器學(xué)習(xí)是人工智能的組成部分,是人工智能的核心和前沿。機(jī)器學(xué)習(xí)的進(jìn)展將不斷推動(dòng)人工智能向前發(fā)展。
責(zé)任編輯:Ct
評論
查看更多