目前,深度學(xué)習(xí)受到大規(guī)模的炒作,人們恨不得在各個地方都使用神經(jīng)網(wǎng)絡(luò),但確實(shí)在每一個地方都適用么?我們將在下面的章節(jié)中進(jìn)行討論,閱讀完它后,您將知道神經(jīng)網(wǎng)絡(luò)的主要缺點(diǎn),并且當(dāng)您為當(dāng)前的機(jī)器學(xué)習(xí)問題選擇正確類型的算法時,您將有一個粗略的指導(dǎo)原則。您還將了解我們現(xiàn)在面臨的機(jī)器學(xué)習(xí)中的主要問題。
·概要
·結(jié)論
為什么深度學(xué)習(xí)受到炒作?
深度學(xué)習(xí)有目前正在進(jìn)行炒作的四個主要原因,包括數(shù)據(jù)、計算能力、算法本身和市場營銷。我們將在下面的章節(jié)中討論它們中的每一個。
1.數(shù)據(jù)
增加深度學(xué)習(xí)的受歡迎程度的一個因素是2018年可用的大量數(shù)據(jù),這些數(shù)據(jù)是在過去幾年和幾十年中收集的。這使得神經(jīng)網(wǎng)絡(luò)能夠真正發(fā)揮他們的潛力,因為他們獲得的數(shù)據(jù)越多越好。
相比之下,傳統(tǒng)的機(jī)器學(xué)習(xí)算法肯定會達(dá)到一個水平,更多的數(shù)據(jù)不會提高其性能。下面的圖表說明了這一點(diǎn):
2.計算能力
另一個非常重要的原因是現(xiàn)在可用的計算能力,這使我們能夠處理更多的數(shù)據(jù)。根據(jù)人工智能的領(lǐng)先人物Ray Kurzweil的說法,計算能力在每個時間單位會乘以一個常數(shù)因子(例如,每年增加一倍),而不是逐漸增加。這意味著計算能力呈指數(shù)增長。
3.算法
提高Deep Learning流行度的第三個因素是算法本身的進(jìn)步。算法開發(fā)中的出現(xiàn)最近的突破主要是由于使它們比以前運(yùn)行得更快,這使得使用越來越多的數(shù)據(jù)成為可能。
4.營銷
營銷可能也是一個很重要的因素。神經(jīng)網(wǎng)絡(luò)幾十年來(第一次在1944年提出),已經(jīng)經(jīng)歷了一些炒作,但過去處于沒有人想相信和投資的時代。 “深度學(xué)習(xí)”這個詞組給了它一個新的花哨的名字,這使得新的炒作成為可能,這也是許多人錯誤地認(rèn)為深度學(xué)習(xí)是一個新創(chuàng)造的領(lǐng)域的原因。
此外,其他因素也促成了深度學(xué)習(xí)的營銷,例如漢森機(jī)器人技術(shù)的“人形”機(jī)器人Sophia,在大眾中引起了廣泛的爭議,以及機(jī)器學(xué)習(xí)主要領(lǐng)域的幾項突破,使其成為大眾媒體等等。
神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)算法
當(dāng)你應(yīng)該使用神經(jīng)網(wǎng)絡(luò)或傳統(tǒng)的機(jī)器學(xué)習(xí)算法,這是一個難以回答的問題,因為它很大程度上取決于你試圖解決的問題。這也是由于“沒有免費(fèi)的午餐定理”,它大致表明沒有“完美”的機(jī)器學(xué)習(xí)算法,在任何問題上都能表現(xiàn)出色。對于每一個問題,一個特定的方法是適合的,能取得良好的效果,而另一種方法或許會失敗,但這可能是機(jī)器學(xué)習(xí)最有趣的部分之一。
這也是您需要精通幾種算法的原因,以及為什么通過練習(xí)獲得優(yōu)秀機(jī)器學(xué)習(xí)工程師或數(shù)據(jù)科學(xué)家的較好的方法。在這篇文章中會為您提供一些指導(dǎo)方針,幫助您更好地理解何時應(yīng)使用哪種類型的算法。
神經(jīng)網(wǎng)絡(luò)的主要優(yōu)勢在于其幾乎超越了其他所有機(jī)器學(xué)習(xí)算法的能力,但是這有一些缺點(diǎn),我們將在本文中討論并重點(diǎn)關(guān)注。就像我之前提到的那樣,決定是否應(yīng)該使用深度學(xué)習(xí)主要取決于您正在嘗試解決的問題。例如,在癌癥檢測中,高性能至關(guān)重要,因為性能越好,可以治療的人越多。但也有機(jī)器學(xué)習(xí)問題,傳統(tǒng)的算法提供的不僅僅是滿意的結(jié)果。
1.黑盒子
神經(jīng)網(wǎng)絡(luò)最為人所知的缺點(diǎn)可能就是它們的“黑盒子”性質(zhì),這意味著你不知道神經(jīng)網(wǎng)絡(luò)如何以及為什么會產(chǎn)生一定的輸出。例如,當(dāng)你將一張貓的圖像放入神經(jīng)網(wǎng)絡(luò),并預(yù)測它是一輛汽車時,很難理解是什么導(dǎo)致它產(chǎn)生這個預(yù)測。當(dāng)你具有人類可解釋的特征時,理解其錯誤的原因要容易得多。在比較中,像決策樹這樣的算法是非常容易理解的。這很重要,因為在某些領(lǐng)域,可解釋性非常重要。
這就是為什么很多銀行不使用神經(jīng)網(wǎng)絡(luò)來預(yù)測一個人是否有信譽(yù),因為他們需要向客戶解釋為什么他們沒有獲得貸款。否則,這個人可能會覺得受到銀行的錯誤威脅,因為他不明白他為什么沒有獲得貸款,這可能導(dǎo)致他改變對該銀行的看法,像Quora這樣的網(wǎng)站也是如此。如果他們因為機(jī)器學(xué)習(xí)算法而決定刪除用戶帳戶,他們需要向用戶解釋為什么他們已經(jīng)完成了它。我懷疑他們是否會滿意電腦所給的答案。
在機(jī)器學(xué)習(xí)的推動下,其他情景將是重要的商業(yè)決策。你能想象一個大公司的首席執(zhí)行官會在不明白為什么應(yīng)該完成的情況下做出價值數(shù)百萬美元的決定嗎?僅僅因為“計算機(jī)”說他需要這樣做。
2.開發(fā)持續(xù)時間
盡管像Keras這樣的庫使得神經(jīng)網(wǎng)絡(luò)的開發(fā)非常簡單,但是有時您需要更多地控制算法的細(xì)節(jié),例如,當(dāng)您試圖解決機(jī)器學(xué)習(xí)中的難題時。
然后你可能會使用Tensorflow,它為你提供了更多的機(jī)會,但因為它也更復(fù)雜,開發(fā)需要更長的時間(取決于你想要構(gòu)建的)。那么對于公司管理層來說,如果真的值得他們昂貴的工程師花費(fèi)數(shù)周時間來開發(fā)一些東西,那么問題就會出現(xiàn),用更簡單的算法可以更快地解決問題。
3.數(shù)據(jù)量
與傳統(tǒng)的機(jī)器學(xué)習(xí)算法相比,神經(jīng)網(wǎng)絡(luò)通常需要更多的數(shù)據(jù),至少有數(shù)千甚至數(shù)百萬個標(biāo)記樣本。這不是一個容易解決的問題,如果使用其他算法,許多機(jī)器學(xué)習(xí)問題可以用較少的數(shù)據(jù)很好地解決。
盡管有些情況下神經(jīng)網(wǎng)絡(luò)很少處理數(shù)據(jù),但大多數(shù)情況下他們不處理。在這種情況下,像樸素貝葉斯這樣的簡單算法可以很好地處理少數(shù)數(shù)據(jù)。
4.計算昂貴
通常,神經(jīng)網(wǎng)絡(luò)比傳統(tǒng)算法在計算上更昂貴。最先進(jìn)的深度學(xué)習(xí)算法,實(shí)現(xiàn)真正深度的神經(jīng)網(wǎng)絡(luò)的成功訓(xùn)練,可能需要幾周時間才能完全從頭開始進(jìn)行訓(xùn)練。大多數(shù)傳統(tǒng)的機(jī)器學(xué)習(xí)算法花費(fèi)的時間少于幾分鐘到幾個小時或幾天。
神經(jīng)網(wǎng)絡(luò)所需的計算能力很大程度上取決于數(shù)據(jù)的大小,但也取決于網(wǎng)絡(luò)的深度和復(fù)雜程度。例如,具有一層和50個神經(jīng)元的神經(jīng)網(wǎng)絡(luò)將比具有1000棵樹的隨機(jī)森林快得多。相比之下,具有50層的神經(jīng)網(wǎng)絡(luò)將比僅有10棵樹的隨機(jī)森林慢得多。
概要
現(xiàn)在你可能會知道神經(jīng)網(wǎng)絡(luò)對于某些任務(wù)比較適用,但對其他人來說并不一定適用。您了解到,大量的數(shù)據(jù)、更多的計算能力、更好的算法和智能營銷增加了深度學(xué)習(xí)的受歡迎程度,并使其成為目前最熱門的領(lǐng)域之一。最重要的是,您已經(jīng)了解到,神經(jīng)網(wǎng)絡(luò)幾乎可以擊敗所有其他機(jī)器學(xué)習(xí)算法以及與之相伴隨的缺點(diǎn)。最大的缺點(diǎn)是它們的“黑盒子”性質(zhì),增加開發(fā)時間(取決于您的問題)、所需的數(shù)據(jù)量以及它們大部分計算成本高昂。
結(jié)論
深度學(xué)習(xí)目前可能仍舊有點(diǎn)過度炒作的情況,并且超過期望完成的事情。但這并不意味著它沒有用處。我認(rèn)為我們生活在機(jī)器學(xué)習(xí)復(fù)興中,因為它越來越民主化,越來越多的人可以用它來構(gòu)建有用的產(chǎn)品。機(jī)器學(xué)習(xí)可以解決很多問題,我相信這將在未來幾年內(nèi)發(fā)生。
其中一個主要問題是只有少數(shù)人了解可以用它做些什么,并知道如何建立成功的數(shù)據(jù)科學(xué)團(tuán)隊,為公司帶來真正的價值。一方面,我們擁有博士級工程師,他們是機(jī)器學(xué)習(xí)背后的理論天才,但可能缺乏對商業(yè)方面的理解。另一方面,我們有首席執(zhí)行官和管理職位的人員,他們不知道深度學(xué)習(xí)可以做些什么,并認(rèn)為它將在未來幾年解決所有問題。我們需要更多的人來填補(bǔ)這個空白,這將產(chǎn)生更多對我們社會有用的產(chǎn)品。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4777瀏覽量
100973 -
算法
+關(guān)注
關(guān)注
23文章
4625瀏覽量
93126 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5511瀏覽量
121353
發(fā)布評論請先 登錄
相關(guān)推薦
評論