深度學(xué)習(xí)在語音識別、圖像理解、自動(dòng)駕駛汽車、自然語言處理、搜索引擎優(yōu)化等方面提供了顯著的功能和進(jìn)步。你知道嗎,盡管深度學(xué)習(xí)的范圍如此廣闊,但人工智能的這種變體在第三次迭代中,也就是現(xiàn)在的21世紀(jì),獲得了巨大的轟動(dòng)。隨著gpu的出現(xiàn),深度學(xué)習(xí)可以在大量基準(zhǔn)測試和實(shí)際應(yīng)用程序上超越競爭對手。即使是計(jì)算機(jī)視覺(深度學(xué)習(xí)的常見用例之一)社區(qū)也相當(dāng)懷疑,直到2011年AlexNet在ImageNet上擊敗了所有競爭對手。
盡管在這些發(fā)展之后,深度學(xué)習(xí)模式仍存在許多局限性,阻礙了它在當(dāng)今的大規(guī)模應(yīng)用。例如,模型不具有可伸縮性和旋轉(zhuǎn)不變性,當(dāng)物體姿態(tài)異常時(shí),很容易對圖像進(jìn)行錯(cuò)誤分類。讓我們關(guān)注一些常見的缺點(diǎn)。
一個(gè)主要的缺點(diǎn)是深度學(xué)習(xí)算法需要大量的數(shù)據(jù)集進(jìn)行訓(xùn)練。舉例來說,對于語音識別程序,需要形成多種方言、人口統(tǒng)計(jì)學(xué)和時(shí)間尺度的數(shù)據(jù)來獲得期望的結(jié)果。雖然像谷歌和微軟這樣的大型科技巨頭能夠收集并擁有豐富的數(shù)據(jù),但有好主意的小公司可能無法做到這一點(diǎn)。此外,有時(shí)訓(xùn)練模型所需的數(shù)據(jù)已經(jīng)很稀疏或不可用,這是很有可能的。
此外,在更大的架構(gòu)下,深度學(xué)習(xí)模型需要更多的數(shù)據(jù)來產(chǎn)生可行的結(jié)果。在這樣的場景中,重用數(shù)據(jù)可能不是一個(gè)合適的想法,數(shù)據(jù)擴(kuò)充在某種程度上可能是有用的,但是擁有更多的數(shù)據(jù)總是首選的解決方案。此外,由于復(fù)雜的數(shù)據(jù)模型,訓(xùn)練深度學(xué)習(xí)模型是一件非常昂貴的事情。有時(shí),它們需要昂貴的gpu和數(shù)百臺機(jī)器,這就增加了用戶的成本。
其次,在基準(zhǔn)數(shù)據(jù)集上表現(xiàn)良好的深度學(xué)習(xí)模型在數(shù)據(jù)集之外的真實(shí)圖像上可能會嚴(yán)重失敗。為了說明這一點(diǎn),考慮一個(gè)深度學(xué)習(xí)算法,它學(xué)習(xí)到校車總是黃色的,但是,突然,校車變成藍(lán)色,它將需要重新訓(xùn)練。相反,一個(gè)5歲的孩子認(rèn)出這輛車是一輛藍(lán)色校車是沒有問題的。此外,他們也無法在與訓(xùn)練環(huán)境幾乎不同的情況下有效地執(zhí)行任務(wù)。例如,Google的DeepMind訓(xùn)練了一個(gè)系統(tǒng)來擊敗49款A(yù)tari游戲;然而,每次該系統(tǒng)擊敗一款游戲時(shí),它都必須經(jīng)過再訓(xùn)練才能擊敗下一款游戲。
這給我們帶來了深度學(xué)習(xí)的另一個(gè)局限性,即雖然模型可能非常擅長將輸入映射到輸出,但它可能不擅長理解它們正在處理的數(shù)據(jù)的上下文。換言之,它缺乏常識,在跨領(lǐng)域的邊界地區(qū)得出結(jié)論。據(jù)DeepMind的人工智能研究員格雷格·韋恩(GregWayne)說,目前的算法可能無法辨別沙發(fā)和椅子是用來坐的。它還缺乏通用智能和多領(lǐng)域集成。
深度學(xué)習(xí)算法還可以解決不透明或黑盒問題,使它們難以調(diào)試或理解如何做出決策。這也讓用戶在理解某些部件為什么會出現(xiàn)故障時(shí)無所適從。一般來說,深度學(xué)習(xí)算法會對數(shù)百萬個(gè)數(shù)據(jù)點(diǎn)進(jìn)行篩選,以找到人類專家通常不會注意到的模式和相關(guān)性。雖然在執(zhí)行一些瑣碎的任務(wù)時(shí)可能會遇到問題,但在腫瘤檢測等情況下,醫(yī)生需要知道為什么模型在掃描報(bào)告中標(biāo)記了一些區(qū)域,為什么沒有標(biāo)記其他區(qū)域。
此外,深度學(xué)習(xí)算法在訓(xùn)練階段的缺陷使其容易受到對手樣本的攻擊:對手精心設(shè)計(jì)的輸入,意圖導(dǎo)致深度神經(jīng)網(wǎng)絡(luò)錯(cuò)誤分類。同時(shí),數(shù)據(jù)集中存在的偏見可能導(dǎo)致不準(zhǔn)確的結(jié)果,從而內(nèi)在地放大了現(xiàn)實(shí)世界中的歧視。黑匣子的存在使得開發(fā)人員很難確定這些惡意數(shù)據(jù)是在哪里、如何輸入系統(tǒng)的。
最后,深度學(xué)習(xí)架構(gòu)具有出色的能力,如圖像分類和序列預(yù)測。它們甚至可以生成與另一個(gè)類似GANs的模式相匹配的數(shù)據(jù)。然而,它們并不能推廣到每一個(gè)監(jiān)督學(xué)習(xí)問題。
編輯:lyn
-
語音識別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112747 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1699瀏覽量
46052 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5510瀏覽量
121345
發(fā)布評論請先 登錄
相關(guān)推薦
評論