0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

神經(jīng)網(wǎng)絡(luò)技術(shù)解析:手寫數(shù)字識(shí)別項(xiàng)目解讀

電子設(shè)計(jì) ? 來源:機(jī)器之心 ? 作者:澤南 張倩 ? 2021-01-13 15:50 ? 次閱讀

手寫數(shù)字識(shí)別是很多人入門神經(jīng)網(wǎng)絡(luò)時(shí)用來練手的一個(gè)項(xiàng)目,但就是這么簡單的一個(gè)項(xiàng)目,最近在 reddit 上又火了一把,因?yàn)樵?MIT 計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室,有人挖到了一個(gè)「祖師爺」級別的視頻……

這段視頻錄制于 1993 年,主人公是圖靈獎(jiǎng)得主 Yann LeCun(楊立昆)。彼時(shí) LeCun 才 32 歲,剛剛進(jìn)入貝爾實(shí)驗(yàn)室工作,而視頻里機(jī)器學(xué)習(xí)識(shí)別的第一段數(shù)字 201-949-4038,是 LeCun 在貝爾實(shí)驗(yàn)室里的電話號(hào)碼。 從這段視頻中我們可以看到,LeCun 在 90 年代初創(chuàng)造的文本識(shí)別系統(tǒng)已經(jīng)達(dá)到了驚人的速度和準(zhǔn)確率,這在當(dāng)時(shí)的條件下是非常難能可貴的。

這段視頻由貝爾實(shí)驗(yàn)室自適應(yīng)系統(tǒng)研究部門主任 Larry Jackel 拍攝(Larry 當(dāng)時(shí)是 LeCun 的 boss,現(xiàn)任英偉達(dá)自動(dòng)駕駛顧問)。視頻中出鏡的還有實(shí)驗(yàn)室負(fù)責(zé)人 Rich Howard(Larry 的 boss)和研究工程師 Donnie Henderson。Yann LeCun 本人表示:「Donnie Henderson 將整個(gè)演示系統(tǒng)整合在了一起…… 整套系統(tǒng)在算力為 20MFLOPS 的 DSP 版上運(yùn)行?!?/p>

幾位工程師在視頻中洋溢的笑容也頗具感染力。

LeCun 表示,1993 年的文字識(shí)別系統(tǒng)已經(jīng)用上了卷積神經(jīng)網(wǎng)絡(luò)(CNN),自己在這套系統(tǒng)中編寫了一種網(wǎng)絡(luò)數(shù)據(jù)結(jié)構(gòu)的編譯器,并生成了可編譯的 C 語言代碼,在源代碼中以權(quán)重和網(wǎng)表(netlist)代表文字。 這段視頻的驚艷之處還在于,它比經(jīng)典手寫數(shù)字?jǐn)?shù)據(jù)集 MNIST 的問世還要早 6 年。

pIYBAF_-pMeAMHCAAABq5qkjYcU826.png

其實(shí),早在 1989 年,LeCun 就已經(jīng)發(fā)表了「將反向傳播用于手寫郵政編碼識(shí)別」的相關(guān)研究,而且已經(jīng)在美國的郵政系統(tǒng)中成功應(yīng)用。隨后,這一系統(tǒng)的應(yīng)用范圍擴(kuò)展至銀行支票。90 年代末期,該系統(tǒng)已經(jīng)處理了美國 10%-20%的支票識(shí)別。

o4YBAF_-pNWAK3ObAALBa2Q5DDU736.png

1999 年,LeCun 等人聯(lián)合發(fā)表了「MNIST」手寫數(shù)字?jǐn)?shù)據(jù)集。這一數(shù)據(jù)集包含數(shù)萬個(gè)樣本,被稱為「計(jì)算機(jī)視覺領(lǐng)域的 hello world 數(shù)據(jù)集」、「機(jī)器學(xué)習(xí)界的果蠅」,如今已經(jīng)作為基準(zhǔn)被使用了二十余年。

pIYBAF_-pOWAejsuAAIT49kFyNQ943.png

在看了這段視頻之后,有研究者感嘆,「不要再抱怨 GPU 算力不夠了」。

o4YBAF_-pPGAYaTEAAByJSj2qWU470.png

深度學(xué)習(xí)先驅(qū) Yann LeCun 說起 Yann LeCun,熟悉人工智能領(lǐng)域的人肯定不會(huì)陌生,Yann LeCun 現(xiàn)在是紐約大學(xué)教授、美國工程院院士、Facebook 副總裁和首席 AI 科學(xué)家。 在深度學(xué)習(xí)還未流行的 20 世紀(jì)八九十年代,LeCun 與另兩位先驅(qū)者 Yoshua Bengio、Geoffrey Hinton 一道探索了深度學(xué)習(xí)領(lǐng)域的概念基礎(chǔ),并通過實(shí)驗(yàn)向人們展示了新方法的前景。此外,他們還貢獻(xiàn)了一系列工程進(jìn)展,展示了深度神經(jīng)網(wǎng)絡(luò)的實(shí)用優(yōu)勢。 雖然在二十世紀(jì)八十年代,研究者就開始試用人工神經(jīng)網(wǎng)絡(luò)幫助計(jì)算機(jī)識(shí)別模式、模擬人類智能,但直到二十一世紀(jì)的前幾年,這種方式仍未獲得廣泛認(rèn)同,LeCun 等研究者試圖重燃 AI 社區(qū)對神經(jīng)網(wǎng)絡(luò)興趣的努力曾經(jīng)一直被人們質(zhì)疑,但如今他們的想法帶來了重大的技術(shù)進(jìn)步,他們的方法也已成為該領(lǐng)域的主導(dǎo)范式。 自 2012 年以來,深度學(xué)習(xí)方法促進(jìn)計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理和機(jī)器人技術(shù)等應(yīng)用領(lǐng)域取得極大突破。 在 2019 年,美國計(jì)算機(jī)協(xié)會(huì) ACM 公布了上一年度的圖靈獎(jiǎng),Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun 三位深度學(xué)習(xí)巨頭同時(shí)獲獎(jiǎng)。

從左至右:Yoshua Bengio、Geoffrey Hinton、Yann LeCun。 ACM 表示,Yann LeCun 主要作出了三大貢獻(xiàn):

  • 提出卷積神經(jīng)網(wǎng)絡(luò)
  • 改進(jìn)反向傳播算法
  • 拓寬神經(jīng)網(wǎng)絡(luò)的視角

20 世紀(jì) 80 年代后期,LeCun 就職于多倫多大學(xué)和貝爾實(shí)驗(yàn)室,也是在這一時(shí)期,他利用手寫數(shù)字圖像訓(xùn)練了第一個(gè)卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)。如今,卷積神經(jīng)網(wǎng)絡(luò)已成為計(jì)算機(jī)視覺、語音識(shí)別、語音合成、圖像合成和自然語言處理領(lǐng)域的行業(yè)標(biāo)準(zhǔn)。卷積神經(jīng)網(wǎng)絡(luò)有著廣泛的應(yīng)用,如自動(dòng)駕駛、醫(yī)學(xué)圖像分析、語音助手和信息過濾等。 這可不是搞定 MNIST 那么簡單 與我們通常為 MINIST 數(shù)據(jù)集構(gòu)建文字識(shí)別系統(tǒng)不同,Yann LeCun 在 1993 年展示的技術(shù)可是用攝像頭直接拍攝的,還需要搞定文字縮放、位置等問題,后來也確實(shí)在郵政系統(tǒng)里獲得了應(yīng)用。 如此看來在當(dāng)年就能實(shí)現(xiàn)這樣的效果確實(shí)不容易,更何況在 20 世紀(jì) 90 年代,研究者們是沒有 TensorFlow 可用的,全靠 C 語言手寫,這個(gè)問題求解的非機(jī)器學(xué)習(xí)部分與其說是困難,不如說是繁瑣。 在社交網(wǎng)絡(luò)中,人們對 LeCun 展示的算法除了感興趣,還有贊譽(yù)和膜拜,有人說道:「這并不是說他們在 1993 年就解決了 MNIST 上的問題,比那還要更進(jìn)一步。」 在深度學(xué)習(xí)被 GPU 帶動(dòng)開展大規(guī)模應(yīng)用以前,人工智能算法其實(shí)已經(jīng)實(shí)現(xiàn)了相當(dāng)?shù)穆斆鞒潭?。?1993 年的文字識(shí)別之后,昨天,人們又挖出了 LeCun 參與的另一項(xiàng)研究:人臉檢測。

在 2003 年,一個(gè)視頻展示了 Rita Osadchy、Matt Miller 以及 Yann LeCun 等人在 NEC 實(shí)驗(yàn)室的研究,使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉檢測研究。 雖然只是人臉檢測而不是人臉識(shí)別,但這種技術(shù)的意義不言而喻,如今自動(dòng)駕駛汽車上的障礙物檢測方法使用的就是和它相同的技術(shù)。在推特上,LeCun 也點(diǎn)贊了這段視頻。

看來,如今我們在機(jī)器學(xué)習(xí)領(lǐng)域廣泛使用的方法,早在幾十年前就已完成了整體架構(gòu)。 不過與此同時(shí),也有網(wǎng)友發(fā)出了直擊靈魂的提問:「既然 LeCun 在 1993 年就可以讓 AI 這樣識(shí)別文字了,為啥直到今天大多數(shù)網(wǎng)站仍然認(rèn)為文字驗(yàn)證碼是識(shí)別機(jī)器人的好辦法?」
編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評論

    相關(guān)推薦

    怎么對神經(jīng)網(wǎng)絡(luò)重新訓(xùn)練

    重新訓(xùn)練神經(jīng)網(wǎng)絡(luò)是一個(gè)復(fù)雜的過程,涉及到多個(gè)步驟和考慮因素。 引言 神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、自然語言處理、語音識(shí)別等領(lǐng)域。然而,隨著時(shí)間的推移,數(shù)據(jù)分布可
    的頭像 發(fā)表于 07-11 10:25 ?493次閱讀

    rnn是遞歸神經(jīng)網(wǎng)絡(luò)還是循環(huán)神經(jīng)網(wǎng)絡(luò)

    RNN(Recurrent Neural Network)是循環(huán)神經(jīng)網(wǎng)絡(luò),而非遞歸神經(jīng)網(wǎng)絡(luò)。循環(huán)神經(jīng)網(wǎng)絡(luò)是一種具有時(shí)間序列特性的神經(jīng)網(wǎng)絡(luò),能夠處理序列數(shù)據(jù),具有記憶功能。以下是關(guān)于循環(huán)
    的頭像 發(fā)表于 07-05 09:52 ?615次閱讀

    人工神經(jīng)網(wǎng)絡(luò)模型的分類有哪些

    人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANNs)是一種模擬人腦神經(jīng)元網(wǎng)絡(luò)的計(jì)算模型,它在許多領(lǐng)域,如圖像識(shí)別、語音識(shí)別、自然語言處理、預(yù)測分析等有著廣泛
    的頭像 發(fā)表于 07-05 09:13 ?1307次閱讀

    bp神經(jīng)網(wǎng)絡(luò)和反向傳播神經(jīng)網(wǎng)絡(luò)區(qū)別在哪

    神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都有廣泛的應(yīng)用,如語音識(shí)別、圖像識(shí)別、自然語言處理等。然而,BP神經(jīng)網(wǎng)絡(luò)也存在一些問題,如容易陷入局部最優(yōu)解、訓(xùn)練時(shí)間長、對初始權(quán)重敏感等。為了解決這些問題,研究者們
    的頭像 發(fā)表于 07-04 09:51 ?492次閱讀

    如何設(shè)計(jì)人臉識(shí)別神經(jīng)網(wǎng)絡(luò)

    人臉識(shí)別技術(shù)是一種基于人臉特征信息進(jìn)行身份識(shí)別技術(shù),廣泛應(yīng)用于安全監(jiān)控、身份認(rèn)證、智能門禁等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)人臉
    的頭像 發(fā)表于 07-04 09:20 ?705次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)的區(qū)別

    網(wǎng)絡(luò)結(jié)構(gòu),分別適用于不同的應(yīng)用場景。本文將從基本概念、結(jié)構(gòu)組成、工作原理及應(yīng)用領(lǐng)域等方面對這兩種神經(jīng)網(wǎng)絡(luò)進(jìn)行深入解讀。
    的頭像 發(fā)表于 07-03 16:12 ?3582次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都有廣泛的應(yīng)用,如語音識(shí)別、圖像識(shí)別、自然語言處理等。然而,BP神經(jīng)網(wǎng)絡(luò)也存在一些問題,如容易陷入局部最優(yōu)解、訓(xùn)練時(shí)間長、對初始權(quán)重敏感等。為了解決這些問題,研究者們
    的頭像 發(fā)表于 07-03 11:00 ?849次閱讀

    如何使用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱

    神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元網(wǎng)絡(luò)的計(jì)算模型,廣泛應(yīng)用于各種領(lǐng)域,如圖像識(shí)別、語音識(shí)別、自然語言處理等。在MATLAB中,可以使用神經(jīng)網(wǎng)絡(luò)工具
    的頭像 發(fā)表于 07-03 10:34 ?2594次閱讀

    bp神經(jīng)網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)

    Network)有相似之處,但它們之間還是存在一些關(guān)鍵的區(qū)別。 一、引言 神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元結(jié)構(gòu)的計(jì)算模型,它由大量的神經(jīng)元(或稱為節(jié)點(diǎn))組成,這些神經(jīng)元通過權(quán)重連接在一起
    的頭像 發(fā)表于 07-03 10:14 ?908次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是一種深度學(xué)習(xí)模型,廣泛應(yīng)用于圖像識(shí)別、語音識(shí)別、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)的原
    的頭像 發(fā)表于 07-02 14:44 ?745次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    化能力。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,神經(jīng)網(wǎng)絡(luò)已經(jīng)成為人工智能領(lǐng)域的重要技術(shù)之一。卷積神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)
    的頭像 發(fā)表于 07-02 14:24 ?4558次閱讀

    神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)類型和應(yīng)用實(shí)例

    神經(jīng)網(wǎng)絡(luò)模型,作為深度學(xué)習(xí)領(lǐng)域的核心組成部分,近年來在圖像識(shí)別、自然語言處理、語音識(shí)別等多個(gè)領(lǐng)域取得了顯著進(jìn)展。本文旨在深入解讀神經(jīng)網(wǎng)絡(luò)的基
    的頭像 發(fā)表于 07-02 11:33 ?509次閱讀

    神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別領(lǐng)域的應(yīng)用日益廣泛。神經(jīng)網(wǎng)絡(luò)以其強(qiáng)大的特征提取和分類能力,為圖像識(shí)別帶來了革命性的進(jìn)步。本文將
    的頭像 發(fā)表于 07-01 14:19 ?746次閱讀

    神經(jīng)網(wǎng)絡(luò)架構(gòu)有哪些

    神經(jīng)網(wǎng)絡(luò)架構(gòu)是機(jī)器學(xué)習(xí)領(lǐng)域中的核心組成部分,它們模仿了生物神經(jīng)網(wǎng)絡(luò)的運(yùn)作方式,通過復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)實(shí)現(xiàn)信息的處理、存儲(chǔ)和傳遞。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,各種
    的頭像 發(fā)表于 07-01 14:16 ?815次閱讀

    基于毫米波雷達(dá)的手勢識(shí)別神經(jīng)網(wǎng)絡(luò)

    ,本文介紹了一種基于神經(jīng)網(wǎng)絡(luò)的手勢識(shí)別方法。我們使用毫米波雷達(dá)來捕捉手勢運(yùn)動(dòng)的原始信號(hào),隨后,通過預(yù)處理和神經(jīng)網(wǎng)絡(luò)技術(shù),我們可以捕捉時(shí)間和空間變化,同時(shí)減少噪聲干擾。這導(dǎo)致了手勢識(shí)別
    發(fā)表于 05-23 12:12