0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌向神經(jīng)網(wǎng)絡(luò)手寫數(shù)字識(shí)別發(fā)起挑戰(zhàn),竟用量子計(jì)算識(shí)別

如意 ? 來源:機(jī)器之心 ? 作者:機(jī)器之心編輯部 ? 2020-08-17 17:17 ? 次閱讀

神經(jīng)網(wǎng)絡(luò)做 MNIST 手寫數(shù)字識(shí)別是機(jī)器學(xué)習(xí)小白用來練手的入門項(xiàng)目,業(yè)內(nèi)最佳準(zhǔn)確率已經(jīng)達(dá)到了 99.84%。但最近,谷歌向這個(gè)「古老」的數(shù)據(jù)集發(fā)起了一項(xiàng)新的挑戰(zhàn):用量子計(jì)算來進(jìn)行識(shí)別,看看準(zhǔn)確率能達(dá)到多少。

MNIST 對(duì)于機(jī)器學(xué)習(xí)研究者來說再熟悉不過了,它是一個(gè)由 Yann Lecun 等人創(chuàng)建的手寫數(shù)字圖像數(shù)據(jù)集,包含訓(xùn)練集和測(cè)試集,訓(xùn)練集包含 60000 個(gè)樣本,測(cè)試集包含 10000 個(gè)樣本(在 2019 年又增加了 50000 個(gè)測(cè)試集樣本)。

谷歌向神經(jīng)網(wǎng)絡(luò)手寫數(shù)字識(shí)別發(fā)起挑戰(zhàn),竟用量子計(jì)算識(shí)別

在機(jī)器學(xué)習(xí)研究中,MNIST 手寫數(shù)字圖像數(shù)據(jù)集已經(jīng)作為基準(zhǔn)使用了二十余年,它可以說是所有機(jī)器學(xué)習(xí)研究者的入門必備。對(duì)于新興方法的研究來說,從 MNIST 開始也是最合理的選擇,2017 年 Geoffrey Hinton 提出的膠囊網(wǎng)絡(luò)(Capsule Networks)也是這樣做的。

目前,大部分深度學(xué)習(xí)模型在 MNIST 上的分類精度都超過了 95%。有時(shí)為了更直觀地觀察算法之間的差異,我們會(huì)使用圖像內(nèi)容更加復(fù)雜的 Fashion-MNIST 數(shù)據(jù)集。

在準(zhǔn)確率已經(jīng)如此之高的情況下,用神經(jīng)網(wǎng)絡(luò)向此數(shù)據(jù)集發(fā)起挑戰(zhàn)已經(jīng)沒有多大意義。于是,谷歌索性換了一個(gè)思路:用量子計(jì)算技術(shù)來挑戰(zhàn)一下,看看分類準(zhǔn)確率能達(dá)到多少。

實(shí)驗(yàn)結(jié)果表明,用量子計(jì)算技術(shù)可以在 MNIST 數(shù)據(jù)集上至少實(shí)現(xiàn) 41.27% 的分類準(zhǔn)確率,而之前的經(jīng)典方法只能達(dá)到 21.27%。

為什么要這么做?

在現(xiàn)代科技中,量子力學(xué)和機(jī)器學(xué)習(xí)都發(fā)揮著重要作用,量子計(jì)算的 AI 應(yīng)用這一新興領(lǐng)域很有可能幫助許多學(xué)科實(shí)現(xiàn)重大突破。然而,目前大多數(shù)機(jī)器學(xué)習(xí)從業(yè)者對(duì)量子力學(xué)還沒有透徹的了解,多數(shù)量子物理學(xué)家對(duì)機(jī)器學(xué)習(xí)的理解也非常有限。因此,找到一些二者都能理解的問題非常重要,這些問題既要包含簡(jiǎn)單且被廣泛理解的機(jī)器學(xué)習(xí)思想,也要包含類似的量子力學(xué)思想。

基于以上考量,谷歌的研究者提出用簡(jiǎn)單的量子力學(xué)知識(shí)解決一種簡(jiǎn)單的機(jī)器學(xué)習(xí)問題——MNIST 手寫數(shù)字分類。這有點(diǎn)類似于谷歌的 TensorFlow Playground。TensorFlow Playground 本質(zhì)上就是一種教學(xué)輔助,目的是向大眾闡明深度學(xué)習(xí)的關(guān)鍵概念。

研究細(xì)節(jié)

具體來說,研究者想要探究的是:在一個(gè)普通的圖像分類問題中,如果你必須在通過一個(gè) filter(可以顯示來自測(cè)試集的示例圖像)的第一個(gè)光量子(光子)之后做出決定,最高準(zhǔn)確率能達(dá)到多少?在 MNIST 手寫數(shù)字?jǐn)?shù)據(jù)集上(28×28 像素),最佳經(jīng)典方法是檢測(cè)落在其中某個(gè)像素上的光子,然后使用在訓(xùn)練集上觀察到的 per-pixel 概率(即光強(qiáng)度)分布來選擇最有可能的數(shù)字類別。這需要將每個(gè)示例圖像的亮度縮放到一個(gè)單位和(unit sum),以獲得一個(gè)概率分布。在 MNIST 數(shù)據(jù)集上,上述經(jīng)典方法可以實(shí)現(xiàn) 21.27% 的分類準(zhǔn)確率,大大高于隨機(jī)結(jié)果(10%)。每個(gè)像素最有可能的數(shù)字類別如下圖 2(b)所示。

谷歌向神經(jīng)網(wǎng)絡(luò)手寫數(shù)字識(shí)別發(fā)起挑戰(zhàn),竟用量子計(jì)算識(shí)別

如果可以將學(xué)習(xí)到的轉(zhuǎn)換應(yīng)用到圖像和檢測(cè)器之間的光子的量子態(tài),我們就能利用量子力學(xué)實(shí)現(xiàn)更高的準(zhǔn)確率。分束器和移相器等無源線性光學(xué)器件(passive linear optical element)可以用來解決這一問題,它們可以產(chǎn)生一種全息圖式的干涉圖樣。接下來,根據(jù)第一個(gè)光子落在哪一個(gè)區(qū)域來進(jìn)行最大似然估計(jì)。這說明了一種量子原理:?jiǎn)蝹€(gè)量子的概率振幅與自身發(fā)生干涉。此處沒有必要同時(shí)用許多光子照亮一個(gè)場(chǎng)景來產(chǎn)生干涉。

從概念上講,利用干涉來增強(qiáng)量子實(shí)驗(yàn)產(chǎn)生所需結(jié)果的可能性是所有量子計(jì)算的基本思想。這個(gè)問題與現(xiàn)代量子計(jì)算之間的主要區(qū)別在于,后者試圖通過控制多個(gè)「糾纏」成分的量子態(tài)來執(zhí)行計(jì)算,這些「糾纏」成分通常是耦合了兩種狀態(tài)的量子系統(tǒng)(被稱作「量子比特」),通過由整個(gè)量子系統(tǒng)量子態(tài)的一部分所控制的「量子門」來實(shí)現(xiàn)。

因此,構(gòu)建有多個(gè)量子比特的量子計(jì)算機(jī)需要精細(xì)地控制量子比特之間的相互作用。這通常需要將溫度降至 0.1 開爾文(-273.05℃)來消除熱噪聲。

但是,在本文研究的這個(gè)問題中,量子態(tài)之間的轉(zhuǎn)換可以在室溫下使用常規(guī)光學(xué)器件來完成:綠色光子的能量為 2.5 eV(電子伏特),遠(yuǎn)高于典型的室溫?zé)彷椛淠芰?kT ‘ 25 meV。但制造一種允許多個(gè)光子像在多比特量子計(jì)算機(jī)中一樣交互的設(shè)備就非常具有挑戰(zhàn)性了。

盡管如此,Knill、Laflamme 和 Milburn 等人在 2001 年設(shè)計(jì)了一種協(xié)議,使其在理論上可行。他們通過巧妙地利用輔助光子量子比特(ancillary photon qubit)、玻色統(tǒng)計(jì)和測(cè)量過程避免了使用保留相干性的非線性光學(xué)器件(可能無法通過實(shí)驗(yàn)實(shí)現(xiàn))。在所有此類應(yīng)用中,基本思想都是采用相干多光子量子態(tài)進(jìn)行多個(gè)量子比特的計(jì)算。

在這個(gè)問題中,研究者只用了一個(gè)光子,唯一要處理的相關(guān)信息被編碼在其波函數(shù)的空間部分(即偏振無關(guān))。因此,當(dāng)前的工作類似于由 Cerf 等人在 1998 年提出的「量子邏輯的光學(xué)模擬」,其中一個(gè) N 量子比特的系統(tǒng)由一個(gè)光子的 2^N 個(gè)空間模式表示。目前相關(guān)的研究有用于實(shí)現(xiàn)各種算法的類似「量子計(jì)算的光學(xué)模擬」,包括(?。┱麛?shù)分解等,但仍未與機(jī)器學(xué)習(xí)關(guān)聯(lián)起來。

本研究可以被歸為量子不可擴(kuò)展(non-scalable)架構(gòu)上的機(jī)器學(xué)習(xí)方法范疇。或者,我們也可以將其視為一項(xiàng)最新研究 (Khoram et al. [2019]。) 的量子模擬。

研究者表示:「從概念上說,利用干涉來提高量子實(shí)驗(yàn)產(chǎn)生所需結(jié)果的可能性是量子計(jì)算領(lǐng)域的基本思想。」除了為量子和機(jī)器學(xué)習(xí)專家提供一個(gè)容易理解、上手的問題之外,這對(duì)于在更易訪問的環(huán)境中進(jìn)行測(cè)量過程的物理學(xué)教學(xué)(通常被稱為波函數(shù)的坍縮)也有一定意義。

遇事不決,量子力學(xué)

研究者說,這項(xiàng)工作旨在展示簡(jiǎn)單的量子力學(xué)技術(shù)如何能夠?yàn)榻鉀Q AI 問題提供新的思路。

在 MNIST 上,最經(jīng)典的計(jì)算可以實(shí)現(xiàn)的是檢測(cè)落在圖像像素之一上的光子,并根據(jù)光的強(qiáng)度分布猜測(cè)數(shù)字,光的強(qiáng)度的分布是通過將每個(gè)圖像的亮度重新縮放為單位和而獲得的。

該研究的量子力學(xué)方法采用分束器、移相器和其他光學(xué)元件來創(chuàng)建類似全息圖的推斷圖。光子所降落的推斷模式區(qū)域可作為信息提供給圖像分類,從而說明了不必同時(shí)用多個(gè)光子照射一個(gè)場(chǎng)景來產(chǎn)生干涉。

有人預(yù)測(cè),量子計(jì)算將大大推動(dòng)人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的發(fā)展。去年 3 月,IBM、麻省理工學(xué)院和牛津大學(xué)在《自然》雜志發(fā)表了一篇文章,稱隨著量子計(jì)算機(jī)變得越來越強(qiáng)大,它們將能夠執(zhí)行特征映射,也就是將數(shù)據(jù)分解為非冗余特征。如此一來,研究者將可以開發(fā)出更高效的 AI,比如去識(shí)別傳統(tǒng)計(jì)算機(jī)無法識(shí)別的數(shù)據(jù)模式。

在那篇《自然》雜志的文章中,作者們這樣寫道:「機(jī)器學(xué)習(xí)和量子計(jì)算是兩種技術(shù),每一種技術(shù)都有潛力改變彼此之前無法解決的難題。量子算法所提供的計(jì)算加速的核心要素是通過可控的糾纏和干涉來利用指數(shù)級(jí)的量子態(tài)空間?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6178

    瀏覽量

    105697
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4777

    瀏覽量

    100966
  • 量子計(jì)算
    +關(guān)注

    關(guān)注

    4

    文章

    1108

    瀏覽量

    34982
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    LSTM神經(jīng)網(wǎng)絡(luò)在語音識(shí)別中的應(yīng)用實(shí)例

    語音識(shí)別技術(shù)是人工智能領(lǐng)域的一個(gè)重要分支,它使計(jì)算機(jī)能夠理解和處理人類語言。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,特別是長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)的引入,語音識(shí)別的準(zhǔn)確性和效率得到了顯著提升。
    的頭像 發(fā)表于 11-13 10:03 ?700次閱讀

    【飛凌嵌入式OK3576-C開發(fā)板體驗(yàn)】RKNN神經(jīng)網(wǎng)絡(luò)-車牌識(shí)別

    LPRNet基于深層神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),通過輕量級(jí)的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)車牌識(shí)別。它采用端到端的訓(xùn)練方式,不依賴字符分割,能夠直接處理整張車牌圖像,并輸出最終的字符序列。這種設(shè)計(jì)提高了識(shí)別的實(shí)時(shí)
    發(fā)表于 10-10 16:40

    如何在FPGA上實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)作為其核心組成部分,已廣泛應(yīng)用于圖像識(shí)別、語音識(shí)別、自然語言處理等多個(gè)領(lǐng)域。然而,傳統(tǒng)基于CPU或GPU的神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-10 17:01 ?2169次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用

    人臉識(shí)別技術(shù)作為人工智能領(lǐng)域的一個(gè)重要分支,近年來取得了顯著的發(fā)展。其核心在于通過計(jì)算機(jī)對(duì)人臉圖像進(jìn)行特征提取和識(shí)別,從而實(shí)現(xiàn)自動(dòng)的人臉身份確認(rèn)。隨著深度學(xué)習(xí)技術(shù)的興起,特別是卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-08 10:48 ?818次閱讀

    人工神經(jīng)網(wǎng)絡(luò)模型的分類有哪些

    人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANNs)是一種模擬人腦神經(jīng)元網(wǎng)絡(luò)計(jì)算模型,它在許多領(lǐng)域,如圖像識(shí)別、語音識(shí)
    的頭像 發(fā)表于 07-05 09:13 ?1299次閱讀

    如何設(shè)計(jì)人臉識(shí)別神經(jīng)網(wǎng)絡(luò)

    人臉識(shí)別技術(shù)是一種基于人臉特征信息進(jìn)行身份識(shí)別的技術(shù),廣泛應(yīng)用于安全監(jiān)控、身份認(rèn)證、智能門禁等領(lǐng)域。神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)人臉識(shí)別的關(guān)鍵技術(shù)之一,本文將介紹如何設(shè)計(jì)人臉
    的頭像 發(fā)表于 07-04 09:20 ?700次閱讀

    反向傳播神經(jīng)網(wǎng)絡(luò)和bp神經(jīng)網(wǎng)絡(luò)的區(qū)別

    神經(jīng)網(wǎng)絡(luò)在許多領(lǐng)域都有廣泛的應(yīng)用,如語音識(shí)別、圖像識(shí)別、自然語言處理等。然而,BP神經(jīng)網(wǎng)絡(luò)也存在一些問題,如容易陷入局部最優(yōu)解、訓(xùn)練時(shí)間長(zhǎng)、對(duì)初始權(quán)重敏感等。為了解決這些問題,研究者們
    的頭像 發(fā)表于 07-03 11:00 ?845次閱讀

    bp神經(jīng)網(wǎng)絡(luò)是深度神經(jīng)網(wǎng)絡(luò)

    Network)有相似之處,但它們之間還是存在一些關(guān)鍵的區(qū)別。 一、引言 神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元結(jié)構(gòu)的計(jì)算模型,它由大量的神經(jīng)元(或稱為節(jié)點(diǎn))組成,這些
    的頭像 發(fā)表于 07-03 10:14 ?901次閱讀

    BP神經(jīng)網(wǎng)絡(luò)算法的基本流程包括

    BP神經(jīng)網(wǎng)絡(luò)算法,即反向傳播(Backpropagation)神經(jīng)網(wǎng)絡(luò)算法,是一種多層前饋神經(jīng)網(wǎng)絡(luò),通過反向傳播誤差來訓(xùn)練網(wǎng)絡(luò)權(quán)重。BP神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-03 09:52 ?551次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用

    卷積操作 卷積神經(jīng)網(wǎng)絡(luò)的核心是卷積操作。卷積操作是一種數(shù)學(xué)運(yùn)算,用于提取圖像中的局部特征。在圖像識(shí)別中,卷積操作通過滑動(dòng)窗口(或稱為濾波器、卷積核)在輸入圖像上進(jìn)行掃描,計(jì)算窗口內(nèi)像素值與濾波器的加權(quán)和,生成新的特征圖(Fea
    的頭像 發(fā)表于 07-02 14:28 ?1229次閱讀

    神經(jīng)網(wǎng)絡(luò)傳播和反向傳播區(qū)別

    神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)模型,廣泛應(yīng)用于各種領(lǐng)域,如圖像識(shí)別、語音識(shí)別、自然語言處理等。神經(jīng)網(wǎng)絡(luò)的核心是前傳播和反向傳播算法。本文將詳
    的頭像 發(fā)表于 07-02 14:18 ?884次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在語音識(shí)別中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,語音識(shí)別技術(shù)作為人機(jī)交互的重要橋梁,受到了廣泛的關(guān)注和研究。語音識(shí)別技術(shù)旨在將人類語音信號(hào)轉(zhuǎn)換為文本信息,實(shí)現(xiàn)自然語言理解和人機(jī)交互。在這一過程中,卷積神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-01 16:01 ?943次閱讀

    神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別領(lǐng)域的應(yīng)用日益廣泛。神經(jīng)網(wǎng)絡(luò)以其強(qiáng)大的特征提取和分類能力,為圖像識(shí)別帶來了革命性的進(jìn)步。本文將詳細(xì)介紹
    的頭像 發(fā)表于 07-01 14:19 ?738次閱讀

    基于毫米波雷達(dá)的手勢(shì)識(shí)別神經(jīng)網(wǎng)絡(luò)

    預(yù)處理后的信號(hào)輸入卷積神經(jīng)網(wǎng)絡(luò)時(shí)域卷積網(wǎng)絡(luò)(CNNTCN)模型,提取時(shí)空特征,并通過分類評(píng)估識(shí)別性能。實(shí)驗(yàn)結(jié)果表明,該方法在特定領(lǐng)域的識(shí)別中實(shí)現(xiàn)了98.2%的準(zhǔn)確率,并在不同的
    發(fā)表于 05-23 12:12

    基于深度神經(jīng)網(wǎng)絡(luò)的嬰兒哭聲識(shí)別算法

    神經(jīng)網(wǎng)絡(luò)的更好的初始化權(quán)重方面是流行的。通常,RBN與另一個(gè)深度神經(jīng)網(wǎng)絡(luò)一起使用來形成深度信念網(wǎng)絡(luò)(DBN),并且這一方的研究正朝著卷積RBN變體的方向發(fā)展。同時(shí),由于反向傳播和主
    發(fā)表于 05-20 19:20