用神經(jīng)網(wǎng)絡(luò)做 MNIST 手寫數(shù)字識(shí)別是機(jī)器學(xué)習(xí)小白用來練手的入門項(xiàng)目,業(yè)內(nèi)最佳準(zhǔn)確率已經(jīng)達(dá)到了 99.84%。但最近,谷歌向這個(gè)「古老」的數(shù)據(jù)集發(fā)起了一項(xiàng)新的挑戰(zhàn):用量子計(jì)算來進(jìn)行識(shí)別,看看準(zhǔn)確率能達(dá)到多少。
MNIST 對(duì)于機(jī)器學(xué)習(xí)研究者來說再熟悉不過了,它是一個(gè)由 Yann Lecun 等人創(chuàng)建的手寫數(shù)字圖像數(shù)據(jù)集,包含訓(xùn)練集和測(cè)試集,訓(xùn)練集包含 60000 個(gè)樣本,測(cè)試集包含 10000 個(gè)樣本(在 2019 年又增加了 50000 個(gè)測(cè)試集樣本)。
在機(jī)器學(xué)習(xí)研究中,MNIST 手寫數(shù)字圖像數(shù)據(jù)集已經(jīng)作為基準(zhǔn)使用了二十余年,它可以說是所有機(jī)器學(xué)習(xí)研究者的入門必備。對(duì)于新興方法的研究來說,從 MNIST 開始也是最合理的選擇,2017 年 Geoffrey Hinton 提出的膠囊網(wǎng)絡(luò)(Capsule Networks)也是這樣做的。
目前,大部分深度學(xué)習(xí)模型在 MNIST 上的分類精度都超過了 95%。有時(shí)為了更直觀地觀察算法之間的差異,我們會(huì)使用圖像內(nèi)容更加復(fù)雜的 Fashion-MNIST 數(shù)據(jù)集。
在準(zhǔn)確率已經(jīng)如此之高的情況下,用神經(jīng)網(wǎng)絡(luò)向此數(shù)據(jù)集發(fā)起挑戰(zhàn)已經(jīng)沒有多大意義。于是,谷歌索性換了一個(gè)思路:用量子計(jì)算技術(shù)來挑戰(zhàn)一下,看看分類準(zhǔn)確率能達(dá)到多少。
實(shí)驗(yàn)結(jié)果表明,用量子計(jì)算技術(shù)可以在 MNIST 數(shù)據(jù)集上至少實(shí)現(xiàn) 41.27% 的分類準(zhǔn)確率,而之前的經(jīng)典方法只能達(dá)到 21.27%。
為什么要這么做?
在現(xiàn)代科技中,量子力學(xué)和機(jī)器學(xué)習(xí)都發(fā)揮著重要作用,量子計(jì)算的 AI 應(yīng)用這一新興領(lǐng)域很有可能幫助許多學(xué)科實(shí)現(xiàn)重大突破。然而,目前大多數(shù)機(jī)器學(xué)習(xí)從業(yè)者對(duì)量子力學(xué)還沒有透徹的了解,多數(shù)量子物理學(xué)家對(duì)機(jī)器學(xué)習(xí)的理解也非常有限。因此,找到一些二者都能理解的問題非常重要,這些問題既要包含簡(jiǎn)單且被廣泛理解的機(jī)器學(xué)習(xí)思想,也要包含類似的量子力學(xué)思想。
基于以上考量,谷歌的研究者提出用簡(jiǎn)單的量子力學(xué)知識(shí)解決一種簡(jiǎn)單的機(jī)器學(xué)習(xí)問題——MNIST 手寫數(shù)字分類。這有點(diǎn)類似于谷歌的 TensorFlow Playground。TensorFlow Playground 本質(zhì)上就是一種教學(xué)輔助,目的是向大眾闡明深度學(xué)習(xí)的關(guān)鍵概念。
研究細(xì)節(jié)
具體來說,研究者想要探究的是:在一個(gè)普通的圖像分類問題中,如果你必須在通過一個(gè) filter(可以顯示來自測(cè)試集的示例圖像)的第一個(gè)光量子(光子)之后做出決定,最高準(zhǔn)確率能達(dá)到多少?在 MNIST 手寫數(shù)字?jǐn)?shù)據(jù)集上(28×28 像素),最佳經(jīng)典方法是檢測(cè)落在其中某個(gè)像素上的光子,然后使用在訓(xùn)練集上觀察到的 per-pixel 概率(即光強(qiáng)度)分布來選擇最有可能的數(shù)字類別。這需要將每個(gè)示例圖像的亮度縮放到一個(gè)單位和(unit sum),以獲得一個(gè)概率分布。在 MNIST 數(shù)據(jù)集上,上述經(jīng)典方法可以實(shí)現(xiàn) 21.27% 的分類準(zhǔn)確率,大大高于隨機(jī)結(jié)果(10%)。每個(gè)像素最有可能的數(shù)字類別如下圖 2(b)所示。
如果可以將學(xué)習(xí)到的轉(zhuǎn)換應(yīng)用到圖像和檢測(cè)器之間的光子的量子態(tài),我們就能利用量子力學(xué)實(shí)現(xiàn)更高的準(zhǔn)確率。分束器和移相器等無源線性光學(xué)器件(passive linear optical element)可以用來解決這一問題,它們可以產(chǎn)生一種全息圖式的干涉圖樣。接下來,根據(jù)第一個(gè)光子落在哪一個(gè)區(qū)域來進(jìn)行最大似然估計(jì)。這說明了一種量子原理:?jiǎn)蝹€(gè)量子的概率振幅與自身發(fā)生干涉。此處沒有必要同時(shí)用許多光子照亮一個(gè)場(chǎng)景來產(chǎn)生干涉。
從概念上講,利用干涉來增強(qiáng)量子實(shí)驗(yàn)產(chǎn)生所需結(jié)果的可能性是所有量子計(jì)算的基本思想。這個(gè)問題與現(xiàn)代量子計(jì)算之間的主要區(qū)別在于,后者試圖通過控制多個(gè)「糾纏」成分的量子態(tài)來執(zhí)行計(jì)算,這些「糾纏」成分通常是耦合了兩種狀態(tài)的量子系統(tǒng)(被稱作「量子比特」),通過由整個(gè)量子系統(tǒng)量子態(tài)的一部分所控制的「量子門」來實(shí)現(xiàn)。
因此,構(gòu)建有多個(gè)量子比特的量子計(jì)算機(jī)需要精細(xì)地控制量子比特之間的相互作用。這通常需要將溫度降至 0.1 開爾文(-273.05℃)來消除熱噪聲。
但是,在本文研究的這個(gè)問題中,量子態(tài)之間的轉(zhuǎn)換可以在室溫下使用常規(guī)光學(xué)器件來完成:綠色光子的能量為 2.5 eV(電子伏特),遠(yuǎn)高于典型的室溫?zé)彷椛淠芰?kT ‘ 25 meV。但制造一種允許多個(gè)光子像在多比特量子計(jì)算機(jī)中一樣交互的設(shè)備就非常具有挑戰(zhàn)性了。
盡管如此,Knill、Laflamme 和 Milburn 等人在 2001 年設(shè)計(jì)了一種協(xié)議,使其在理論上可行。他們通過巧妙地利用輔助光子量子比特(ancillary photon qubit)、玻色統(tǒng)計(jì)和測(cè)量過程避免了使用保留相干性的非線性光學(xué)器件(可能無法通過實(shí)驗(yàn)實(shí)現(xiàn))。在所有此類應(yīng)用中,基本思想都是采用相干多光子量子態(tài)進(jìn)行多個(gè)量子比特的計(jì)算。
在這個(gè)問題中,研究者只用了一個(gè)光子,唯一要處理的相關(guān)信息被編碼在其波函數(shù)的空間部分(即偏振無關(guān))。因此,當(dāng)前的工作類似于由 Cerf 等人在 1998 年提出的「量子邏輯的光學(xué)模擬」,其中一個(gè) N 量子比特的系統(tǒng)由一個(gè)光子的 2^N 個(gè)空間模式表示。目前相關(guān)的研究有用于實(shí)現(xiàn)各種算法的類似「量子計(jì)算的光學(xué)模擬」,包括(?。┱麛?shù)分解等,但仍未與機(jī)器學(xué)習(xí)關(guān)聯(lián)起來。
本研究可以被歸為量子不可擴(kuò)展(non-scalable)架構(gòu)上的機(jī)器學(xué)習(xí)方法范疇。或者,我們也可以將其視為一項(xiàng)最新研究 (Khoram et al. [2019]。) 的量子模擬。
研究者表示:「從概念上說,利用干涉來提高量子實(shí)驗(yàn)產(chǎn)生所需結(jié)果的可能性是量子計(jì)算領(lǐng)域的基本思想。」除了為量子和機(jī)器學(xué)習(xí)專家提供一個(gè)容易理解、上手的問題之外,這對(duì)于在更易訪問的環(huán)境中進(jìn)行測(cè)量過程的物理學(xué)教學(xué)(通常被稱為波函數(shù)的坍縮)也有一定意義。
遇事不決,量子力學(xué)
研究者說,這項(xiàng)工作旨在展示簡(jiǎn)單的量子力學(xué)技術(shù)如何能夠?yàn)榻鉀Q AI 問題提供新的思路。
在 MNIST 上,最經(jīng)典的計(jì)算可以實(shí)現(xiàn)的是檢測(cè)落在圖像像素之一上的光子,并根據(jù)光的強(qiáng)度分布猜測(cè)數(shù)字,光的強(qiáng)度的分布是通過將每個(gè)圖像的亮度重新縮放為單位和而獲得的。
該研究的量子力學(xué)方法采用分束器、移相器和其他光學(xué)元件來創(chuàng)建類似全息圖的推斷圖。光子所降落的推斷模式區(qū)域可作為信息提供給圖像分類,從而說明了不必同時(shí)用多個(gè)光子照射一個(gè)場(chǎng)景來產(chǎn)生干涉。
有人預(yù)測(cè),量子計(jì)算將大大推動(dòng)人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的發(fā)展。去年 3 月,IBM、麻省理工學(xué)院和牛津大學(xué)在《自然》雜志發(fā)表了一篇文章,稱隨著量子計(jì)算機(jī)變得越來越強(qiáng)大,它們將能夠執(zhí)行特征映射,也就是將數(shù)據(jù)分解為非冗余特征。如此一來,研究者將可以開發(fā)出更高效的 AI,比如去識(shí)別傳統(tǒng)計(jì)算機(jī)無法識(shí)別的數(shù)據(jù)模式。
在那篇《自然》雜志的文章中,作者們這樣寫道:「機(jī)器學(xué)習(xí)和量子計(jì)算是兩種技術(shù),每一種技術(shù)都有潛力改變彼此之前無法解決的難題。量子算法所提供的計(jì)算加速的核心要素是通過可控的糾纏和干涉來利用指數(shù)級(jí)的量子態(tài)空間?!?/p>
-
谷歌
+關(guān)注
關(guān)注
27文章
6178瀏覽量
105697 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4777瀏覽量
100966 -
量子計(jì)算
+關(guān)注
關(guān)注
4文章
1108瀏覽量
34982
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論