怎樣才能讓人工智能度過“人工智障”的尷尬期

　　人工智能（AI）很熱，但很多時候我們覺得人工智能還不夠“智能”，比如說蘋果手機，一家公司的創(chuàng)始人楊靜前一段時間就把Siri卸載了，因為它不夠智能，有時候還會添亂，一按它就跳出來，使得人工智能似乎變成了“人工智障”，感覺還不如不出現的好。

　　這就說明在人工智能技術的研發(fā)及應用方面遇到了一些技術挑戰(zhàn)，很多專家都在自己深耕的領域對AI技術進行著自己的探索，很多探索是很超前的，那么，我們怎樣才能跨越這樣的艱難險阻，達到AI的一種新境界呢？

　　怎才能讓人工智能度過“人工智障”的尷尬期

　　火爆下的隱憂

　　AI這么火，一切的根源在于數據，龐大的數據洪流。我們身處在智能萬物互聯的時代，一切東西都聯在網上，而且越來越智能，都在收集數據、分析數據。所以人工智能這個技術的關鍵性就在于怎么更好的把收集的數據挖掘、分析，然后利用起來，實現增值，從而帶來增值的業(yè)務，這是大家如此關注人工智能的一個重要原因。

　　目前，人工智能還處在發(fā)展的初期。隨著計算機時代的發(fā)展變得愈加成熟，很多技術的部署變得非常困難，因為很多技術都是在整個人工智能的框架之下的，但是在整個AI相關的領域當中，只有7%的應用才是符合AI的具體要求的。為了更好地實現人工智能，需要非常強大的計算能力才能夠處理如此大型的數據。預計到2020年，用于人工智能的計算循環(huán)將會增長12倍之多。

　　英特爾的執(zhí)著

　　大概在一年之前，英特爾收購了人工智能公司Saffron Technology。Saffron是AI領域平臺服務的佼佼者，他們特別關注在基于技術的邏輯和推理的處理能力，非常關注數據的分析，同時也希望能夠加入大家對于數據的理解，比如說對于欺詐的分析及其在銀行業(yè)當中的具體應用，很多成功的案例都是在Saffron Technology的推動下得以完成的。近期，該行業(yè)巨頭又收購了Nervana Systems。

　　對于這次并購，英特爾公司副總裁，數據中心事業(yè)部數據中心解決方案部門總經理Jason Waxman表示，在這次Nervana Systems的收購中最激動人心的一點是，我們認為這家公司是符合我們的戰(zhàn)略思路的，尤其在解決方案的初期一直到整個軟件基礎設施的構架，同時可以增加我們的數據庫，并助力我們半導體的優(yōu)化。因此，我們通過這么大量的IP的收購，最后將整個產品組合買下。這個收購結束完之后，我覺得在前90天我們就已經把這種非常好的技術進行了破壁式的發(fā)展，我想這也是增加了英特爾的處理和戰(zhàn)略的能力。

　　與此同時，英特爾還并購了Movidius，這項收購案尚未完全完成，但是完成之后這項收購對于推動智能設備的發(fā)展將會非常關鍵。Movidius在嵌入式計算機領域是非常關鍵的，英特爾將會在智能照相機和圖象識別，以及物聯網領域都使用Movidius技術。因此將會持續(xù)擴大其在這個領域的投資。

　　Jason Waxman表示，構建基于英特爾架構的涵蓋至強處理器、至強融核處理器、Nervana平臺和FPGA、Omni-Path網絡、3DXPoint存儲等技術的硬件平臺，結合英特爾針對深度學習/機器學習而優(yōu)化的英特爾數學函數庫（Intel.MKL）、數據分析加速庫Intel.DAAL）等，和致力于為多節(jié)點架構提供卓越性能的開源軟件框架，如Spark、Caffe、Theano以及Neon等，及可推動前后端協同人工智能發(fā)展布局的Saffron、TAP、Nervana系統(tǒng)、Movidius等工具和平臺，以上這些產品組合可幫助企業(yè)更方便地獲取、開發(fā)和部署人工智能應用，將人工智能潛能在各個領域充分釋放，如智能工廠、無人駕駛汽車、體育、欺詐檢測、生命科學等。

　　技術的創(chuàng)新機遇

　　現在技術的發(fā)展日新月異，我們看到大量的創(chuàng)新和新的改革。有些技術其實已經存在有幾年了，現在正是開拓新市場機遇的時機。

　　機器學習

　　機器學習有不同的理念和觀點，通常就是指從數據當中學習的方法，它能夠構建這些數據，并且通過數據改進自己的性能，包括如何從數據當中進行系統(tǒng)化和架構的學習，這是非常寬泛的一個定義，并且這個概念在學術界已經存在很久了。直到最近，生活和工作當中能夠產生更多的數據，因此就推動了機器學習的需要。

　　機器學習有三種不同類型，Nervana Systems公司的前CEO、人工智能專家Naveen Rao表示，對此，我不能說只有這三種類型，但是這可以讓大家稍微了解一下機器學習的世界。我們在最近的許多新聞當中可以看到一個叫做監(jiān)督學習的概念。比如說我有一些圖片、標識，這個標識是貼在我的數據上的，例如一個人的面部識別，這個數據的標識就代表他的名字，這個名字可以聯到計算機當中，計算機就能夠學習，或者將這種輸入的數據，將它的名字和圖片連在一起。非監(jiān)督學習則處于我們的技術前沿，很難去真正找到具有潛在的、可使用的一種數據架構，而且前提是你一開始還不了解這個架構的詳情。

　　如果你想學一種語言，你先要聽它，了解它的發(fā)音，了解語音語調，至少要形成一個語言的框架之后才能開始真正學習這個語言。事實上，我們很難賦予機器學習這項能力，但是我們還在不斷推動這方面的研究。

　　接下來講一下強化學習。就像培訓你自己家的寵物一樣，你希望它有一個正面、你想要的反映，如果它給了負面的、你不想要的反映，你就要懲罰它，這就是強化學習的概念。我想真正的AI不僅僅是這三種類型。而事實上，讓我們的生活、我們的世界更加好也就是機器學習和人工智能的最終目標。

　　舉一個例子，是非常傳統(tǒng)經典的機器學習。這里可以給大家看一些圖片。大家可以看到這是我們其中的一個創(chuàng)始人，我們如何教會機器能夠識別人的面孔，也就是說，讓機器將名字和面孔連接在一起。按照傳統(tǒng)方法來說，我要看一下他面部的特點，也就是眼睛和眉毛的寬度和鼻子的長度，這些都是非常重要的辨識特點，通過軟件進行辨識，把它變成一種圖像的關鍵點，我們把它叫做面部識別特點的函數。

　　最后我們通過不同的分類器，和一些集成的方法，最終能夠辨別出他的名字。我想人類或者是動物能夠更好的辨別這個面孔，但是機器需要很多的學習，因為它們沒有辦法直接提取出這些特點。傳統(tǒng)的經典機器學習就是以這種方式進行面部識別的。

　　機器能力向人類看齊

　　未來，要想讓機器具備像人一樣的能力，這個能力體現哪幾方面呢？英特爾中國研究院院長宋繼強先生將其概括為四大能力：首先是感知外界環(huán)境的能力；二是根據感知來的能力進行推理；三是推理形成一些決策觸動機器做反饋，這個反饋可以是動的，也可以是不動的，比如說視覺的反饋、聲音的反饋；最后一個更重要的是能適應環(huán)境，要能根據環(huán)境的變化，交互的人的變化去相應的做適應，這個非常重要，要不然就會變成一個死的程序。

　　這里面有一條橫線很重要，“記憶”，記憶是一個非常突出的重點。Jeff Hawkins，就是Numenta的創(chuàng)始人，他寫了一本書叫《人工智能的未來》，就是專門講人工智能或者說智能怎么去看待他，其實就表現在能夠利用記憶去進行預測，如果能做到這一點，這個機器就真的有智能了。所以記憶這個能力非常重要，我們現在看到很多做人工智能的廠商也都把這個加入到系統(tǒng)方案里面。

　　深度學習

　　深度學習的好處是深層的，這樣可以在很多不同的抽象層提取特征，而這個特征不是人去定義的，以前很多做人工智能和機器學習的人是去找Future，所以有Futureengineer的工作，但現在可以不需要了，它可以讓特征是自己從數據中發(fā)現，并且通過越來越多的數據提升系統(tǒng)的性能，而不是靠一兩個Futureengineer。

　　同時，深度學習也越來越具備強大的表示能力，從原來只能表示靜態(tài)的圖像和簡單的語句，到現在有能力去表示連續(xù)的圖像，也就是視頻，甚至加上多模態(tài)這種方式。深度學習是一種突破性的技術，它的突破表現在在數據足夠大的情況下，已經可以在某些層面超過人的能力，比如說在做人臉識別方面，在ImageNet上面已經超過了人的能力。在語音方面，語音識別、機器翻譯也都達到了讓人滿意的水平。所以，隨著計算量和數據量的增加，深度學習方面已經看到了巨大的突破。

　　我們期望性能隨著數據增多而提升，同樣數據多了訓練時間也變長，當訓練時間變長，一種情況下可以通過增加處理器的數量去擴展它的性能，讓它仍然保持在一兩天內可以把這個模型訓練出來，如果處理器數量達到了一定程度，這個時候它的瓶頸不再是計算能力了，而變成了I/O能力，就是處理器和處理器之間通訊，或者是處理器訪問內存的I/O變成了瓶頸，這個時候你再增加處理器的數量也看不到性能的增長，還是要那么多時間才能訓練出來。Nervana技術就可以更高效的去定義內存的訪問帶寬和計算的密度，讓它很好的去匹配現在的數據量增大的需求。同時可以讓多個節(jié)點并行支持這種大模型的訓練，所以我們可以看到近乎一種線性的性能擴展。

　　下圖是一個基于張量運算的架構，張量運算是一個多于二維塊狀的運算，矩陣運算都屬于張量運算。里面這些綠色的部分都是專門針對矩陣運算的處理單元。同時我們還用了一種叫Flexpoint技術，這個技術既不是定點的，也不是雙精度浮點的，它其實是基于這兩者之間可以變化的技術，所以在這個里面它可以提供前所未有的并行化的水平，計算密度非常高，是目前最好的一種硬件加速水平的10倍。

　　同時，由于計算單元是專門針對張量運算所設計的，所以它的功耗非常低。同時我們看到旁邊有黃色的4塊，這個是高帶寬內存，專門通過專用的內存訪問接口連接到主芯片上，中間灰色大區(qū)域可以把它看作是一個芯片。這些內存是直接由軟件管理的，所以整個計算里面不會存在Cache，不會存在不可預測的Cachemiss，完全由程序去控制去哪里讀數據，什么時候數據好了，我放回去。

　　你會想到這一個芯片可能處理不了所有的深度學習訓練任務，那我用多個芯片。多個芯片之間的互聯就是靠RCL，我們專門定制了一種Interchip Link，它的速度比傳統(tǒng)的PCIE要快20倍，而且是雙向的數據帶寬通道，有這樣技術以后，我可以把一個芯片最多可以跟12個芯片連在一起，這樣可以組成一個很大的超網格做訓練。

　　軟件/算法對AI發(fā)展的重要性

　　同時，有了硬件之后，我們不能放松對軟件AI算法的研究，因為硬件提供了一個基礎，如果你用設計得很差的算法去運行，實際上也是浪費它的資源。所以在英特爾研究院以及軟件部門也在一起進行AI算法的各種研究，其中包括這4大類，第一大類是怎樣讓訓練做得更快，讓它需要更少的數據和人的監(jiān)督。因為現在做訓練通常還需要大量的數據，需要label好的數據，但是我們很多非人工智能領域的人就問了，小孩子去識別哪需要這么多圖片，給兩三張圖片看看就懂了，也不需要那么長時間，所以這里面應該還有更多的技術點可以去鉆研。怎么樣去增強現在的深度神經網絡，因為這只是其中一個工具，未必是最終的工具。

　　深度神經網絡+X，加什么呢？另外再加上一些記憶，或許這里面就有更好的適合于去學習產生知識并且進行推理的模型能夠出來。另外，我們知道大的模型訓練出來以后是很稀疏的，它里面很多參數是0，對于這些0傳輸它或者存儲它甚至做運算都是毫無價值的，所以我們就要想辦法讓模型更稀疏，讓它存儲起來更壓縮，同時我們可以在模型里面做裁剪，裁剪的時候一些0的地方就不運算了，所以運算量也會減少。

　　另外一個維度是計算的精度下降，這也是目前很熱的一個研究點，原來我們用16位去計算，現在我們看看用8位、4位、2位甚至到1位，是否也能夠完成這個模型的運算，同時我來保證性能、準確度不會下降太多，這也是目前我們在研究的一個重點。同時還看怎么樣能夠讓它去擴展，采用更大的Bach Size和High-order方法去做深度學習的訓練。

　　AI何時飛入尋常百姓家

　　今年，從AlphaGo開始，AI就成為社會焦點議題了，現在AI雖然炒得很熱，但是它的應用仍局限在一些比較窄的專業(yè)領域，比如圖象識別、語音識別，或者是無人駕駛、智能駕駛，神經語言學等，那么，AI在大眾生活方面有沒有相關的應用呢？

　　處在嬰兒期的深度學習應用

　　對于AI在百姓生活中的應用情況，英特爾數據中心事業(yè)部首席工程師兼人工智能解決方案架構師張彤表示，現在深度學習的應用還處在嬰兒階段，我們預計在未來幾年時間里面，在各個領域會有更深入、更廣泛的應用。目前英特爾主要是在圖像、語音或者自然語言處理等，特別是跟我們的云的提供商（Cloud Provider）它們之間的合作比較多。

　　下一步我們會更多的深入到行業(yè)應用當中去，比如說醫(yī)療領域的應用，這個跟我們大家的生活是息息相關的，比如醫(yī)學影像的識別，現在很多時候機器判斷癌癥，我就看到國內有的教授在這方面研究做得非常好，就是用機器學習來判斷癌癥，比一般的醫(yī)生判斷得都要準確。

　　商湯科技讓AI落地

　　商湯科技主要做人工智能落地的產品，比如說直播領域，對此，該公司異構并行計算部門工程總監(jiān)劉文志表示，女主播是否漂亮是非常重要的，商湯的人臉識別技術可以精準美化女主播的顏值，這是實際中已經在大范圍使用的，當然也借了今年直播的風口。

　　另外，我們在一些人臉閘機，用于通關，如果我們自己掏出身份證或者其他設備，相對來說是比較復雜的，如果靠著我們自己的一張臉就可以暢通無阻的話，包括在某種情況下自己的家門都不用帶鑰匙了。還有一些和圖像相關的，當然商湯科技也能提供很好的解決方案。比如說Pikazo。

　　京東的AI謀略

　　京東集團AI/VR/AR實驗室人工智能方向研發(fā)總監(jiān)陳宇表示，作為一個技術的研發(fā)從業(yè)者，我感覺這個事情分兩層看，首先從感知角度，感知本身就是人工智能領域的一個非常重要的方向，比如說視覺、聽覺，我們對事物的分析，也就是說圖象識別、語音識別，我們京東都有在落地。

　　舉個例子，我們的圖象識別不只是大家看到的一些人臉識別或者文字識別，或者是圖像的一些簡單識別，我們甚至可以幫助我們的倉儲系統(tǒng)進行貨品的審核和分揀，這些東西都是具體落地場景。同時除了感知之外，我們京東也有很多其他的應用，舉一個例子，京東有吉米機器人，它可以替代人工進行Q&A的服務，可以節(jié)省大量的人工，這些不只是感知，同時也是做了智能信息的處理，這些都是人工智能在京東實際的落地場景，也是大家能夠直接體會到的東西。

　　來自中科院的聲音

　　中國科學院計算技術研究所研究員，博士生導師，計算機體系結構國家重點實驗室副主任馮曉兵博士表示，因為我是做研究的，所以在具體的應用上，我只能說一些別人的例子，像我們現在用的智能手機，手寫體識別、語音的輸入，這后面都是有人工智能的支持，包括像京東也好，國內很多電商網站，商品推薦，其背后多少都是有人工智能的幫忙，讓它做得更精準。包括有些旅游、簡單的問答系統(tǒng)、客服等等，我相信后面都是有人工智能支持的。

　　但是我想，未來可能我們在新的制造業(yè)、工業(yè)的升級上面應該也會有它的作用。

　　馮曉兵表示，我覺得人工智能繼續(xù)發(fā)展會有兩大趨勢，第一是怎么讓更多的應用，從人工智能本身的理論、方法，能處理更多的應用，現在主要是基于學習的方法比較成功，除了學習方法之外，我們還有沒有別的可以讓它往前走的，但這個可能跟我們關系不大。我們可能跟英特爾比較類似，因為計算所都是做系統(tǒng)的，所以說第二個大方面的問題是我們怎么做一個更合理的系統(tǒng)，使得已經有的人工智能的應用，讓它在一個可接受的代價的前提下得到更廣泛的應用，

　　像芯片、系統(tǒng)軟件，包括編程框架的支持，像這些方面可能都面臨很多挑戰(zhàn)。不管是計算所在做的，還是企業(yè)界提到的，都是在嘗試怎么做一個更好的系統(tǒng)，使得我們可以用更小的功耗、更低的程序開發(fā)代價，獲得更好的性能，可以做更大的數據規(guī)模的處理。另一方面，因為有很多不同的種類，我們有沒有一些基礎的技術，使得一些系統(tǒng)可以在不同的應用種類上面獲得更好的適應性，而不需要太多的程序員或者系統(tǒng)工程師深度的介入，這將來都會面臨很大的挑戰(zhàn)。

　　對未來的期待

　　2020年快來了，人工智能在哪個領域會出現更新的、更引人注目的突破呢？

　　對此，馮曉兵表示，我最希望的一點還是在醫(yī)療方面，因為醫(yī)療確實有很多新聞事件，對于每一個家庭來說都是非常重要的事情，通過人工智能，能夠作為醫(yī)療的輔助和管理系統(tǒng)，可能沒辦法完全替代醫(yī)生，但是我們可以通過人工智能的輔助，使得我們平均的醫(yī)生水準，以及每個人受到的醫(yī)療服務的水準得到比較好的改善，能夠讓大家更安心的、花更少的錢得到更好的服務，這是我的期望。

閱讀全文