今天上午,英特爾在北京舉辦了釋放IA,原力擁抱AI時代的年度論壇,英特爾全球副總裁兼中國區(qū)總裁楊旭;英特爾數(shù)據(jù)中心事業(yè)部副總裁、數(shù)據(jù)中心解決方案部總經(jīng)理Jason Waxman;英特爾數(shù)據(jù)中心事業(yè)部副總裁,人工智能解決方案部總經(jīng)理Naveen Rao;英特爾公司軟件與服務(wù)事業(yè)部副總裁、開發(fā)者及產(chǎn)品部總經(jīng)理William(Bill) Savage;英特爾中國研究院院長宋繼強(qiáng)分別做了《AI在中國》;《英特爾,讓人工智能加速未來變革》;《人工智能的“芯“突破》;《加速人工智能普及和應(yīng)用》;《技術(shù)深究-英特爾架構(gòu)和人工智能》的主題演講。
人工智能解決方案部總經(jīng)理Naveen Rao先生主題演講的精華(其它主題演講精華將在后續(xù)專訪文中詳細(xì)呈現(xiàn)),來和廣大開發(fā)者一起探討人工智能面對的技術(shù)挑戰(zhàn)和應(yīng)對之道,并希望攜手大家一起一起抓住人工智能時代的巨大機(jī)遇。
大家早上好,非常高興大家能夠出席今天的AI Day,很抱歉我并不懂中文,但是希望大家能夠仔細(xì)的聽。我的名字叫做Naveen Rao,我是英特爾公司數(shù)據(jù)中心事業(yè)部副總裁,同時也是Nervana系統(tǒng)的前CEO,也就是由英特爾所并購的這家公司,剛才我的同事Jason Waxman也提到。我們所做的事情可以增加英特爾半導(dǎo)體的技術(shù)能力,也正處在開發(fā)這個市場的前沿,這是非常關(guān)鍵的,我們希望通過技術(shù)改變?nèi)澜纭?/p>
在整個行業(yè)當(dāng)中這是非常激動人心的時代,因為現(xiàn)在技術(shù)的發(fā)展日新月異,我們看到大量新的創(chuàng)新和新的改革。我認(rèn)為有一些技術(shù)已經(jīng)存在有幾年了,現(xiàn)在已經(jīng)開始開拓新的市場機(jī)遇,有新的產(chǎn)品和解決方案的出現(xiàn)。
首先讓大家了解一下什么是機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)有不同的理念和觀點,也就是指從數(shù)據(jù)當(dāng)中學(xué)習(xí)的方法,它能夠構(gòu)建這些數(shù)據(jù),通過數(shù)據(jù)改進(jìn)自己的性能,這是非常寬泛的一個定義,當(dāng)然這個概念存在已經(jīng)有很久了,在學(xué)術(shù)界當(dāng)中,包括如何從數(shù)據(jù)當(dāng)中進(jìn)行系統(tǒng)化和架構(gòu)的學(xué)習(xí)等。
直到最近,我們知道更多的數(shù)據(jù)被生活和工作當(dāng)中產(chǎn)生,因此就推動了機(jī)器學(xué)習(xí)的需要。這里先跟大家分享一下機(jī)器學(xué)習(xí)的三種不同類型,我不能說只有這三種類型,但是讓大家稍微了解一下機(jī)器學(xué)習(xí)的世界。
我們最近經(jīng)常聽到一個的詞語叫做監(jiān)督學(xué)習(xí),比如說我有一些圖片、標(biāo)識,這個標(biāo)識是貼在我的數(shù)據(jù)上的,比如說一個人的面部識別,這個數(shù)據(jù)的標(biāo)識就代表他的名字,這個名字可以聯(lián)到計算機(jī)當(dāng)中,計算機(jī)就可以學(xué)習(xí),或者將這種輸入的數(shù)據(jù),將他的名字和圖片連在一起。
另一個詞語是非監(jiān)督學(xué)習(xí)。通常我們需要用到它的場景,是在很難真正找到具有潛在的、可使用的數(shù)據(jù)架構(gòu),而且前提是你一開始還不了解這個架構(gòu)的詳情。如果說你想學(xué)一個語言,你先要聽它,被動的學(xué)習(xí)它這樣的語言,了解它的發(fā)音,了解它的語音語調(diào),至少要形成一個語言的框架之后才能開始真正學(xué)習(xí)這個語言。雖然目前這還是機(jī)器學(xué)習(xí)的一個難點,但我們正在不斷推動這方面的研究。
非監(jiān)督學(xué)習(xí)講完了之后,開始給大家講一下強(qiáng)化學(xué)習(xí)。比如說就像培訓(xùn)你自己家的寵物一樣,你是希望它有一個正面的反映,你想要的反映,負(fù)面的反映,如果你不想要的反映你就懲罰它,就像你訓(xùn)練你家的狗或者貓一樣,這是強(qiáng)化學(xué)習(xí)的概念。
當(dāng)然真正的AI不僅僅是這三種類型,不過當(dāng)下,我們花了大量時間在不斷靠近這三個領(lǐng)域?,F(xiàn)在讓我們的生活、我們的世界更加好也就是機(jī)器學(xué)習(xí)和人工智能的最終目標(biāo)。
下面給大家舉一個例子——非常傳統(tǒng)經(jīng)典的機(jī)器學(xué)習(xí),我們在過去所學(xué)習(xí)到的,我們有一定的圖片。大家可以看到這是我們其中的一個創(chuàng)始人,我們?nèi)绾谓虝C(jī)器能夠識別人的面孔,也就是說將名字和面孔連接在一起。按照傳統(tǒng)方法來說,我要看一下他面部的特點,眼睛和眉毛的寬度和鼻子的長度,這些都是非常關(guān)鍵的辨識特點,通過軟件辨識,作為圖像的關(guān)鍵點,作為面部特點的函數(shù)。最后我們通過不同的分類器,不同的隨機(jī)森林和集成方法,最終能夠辨別出他的名字。我想人類或者是動物能夠更好的辨別這個面孔,但是機(jī)器需要很多的學(xué)習(xí)過程,因為它們沒有辦法直接提取出這些特點。傳統(tǒng)的機(jī)器學(xué)習(xí)就是以這種方式進(jìn)行面部識別的。
我們看一下深度學(xué)習(xí),在過去幾年當(dāng)中有非常多的研究方面的突破,也就是說在數(shù)據(jù)層面提取出特征來進(jìn)行學(xué)習(xí)。我們首先要了解特征是什么,這是我們數(shù)據(jù)的輸出,這是數(shù)據(jù)的輸入,告訴我在這個過程當(dāng)中你提取出來的特征是什么。通過大量的計算能力,這也是為什么在過去花的時間,通過大量數(shù)據(jù)的學(xué)習(xí)可能要花幾個月、幾年的時間,因為之前這個計算的能力是非常受限的。
現(xiàn)在系統(tǒng)的發(fā)展更加先進(jìn),我們把它叫做端對端的深度學(xué)習(xí),它有超過6000萬個參數(shù),這6000萬個參數(shù)就代表著有6000萬個不同的培訓(xùn)點,同時這個數(shù)據(jù),可以看到它有自己的一些范式,我們可以將這個問題變得簡單化。但是在這邊我們需要注意的一點,這一點非常重要,我們應(yīng)該有非常好的數(shù)據(jù),非常好的標(biāo)記,與此同時能夠?qū)ξ覀冚斎氲?a target="_blank">信息作出正確的定義。
所以在過去幾年間,信息界發(fā)生的一個很大的變化是機(jī)器學(xué)習(xí)正在處理之前人工處理的一些內(nèi)容,比如說之前有一些自然的圖像,我們有1000多個類別,當(dāng)時的想法是,把這些圖像按類別進(jìn)行分類,看起來非常簡單,不知道在座各位有沒有做過這樣一些工作,這些工作正確率在80%左右,正確率不是特別差,如果看計算機(jī)進(jìn)行分類的話,錯誤率也沒有低很多,如果我們對所有機(jī)器進(jìn)行培訓(xùn)的話,這些受過訓(xùn)練的機(jī)器可以達(dá)到更高的分類精度。
之后我們?yōu)榱私鉀Q錯誤率的問題,去應(yīng)用了神經(jīng)網(wǎng)絡(luò),你會看到在應(yīng)用神經(jīng)網(wǎng)絡(luò)之后語音錯誤率以及ImageNet錯誤率得到了進(jìn)一步下降。我們在這邊看到了人類的表現(xiàn),人類的錯誤率,其實我們所做的是研究這些錯誤,我們大概有5%左右的錯誤率,過去幾年間,真正讓機(jī)器能夠打敗人類或者打敗其他智能的動物還需要幾年的時間,但是我們確實已經(jīng)見證多了一些重大的進(jìn)步,大家已經(jīng)有了智能手機(jī),我們說到這些智能系統(tǒng)的時候,我們知道這些智能手機(jī)的智能系統(tǒng)是非常好的,可以在大部分情況下幫我們作出正確的選擇,因為我們在它上面加入了神經(jīng)網(wǎng)絡(luò),因此我們可以幫他們的正確率得到提高。在Nervana我們也在整個平臺上應(yīng)用了各種各樣不同的數(shù)據(jù),我們用了自然語言加工,我們用了很多時間序列、金融數(shù)據(jù)等等,這些都是朝著同樣一個方向發(fā)展的。
展望機(jī)器學(xué)習(xí)的未來
從我們的大腦中尋求答案
很有趣的一點,英特爾其中一個創(chuàng)始人之一曾經(jīng)說過,“我們通過計算機(jī)建模的方式來研究人類大腦是如何工作。”,其實我們或許應(yīng)該用另外一種方法反其道而行之。我們已經(jīng)發(fā)展到了這樣一個階段,就是為了探索計算機(jī)新的發(fā)展方向,也就是數(shù)據(jù)的發(fā)展方向,我們可以向我們的大腦尋求答案。
用我們的芯片打造一個神經(jīng)元
這也是Nervana所使用的方向之一,我自己本身是學(xué)計算機(jī)出身的,我自己也對神經(jīng)系統(tǒng)非常感興趣,我希望我們能夠從大腦中獲取一些概念,能夠從大腦中獲取一些新的想法,把它應(yīng)用到我們的計算機(jī)工程中去。我們不知道如何去真正打造一個生物上的神經(jīng)元,但是我們可以用我們的芯片打造一個神經(jīng)元。我們可以把我們大腦中的模式,一種數(shù)學(xué)模型的方式提取出來,然后應(yīng)用到計算機(jī)模型當(dāng)中去。我們可以在其中加入一些生物的元素,然后建立起這樣一個模型,當(dāng)然這個部分是非常復(fù)雜的,然后我們把它轉(zhuǎn)化為模型描述語言,轉(zhuǎn)化為原語或者編譯器,之后轉(zhuǎn)化為針對工作負(fù)載的優(yōu)化硬件,這就是我們的工作方向。
重視計算力的價值
前面Jason Waxman之前也提到了,到2020年,AI計算量就會增長到12倍,我們對硬件也作出了投資,這是從行業(yè)來說更加重要的投資原因,到2020年的時候,我們數(shù)據(jù)中大部分都是由AI驅(qū)動的,我們說到很多數(shù)據(jù)的價值,現(xiàn)在全世界有海量的數(shù)據(jù),全世界每天都會產(chǎn)生巨大的數(shù)據(jù),每一個星球上生活的孩子,不管是成人,他們?nèi)绻米约旱娜四X進(jìn)行計算的話,要用30多年的時候才會產(chǎn)生這樣的數(shù)據(jù)。但是在未來,我們AI的計算量將增加到12倍,我們不再需要人工幫我們進(jìn)行這樣數(shù)據(jù)的計算,我們都會變成自動的計算。
關(guān)于英特爾人工智能咨詢委員會
我非常開心的宣布,我們成立了非常了不起的英特爾人工智能咨詢委員會,這些都是業(yè)界的領(lǐng)袖,可以幫助我們進(jìn)一步制定AI的戰(zhàn)略,并且?guī)椭覀冞M(jìn)一步研究神經(jīng)網(wǎng)絡(luò)。
Bruno Olshausen來自加州伯克利的,他是第一位咨詢員,從我們公司建立的開始就跟他建立了很好的合作關(guān)系。
之后是Ron Dror,他來自于斯坦福大學(xué),他致力于研究超級計算機(jī),他所研究的超級計算機(jī)模型可以用作藥物計算的發(fā)展。
還有一位是Jan Rabaey,加州大學(xué)伯克利分校的,他也是專注于研究我們整個神經(jīng)網(wǎng)絡(luò)架構(gòu)的,并且和我們整個行業(yè)有很好的練習(xí)。
Yoshua BenGio是我們深度學(xué)習(xí)的三大創(chuàng)始人之一,他們也是我們最后20幾年間所作出創(chuàng)新的先鋒者。幫助我們能夠把深度神經(jīng)元打造得更加有用,在一開始的時候深度神經(jīng)系統(tǒng)被人們認(rèn)為并沒有那么有用,但是現(xiàn)在讓人們相信這是非常有效的技術(shù)。
所以我們說AI可以從各種方向來被我們進(jìn)行應(yīng)用,現(xiàn)在AI是一個非常熱門的話題,但我們有不同的使用AI的方式,有一些是可以把它用到機(jī)器學(xué)習(xí)中去,有一些用到推理系統(tǒng)中,比如我們的Saffron系統(tǒng)。另外我們兩邊,也就是機(jī)器學(xué)習(xí)和推理系統(tǒng)可以進(jìn)行互動,另外我們可以有四種不同的實施方法,可以為用戶提供滿足他需求的方法。不管是深度學(xué)習(xí)、經(jīng)典機(jī)器的學(xué)習(xí),還是基于記憶或者是基于邏輯的學(xué)習(xí),我們?yōu)橛脩籼峁┑氖亲钸m合他們的最好的解決方案。
關(guān)于英特爾Nervana
XEON
在這邊我列出了英特爾Nervana一部分產(chǎn)品組合,首先是我們的XEON,這是我們比較通用的解決方案和處理器。另外,我們的軟件解決方案也可以在所有這些處理器上進(jìn)行工作,之后就是至強(qiáng)融核,它非常適合高性能和通用機(jī)器學(xué)習(xí)。
Skylake
另外,我們還有FPGA,來自Nervana的一個技術(shù)。我們剛剛也發(fā)布了Skylake,是我們最新版本的至強(qiáng),這一個版本也已經(jīng)進(jìn)行了進(jìn)一步的優(yōu)化,它可以幫我們將性能提高到的8倍,并且也是針對能效進(jìn)行的優(yōu)化。
至強(qiáng)融核
至強(qiáng)融核也是令大家非常興奮的一個部分,它也和我們深度學(xué)習(xí)有著非常深的融匯,它的主要目的就是能夠處理多重的工作負(fù)荷,所以在軟件部分我們也發(fā)現(xiàn)了有各種各樣不同的創(chuàng)新,通過應(yīng)用至強(qiáng)融核,可以講深度學(xué)習(xí)性能提高到四倍,與此同時性能也非常卓越。
KNIGHTS MLL
我們還有KNIGHTS MLL,另外再這樣的一個已有的平臺中,有了它我們就不再收到其它的限制,我們可以自由進(jìn)行AI或者是機(jī)器學(xué)習(xí)?,F(xiàn)在在我們的平臺上有非常多的用戶案例,但是這些用戶案例確實有受到了很多限制,有的時候是被內(nèi)存所限制,有的時候是被容量所限制,但是現(xiàn)在我們有了至強(qiáng)融核之后,就可以在我們平臺上采用更多的實例。
關(guān)于AI的應(yīng)用落地
我認(rèn)為醫(yī)療是AI可以去進(jìn)行應(yīng)用的一個非常重要的行業(yè),目前為止我們還并沒有非常完善的一些算法,我們也沒有一個完整的平臺提供給這些醫(yī)療服務(wù)系統(tǒng),但是我們也致力于將AI投入到醫(yī)療行業(yè)中去。比如說MICHAEL.j-FOX,基金會是一個專注于治療帕金森綜合癥的一個基金會,我們還共同建立了協(xié)作式的癌癥云,AI也被應(yīng)用于新藥的發(fā)行中去,我們也希望能夠宣布我們與Broad Institute共同合作,成立了可拓展的基金中心,我們這個中心需要技術(shù),需要更強(qiáng)的計算能力,更強(qiáng)的技術(shù)能力,我們可以為他們提供這樣的能力。
通過AI為世界做更好的貢獻(xiàn)。這就是我們所說的如何加速人工智能的“芯”變革。
我也非常為我們未來的幾年感到興奮,去看一下AI到底如何被應(yīng)用,如何發(fā)展。非常感謝各位。
評論
查看更多