蘋果公司(以下簡稱“蘋果”)近日終于不再遮遮掩掩,發(fā)布了自己的首份人工智能研究報告。業(yè)內人士稱,這對蘋果將來推廣自己的人工智能應用大有裨益。蘋果本月初曾表示,將發(fā)布自己的人工智能研究報告。不到一個月的時間,蘋果就兌現(xiàn)了承諾。近日,蘋果發(fā)布了第一份關于人工智能的學術論文。這篇報告闡述了一項新技術,即如何通過計算機生成圖像、而非真實圖像來訓練一種算法的圖像識別能力。
蘋果在報告中稱,在機器學習研究中,使用合成圖像(例如,來自一款視頻游戲)來訓練神經(jīng)網(wǎng)絡要比使用真實圖像更有效。因為合成圖像數(shù)據(jù)已經(jīng)被標記和注釋,而真實的圖像數(shù)據(jù)需要有人耗費巨大的精力去標記計算機看到的每件事物,如一棵樹、一條狗或一輛自行車。
當然,使用合成圖像也存在一定的弊端,導致一種算法所了解的內容與真實世界中的場景有所不同。蘋果在報告中稱:“有時,合成圖像數(shù)據(jù)不夠真實,導致神經(jīng)網(wǎng)絡只能了解到合成圖像中所呈現(xiàn)的細節(jié),而對真實圖像的認識有所不足?!?/p>
為解決該問題,提高合成圖像數(shù)據(jù)的訓練效果,蘋果研究人員推出了“模擬+無監(jiān)督”的學習方法,以提高模擬圖像的真實感。蘋果研究人員使用一種經(jīng)過修改的新型機器學習技術,被稱為“生成對抗網(wǎng)絡”(GAN),讓兩個神經(jīng)網(wǎng)絡彼此對抗,從而生成更逼真的圖像。
這篇報告的第一作者是蘋果研究員阿希什·什里瓦斯特瓦(Ashish Shrivastava),擁有馬里蘭大學帕克分校計算機視覺博士學位。有業(yè)內人士稱,對于蘋果而言,此次公開其首份人工智能研究報告也是一大進步。多年來,蘋果對其在人工智能領域的研究一直守口如瓶,這遭到了人工智能研究社區(qū)的批評。同時,這也影響了蘋果招募人工智能人才。
此外,此次公開自己的人工智能研究也有助于將來普及自己的人工智能軟件。如今,人工智能軟件正被應用到幾乎所有應用中,如iPhone 7的拍照功能,以及各種互聯(lián)網(wǎng)服務。
蘋果人工智能的未來,將靠這15家收購企業(yè)支撐
外界一直認為蘋果在人工智能領域比較低調,其技術也落后于Google、微軟等公司。
其實蘋果有著寫滿兩頁紙的機器學習應用,部分已經(jīng)投入使用,其他的還在討論中。而這些應用的背后則是這6年來蘋果已悄無聲息收購了15家人工智能公司,包括:語音識別、自然語言處理、圖像識別、人臉識別、動作捕捉、機器學習等方向的創(chuàng)新型技術公司。
有個有趣的現(xiàn)象是,蘋果每收購一個AI公司后,均不會對外公布收購目的和發(fā)展計劃,而且會立即關閉被收購公司的產(chǎn)品和服務。
語音、語義識別
Siri語音助手
Siri無疑是蘋果最為重要的語音產(chǎn)品,2010年以2億美金的價格購入無疑是一筆非常劃算的買賣,之后蘋果在語音識別和NLP方向的收購舉措均基于Siri而展開。
Novauris語音識別
2014年4月,蘋果收購的Novauris是一家自動化語音識別技術公司,Novauris是由Nuance旗下的Dragon Systems創(chuàng)始人創(chuàng)辦,而Nuance曾是Siri的基礎語音技術提供商。他們的核心產(chǎn)品是基于服務器的可擴展語音識別系統(tǒng)NovaSystem,特點是能夠同時處理多個語音訪問請求。雖然蘋果拒絕透露如何使用Novauris團隊,但從Siri和Nuance的合作關系來看,蘋果此項收購意在擺脫對Nuance的依賴,利用Novauris團隊開發(fā)自己的語音技術。
VocalIQ人機對話
一直以來,Siri只能識別最基本的指令,無法做出匹配度較高的回答,這導致它成為一款娛樂屬性的娛樂產(chǎn)品。2015年10月,蘋果通過收購VocalIQ予以解決此項問題。VocalIQ能夠利用深度學習來理解語言的環(huán)境,從而使得人機對話變得更加自然。開發(fā)者在Siri中嵌入VocalIQ的人工智能技術后,利用這個平臺來儲存和學習用戶的交流信息,實現(xiàn)準確識別用戶的指令并提供更加智能的對話。
機器學習
蘋果曾提到他們利用AI技術試水一些微功能:如識別陌生來電;檢測用戶的運動狀態(tài);手機解鎖后列出最可能使用的應用;自動顯示附近標記的酒店;日程表安排;興趣新聞推薦等等。這些看似簡單的功能其實全部被置人到機器學習系統(tǒng)中,為此蘋果通過收購多家以興趣推薦和習慣預測為研究方向的機器學習公司,用于提高自身的數(shù)據(jù)挖掘實力。
Turi機器學習平臺
2016年8月,蘋果斥資2億美元收購機器學習公司Turi。目前Turi已推出了GraphLabCreate、Turi機器學習平臺、TuriDistributed和TuriPredictive Services等產(chǎn)品,這些產(chǎn)品主要用于開發(fā)推薦引擎、情緒分析、欺詐探測等解決方案。
Cue數(shù)據(jù)挖掘
2013年10月,蘋果以4000萬美金收購被稱為“云數(shù)據(jù)的搜索引擎”的Cue,Cue可以從用戶郵件、聯(lián)系人、臉書、推特、LinkedIn、Reddit、Dropbox、印象筆記、Tumblr中收集數(shù)據(jù),通過處理所有數(shù)據(jù)并通過機器學習算法找出用戶需要的信息,從而進行整理:如提供日歷提醒、通知與某人約會、會面餐館推薦等。據(jù)悉,Cue將會整合到Siri中。
Matcha視頻推薦
2013年8月,蘋果約以1000—1500萬美金(雙方未對外公布明確交易價格)收購Matcha,其產(chǎn)品可從Netflix、iTunes、Hulu以及Amazon Prime等流媒體網(wǎng)站上抓取內容,根據(jù)興趣焦點推薦合適的信息給用戶。蘋果收購Matcha主要就是為了獲得視頻推薦算法。下線之前,Matcha的iOS應用在App Store娛樂類別軟件暢銷榜前15名,用戶增長率非???。
Semetric音樂數(shù)據(jù)挖掘
2015年1月,蘋果以5000萬美金收購Semetric公司,該公司在2008年推出了Musicmetric服務,主要業(yè)務是提供與音樂下載和流播放有關的數(shù)據(jù)分析服務,利用機器學習幫助客戶分析社交媒體中音樂愛好者喜歡哪些歌手和歌曲,從而給出相關音樂推薦。完成收購后,蘋果將其整合在iTunes音樂中。除音樂外,Semetric在游戲、電視、電影和圖書方面的數(shù)據(jù)分析服務也有著一定的積累,這將有助于增強蘋果對旗下各類數(shù)字產(chǎn)品的數(shù)據(jù)挖掘。
Spotsetter地圖社交個性化推薦
Spotsetter是基于Google地圖的社交搜索引擎,于2014年6月被蘋果收購,其通過分析用戶的社交圈數(shù)據(jù),為用戶提供個性化的地點(如旅游地點和餐館)推薦服務,致力于解決所謂的“where to go”問題。蘋果的收購目的不外乎其推薦算法與蘋果Maps整合的前景。
WiFiSlam機器學習與模式識別
2013年3月,蘋果以2000萬美元收購室內導航服務商WiFiSlam,該公司的優(yōu)勢在于機器學習和模式識別技術,可對設備上各種傳感器收集的數(shù)據(jù)進行相關性繪圖,并且與WiFi三角定位的數(shù)據(jù)相結合,用于繪制準確的室內地圖,蘋果將其算法應用在地圖中。
Topsy 社交數(shù)據(jù)挖掘
2013年,蘋果以2億美金收購Topsy,該公司的產(chǎn)品能夠幫助用戶從Twitter以及其他社交媒體數(shù)據(jù)中提取關鍵信息,包括關鍵字追蹤器以及判斷社交媒體中用戶對某個話題的反應態(tài)度。
計算機視覺
蘋果官方提到,他們的人臉識別和視頻檢測技術已經(jīng)開始應用在相機等產(chǎn)品當中,與此同時,消息人稱蘋果為研發(fā)VR/AR產(chǎn)品收購了多家專注于計算機視覺的公司。
Perceptio圖像識別
2015年10月,蘋果收購圖像識別公司Perceptio,該公司的產(chǎn)品是開發(fā)智能手機端的人工智能圖像分類系統(tǒng),該系統(tǒng)的最大優(yōu)勢是無需大量外部數(shù)據(jù)進行分類。這符合蘋果的隱私保護策略,對用戶數(shù)據(jù)的利用最小化,并將盡可能多的技術放在手機端,而非云端。
Metaio計算機視覺
2015年5月蘋果收購Metaio,Metaio專注于計算機視覺和增強現(xiàn)實的技術公司,其在計算機視覺尤其是人臉識別方向有著十幾年的研發(fā)經(jīng)驗。
Polar Rose人臉識別
2011年12月,蘋果以2900萬美元收購瑞典人臉識別廠商Polar Rose。Polar Rose曾推出多個產(chǎn)品,包括針對網(wǎng)絡服務的面部識別技術FaceCloud,以及為手機添加功能性的FaceLib。其臉部識別軟件,通過臉部識別Polar Rose可以為用戶自動圈出照片中的人臉。
Emollient 人臉識別
2016年1月Emollient被蘋果收入囊中,其可以通過臉部識別技術分析人類的表情,從而判斷人的情緒。醫(yī)生也可以用他們公司的技術了解病人的表情是否痛苦,也可將這項技術應用在監(jiān)視器,查看是否有“表情可疑”的人正在商品前面徘徊等等。
Flyby Media 計算機視覺
今年年初,蘋果悄悄買下Flyby Media,F(xiàn)lyby Media擁有尖端的計算機視覺技術,此外其慣性傳感、同時定位和導航空間感知技術也深受蘋果喜愛。Flyby media曾與谷歌合作,利用計算機視覺技術幫助谷歌開發(fā)Project Tango。Flyby Media可幫助系統(tǒng)看到和繪制其周圍環(huán)境地圖,對于無人駕駛汽車和增強現(xiàn)實技術來說都必不可少。
蘋果的AI原則:用戶隱私》數(shù)據(jù)訓練
多年來蘋果遵守一個原則:不利用用戶數(shù)據(jù)做營收。蘋果官方稱,他們是唯一一家在用戶隱私及用戶體驗上取得平衡的公司。
據(jù)悉,蘋果只在每個用戶身上抓取200MB緩存數(shù)據(jù)供機器學習調用,包括應用使用習慣、與他人的交互,數(shù)據(jù)用于神經(jīng)網(wǎng)絡處理、自然語言模型對象識別、人臉識別、場景識別等。而且這些私人信息,并不會被上傳到網(wǎng)絡及云端。
相關從業(yè)人士指出,如果蘋果繼續(xù)限制用戶數(shù)據(jù)的使用,會嚴重阻礙到蘋果人工智能的研究效果。但蘋果認為數(shù)據(jù)的阻礙是可以逾越的,他們在未來將繼續(xù)恪守這一原則。
評論
查看更多