說起近年來手機上出現(xiàn)的新玩意兒,AI芯片可能是其中最耀眼的明星。無論是安卓陣營還是iOS陣營,旗艦級別手機所使用的SoC中,AI算力總能成為著力吆喝的賣點。例如最近華為發(fā)布麒麟990芯片,其AI模塊的算力相比前代大幅提升數(shù)倍,甚至登頂安卓陣營AI Benchmark榜單;而在最新發(fā)布的iPhone 11當中,所使用的A13 Bionic仿生芯片也表現(xiàn)不俗,性能提升20%,每秒可執(zhí)行1萬億次運算。可以說,AI芯片目前已經(jīng)進入到了軍備競賽階段。
iPhone 11所使用的A13 Bionic芯片,AI性能是歷代之最
然而,和性能提升可以直觀感受到的CPU、GPU模塊不同,SoC當中的AI性能攀升,其實際應(yīng)用場景一直令很多朋友感到迷?!狝I這么強,日常使用的APP似乎也沒太大變化,游戲該咋玩還是咋玩。但AI芯片是否真的雞肋?這也未必。
軟件應(yīng)用往往滯后于硬件發(fā)展。觸摸屏并非是什么新鮮事物,但直到iOS橫空出世才讓人找到正確的交互方式;NFC早在安卓2.X時代就已經(jīng)實裝,但直到近年才迎來各種支付應(yīng)用的廣泛支持。
AI芯片目前的應(yīng)用范圍并不廣,大家可以感受到的,可能就是相機中場景的AI識別、人臉認證等等。隨著AI芯片算力的提升、軟件應(yīng)用的完善,未來的APP到底能進化到怎樣的神奇地步?今天一起來聊聊吧。
·為何手機需要AI芯片?
作為近年最熱門的話題之一,AI這一字眼頻頻出現(xiàn)在各類科技資訊當中。而谷歌開發(fā)的圍棋AI Alpha Go一舉擊敗李世石、柯潔,更是令A(yù)I走進了聚光燈下。和傳統(tǒng)的算法相比,AI能夠讓計算機的某些舉止更接近人類,例如能夠識別圖像內(nèi)容、識別句法語義等等,而這些,往往得益于使用神經(jīng)算法來進行機器學(xué)習(xí)。
移動互聯(lián)網(wǎng)時代的到來令數(shù)據(jù)規(guī)模前所未有的龐大,這為AI提供了茁壯成長的土壤。這些數(shù)據(jù)成為了AI極其有價值的樣本,人們通過神經(jīng)算法對這些樣本進行卷積分類,進行一遍又一遍的機器學(xué)習(xí),輸出了不同權(quán)重的結(jié)果,并以此作為識別行為事物的判斷依據(jù)。從這方面來看,AI的本質(zhì)是數(shù)據(jù)密集、算法先進、分類權(quán)重細致的統(tǒng)計學(xué),通過不斷輸入數(shù)據(jù)、不斷卷積衡量權(quán)重,AI最終所能做出的判斷會無比接近甚至超越人類。
AI芯片能支持多種機器學(xué)習(xí)模型
由此可見,AI是依賴特定的神經(jīng)算法實現(xiàn)的,這個任務(wù)交給普通的CPU來做,效率比較低下——CPU屬于通用計算單元,暴力運行某種算法并非其特長,例如CPU挖礦的效率就遠比不上專門為HASH算法特制的ASIC礦機芯片。而AI芯片正是為密集處理數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)算法特制的,例如華為的麒麟990就可以支持包括VGG、VDSR等在內(nèi)的90%視覺神經(jīng)網(wǎng)絡(luò)計算模型。
換言之,AI芯片能否發(fā)揮其功用,關(guān)鍵在于軟件應(yīng)用是否對相應(yīng)的神經(jīng)網(wǎng)絡(luò)算法有著良好的支持和運用。隨著APP不斷進化,AI會越來越多地應(yīng)用到實際當中,出于算力和能效方面的考慮,AI芯片(模塊)的確必不可少。而當AI芯片的性能日益強大時,下面這些神奇的應(yīng)用可能會漸漸成為我們的日常。
·AI實時P視頻
在一些手機中,拍照APP可以通過AI來識別場景,然后成像風(fēng)格根據(jù)不同的場景變化,例如拍植物增加色彩的鮮艷度讓花朵綠葉更加嬌艷欲滴,拍人像則增加柔光令皮膚更加白嫩等等。而在未來,AI在圖像識別方面的應(yīng)用會更加廣泛,這在現(xiàn)在已經(jīng)可以看到一些苗頭。
AI既然可以辨認出場景,自然也能辨認出圖像中的事物。例如一張照片中,哪里是人臉,哪里是寵物,哪里是背景,AI都可以做到比較準確的判斷。在這個前提下,AI實時“PS”視頻,也就成為了可能。
Google利用“卷積神經(jīng)網(wǎng)絡(luò)(CNN)”技術(shù)將人從視頻背景中摳出來
例如Google之前就展示了一項名為“卷積神經(jīng)網(wǎng)絡(luò)(CNN)”技術(shù),它是一種機器學(xué)習(xí)算法。該技術(shù)使用了數(shù)以萬計的圖像數(shù)據(jù)用以機器學(xué)習(xí),并且專門分辨出“頭發(fā)”、“頸部”、“皮膚”等處的數(shù)據(jù),能夠輕而易舉地將人從背景中“摳”出來,背景自然也可以實時更換。從演示來看,Google的這項技術(shù)的確效果拔群,很輕松就能夠在雜亂的背景中辨認人像,然后只置換視頻中的背景,效果還非常自然。
Google利用AI實時視頻摳圖的演示
而相關(guān)的應(yīng)用在國內(nèi)也由開展,而且可能很快就會和消費者見面。華為在演示麒麟990的AI性能之時,也呈現(xiàn)了令人吃驚的實時摳圖功能。在AI的作用下,視頻中的人物能夠隨時變更背景,非常神奇。
華為對AI技術(shù)的新應(yīng)用——實時P視頻
而AI算法顯然不僅僅能作用于背景,也可以作用于人像。前不久AI換臉APP“ZAO”的上線,引起了人們的熱烈討論。在ZAO應(yīng)用當中,只要上傳一段視頻,即可通過AI算法將其中的人臉換成另一個人的,這種偽造身份的玩法的確令人感到驚愕。而在未來的AI應(yīng)用中,隨著算力的加強,這一過程可能在手機中就能夠?qū)崟r完成,P一段子虛烏有的視頻,并非天方夜譚。
·AI去碼(圖像修復(fù))
看到這個小標題,可能很多老司機就頓時不困了。如果說AI實時P視頻只是將已有的元素重新組合,例如場景換成另一個場景、人臉換成另一張人臉等;而AI去碼,則可謂是憑空畫餅,將原本不存在的事物添加上去,這在很多場景下都有極大用途。
一般而言,去馬賽克是需要人類“腦補”的工作。從原理來看,馬賽克屬于不可逆運算,把大量的小像素點合并到一個大的像素點,并取平均色,就制造成了馬賽克——很顯然,你是難以知道被攪勻之前的各個小像素的顏色是如何排布的。一般來說,要消除馬賽克,需要人進行想象腦補,然后把缺失的內(nèi)容重新畫出來。而有了AI,人不再是必須了,Google Brain的算法能夠自動去除馬賽克,騎兵自動變步兵。
就算是不可名狀的馬賽克,AI技術(shù)也能修復(fù)成高清
Google Brain使用的是一種全新的像素遞歸超分辨率技術(shù),通過大量高、低分辨率的采樣學(xué)習(xí),然后得出規(guī)律來匹配修復(fù)結(jié)果。例如,Google Brain學(xué)習(xí)到了某種黑點是屬于眼鏡,那么在還原馬賽克的時候,就可以把這種黑點還原成眼睛。從測試來看,效果的確不同凡響。
這樣的AI技術(shù)有什么用?去除馬賽克只是特定場合的具體應(yīng)用,類似的算法在很多時候都可以發(fā)揮作用——只要當圖像需要修復(fù)的時候,就用用武之地。例如拍照片手抖了失焦了,糊成一片該咋辦?傳統(tǒng)的方法可能就是簡單粗暴的銳化了,而如果拍照APP使用AI技術(shù),就可以“腦補”回丟失的細節(jié)和銳度,給你一張盡量可用的照片。
·AI上色
既然AI能夠識別圖像內(nèi)容、腦補細節(jié),那么AI自動上色也就成為了可能。上色其實涉及到了創(chuàng)作層面,而創(chuàng)作被很多人視為人類和機器的鴻溝,但這在AI時代不那么靈了。借助AI技術(shù),手機APP可以自動為黑白照片甚至線稿畫作來涂上適合的顏色。
類似的技術(shù)現(xiàn)在已經(jīng)出現(xiàn)。照片處理自不必說,AI識別場景調(diào)節(jié)顏色和黑白照片上色并沒有本質(zhì)上的區(qū)別;而給線稿上色,在之前曾被認為是不可思議的事情——電腦能夠讀懂線條勾勒的是何種輪廓、該輪廓還得填上適合的顏色,聽上去就如同魔法。不過Paintschainer推出的AI上色技術(shù)卻令人大吃一驚——它可以識別某部分屬于皮膚,某部分是頭發(fā),某部分是衣服,某部分是背景,然后分別涂上適當?shù)念伾?/p>
Paintschainer的AI自動上色,可以精準辨認線稿
不僅如此,Paintschainer的上色范圍還相當精準,盡管線稿沒有封閉,但顏色依然會保留在適當?shù)姆秶?,而不會涂得滿地都是——用過PS中油漆桶工具上色的朋友,應(yīng)該知道這是什么意思。
這意味著,以后在手機中繪畫成為了可能。盡管手機的屏幕小且觸控并不算精確(相比數(shù)位板),但得益于AI已經(jīng)能辨識線稿,因此手指繪畫粗糙的筆跡,就可以被AI完補為精細的描線,并填上適合的顏色。對于創(chuàng)作者而言,這大大節(jié)省了打磨具體畫技所需要的功夫,將更多精力留給設(shè)計、構(gòu)思,提高了效率。
這種AI輔佐創(chuàng)作的技術(shù),并不僅能用于攝影、繪畫,在作曲等領(lǐng)域也同樣適用?;蛟S在不久后,對著手機哼一段旋律,AI自動幫你編好曲、選擇好演奏樂器、最后完成一段高質(zhì)量曲子的日子,也已經(jīng)并不遙遠。
·AI自動翻譯
語義識別可謂是AI另一大廣泛實裝的應(yīng)用了。無論是語音識別,還是自動翻譯,都離不開精準的語義判斷。得益于AI,近年的機翻竟然也能說人話了——例如Google翻譯,已經(jīng)基本做到了語句通順流暢,用來閱讀一些專業(yè)性不強的外文,Google翻譯綽綽有余。這是如何做到的呢?
這主要得益于Google翻譯引入了神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等人工智能算法,邁入了“神經(jīng)機器翻譯(GNMT)”的時代。得益于人工智能和谷歌的大數(shù)據(jù),谷歌翻譯對語言的解析有了遠比之前深入的理解,因此在長句、整篇翻譯方面有了長足的進步。
引入了GNMT后,Google翻譯的精度與日俱增,越來越像是說人話了
在未來,AI翻譯還會愈加強悍,也不僅僅局限于靜態(tài)的文字。例如在Android 10當中,引入了Live Caption(實時字幕)功能,借助機器學(xué)習(xí),它能夠讓手機在播放任何視頻的時候,精準識別出音頻,并生成字幕。該技術(shù)顯然可以和AI翻譯結(jié)合,幫助人們啃下各地語言的生肉,大大減少交流的鴻溝。
得益于AI,安卓可以為任何視頻生成字幕,未來有望還能實時翻譯
另外,AI自動翻譯還可以用于語音交流。隨著處理速度和精準度的上升,手機安裝響應(yīng)的APP后,化身同聲傳譯器也并非不可能,雖然對于一些專業(yè)詞句、地域文化梗的翻譯,可能還比不上人工,但對比現(xiàn)在已有的機翻,這無疑要好上太多。
·AI自動對話
自從蘋果推出了Siri,語音助手成為了人們關(guān)注的焦點之一。然而在大多數(shù)情況下,語音助手們的表現(xiàn)并不盡如人意,無法理解自然語義、對話機械、無法針對上下文內(nèi)容應(yīng)答等缺點,令語音助手如同“人工弱智”。而在AI的加持下,未來的語音助手們將會飛躍上新的臺階。
例如,Google Assistant就已經(jīng)走在了進化的路上。在 I/O開發(fā)者大會上,Google演示了AI技術(shù)加持的Google Assistant,它能夠和人類對答如流,能夠識別上下文內(nèi)容,話語也都非常符合邏輯,無論是內(nèi)容還是語調(diào)都異常接近真人。無論是識別、應(yīng)答還是任務(wù)的完成度,新的Google Assistant都遠比之前的語音助手表現(xiàn)出色。
得益于大數(shù)據(jù)和AI算法,Google Assistant的智能程度大大提升,甚至可以對答如流
這樣的進化,很大程度上得益于企業(yè)利用用戶數(shù)據(jù)訓(xùn)練語音、語言模型——蘋果、谷歌、微軟、Facebook等大佬都被爆出干過這樣的事情。在未來,手機APP的語音交互或許會更加智能,但這種進化的代價卻以用戶隱私作為代價。我們到底該如何平衡技術(shù)發(fā)展的需求和隱私信息的保護?這恐怕是值得一直深究的問題。
·AI信息分類
智能分類在當前很多相冊服務(wù)中都已經(jīng)初現(xiàn)雛形。例如在Google Photo中,照片可以根據(jù)題材、人物等自動歸類為風(fēng)景照、建筑照、美食照、某個人的合照等等,查找起來非常方便。而智能分類的出現(xiàn),很大程度上依賴于AI技術(shù)的發(fā)展——AI通過機器學(xué)習(xí),得以辨認出照片場景、主體后,才讓智能分類成為可能。
目前AI對照片已經(jīng)能夠進行比較精確的智能分類
而伴隨著AI的進步,智能分類擁有了更多可能。目前智能分類主要涉及照片,而在未來隨著AI芯片算力的加強,視頻的智能分類也將最終得以實現(xiàn)。而由于AI經(jīng)過足夠訓(xùn)練后,能夠較好地理解語言語義,因此將文稿按照其中內(nèi)容進行分門別類,也成為了可能。類似的功用也可以作用于音頻中,某些音樂APP可以將音樂按照不同風(fēng)格的旋律分類,例如舒緩、激烈、甜美等,而隨著AI芯片愈發(fā)強大,手機本地也可以完成這樣的任務(wù)。
也就是說,當AI發(fā)展到一定地步,手機中的相冊APP能夠按照內(nèi)容整理照片、視頻庫可以自動分類不同內(nèi)容的視頻、文件管理器可以將近似內(nèi)容的文檔歸類在一起、音樂APP能夠識別風(fēng)格各異的旋律,都有可能成為現(xiàn)實。而當AI將這些結(jié)合在一起,視頻的自動剪輯、踩點等應(yīng)用,也將愈發(fā)成熟——目前微軟Windows 10中的相冊就已經(jīng)初步提供了類似功能,但還不太智能,將來手機在AI芯片的加持下,利用相應(yīng)的APP一鍵生成短視頻、Vlog等,將不再是夢。
AI行為調(diào)度
得益于大數(shù)據(jù),AI能夠采集方方面面的信息,并給出一個統(tǒng)計學(xué)上的最優(yōu)解。例如Google的Alpha Go,就在學(xué)習(xí)了大量對弈樣本后,得知了圍棋每一步的權(quán)重,從而擊敗最頂級的棋手。因此當AI的涉及面足夠廣,它就能以普通人所難以企及的全面視野,來為你安排生活中的點點滴滴,讓你真正感受到“智能”的精髓。
AI將能成為真正的智能管家
例如,很多人家中都購置了智能家電,但這些家電的調(diào)度仍不那么的“智能”——你需要為它們預(yù)設(shè)開啟、工作的時間段或者條件,雖然比傳統(tǒng)家電方便,但仍做不到根據(jù)你的實際行程,全自動為你安排家電的開啟。
例如當你設(shè)置了下班后自動提前開啟空調(diào)等待回家,但某天突然塞車,又不便操作手機,智能家電并不能因為這個調(diào)整自己的開啟時間,白白耗費電能。當你需要突然出差的時候,你還得手動調(diào)節(jié)智能家電的使用方案,更加不便。而如果管控智能家電的APP加入了AI相關(guān)技術(shù),一切可能就變得不同了——APP會根據(jù)你的行程、身體情況、環(huán)境氣候等等,自動安排自己的工作時段、時長、模式,你甚至?xí)杏X到電器上的開關(guān)功能按鈕是多余的——這才叫做智能家電嘛。
總結(jié)
AI的一大魅力在于找出大數(shù)據(jù)中的內(nèi)在規(guī)律,從而讓功能的自動化實現(xiàn)成為可能,甚至能極大程度模糊人與機器間的界限。AI芯片目前仍處于起步階段,或許我們現(xiàn)在只能在少量應(yīng)用場景中感受到它的存在,但隨著應(yīng)用生態(tài)的完善,AI芯片將會為手機帶來更多神奇功用,期待AI芯片能在未來進一步發(fā)光發(fā)熱吧。
-
soc
+關(guān)注
關(guān)注
38文章
4166瀏覽量
218280 -
AI
+關(guān)注
關(guān)注
87文章
30898瀏覽量
269126 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8890瀏覽量
137449
發(fā)布評論請先 登錄
相關(guān)推薦
評論