“目前這個領(lǐng)域的投資熱度不減,但還是趨于冷靜的?!笔袌鲅芯繖C(jī)構(gòu)IDC人工智能領(lǐng)域分析師劉艷霞這樣對本刊評價人臉識別領(lǐng)域目前的市場投資情況,在他們看來,“熱度不減”是因為在目前市場應(yīng)用還不是很多的情況下,這個領(lǐng)域還有很多新的應(yīng)用場景亟待開發(fā),里面有大量的機(jī)會存在?!摆呌诶潇o”則是因為在已有的賽道內(nèi)已經(jīng)聚集了不少實力雄厚的競爭者?!霸谶@個時間點,后面加入的一些公司相對來講就處于一個比較劣勢的地位,可能你很難再有機(jī)會能夠追趕上來?!编噥喎鍖Ρ究绱苏f道,他來自國內(nèi)另一家計算機(jī)視覺領(lǐng)域創(chuàng)業(yè)公司格靈深瞳。
根據(jù)國海證券研究所行業(yè)報告研究院的研究顯示,人臉識別主要應(yīng)用領(lǐng)域市場規(guī)模,公安領(lǐng)域16億以上、交通領(lǐng)域50億以上,金融領(lǐng)域百億級別、教育領(lǐng)域百億級別,在不考慮大安防硬件存量市場的前提下,整體市場規(guī)模就達(dá)到數(shù)百億。
而安防市場的廣闊前景則是人臉識別技術(shù)目前的最大戰(zhàn)場。根據(jù)中安網(wǎng)數(shù)據(jù),中國安防行業(yè)市場規(guī)模從2012年的3240億元增長到了2016年的5400億元,年復(fù)合增長率達(dá)到驚人的15%,而其中2016年視頻監(jiān)控產(chǎn)品的產(chǎn)值就達(dá)到了962億元。而這也是云從科技創(chuàng)始人周曦的信心來源,去年他就曾經(jīng)公開預(yù)測“未來5年之內(nèi),國內(nèi)人臉識別的市場規(guī)模要達(dá)到1000億元”。
來自第三方研究機(jī)構(gòu)的劉艷霞沒有周曦那么充足的自信,她認(rèn)為單純的“人臉識別”可能達(dá)不到1000億的規(guī)模,但如果把所有上下游的硬件攝像頭與軟件服務(wù)都算上,那就沒問題。“在安防領(lǐng)域,如果算上軟件及人工服務(wù),一個攝像頭的投入可能會達(dá)到10萬元,那100萬個攝像頭就有1000億元了,而100萬個攝像頭也就是一、二線城市普通攝像頭投入的規(guī)模,所以這樣算的話,一個城市可能就有1000億了?!倍绻麊渭儚募夹g(shù)層面來看,“1000億”顯然是一個有些夸大的數(shù)字。
格靈深瞳CTO鄧亞峰也對本刊表示:“如果提供的只是核心算法或者提供一些核心的人臉識別設(shè)備的話,我覺得這個市場可能沒有到千億這個規(guī)模,但它可能帶動的市場也許真的能有這么大?!?/p>
政府的支持則是另一股助推劑。2015年以來,政府出臺了多項政策法規(guī),為人臉識別在安防、金融等領(lǐng)域的普及打下了堅實的基礎(chǔ),掃清了政策障礙。比如2015年4月,中央辦公廳就印發(fā)了《關(guān)于加強(qiáng)社會治安防控體系建設(shè)的意見》,其中提到“未來網(wǎng)絡(luò)化精細(xì)管理是平安城市和智能交通管理的發(fā)展方向”,而人臉識別技術(shù)則是這一切實施的重要技術(shù)基礎(chǔ)。
同時,政府采買本身也是這個領(lǐng)域目前最重要的收入來源,其中公安系統(tǒng)理所當(dāng)然地成為大頭,你幾乎可以從每一家相關(guān)創(chuàng)業(yè)公司的官網(wǎng)上看到他們和不同地區(qū)公安部門的合作協(xié)議。IDC中國人工智能研究總監(jiān)張卓此前在接受媒體采訪時曾經(jīng)表示,為國家安全提供智能監(jiān)控系統(tǒng)給了這些人臉識別領(lǐng)域的初創(chuàng)企業(yè)在起步時的巨大助力。他同時表示,中國每年公共安全預(yù)算充裕,這使得這一領(lǐng)域的公司創(chuàng)收也較為容易。
“3·15”的打擊證明它還沒有完全成熟
事實上,作為計算機(jī)視覺領(lǐng)域的一個分支,對于人臉識別技術(shù)的研究可能至少有50年的歷史,目前可以查閱到的最早一篇論文發(fā)表于1967年。但在隨后的二三十年間,相關(guān)的研究因為各種條件的限制并沒有太大的進(jìn)展?!?998年微軟亞洲研究院建院的時候我們第一個成立的組就是視覺計算組,那時候計算機(jī)視覺應(yīng)用非常少,很冷門?!蔽④泚喼扪芯吭撼?wù)副院長郭百寧博士此前就對本刊記者這樣說道。但到了2012年,深度學(xué)習(xí)技術(shù)的出現(xiàn)才真正讓整個人工智能領(lǐng)域看見了可用的曙光,識別率逐年上升。目前,頂尖的人臉識別算法在“一對一”人臉驗證的場景下準(zhǔn)確率已經(jīng)超過了人類的平均水平。
LFW(Labeled Faces in theWild Home)是國際權(quán)威的人臉識別數(shù)據(jù)庫,它是為了研究非限制環(huán)境下的人臉識別問題而建立,里面包含超過1.3萬張人臉圖像。目前,在這個數(shù)據(jù)庫的測試結(jié)果中,幾乎全球頂尖團(tuán)隊的準(zhǔn)確率都超過了99%?!拔覀冊谶@個數(shù)據(jù)庫上的識別準(zhǔn)確率已經(jīng)達(dá)到了99.7%以上,這個準(zhǔn)確率已經(jīng)比絕大多數(shù)人類的識別率要高了?!标悇倢Ρ究f道,他是微軟亞洲研究院創(chuàng)新工程組首席項目開發(fā)經(jīng)理,目前主要負(fù)責(zé)人臉識別技術(shù)的工程開發(fā)工作。
微軟亞洲研究院創(chuàng)新工程組首席項目開發(fā)經(jīng)理陳剛
當(dāng)然,在測試環(huán)境下得到的數(shù)據(jù)并不意味著人臉識別在技術(shù)上已經(jīng)完全成熟。“要看測試數(shù)據(jù)集的表達(dá)能力是否與目標(biāo)場景的數(shù)據(jù)情況和使用要求相匹配”,陳剛解釋道,由于LFW這樣的數(shù)據(jù)庫中的測試內(nèi)容是固定的,所以很容易進(jìn)行有針對性的訓(xùn)練,“如果現(xiàn)在去做視頻安防類的測試,它的那個數(shù)據(jù)集就和這個數(shù)據(jù)是不一樣”。而根據(jù)鄧亞峰提供的數(shù)據(jù),在更加靠近現(xiàn)實的視頻動態(tài)人臉識別場景中,現(xiàn)有的人臉識別也只能在理想場景中達(dá)到60%~70%的水平。
作為應(yīng)用在登錄、安防等領(lǐng)域的技術(shù),是否可靠其實是普通用戶最關(guān)心的事,但在年初的央視“3·15”晚會上,人臉識別的相關(guān)技術(shù)漏洞卻被當(dāng)眾曝光。在演示過程中,一張他人的靜態(tài)自拍照,通過技術(shù)處理,可以變成能眨眼睛、能微笑的“偽活人”;而借助3D建模技術(shù),這張自拍照還能讓自己“變臉”成另一個人,輕易騙過登錄系統(tǒng)。一時間,關(guān)于人臉識別是否足夠安全的話題也讓很多用戶擔(dān)心。
但在這個行業(yè)內(nèi)的專業(yè)人士看來,“3·15”晚會所曝光的問題既反映了人臉識別技術(shù)上的不夠成熟,也反映了很多應(yīng)用廠商在技術(shù)使用上的不負(fù)責(zé)任。
從技術(shù)上看,目前人臉識別技術(shù)主要分為2D人臉識別(包括彩色圖像,紅外圖像)和3D人臉識別。2D人臉識別是在彩色圖像上的識別方法,主要優(yōu)勢在于檢測數(shù)據(jù)獲取方式便捷,同時目前算法相對成熟,是目前主流的技術(shù)應(yīng)用方向。但“3·15”晚會上的案例已經(jīng)暴露了在安全性要求高的場景下,靠單一人臉識別算法來身份驗證的使用方式是不夠安全的。由于人臉在2D維度的投影會使得部分有效信息缺失,所以容易被犯罪分子攻擊。
而3D人臉識別方法是基于人臉3D立體模型進(jìn)行識別,充分利用立體空間信息,能有效解決2D識別的遮擋以及角度旋轉(zhuǎn)等識別難點,識別精度較高。傳言iPhone 8將使用的“3D結(jié)構(gòu)光”技術(shù)就屬于這一類別。曠視科技工作人員對我們說道:“如果結(jié)構(gòu)光屬實,那這項技術(shù)將可以抵御所有的翻拍攻擊手段(例如屏幕翻拍照片、翻拍視頻、紙張打印、相片打印等),因為翻拍攻擊的都是2D人臉畫面,而結(jié)構(gòu)光能有效分辨出2D人臉和3D人臉?!蹦壳?D人臉識別的問題主要在于數(shù)據(jù)采集相對困難,采集數(shù)據(jù)量十分巨大,對計算機(jī)的計算存儲能力要求較高,在商業(yè)化上仍然不夠成熟,但也許會是未來的主要方向。
但更嚴(yán)重的問題不在技術(shù)本身,而在于如何使用技術(shù)。“在有些情況下我們沒有解決好某一些相關(guān)的技術(shù),比如活體檢測的相關(guān)技術(shù),那可能它就不適合在這樣的場景下去應(yīng)用,但是有些人可能就要這樣用它,這就會造成一些潛在的風(fēng)險?!编噥喎逭f道。同時,他也強(qiáng)調(diào)人臉識別還不是一項完全成熟的技術(shù),不應(yīng)該被使用在任何場景下。
而陳剛則認(rèn)為,從長遠(yuǎn)的角度來看,不同的安防場景其實有不同的要求,就需要不同的技術(shù)解決方案,所有安防環(huán)節(jié)都要依賴于場景的要求,有針對性地設(shè)計選擇合適的解決方案是一個思路。“我們?nèi)四樳@個圈子基本有一個共識,就是作為‘人臉’這種生物識別的話,作為單一技術(shù)去做高層級安全水平的安防,其實是有挑戰(zhàn)的,提高安全等級的通常做法是結(jié)合其他驗證手段、信息一起驗證?!?/p>
為支付寶等金融產(chǎn)品提供身份認(rèn)證服務(wù)的曠視科技也持相似的看法,他們認(rèn)為在單攝解鎖的場景下,他們的技術(shù)“已經(jīng)可以應(yīng)對大部分的攻擊場景”了,因此用于解鎖是夠用的。然而,“到了支付級的安全程度,則需要依賴硬件(攝像頭)的加持”。
而歸根結(jié)底,“場景”才是所有安防服務(wù)的核心要素,陳剛就認(rèn)為要在“用戶可以通過”和“能夠防止攻擊”這兩者之間取得一個平衡。比如在一些不涉及財務(wù)及敏感信息的生活娛樂服務(wù)中,目前的人臉識別技術(shù)已經(jīng)夠用了,但在支付這樣的場景中,多種驗證方式并行也許才能確保用戶的安全。
在實際應(yīng)用中還有很多路要走
不同于各個計算機(jī)視覺領(lǐng)域內(nèi)的創(chuàng)業(yè)公司,微軟亞洲研究院一方面專注于純粹的技術(shù)研究,另一方面也借助自己龐大的業(yè)務(wù)線面向全球的普通用戶率先推出了一些相關(guān)的應(yīng)用嘗試,Windows Hello就是其中一項重要的功能。如果你用過Surface Pro 4這款平板電腦產(chǎn)品,那你一定使用過由Windows Hello所提供的面部識別解鎖功能,不需要手動輸入密碼,只需雙眼平視攝像頭就能在大概一兩秒內(nèi)解鎖電腦。雖然在一些光線條件限制的情況下會出現(xiàn)識別失敗的情況,但總體的使用體驗已經(jīng)基本能滿足用戶的需求了?!霸谏逃秒娔X的使用場景下是一個相當(dāng)牢靠的登錄方式了?!标悇倢Ρ究f道。
但除了“安防”這個人臉識別技術(shù)的天然應(yīng)用場景之外,作為生物特征識別領(lǐng)域的一項分支技術(shù),人臉識別在其他應(yīng)用場景中面臨的競爭還有很多。
事實上,自從蘋果在2013年率先在iPhone 5S上開始使用指紋識別解鎖之后,指紋識別直到今天都還是市場及用戶接受度最高的生物特征識別技術(shù)。此前,由于沒有配備指紋識別功能,羅永浩在2015年底發(fā)布的錘子T2手機(jī)就在市場上招來了很多用戶的不滿。
而從“生物特征識別”這個更大的概念來看,除了指紋識別、人臉識別之外,還包括虹膜識別、聲紋識別以及指靜脈識別等多種細(xì)分技術(shù)。其中,指紋識別、人臉識別和虹膜識別既同屬“圖像識別”,又是目前相對比較成熟的技術(shù),所以他們目前各自在市場上占有一席之地。
盡管三星公司在去年下半年推出的旗艦產(chǎn)品Galaxy Note 7因為爆炸事件掀起了軒然大波,但他們卻是全球第一款使用了虹膜識別技術(shù)的大眾級智能手機(jī)產(chǎn)品,在今年推出的Galaxy S8中,他們繼續(xù)使用了這項技術(shù)。相比其他生物特征識別技術(shù),由于虹膜在胎兒發(fā)育階段形成后,在人的整個生命歷程中基本保持不變,所以這也決定了虹膜識別擁有極為精確的特點。但作為面向用戶的識別方式,因為虹膜識別要求用戶必須睜大眼睛近距離對準(zhǔn)攝像頭,所以它在使用體驗上不夠友好。
鄧亞峰對本刊承認(rèn),如果用戶愿意接受使用條件的約束,“虹膜識別的成功率要比人臉識別更高一些”。但它在識別率已經(jīng)達(dá)到實用要求的情況下一直沒有得到大規(guī)模應(yīng)用的重要原因就是“不夠易用”。曠視科技也認(rèn)為“總體而言,人臉解鎖的速度更快(毫秒級別),體驗更好”。
至于指紋識別,它的優(yōu)缺點相信大家都有自己的體會。而幾乎所有的人臉識別廠商都強(qiáng)調(diào)“非接觸”是人臉識別區(qū)別于指紋識別的一大優(yōu)勢,既有便利性上的提升,同時也是最自然的一種解鎖方式。
但就未來的市場應(yīng)用來看,究竟哪種技術(shù)會成為用戶使用的主流還并不那么確定。
作為手機(jī)行業(yè)的資深觀察者,蔣鴻杰認(rèn)為僅就手機(jī)而言,如果“屏下指紋技術(shù)”能在未來的一兩年之內(nèi)達(dá)到成熟,那它可能會成為更受手機(jī)廠商歡迎的方案,畢竟它一方面符合用戶已有的使用習(xí)慣,同時也滿足了解放屏幕空間的目的。但如果屏下指紋技術(shù)無法在短時間內(nèi)成熟,“那可能大家就都轉(zhuǎn)向3D結(jié)構(gòu)光,把指紋拋棄掉”。而IDC中國研究經(jīng)理金迪則對記者表示,“像人臉識別這樣的生物特征識別技術(shù)肯定會是未來的主流趨勢”,她同時認(rèn)為長遠(yuǎn)來看,肯定會有越來越多的硬件廠商加入人臉識別的行列。
微軟作為更加專注于研究方向的大公司代表則表現(xiàn)得更為謹(jǐn)慎。他們認(rèn)為從目前來看還很難說會有哪一種技術(shù)占據(jù)主導(dǎo)地位,更有可能的一種情況是“多種生物識別技術(shù)的結(jié)合”。
商湯科技聯(lián)合創(chuàng)始人、CEO徐立博士認(rèn)為,推動新的交互方式的重點還是“如何在應(yīng)用場景中定義問題”,“只有搞清楚了每一個應(yīng)用場景下使用人臉識別是否能帶來更好的效果,然后在技術(shù)層面上實現(xiàn)突破,達(dá)到工業(yè)應(yīng)用的紅線,用戶的使用體驗才能獲得平滑的升級”。
而急需解決的最大問題既來自技術(shù)上的持續(xù)提升,更來自整個產(chǎn)業(yè)的探索。但作為一個還處于發(fā)展階段的技術(shù),不同的公司各有自己的想法。
“我更認(rèn)同這樣一種方式,就是要做到垂直領(lǐng)域中,結(jié)合這個領(lǐng)域的情況去解決這個領(lǐng)域的問題,而不只是提供一個標(biāo)準(zhǔn)化的人臉識別技術(shù)?!编噥喎逭f道。作為一家創(chuàng)業(yè)公司,他們覺得自己相比大公司的優(yōu)勢就是可以深耕某一個細(xì)分領(lǐng)域,比較靈活。
徐立給我們舉了一個具體的例子:“例如,它可以用于銀行、餐廳等線下服務(wù)行業(yè),針對前來的顧客進(jìn)行身份識別,當(dāng)遇到VIP客戶時,便可自動激活后續(xù)的定制化服務(wù)機(jī)制,如此一來,VIP客戶將不需要主動出示VIP會員卡,大大增強(qiáng)了用戶的體驗?!?/p>
而微軟這樣的公司則有更開闊的目標(biāo)。除了“更快更準(zhǔn)更安全”的大方向之外,“我們希望我們現(xiàn)在這個AI算法能夠像人一樣去認(rèn)知周圍的世界,然后成為一個對人類有用的工具,它未來能夠幫助這些設(shè)備更智能?!?/p>
評論
查看更多