[ 導(dǎo)讀 ]計算機視覺技術(shù)讓視頻智能化不斷升級,互聯(lián)網(wǎng)應(yīng)用在視頻中運作起來,并讓視頻成為互聯(lián)網(wǎng)應(yīng)用的一個超級入口。
人工智能無疑是2017年互聯(lián)網(wǎng)科技領(lǐng)域最火熱的關(guān)鍵詞,從各方面表現(xiàn)看,人工智能在2017年走向了新的拐點,很大程度上預(yù)示著人工智能的商業(yè)紅利期即將來臨,人工智能在各個領(lǐng)域的應(yīng)用開始爆發(fā)。
在此背景下,作為人工智能(AI)三大領(lǐng)域之一的計算機視覺近期也越來越受到人們的關(guān)注。而計算機視覺作為一種人工智能的基礎(chǔ)技術(shù)應(yīng)用,使用場景多樣,市場潛力巨大。因此在人工智能的牽引下,計算機視覺賦能視頻行業(yè)也走進了智能化的時代。
視頻行業(yè)在進入智能化之前,在互聯(lián)網(wǎng)的影響下,還經(jīng)歷了三個階段的變化:首先第一個階段是傳統(tǒng)視頻時代,還處在以線下的電視、電影作為視頻傳播為主的階段,無法進行交互,也無法自主選擇內(nèi)容;后來進入了互聯(lián)網(wǎng)時代,開始涌出像優(yōu)酷、土豆、愛奇藝等網(wǎng)絡(luò)視頻平臺,用戶通過網(wǎng)絡(luò)在平臺上可以選擇觀看內(nèi)容,這是第二階段;直到2016年直播的迅速爆發(fā),讓視頻行業(yè)進入了第三階段,也就是C2C傳播時代,像斗魚、YY、映客、秒拍這些平臺的特點就是傳播速度快、精準化且碎片化,因為技術(shù)背景是H5的鏈接,所以用戶能夠隨意地去發(fā)送。
那么接下來就是進入了現(xiàn)在的智能化時代,在人臉識別、深度學(xué)習(xí)等猶如雨后春筍一般成為行業(yè)熱詞的背后,技術(shù)導(dǎo)向型新銳公司的不斷涌現(xiàn),計算機視覺技術(shù)升級視頻行業(yè),讓視頻在安防、廣告營銷、新零售等領(lǐng)域全面升級開花,因此我們今天就來盤點,計算機視覺有哪些實際可以應(yīng)用到視頻場景中的技術(shù)呢?
1、應(yīng)用點之一:安防領(lǐng)域
安防領(lǐng)域成為【計算機視覺+視頻】結(jié)合的第一著陸點。這主要源于安防本身的兩大特性:首先,以視頻技術(shù)為核心的安防行業(yè)擁有海量的數(shù)據(jù)來源,可以充分滿足人工智能對于算法模型訓(xùn)練的要求;其次,安防行業(yè)中事前預(yù)防、事中響應(yīng)、事后追查的訴求與人工智能的技術(shù)邏輯完全吻合。
目前【計算機視覺+視頻】在安防領(lǐng)域的應(yīng)用主要還是涉及對人臉、車輛的識別,包括生物特征識別技術(shù)、大數(shù)據(jù)及視頻結(jié)構(gòu)化技術(shù)等。其中,生物特征識別包含了指紋識別、虹膜識別、人臉識別、步態(tài)識別等,前兩個主要應(yīng)用于特定場景的身份認證居多;而關(guān)于視頻結(jié)構(gòu)化技術(shù),目前則主要融合了機器視覺、圖像處理、模式識別、深度學(xué)習(xí)等人工智能技術(shù),這也是視頻內(nèi)容理解的基礎(chǔ)。并且在公安、交通、樓宇、金融、工業(yè)、民用等多個領(lǐng)域都有應(yīng)用場景。
例如,公安行業(yè)用戶的需求是在海量的視頻信息中,發(fā)現(xiàn)犯罪嫌疑人的線索。要實現(xiàn)這個需求,僅僅用攝像頭捕捉到嫌疑人是遠遠不夠的。它需要智能的前端攝像機實時分析視頻內(nèi)容,檢測運動對象,識別人、車等屬性信息;然后需要匯總海量的城市級信息到后端人工智能的中心數(shù)據(jù)庫進行存儲,再利用計算能力及智能分析能力,對嫌疑人的信息進行實時分析,最終給出最可能的線索建議。
從目前市場現(xiàn)狀來看,安防領(lǐng)域巨大的市場規(guī)模和可觀的營收利潤前景,也恰恰使其成為眾多巨頭以及創(chuàng)業(yè)公司的必爭之地,其中傳統(tǒng)巨頭以海康威視、大華股份領(lǐng)銜,積極布局芯片、算法等上游關(guān)鍵技術(shù)領(lǐng)域,一方面也在向下游整合集成商或運營商業(yè)務(wù)延伸。
而在從計算機視覺切入的創(chuàng)業(yè)獨角獸公司有在今年7月完成4.1億美元B輪融資的商湯科技,以及在16年年底完成億級美元C輪融資的曠視科技等企業(yè),都是具有技術(shù)算法優(yōu)勢但較難獨立實現(xiàn)商業(yè)化,前期多通過與傳統(tǒng)巨頭合作的方式實現(xiàn)市場布局。
2、應(yīng)用點之二:新零售
什么是新零售,馬云給出的定義是通過運用大數(shù)據(jù)、人工智能等先進技術(shù)手段,對商品的生產(chǎn)、流通與銷售過程進行升級改造,進而重塑業(yè)態(tài)結(jié)構(gòu)與生態(tài)圈,并對線上服務(wù)、線下體驗以及現(xiàn)代物流進行深度融合的零售新模式。
在各家的解決方案中,被提及最多的是基于卷積神經(jīng)網(wǎng)絡(luò)的視覺識別技術(shù),那么計算機視覺在新零售領(lǐng)域如何與視頻做結(jié)合呢?
即通過深度學(xué)習(xí)教會計算機認識商品,消費者自助購買時,計算機通過店內(nèi)攝像頭識別商品的類別價格,消費可以實現(xiàn)自動扣款,無需消費者人為結(jié)賬。
計算機視覺賦予視頻強大識別技術(shù),為新零售推出完整的解決方案,集成人臉識別分析引擎,驗證用戶身份,引導(dǎo)新用戶進行支付方式綁定及身份/信用信息錄入。同時結(jié)合人臉屬性分析技術(shù),判斷用戶的性別、年齡等信息,生成用戶畫像。追蹤用戶行走的線路,結(jié)合人臉識別技術(shù),收集用戶在貨架前停留時間的長短,識別用戶拿取和放回的行為動作和商品,分析不同用戶的購物傾向和喜好。通過大量用戶圖像行為數(shù)據(jù)的分析,為商家提供商品貨架布局擺放的建議。
比如亞馬遜推出新型概念店Amazon Go,通過AI、深度學(xué)習(xí)等高科技,顧客只需下載Amazon Go的APP,在商店入口掃碼成功后,便可進入商店開始購物。Amazon Go的傳感器會計算顧客有效的購物行為,并在顧客離開商店后,自動根據(jù)顧客的消費情況在亞馬遜賬戶上結(jié)賬收費。其中涉及了計算機視覺、傳感器、深度學(xué)習(xí)等技術(shù),核心在于識別動作、商品和人,通過位置或姿勢進行關(guān)聯(lián),亞馬遜也形象地稱之為“just walk out”技術(shù)。
3、應(yīng)用點之三:視頻營銷
伴隨視頻行業(yè)的發(fā)展及變化,特別是移動視頻的高速增長,互聯(lián)網(wǎng)視頻廣告及營銷的方式也隨之變遷,同時,廣告收入依然是在線視頻行業(yè)收入的中流砥柱。而視頻廣告營銷的逐漸升級,廣告主的投放決策也不再僅僅是蜻蜓點水、浮于表面的簡單植入。那么視頻網(wǎng)站無論從用戶基數(shù)還是增長速度來看,無疑都擁有巨大的想象空間。
在這樣的背景下,產(chǎn)業(yè)鏈相關(guān)企業(yè)開始著眼為廣告主提供更多元的內(nèi)容營銷形式、更高的廣告投放效率以及更精準的廣告投放策略,視頻的商業(yè)價值被進一步挖掘。在這樣的背景下,產(chǎn)業(yè)鏈相關(guān)企業(yè)開始著眼為廣告主提供更多元的內(nèi)容營銷形式、更高的廣告投放效率以及更精準的廣告投放策略,視頻的商業(yè)價值被進一步挖掘。其中,Video++基于人工智能的智能算法,將視頻內(nèi)容具有廣告價值,打造視頻內(nèi)的創(chuàng)意互動形式成為業(yè)內(nèi)新寵。
Video++所打造的消費級視頻對于大多數(shù)人來說是一個陌生的概念,消費級視頻可以指現(xiàn)在視頻類別下的直播、電影、綜藝節(jié)目、電視劇等擁有復(fù)雜場景、經(jīng)過后期大量加工的視頻。隨著互聯(lián)網(wǎng)的發(fā)展壯大,很多產(chǎn)品的數(shù)據(jù)都通過互聯(lián)網(wǎng)和云端進行傳輸和存儲,數(shù)據(jù)量大也使得消費級視頻的商業(yè)價值的潛力變得巨大。視頻本身是一片廣告的藍海,這里面有很多商業(yè)變現(xiàn)方式,在不打擾用戶體驗的同時,加入一些娛樂互動方式,可以讓用戶在參與中完成了一種電商或廣告商業(yè)價值轉(zhuǎn)化。
對于視頻來說內(nèi)容層是最特別的,在內(nèi)容上,AI可以讓機器擁有人的思維,將視頻傳到機器上進行識別分析時,可以識別出明星、物體、品牌、手機、場景等等,使機器像人類一樣理解視頻的內(nèi)容,并發(fā)現(xiàn)其中有趣的點。到了邏輯層和應(yīng)用層,可以用核心組件和視頻應(yīng)用將這些點進行商業(yè)化的變現(xiàn),將機器識別出的結(jié)構(gòu)化數(shù)據(jù)作為投放點,應(yīng)用到廣告和電商的場景中。
今年,Video++與搜狐進行深度合作,Video++為搜狐提供消費級視頻領(lǐng)域的AI辨識技術(shù)服務(wù)、全套視頻結(jié)構(gòu)化數(shù)據(jù)應(yīng)用系統(tǒng),并為其打造整體的視頻AI數(shù)據(jù)應(yīng)用方案,基于視頻AI數(shù)據(jù)的應(yīng)用(元信息篩選、價值權(quán)重函數(shù)檢索等),搜狐與Video+在內(nèi)容營銷產(chǎn)品上進行深度合作,為廣告主提供內(nèi)容營銷解決方案,讓搜狐的各種精彩內(nèi)容得到充分的廣告場景挖掘。
當(dāng)計算機視覺遇到同樣呼聲很高的視頻廣告營銷,技術(shù)與創(chuàng)意完美結(jié)合,連接品牌和用戶,形成多樣式的互動廣告、場景營銷,有了AI的賦能,“視”界將會被顛覆,視頻消費場景將會形成。
4、應(yīng)用點之四:視頻編輯
隨著人工智能的進步,視頻編輯也變得更為輕松,運用AI顯著提升剪輯視頻的效率,也是意義巨大的。
全球知名的數(shù)字媒體編輯軟件供應(yīng)商Adobe,也加入了人工智能的大潮,發(fā)布了旗下首個基于深度學(xué)習(xí)和機器學(xué)習(xí)的底層技術(shù)開發(fā)平臺——Adobe Sensei。能夠自動完成視頻編輯過程,同時還可以讓我們根據(jù)自己的意愿對人工智能的剪輯風(fēng)格進行控制。
系統(tǒng)會自動將所有的鏡頭,包括多個角度拍攝的畫面,按照我們意愿的腳本進行組織,然后還可以根據(jù)需求找到指定的內(nèi)容。這套程序就可以準確的識別出這些剪輯的內(nèi)容,系統(tǒng)利用面部識別和情緒識別系統(tǒng),對每一幀畫面進行分析。在所有的元素都可以被組織之后,系統(tǒng)會按照不同的風(fēng)格和習(xí)慣對視頻進行剪輯和處理,并且對某種風(fēng)格貼上標(biāo)簽。
同樣瞄準運動愛好者和視頻分享者的Graava,則推出智能運動相機和配套的移動端應(yīng)用。該相機內(nèi)置了智能感應(yīng)模塊,可以通過辨別人體心跳頻率來識別出拍攝者激動瞬間,并自動剪輯成視頻片段。而國內(nèi)有一家名叫慧川智能的公司同樣是一個能夠?qū)⒛_本文字快速轉(zhuǎn)化為短視頻的云平臺。在用戶輸入一篇文章、一個鏈接或者一個關(guān)鍵詞后,它將基于人工智能技術(shù),自動搜索合適的圖片及視頻素材,并配以人工智能合成的語音,最后融合成一條短視頻。
總結(jié)
以上總結(jié)了計算機視覺與視頻行業(yè)四大應(yīng)用點,充分表明了計算機視覺技術(shù)讓視頻智能化不斷升級,互聯(lián)網(wǎng)應(yīng)用在視頻中運作起來,并讓視頻成為互聯(lián)網(wǎng)應(yīng)用的一個超級入口。像素的世界已經(jīng)延伸到圖像之外,雖然視頻對于機器學(xué)習(xí)研究人員來說一直都是個挑戰(zhàn),但現(xiàn)在的技術(shù)能夠使得從視頻中提取信息變得跟從圖像中提取信息一樣簡單。人工智能這個新興“工具”的出現(xiàn),為人類加速前往高度智慧化形態(tài)提供能量,重構(gòu)著整個視頻行業(yè)的結(jié)構(gòu)和協(xié)作方式。
-
視頻
+關(guān)注
關(guān)注
6文章
1945瀏覽量
72910 -
智能化
+關(guān)注
關(guān)注
15文章
4884瀏覽量
55377 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1698瀏覽量
45993 -
讓工智能
+關(guān)注
關(guān)注
0文章
1瀏覽量
946
原文標(biāo)題:視頻智能化時代到來,盤點計算機視覺與視頻行業(yè)四大應(yīng)用點
文章出處:【微信號:gh_211d74f707ff,微信公眾號:重慶人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論