2018年12月4日,第五屆中國IoT大會在深圳成功舉辦,會議同期的人工智能論壇上,來自太古計算機、嘉楠科技、宇泛智能、云天勵飛和清華大學的領導專家,分別從不同視角對人工智能存在的技術挑戰(zhàn)和如何進行應用落地進行了深入的探討。
陳偉:智能AI行為分析帶來的機遇
圖|太古計算機總經理陳偉
在此次論壇上,太古計算機總經理陳偉介紹到,行為監(jiān)控是一款能識別到人的異常動作行為后預警的智能監(jiān)控,比如:當場景下有人打架,傳統(tǒng)監(jiān)控下如果保安發(fā)現(xiàn)了有人打架才知道有人在打架,而行為監(jiān)控則能自己檢測出來打架動作并預警給值班人員。
什么是預警?就是把系統(tǒng)檢測到的正在打架的視頻畫面彈屏顯示在大屏幕上,還能標記正在打架的人。如果監(jiān)控室沒人值班,它還能將信息發(fā)送到手機APP上。另外AI智能行為監(jiān)控,還可以同時監(jiān)控幾百人,對于監(jiān)控人員和管理者來說,既省時省力又高效。
陳偉說,“傳統(tǒng)的監(jiān)控系統(tǒng),如果沒有監(jiān)控中心專人值班,基本上等于擺設,只能起到一定的威懾作用和事后視頻取證的作用。而如果有專人值班的情況,往往又是項目比較大,監(jiān)控畫面比較多,必須設專門的監(jiān)控中心,那么,值班人員面對幾十上百個甚至幾百個監(jiān)控畫面,他們也想看完所有的監(jiān)控畫面,但是有心無力,根本不可能關注到所有畫面,等于還是起不到值班的作用。
在AI智能行為監(jiān)控系統(tǒng)的核心設備中,主要只有三種:前端行為采集攝像機,機房錄像存儲NVR,機房行為預警服務器。而傳統(tǒng)的綜合平臺、上墻高清解碼器、流媒體服務器、網絡鍵盤等類似這類的控制設備,在AI智能行為監(jiān)控系統(tǒng)架構中是完全可以不用的,系統(tǒng)的自動檢測和自動彈屏預警,完全替代了人眼查看和人工調度。”可見AI智能行為監(jiān)控的必要性。
在談到AI智能行為監(jiān)控系統(tǒng)的應用場所時,陳偉介紹說,“其主要功能是增加了對視頻中的人的動作的識別,達到了提前預警的目的。它可以廣泛應用與社會治安、小區(qū)、工廠、酒店、學校、醫(yī)院、養(yǎng)老機構、公園、廣場、旅游區(qū)、監(jiān)獄、客運公交、地鐵、機場、海關、施工工地等領域。
但是,由于每套AI智能行為監(jiān)控系統(tǒng),都需要一臺服務器,相對來說,小型店鋪、家庭等監(jiān)控點數(shù)量較少的場所,成本會提高,這類小型項目慎用?!?/p>
圖|嘉楠科技AI首席技術專家黃銳
在發(fā)表主題演講的時候嘉楠科技AI首席技術專家黃銳表示,嵌入式AI開發(fā)難度與準入門檻高,開發(fā)難度大。而傳統(tǒng)AI解決方案成本高,功耗不占優(yōu)勢。嵌入式AI市場面臨全新的挑戰(zhàn)與機遇。
在談到目前市場有什么痛點或挑戰(zhàn)時,黃銳主要講到四點,一是準入門檻高,傳統(tǒng)人工智能解決方案成本高,開發(fā)難度大,小廠商準入門檻高,市場上現(xiàn)有芯片昂貴;二是系統(tǒng)龐大復雜,傳統(tǒng)人工智能系統(tǒng)龐大、功耗高、電路復雜,難以應用到IoT市場;三是資料與信息封閉,各家的AI芯片資料封閉,普通開發(fā)者難以獲取信息,難以參與開發(fā),對開源社區(qū)不友好;四是芯片買不到,“PPT芯片”過多,很多芯片只能看到宣傳資料,但是卻沒有渠道采購。
在此次論壇上,黃銳還重推了一款AI芯片解決方案-勘智K210,勘智K210是一顆面向邊緣計算的SoC勘物探智,具有機器視覺與機器聽覺的雙重能力。黃銳介紹說,“讓物聯(lián)網外設能看懂這個世界,并且傾聽我們的聲音是勘智團隊的目標。當機器視覺與機器聽覺成功整合到一般的電器設備上后,將會賦予電器更高級的交互能力并提升交互體驗。這是神經網絡硬件落地的一種最快方式,賦予物聯(lián)網節(jié)點邊緣智能。”
K210具有幾大功能,一是K210具備對全卷積神經網絡的處理能力,可勝任60fps的多目標檢測任務,包括并不限于檢測圖像中的人臉。二是K210可以識別目標的特征,從而對目標進行區(qū)分,例如人臉身份識別。三是K210支持麥克風陣列處理加速,可以確定聲音來源方向。例如聲學相機。四是K210支持3D空間中的聲場成像,類似于聲音雷達,可以將K210聽到的聲場情況顯示在屏幕上。五是K210支持特定人與非特定人的離線語音識別,無需聯(lián)網。
另外在主題演講的時候,黃銳還介紹到了開發(fā)板和應用案例,如60幀每秒-實時同時跟蹤多張人臉,人臉關鍵點檢測等等。
蘇亮亮:人臉識別產品落地路徑
圖|宇泛智能COO蘇亮亮
在此次論壇上,宇泛智能COO蘇亮亮介紹到,宇泛智能(Uni-Ubi)成立于2014年3月,是一家集算法、智能硬件、PAAS平臺、大數(shù)據(jù)平臺于一體的物聯(lián)網智能視覺解決方案供應商,可提供完整的AIOT平臺以及垂直應用。
據(jù)蘇亮亮介紹,宇泛智能從2015年3月起,基于深度學習的人臉識別技術開始在世界嶄露頭角,后續(xù)推出Uface??品牌,在泛安防領域已廣泛應用。宇泛智能主做兩大業(yè)務,一是Uface人臉識別相關的技術、產品、方案,二是Hunter視頻結構化相關的技術、產品、方案。
蘇亮亮認為,現(xiàn)階段,優(yōu)秀產品對硬件、算法、應用的強依賴,在硬件上,宇泛智能具有產品迭代領先優(yōu)勢,成本優(yōu)勢、靈活優(yōu)勢、深入服務定制的優(yōu)勢;在算法上,宇泛智能具有特定場景特定算法,特定優(yōu)化,比如工地和學校算法模型不同,大庫需要本地與云端結合比對;在應用上,工程方面的優(yōu)化,持續(xù)打磨,豐富的功能和接口。
最后,蘇亮亮還介紹了宇泛智能新一代開放平臺,包括開放硬件、開放算法、EtherSDK(SDK集成度高,諸多工程方面優(yōu)化)、AIOT(包含設備管理平臺和算法服務)、輕量級解決方案(包含人員管理、權限管理,本地和云端比對自由切換)。
劉子威:人工智能技術在美容領域的實踐
圖|和而泰智能數(shù)據(jù)與人工智能實驗室總監(jiān)劉子威
在會議上,和而泰智能數(shù)據(jù)與人工智能實驗室總監(jiān)劉子威首先談到的是,國內美容市場的情況,他說,目前國內美業(yè)市場規(guī)模已超一萬億,實體門店已超二百萬,中國女性月均美容消費能力為100-500元,男性對美容行業(yè)關注度也日益增長,男女性對美容行業(yè)關注度的人群比例為1:8。
美業(yè)大致可分為四類,包括美發(fā)、美容美體、美甲美睫、醫(yī)療美容,據(jù)劉子威介紹,“四美”市場規(guī)模預計為1.12萬億元,較去年整體年增速15%,而這部分還沒包括屬于制造業(yè)的化妝品護膚品的銷售。
劉子威認為,過去,美業(yè)提供的服務屬于典型的“非標”,難以規(guī)?;?,從業(yè)人員普遍的文化水平較低,專業(yè)能力不高;未來,在“消費升級”和“產業(yè)升級”的雙重驅動下,產業(yè)格局正在發(fā)生巨大的變化。
針對上述問題,和而泰從智慧門店切入,推出輕量級AI拍照測膚方案和基于知識圖譜的護膚推薦方案。劉子威介紹到,AI拍照測膚、AR彩妝已經在美容院、化妝品門店得到應用,并且他們正在嘗試將AI拍照測膚方案,用在百果園門店。
關于知識圖譜的護膚推薦方案,劉子威認為需要以用戶為中心,根據(jù)場景將多領域知識共通。包括護膚知識圖譜、美妝知識圖譜、飲食知識圖譜、睡眠知識圖譜。此外,還可基于美容知識圖譜及對話技術,構建護膚問答機器人,用戶可以通過APP提問,從而獲得美容護膚方案。
王軍:AI城市大腦城市發(fā)展芯動力
圖|云天勵飛首席方案總監(jiān)王軍
在此次論壇上,云天勵飛首席方案總監(jiān)王軍重點介紹了“深目”,這是一套全球最大的動態(tài)人像識別系統(tǒng),并例舉了三大成功案例,一是“深目”在嫌疑人搜索和身份落地中起了關鍵作用,為案件偵破贏得了寶貴時間;
二是天圖案-AI黑科技一網打盡自行車盜竊,全案共打掉團伙13個,抓獲犯罪嫌疑人318名,全區(qū)此類警情同比下降32.55%;三是行人闖紅燈抓拍取證系統(tǒng),深圳交警2017年4月上線首套云天“深目”行人闖紅燈取證系統(tǒng)以來,有效規(guī)范了行人出行習慣,減少了交通事故的發(fā)生。
王軍告訴大家,云天勵飛通過“五位一體”模式做AI,包括自研視覺芯片、人像大數(shù)據(jù)、精準算法、實戰(zhàn)應用、專業(yè)服務體系。王軍認為,做AI需要從實戰(zhàn)中來,到實戰(zhàn)中去,以系統(tǒng)了解行業(yè)需求,以芯片解決場景痛點,以服務賦能全行業(yè)。
如何構建以人為本的AI城市大腦,從應用層面來講,王軍介紹了云天勵飛的三大應用場景,AI+新警務、AI+新治理、AI+新零售。
AI+新警務:構建城市安全盾牌
AI+新治理:打造2公里智慧生活圈
AI+新零售:從萬貨商店到每個人的商店
王軍表示,未來,AI將在賦能百業(yè),實現(xiàn)物理世界的信息結構化。
鄧志東:計算機視覺和深度學習現(xiàn)狀和未來
圖|清華大學教授鄧志東
在此次人工智能論壇上,清華大學教授鄧志東主要分享了兩部分內容,一是深度學習賦能的計算機視覺;二是探索具有認知理解能力的人工智能視覺。所有分享內容重點經鄧教授總結如下:
無論是單目/雙目/紅外攝像機,還是激光雷達/毫米波雷達成像,感知問題大多可歸結為場景或目標的計算機視覺問題;
在大數(shù)據(jù)和超強計算能力的支撐下,基于深度學習的計算機視覺更加接近于人的視覺感知能力;
開放環(huán)境下不存在完備大數(shù)據(jù),但須盡可能多地運用標簽大數(shù)據(jù),并且還要考慮到數(shù)據(jù)與性能的長尾效應,因此產業(yè)應用中亟需發(fā)展基于小樣本的深度學習視覺方法;
須突破多模態(tài)視覺融合技術,進一步增強視覺感知的用戶體驗;
大數(shù)據(jù)人工智能視覺尚缺乏認知理解能力,已成為目前人工智能前沿探索中面臨的一個重大技術挑戰(zhàn);
結合具有自主學習能力的概率圖模型或知識圖譜,發(fā)展具有認知理解能力的計算機視覺技術,可望成為人工智能技術與產業(yè)的核心賦能力量;
輕量化、低功耗、低成本人工智能必將成為發(fā)展智能物聯(lián)網的基礎。
更多相關報道,請持續(xù)關注電子發(fā)燒友網站(elecfans.com)和官網微信公眾號電子發(fā)燒友觀察(ID:elecfanscom),感謝支持!
-
人工智能
+關注
關注
1792文章
47482瀏覽量
239162 -
云天勵飛
+關注
關注
0文章
131瀏覽量
11308 -
2018IOT
+關注
關注
2文章
23瀏覽量
5914
發(fā)布評論請先 登錄
相關推薦
評論