0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

生活中的AI應(yīng)用:淺談人臉偵測原理及衍伸的倫理議題

jf_cVC5iyAO ? 來源:易心Microbit編程 ? 2023-02-02 11:26 ? 次閱讀

科技爆發(fā)的時代,人工智能(Artificial Intelligence, AI)技術(shù)越來越常出現(xiàn)在我們生活。AI技術(shù)表示能夠讓機器具有類似人類的智慧,可用來提升人們的生活質(zhì)量、工作效率等。以日常生活中常見的攝影機為例,這些攝影機可以組成一套監(jiān)控系統(tǒng),守護我們的安全。受惠于消費電子產(chǎn)品的發(fā)展與低廉的價格,一般民眾也能在自己的家里安裝攝影機,目的通常是為了居家監(jiān)護,觀測是否有人進出畫面、隨時注意家中寶寶的狀態(tài),或者觀看寵物的最新動向。市面上的攝影機產(chǎn)品大多具有人物偵測,甚至是人臉或口鼻偵測等相關(guān)功能。這些功能可以自動判斷畫面中的信息,讓我們得知人物出現(xiàn)的時機,不需要長時間觀看畫面去追尋特定的人物。而當(dāng)我們談到人物偵測時,最廣為人知的方法就是「人臉偵測」(detection),藉由分析人臉的器官部位特征,如:眼睛、鼻子、嘴巴等,可以得知畫面中是否有人臉。另一個進階應(yīng)用為「人臉識別」(recognition),用來辨識人臉的身分為何,此技術(shù)需要事先建立數(shù)據(jù)庫搜集每個人員的臉部特征,因此常引來隱私權(quán)的爭議。本文將探討人臉偵測的原理,并說明可能遇到的潛在問題。

傳統(tǒng)人臉偵測的原理

傳統(tǒng)的人臉偵測做法,需要分析圖片上每一個像素點(pixel)的RGB色彩值,這種作法會花費大量的運算資源與時間。根據(jù)相關(guān)的研究論文,研發(fā)出分析方法的團隊使用哈爾小波轉(zhuǎn)換(Haar wavelet)的概念來設(shè)計一個分析影像特征的方法,稱為哈爾特征(Haar-like feature),藉由搜集人體的身形輪廓特征,可以在圖片上偵測是否有人物出現(xiàn)。

圖一(a)即為舉例說明邊緣線條的哈爾特征。后來團隊擴充此方法,發(fā)展為成臉部偵測的系統(tǒng)。因為人臉輪廓具有一定的規(guī)律性,特別是在眼睛、鼻子、嘴巴區(qū)域,此處的輪廓特征最為明顯。圖一(a)的左半部則為哈爾特征,用來分析畫面中的輪廓是否與已有的輪廓特征方格相近。以圖一(b)的上方為例,就是將特定影像區(qū)域的內(nèi)容與哈爾特征進行分析,計算兩者的相似度。當(dāng)影像內(nèi)容與哈爾特征完全相同時,所得到的相似率為1。然而,實際影像不可能會與哈爾特征完全相同,如圖一(b)的下方。此相似率可以協(xié)助我們評估畫面上的對象是否符合指定特征。

2a8ee50a-a2a2-11ed-bfe3-dac502259ad0.png

圖一:哈爾特征的樣式與計算范例。

藉由收集相關(guān)的特征數(shù)據(jù),能夠建立一個數(shù)據(jù)庫來描述人臉的特征,進一步讓計算機判斷是否有人臉出現(xiàn)在畫面上。以鼻子為例,鼻翼四周的輪廓就是一個很明顯的臉部特征。

然而,當(dāng)計算機進行分析時,就需要計算指定圖片區(qū)域的像素點數(shù)值,這個計算量往往相當(dāng)龐大。以圖一的為例,當(dāng)我們計算4×4的圖片區(qū)域時,里面一共有16個像素點,若要計算該區(qū)域的數(shù)值總和時,直覺的做法是將這16個點加在一起。此方法雖然簡單,但圖片尺寸變大、需要分析的特征變多時,會消耗大量的運算資源與時間。因此,研究人員進一步提出一系列的方法來縮短整體流程,首先是積分圖(integral image),此方法會在起始階段掃描整張圖片并計算每個像素點的累加值?;氐较惹暗睦雍螅嬎銏D片區(qū)域的數(shù)值總和時,只需要計算4個像素點的信息。以圖二為例,當(dāng)我們想要計算灰色區(qū)域的數(shù)字總和時,直覺做法為將6個像素點的數(shù)值累加起來。而積分圖的做法是先建立一個像素點的累加值,然后再選取鄰近四個像素點的數(shù)值進行運算,如圖二積分圖中被粗框框起來的數(shù)值。此作法可以大幅度降低運算成本,不論計算的范圍有多大,只需要4個數(shù)值的運算即可得到區(qū)域的總和。

2ac33544-a2a2-11ed-bfe3-dac502259ad0.png

圖二:積分圖例子。

后續(xù)的研究還有結(jié)合自適應(yīng)增強(adaptive boosting, AdaBoost)與串接(cascade)技術(shù),判斷畫面上是否有特定的臉部器官,若有符合條件(如:發(fā)現(xiàn)鼻子)才會進行后續(xù)的分析。此流程的執(zhí)行速度能夠在一秒鐘處理15張圖片(frame per second, FPS),可用于實時的對象偵測。這個技術(shù)被廣泛用在現(xiàn)有的人臉偵測系統(tǒng),網(wǎng)絡(luò)上也有許多教學(xué)供有興趣的人去研究使用。

灰階加速運算,卻產(chǎn)生公平性爭議

值得注意的是,這些人臉偵測的系統(tǒng)都會把彩色圖片轉(zhuǎn)換成灰階(grayscale)樣式,研究人員也有特別說明這一點,這套快速的偵測系統(tǒng)僅適用于灰階的圖片。在人類眼中,我們能夠看到各式各樣的色彩。對計算機來說,也常使用RGB色彩空間來定義顏色,一張彩色的圖片可以用RGB三個通道來描述內(nèi)容。以一個像素點來說,它的顏色一共有255×255×255(約1658萬)種組合。如果采用灰階的色彩空間,一個像素點只有255種組合。當(dāng)計算機在分析圖片的時候,使用灰階圖片可以降低大量的運算資源并縮減時間。此外,灰階的程序代碼復(fù)雜度也較低,如果一開始使用彩色空間進行輪廓分析,需要考慮各種信息,如:亮度、色差??等,將這些信息納入分析之后,整體執(zhí)行效率往往比灰階圖片還要慢。基于效率的需求,大多辨識系統(tǒng)的流程都會先將彩色照片轉(zhuǎn)換為灰階照片,期望能夠快速地獲得結(jié)果。

然而,這種做法會遇到一些潛在的問題,膚色淺的人種在此系統(tǒng)中會有較好的辨識效果,膚色深的人種會不易被辨識,由于人權(quán)意識的興起,AI技術(shù)的公平性也常受到檢視?;仡櫹惹疤岬降臄?shù)據(jù)處理流程,他們會先將彩色照片轉(zhuǎn)換為灰階照片,然后再分析灰階照片上的輪廓特征,檢查是否有特定輪廓的信息。以圖三為例,有3種不同膚色的人臉示意圖,當(dāng)轉(zhuǎn)換成灰階照片后,可以發(fā)現(xiàn)膚色深的輪廓較不明顯。根據(jù)后續(xù)的研究數(shù)據(jù)顯示,研究人員將搜集的皮膚顏色數(shù)據(jù)集大致分為3種類型:淡色皮膚、棕黃皮膚、深色皮膚。圖三的人臉圖片參考所統(tǒng)計的皮膚色碼,然后使用臉部偵測來觀察各自的辨識效果。

2af4c7b2-a2a2-11ed-bfe3-dac502259ad0.png

圖三:不同膚色的臉部偵測流程。

這3張圖片都屬于人臉,唯一的差別只是膚色不同,理論上應(yīng)該都能夠被偵測到。當(dāng)這3張圖片轉(zhuǎn)換成灰階照片后,我們觀察鼻子附近的輪廓,可以發(fā)現(xiàn)深色皮膚的鼻子輪廓較不明顯。這些照片套用先前提到的哈爾特征計算方式,即黑色區(qū)域與白色區(qū)域的數(shù)值相減,淺色皮膚的照片會得到較高的相似率,而深色皮膚會得到較低的相似率。從上面的例子可以得知,膚色淺的人種在此模型中會有較好的辨識效果,而膚色深的人種會不易被辨識。其背后原因和跟運算流程有關(guān),因為將彩色圖片轉(zhuǎn)成灰階圖片可以大幅縮減運算時間,但對于不同膚色的人種會有不同的偵測結(jié)果。對當(dāng)初的開發(fā)者來說,他們僅是想要提出一套快速的偵測方法,但此方法間接產(chǎn)生公平性的議題,這個影響也是始料未及。

對象偵測技術(shù)YOLO的發(fā)展與爭議

除了人臉偵測的技術(shù)以外,對象偵測(object detection)技術(shù)在計算機視覺(computer vision, CV)研究領(lǐng)域也受到許多注目,因為攝影機的畫面通常包含許多信息,如:寵物、車輛等,對象偵測可以自動分析畫面中的對象種類。以YOLO(You Only Look Once)為例,此方法直接將整張原始(彩色)圖片輸入至卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)進行分析,并且依靠圖像處理器(graphicsprocessing unit, GPU)的運算能力,一秒鐘可以處理45張圖片,表示已能夠進行實時對象偵測。YOLO發(fā)表之后受到許多人的關(guān)注,累積至2021年10月的論文引用數(shù)已高達1萬9千多次。YOLO的作者后來發(fā)表YOLOv2與YOLOv3的研究,提供更快速、更精準、可識別更多對象的能力,并且開放原始碼讓有興趣的研究團隊可以研究他們技術(shù)。

然而,YOLO的作者雷德蒙(Joseph Redmon)在2020年于個人twitter發(fā)表了一段令人震撼的宣言:

I stopped doing CV research because I sawthe impact my work was having. I loved the work but the military applicationsand privacy concerns eventually became impossible to ignore.

雷德蒙表示雖然個人很熱愛計算機視覺的研究,但發(fā)現(xiàn)到其研究成果在很多領(lǐng)域產(chǎn)生影響,特別是軍事應(yīng)用與個人隱私的問題,這些倫理議題是無法忽略的,因此選擇離開計算機視覺的研究,讓其他人繼續(xù)接手相關(guān)研究。YOLO官網(wǎng)后來仍發(fā)布新版的YOLOv4的信息,作者就不再出現(xiàn)雷德蒙的名字,取而代之是原本的程序代碼維護者。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機
    +關(guān)注

    關(guān)注

    19

    文章

    7519

    瀏覽量

    88215
  • RGB
    RGB
    +關(guān)注

    關(guān)注

    4

    文章

    799

    瀏覽量

    58574
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31133

    瀏覽量

    269470
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47425

    瀏覽量

    238962

原文標(biāo)題:生活中的AI應(yīng)用:淺談人臉偵測原理及衍伸的倫理議題

文章出處:【微信號:易心Microbit編程,微信公眾號:易心Microbit編程】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    平衡創(chuàng)新與倫理AI時代的隱私保護和算法公平

    在人工智能技術(shù)飛速發(fā)展的今天,它不僅帶來了前所未有的便利和效率,也暴露出了一系列倫理和隱私問題。從數(shù)據(jù)隱私侵犯到“信息繭房”的形成,再到“大數(shù)據(jù)殺熟”、AI歧視和深度偽造技術(shù)的威脅,AI的應(yīng)用似乎
    發(fā)表于 07-16 15:07

    淺談人臉識別”的突破和創(chuàng)新

    `淺談人臉識別”的突破和創(chuàng)新 近年來,安防行業(yè)掀起了一波人臉識別的浪潮,眾多廠商紛紛推出了相關(guān)產(chǎn)品,瞬間,人臉識別成為了行業(yè)內(nèi)的熱點技術(shù)方向。在2014年
    發(fā)表于 08-26 12:44

    安防業(yè)再現(xiàn)人工智能風(fēng)波之真假AI人形檢測

    ,支持攝像機在識別人形后,抓拍對應(yīng)的人臉照片,并支持人臉信息上報,存儲人臉對應(yīng)錄像,并支持根據(jù)人臉查詢錄像信息。2.移動追蹤云臺類產(chǎn)品支持基于人形檢測的智能功能-移動跟蹤,算法能智能識
    發(fā)表于 07-31 11:03

    什么是艾芯智能人臉識別門鎖解決方案?

    隨著人工智能(AI)在家庭場景應(yīng)用與普及,智能鎖逐漸成為智能家居不可或缺的“門面擔(dān)當(dāng)”,安全防盜、便利生活成為住戶選購智能門鎖的重要指標(biāo)。對比密碼、指紋等識別方式,人臉識別門鎖的不可
    發(fā)表于 09-11 11:52

    AI技能解析】人臉識別是怎么做到的?

    上映后不久,經(jīng)過無數(shù)研發(fā)人員的不懈努力,國內(nèi)外都已研發(fā)出了可以和電影場景媲美的人臉識別技術(shù),并已經(jīng)在工控安防、消費、***辦案等領(lǐng)域中廣泛應(yīng)用。尤其是與我們生活息息相關(guān)的支付平臺-阿里巴巴的支付寶,在
    發(fā)表于 03-16 11:25

    【HarmonyOS HiSpark AI Camera】活體人臉檢測

    項目名稱:活體人臉檢測試用計劃:理由:和同學(xué)在研究人臉檢測的具體落地,希望能基于AI Camera基于鴻蒙實現(xiàn)相關(guān)算法邏輯計劃:和同學(xué)合作,分別展開算法研究,開發(fā)版學(xué)習(xí)以及具體項目落地工作預(yù)期成果:能夠成功識別
    發(fā)表于 11-18 17:48

    【開發(fā)教程14】AI語音人臉識別(會議記錄儀-人臉打卡機)-AI人臉系統(tǒng)架構(gòu)

    CC3200AI實驗教程——瘋殼·開發(fā)板系列AI人臉系統(tǒng)架構(gòu)AI人臉識別系統(tǒng)由7大塊組成,分別是攝像頭、CC3200、串口調(diào)試助手、路由器、
    發(fā)表于 06-10 14:32

    【開發(fā)教程17】AI語音人臉識別(會議記錄儀-人臉打卡機)-AI人臉注冊認證與識別

    注意路由器名稱長度和密碼的長度以及加密類型都要修改。 圖1.0.1 路由器相關(guān)信息 圖1 在AI人臉識別系統(tǒng)需要有上層服務(wù)器,CC3200通過TCP與上層的服務(wù)器建立連接關(guān)系,通過這一鏈路來實現(xiàn)
    發(fā)表于 06-15 19:17

    【開發(fā)教程14】瘋殼·AI語音人臉識別(會議記錄儀-人臉打卡機)-AI人臉系統(tǒng)架構(gòu)

    CC3200AI實驗教程——瘋殼·開發(fā)板系列AI人臉系統(tǒng)架構(gòu)AI人臉識別系統(tǒng)由7大塊組成,分別是攝像頭、CC3200、串口調(diào)試助手、路由器、
    發(fā)表于 08-01 18:09

    【開發(fā)教程17】瘋殼·AI語音人臉識別(會議記錄儀-人臉打卡機)-AI人臉注冊認證與識別

    成需要注意路由器名稱長度和密碼的長度以及加密類型都要修改。 圖1.0.1 路由器相關(guān)信息 圖1 在AI人臉識別系統(tǒng)需要有上層服務(wù)器,CC3200通過TCP與上層的服務(wù)器建立連接關(guān)系,通過這一鏈路來
    發(fā)表于 08-02 15:23

    【CC3200AI實驗教程14】瘋殼·AI語音人臉識別-AI人臉系統(tǒng)架構(gòu)

    CC3200AI實驗教程——瘋殼·開發(fā)板系列AI人臉系統(tǒng)架構(gòu)AI人臉識別系統(tǒng)由7大塊組成,分別是攝像頭、CC3200、串口調(diào)試助手、路由器、
    發(fā)表于 08-31 16:35

    【CC3200AI實驗教程17】瘋殼·AI語音人臉識別-AI人臉注冊認證與識別

    注意路由器名稱長度和密碼的長度以及加密類型都要修改。 圖1.0.1 路由器相關(guān)信息 圖1 在AI人臉識別系統(tǒng)需要有上層服務(wù)器,CC3200通過TCP與上層的服務(wù)器建立連接關(guān)系,通過這一鏈路來實現(xiàn)數(shù)據(jù)包
    發(fā)表于 09-01 17:34

    人臉識別在日常生活的應(yīng)用

    隨著互聯(lián)網(wǎng)技術(shù)的日益發(fā)展,人臉識別應(yīng)用的領(lǐng)域越來越寬廣,在日常生活你都在哪些地方有看到過人臉識別應(yīng)用?下面就一起了解下關(guān)于人臉識別應(yīng)用的一
    發(fā)表于 09-18 15:59 ?8842次閱讀

    人臉識別是AI技術(shù)落地的濫用?

    疫情后,“AI+”成為時代主旋律。然而,在隱秘的角落,由AI所引發(fā)的安全風(fēng)險和“黑灰產(chǎn)”問題正與日俱增。尤其是人臉識別,作為 AI 技術(shù)落地最廣泛的場景之一,所面臨的安全、
    發(fā)表于 01-06 11:05 ?959次閱讀

    AI大模型的倫理與社會影響

    AI大模型的倫理與社會影響是一個復(fù)雜且多維度的話題,以下是對其倫理與社會影響的分析: 一、倫理挑戰(zhàn) 數(shù)據(jù)隱私與安全性 AI大模型學(xué)習(xí)通常依賴
    的頭像 發(fā)表于 10-23 15:13 ?524次閱讀