人工智能,或稱人工智能,讓我們在自拍時(shí)看起來更好,當(dāng)我們向Alexa詢問天氣情況時(shí),會順從地告訴我們天氣,并推動(dòng)自動(dòng)駕駛汽車的發(fā)展。正是這項(xiàng)技術(shù)使機(jī)器能夠從經(jīng)驗(yàn)中學(xué)習(xí)并執(zhí)行類似于人類的任務(wù)。
作為一個(gè)整體,人工智能包含許多子領(lǐng)域,包括自然語言處理、計(jì)算機(jī)視覺和深度學(xué)習(xí)。大多數(shù)時(shí)候,工作中的具體技術(shù)是機(jī)器學(xué)習(xí),它專注于開發(fā)分析數(shù)據(jù)和做出預(yù)測的算法,并且在很大程度上依賴于人類的監(jiān)督。
SMU信息系統(tǒng)助理教授孫乾茹將訓(xùn)練一個(gè)小規(guī)模的人工智能模型比作教小孩子識別周圍的物體?!耙婚_始一個(gè)孩子不了解他周圍的很多事情。他可能看到一個(gè)蘋果,但不知道它是蘋果,他可能會問,這是香蕉嗎?他的父母會糾正他,不,這不是香蕉。這是一個(gè)蘋果。這樣的反饋在他的大腦中,然后信號微調(diào)他的知識。”
孫教授的研究主要集中在深度卷積神經(jīng)網(wǎng)絡(luò)、元學(xué)習(xí)、增量學(xué)習(xí)、半監(jiān)督學(xué)習(xí)以及它們在圖像和視頻識別中的應(yīng)用。
訓(xùn)練人工智能模型
由于人工智能的復(fù)雜性,孫教授在潛入研究項(xiàng)目之前,先對該領(lǐng)域的一般概念和當(dāng)前趨勢進(jìn)行了探討。
她解釋說,有監(jiān)督的機(jī)器學(xué)習(xí)涉及到模型本身在一個(gè)標(biāo)記的數(shù)據(jù)集上進(jìn)行訓(xùn)練。也就是說,數(shù)據(jù)被標(biāo)記為模型正在構(gòu)建以確定的信息,這些信息甚至可以按照模型應(yīng)該分類為數(shù)據(jù)的方式進(jìn)行分類。例如,一個(gè)設(shè)計(jì)用來識別蘋果的計(jì)算機(jī)視覺模型可能會在一組不同的蘋果圖像上進(jìn)行訓(xùn)練。
給它數(shù)據(jù),數(shù)據(jù)就有標(biāo)簽,她解釋道一張圖片可能包含一個(gè)蘋果,該圖片通過深度人工智能模型進(jìn)行一些預(yù)測。如果預(yù)測是對的,那就沒事了。否則,該模型將得到計(jì)算損失或懲罰,通過反向傳播來修改其參數(shù)。所以模型會不斷更新。
孫教授觀察到,目前最先進(jìn)或性能最好的人工智能模型幾乎都是基于深度學(xué)習(xí)模型的。在深度學(xué)習(xí)中,該模型基于包含許多層的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),從圖像、文本或聲音中學(xué)習(xí)執(zhí)行識別任務(wù)。例如,如果輸入是圖像,則假設(shè)圖像可以由不同的空間尺度或特征層來描述。
孫教授舉例說:“以我的臉為例。區(qū)別于其他人的特征是我的眼睛、鼻子、嘴巴作為局部特征,臉型和膚色作為全局特征。對于識別,我可以用這些特征來表示“這就是我”。對于機(jī)器模型,它在不同的層中對這些局部和全局特征進(jìn)行編碼,從而可以進(jìn)行相同的識別?!?/p>
訓(xùn)練人工智能模型需要大量的數(shù)據(jù)才能準(zhǔn)確識別。她認(rèn)為,如果一個(gè)人工智能模型只有一張人臉圖像,那么它在識別這個(gè)人時(shí)就會出錯(cuò),因?yàn)樗床坏狡渌娌刻卣鳎@些特征正是這個(gè)人區(qū)別于其他人的面部特征外觀有差異,人工智能依賴于高度不同的數(shù)據(jù)集,以便了解圖像的所有差異。
健康促進(jìn)應(yīng)用程序
孫教授正在研究的項(xiàng)目之一是Food AI++,這是新加坡健康促進(jìn)委員會(HPB)的一個(gè)應(yīng)用程序。用戶只需用手機(jī)拍下正在吃的食物的照片,就可以確定食物成分?jǐn)?shù)據(jù)。該應(yīng)用程序的目的是幫助用戶跟蹤所食用食物的營養(yǎng),并利用這些信息實(shí)現(xiàn)健康、均衡的飲食。
孫教授和她的團(tuán)隊(duì)收集用戶用餐時(shí)拍攝的圖像數(shù)據(jù)并上傳到應(yīng)用程序中。觀察發(fā)現(xiàn),食物圖像非常嘈雜和多樣,反映了不同的文化。
例如,新加坡的華人和馬來人有不同的飲食習(xí)慣、飲食風(fēng)格和不同的食物種類,她澄清道當(dāng)我們訓(xùn)練一個(gè)模型時(shí),我們從有限的類別列表開始,但是對于food應(yīng)用程序,我們發(fā)現(xiàn)我們必須在應(yīng)用程序編程接口(API)中一直擴(kuò)展這些類別。我們必須不斷地修改和更新數(shù)據(jù)集。新加坡豐富的文化多樣性是該項(xiàng)目最大的挑戰(zhàn)之一。
除了收集更多不同的數(shù)據(jù)外,該團(tuán)隊(duì)還在研究領(lǐng)域自適應(yīng)學(xué)習(xí)算法。在不同的文化背景下,有不同的領(lǐng)域,因此他們必須考慮如何通過利用有效的學(xué)習(xí)算法,快速調(diào)整他們預(yù)先訓(xùn)練的模型。為了對食物圖像進(jìn)行這種處理,他們需要開發(fā)特定于食物的域自適應(yīng)算法。他們還需要考慮將食品知識包括在內(nèi),以提高多領(lǐng)域模型的整體效率。
“我們希望通過在新領(lǐng)域中使用一個(gè)小數(shù)據(jù)集來進(jìn)行這種調(diào)整。”孫教授說這是一項(xiàng)具有挑戰(zhàn)性的任務(wù),它將使來自不同文化的新加坡用戶受益。
AME的FANN項(xiàng)目
孫教授目前正處于一個(gè)名為“先進(jìn)人工智能系統(tǒng)的快速適應(yīng)神經(jīng)網(wǎng)絡(luò)(FANN)”的三年項(xiàng)目的早期階段。該項(xiàng)目由美國科學(xué)技術(shù)研究局(a*STAR)在其先進(jìn)制造與工程青年個(gè)人研究基金(AME YIRG)下資助,主要研究計(jì)算機(jī)視覺例如圖像處理,圖像識別,或者視頻中的目標(biāo)檢測。計(jì)算機(jī)視覺算法通常依賴于卷積神經(jīng)網(wǎng)絡(luò)(CNNs),這是她的專長領(lǐng)域。
“這項(xiàng)研究的關(guān)鍵假設(shè)是,有可能建立基于統(tǒng)計(jì)水平知識學(xué)習(xí)的模型適應(yīng)推理水平,通過驗(yàn)證這一假設(shè),我們也正在接近高級人工智能系統(tǒng)的目標(biāo),該系統(tǒng)可以為AME領(lǐng)域的應(yīng)用訓(xùn)練具有類人智能的機(jī)器模型?!?/p>
該研究旨在實(shí)現(xiàn)自動(dòng)化視覺檢測的高魯棒性和計(jì)算效率,以及精密制造和先進(jìn)圖像識別技術(shù)之間的交叉知識。孫教授相信,當(dāng)快速適配檢測裝置廣泛應(yīng)用于生產(chǎn)線的設(shè)計(jì)、布局、制造、裝配和測試過程時(shí),研究成果將大大提高成品率,降低制造成本。
編輯:lyn
-
人工智能
+關(guān)注
關(guān)注
1792文章
47372瀏覽量
238857 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1698瀏覽量
46024 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5505瀏覽量
121255 -
自然語言處理
+關(guān)注
關(guān)注
1文章
619瀏覽量
13575
發(fā)布評論請先 登錄
相關(guān)推薦
評論