炸雞可樂蛋撻,燒烤火鍋奶茶,游戲番劇代碼,夕陽西下,阿宅癱在沙發(fā)。面對(duì)高強(qiáng)度工作負(fù)荷帶來的久坐、各種舌尖上的誘惑,以及一系列可以窩在沙發(fā)里進(jìn)行的娛樂項(xiàng)目,肥胖在當(dāng)代逐漸成了一個(gè)可以當(dāng)作“?!眮碚?wù)摰膯栴}。一首《卡路里》展開持續(xù)洗腦式轟炸的同時(shí),AI也一直在不斷嘗試對(duì)肥胖這一難題“下手”,試圖從更多層面加以挖掘與解釋。
根據(jù)2018年8月31日在線發(fā)表于JAMA Network Open的一項(xiàng)研究顯示(https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2698635),卷積神經(jīng)網(wǎng)絡(luò)(CNN)可從衛(wèi)星圖像中自動(dòng)提取建筑環(huán)境的特質(zhì),并用于健康指標(biāo)研究。而了解建筑環(huán)境的某些特征與肥胖癥患病率之間關(guān)聯(lián),則有助于引導(dǎo)環(huán)境結(jié)構(gòu)上的變化,從而達(dá)到促進(jìn)運(yùn)動(dòng)、降低肥胖率的作用。
全球疾病負(fù)擔(dān)報(bào)告表明,2015年全球約有超過6.03億成年人在遭受肥胖問題的困擾;在美國,成年肥胖人口更是占據(jù)成年總?cè)丝跀?shù)的三分之一。肥胖是一個(gè)復(fù)雜的健康問題,其間涉及的關(guān)聯(lián)因素頗多,包括遺傳學(xué)、人口統(tǒng)計(jì)學(xué),以及行為學(xué)的影響。而不健康的飲食習(xí)慣和久坐不動(dòng)的生活方式則都與所處的社會(huì)環(huán)境特質(zhì)及建筑環(huán)境特征密切相關(guān),環(huán)境可以通過其間的步行方便程度、土地使用、占地面積、住宅區(qū)、可用資源(活動(dòng)及娛樂場(chǎng)所、餐飲店等)、貧困等級(jí)、安全感以及社區(qū)設(shè)計(jì)方案等來影響人們的健康,例如靠近自然空間或是人行道的建筑設(shè)計(jì)能夠在增加運(yùn)動(dòng)量的同時(shí)促進(jìn)定期活動(dòng),這一特征在城市中尤為明顯。
一直以來,關(guān)于肥胖問題和建筑環(huán)境間這二者間關(guān)聯(lián)的討論并不鮮見,但盡管如此,研究人員仍在研究過程中注意到了一些不一致的結(jié)果,造成這些不一致的原因可能是測(cè)量方法和測(cè)量工具的跨研究變化所導(dǎo)致的評(píng)估及比對(duì)困難。此外,相關(guān)指標(biāo)的測(cè)量過程可能代價(jià)高昂、耗時(shí)巨大,并且易受人的主觀思維模式影響。因此,研究人員需要發(fā)掘一種一致性的測(cè)量方式,以實(shí)現(xiàn)跨研究比較。評(píng)估并量化建筑環(huán)境與肥胖間的關(guān)系有助于人們?cè)谏鐓^(qū)基礎(chǔ)上對(duì)相應(yīng)健康問題加以適當(dāng)?shù)母深A(yù)與防范。
對(duì)此,來自華盛頓大學(xué)的研究人員結(jié)合人工智能技術(shù),提出了一種全面評(píng)估法,其中包含使用預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)(一種深度學(xué)習(xí)法)從高分辨率衛(wèi)星圖像中提取鄰域的物理特征。事實(shí)上,類似的研究方法早在此前便受到了研究人員的關(guān)注。Nguyen QC等人2018年3月刊載于《JECH (Journal of Epidemiology and Community Health)》雜志的論文中,便提到了通過卷積神經(jīng)網(wǎng)絡(luò)對(duì)Google街景中的建筑環(huán)境圖像進(jìn)行分類,并借以評(píng)估肥胖與人行道、建筑類型、街道綠化(或景觀美化)這三者間的關(guān)系。只是彼時(shí)的研究未能充分利用卷積神經(jīng)網(wǎng)絡(luò)獨(dú)立發(fā)現(xiàn)關(guān)聯(lián)因素的能力,僅局限于預(yù)設(shè)的三大變量。相較之下,此次華盛頓大學(xué)發(fā)布的最新論文則全面評(píng)估了建筑環(huán)境中的變量因素,并依據(jù)美國四個(gè)區(qū)人口普查肥胖率的細(xì)粒度關(guān)聯(lián)進(jìn)行方法論證。研究中所采用的方法皆可擴(kuò)展,且都基于公開可用的數(shù)據(jù)與計(jì)算工具,可實(shí)現(xiàn)跨研究可比性。
▌研究方法
肥胖癥患病率數(shù)據(jù)分析
數(shù)據(jù)來源:選取美國疾病防控中心“500 Cities”項(xiàng)目中的2014年度人口普查肥胖率粗略估值
分析方法:包含兩個(gè)步驟。首先,利用卷積神經(jīng)網(wǎng)絡(luò)以及提取處理的POI(興趣點(diǎn))數(shù)據(jù)來處理衛(wèi)星圖像,以抓取建筑環(huán)境特征。隨后,利用彈性網(wǎng)絡(luò)回歸建立一個(gè)簡約模型來評(píng)估建筑環(huán)境與肥胖率之間的關(guān)聯(lián)性。
獲取衛(wèi)星圖像和POI數(shù)據(jù)
在設(shè)置好地理中心、圖片尺寸(400*400像素)和縮放級(jí)別(縮放系數(shù)18)的情況下,從Google Static Maps API下載圖像。將每個(gè)城市的地理范圍劃分為方形網(wǎng)格,其中每個(gè)點(diǎn)對(duì)應(yīng)一對(duì)緯度和經(jīng)度值,網(wǎng)格間距約150米。同時(shí),利用人口普查區(qū)地圖文件將每個(gè)圖像與其對(duì)應(yīng)的人口普查區(qū)相關(guān)聯(lián),排除城市范圍外區(qū)域的圖像。使用相同的方形網(wǎng)格來選取地理位置,并在適當(dāng)?shù)木嚯x內(nèi)開啟徑向附近搜索,以此實(shí)現(xiàn)在Google Places of Interest API上下載POI數(shù)據(jù)(此處不包含城市范圍外的興趣點(diǎn))。該研究采集了96個(gè)獨(dú)有的POI類別,并計(jì)算了每個(gè)人口普查區(qū)對(duì)應(yīng)到每個(gè)相關(guān)類別下的位置數(shù)量。
圖像處理
如今,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)在關(guān)鍵的計(jì)算機(jī)視覺任務(wù)(如目標(biāo)識(shí)別、圖像分割)、健康相關(guān)的應(yīng)用(如識(shí)別皮膚癌),以及貧困預(yù)測(cè)等領(lǐng)域的大數(shù)據(jù)集方面取得了突破性的成就。由于缺乏用于對(duì)高肥胖地區(qū)和低肥胖地區(qū)進(jìn)行分類的大型標(biāo)注數(shù)據(jù)集,研究人員采用了遷移學(xué)習(xí)(Transfer Learning)法,其中涉及使用預(yù)訓(xùn)練網(wǎng)絡(luò)從包含近150000個(gè)衛(wèi)星圖像的未標(biāo)注數(shù)據(jù)集中提取建筑環(huán)境特征。遷移學(xué)習(xí)包括微調(diào)預(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)以完成新任務(wù)(修改輸出層)或?qū)㈩A(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)作為固定特征提取器(與線性分類器或回歸模型相結(jié)合)。上述方法已經(jīng)成功運(yùn)用于明顯不同于目標(biāo)識(shí)別的計(jì)算機(jī)視覺任務(wù)。
研究中使用VGG-CNN-F網(wǎng)絡(luò),該網(wǎng)絡(luò)有8層(5個(gè)卷積層和3個(gè)完全連接層),并且基于約120萬個(gè)來自ImageNet數(shù)據(jù)庫的圖像進(jìn)行了訓(xùn)練,以識(shí)別分屬于1000個(gè)類別的目標(biāo)。網(wǎng)絡(luò)學(xué)習(xí)提取有助于目標(biāo)檢測(cè)的圖像梯度、邊緣和圖案。諸多使用類似遷移學(xué)習(xí)方法的研究表明,從基于ImageNet數(shù)據(jù)訓(xùn)練的網(wǎng)絡(luò)中提取的特征可有效地將航拍圖像按照土地用途(如高爾夫球場(chǎng)、橋梁、停車場(chǎng)、建筑物和道路)進(jìn)行細(xì)粒度語義分類。
研究人員收集了數(shù)據(jù)集中每個(gè)圖像網(wǎng)絡(luò)第二個(gè)完全連接層的輸出,這一層有4096個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)與其上一層及下一層的節(jié)點(diǎn)間呈非線性連接,每個(gè)特征向量為4096維,對(duì)應(yīng)(也稱激活)著來自這些節(jié)點(diǎn)的輸出。通過計(jì)算人口普查區(qū)域所有圖像的均值,這些輸出進(jìn)一步聚合成每個(gè)人口普查區(qū)的均值特征向量。這些特征共同代表建筑環(huán)境的指標(biāo)。為了研究CNN能否區(qū)分建筑環(huán)境特征,研究人員通過網(wǎng)絡(luò)向前傳輸了一組隨機(jī)圖像,并檢查lCNN卷積輸出的地圖(圖1)。同時(shí),研究人員還對(duì)圖像特征進(jìn)行了分組,以此說明在肥胖率低和高的地區(qū),建筑環(huán)境的特征存在差異(圖2)。
圖1 卷積神經(jīng)網(wǎng)絡(luò)模型下的特征可視化
圖2
統(tǒng)計(jì)分析
運(yùn)用彈性網(wǎng)絡(luò)(一種正則化回歸方法),消除了非重要協(xié)變量,保留了相關(guān)變量,非常適用于從該研究圖像數(shù)據(jù)集中提取的高維(n?=?4096)特征向量。彈性網(wǎng)絡(luò)的正則化防止過擬合,這也是出于高緯度數(shù)據(jù)集的考量。為了選擇合適的調(diào)整參數(shù)值(λ值),這里用到了交叉驗(yàn)證法,并選取了最小化均值交叉驗(yàn)證錯(cuò)誤的值。
采用5折交叉驗(yàn)證回歸分析法,以量化下列關(guān)聯(lián):
① 人口普查區(qū)建筑環(huán)境特征與肥胖率之間的關(guān)聯(lián);
② 人口普查區(qū)POI密度與肥胖率之間的關(guān)聯(lián);
③ 人口普查區(qū)建筑環(huán)境特征與人均收入差異之間的關(guān)聯(lián)(數(shù)據(jù)來自“美國2014年度社區(qū)調(diào)查”中的未來五年預(yù)測(cè))。
研究還將數(shù)據(jù)分為兩個(gè)隨機(jī)樣本,并用樣本1代表模型擬合中60%的數(shù)據(jù),其余40%則在所有分析中進(jìn)行驗(yàn)證。上述分析針對(duì)所有地區(qū)共同進(jìn)行,并對(duì)每個(gè)地區(qū)獨(dú)立進(jìn)行。
除此之外,基于人工智能技術(shù)的食物營養(yǎng)成分分析項(xiàng)目、科學(xué)食療方案、食物照片的卡路里識(shí)別項(xiàng)目、各種穿戴設(shè)備、語音識(shí)別智能家庭營養(yǎng)健康助手等應(yīng)用早已數(shù)見不鮮,其中就包括Google在2015年推出的Im2Calories項(xiàng)目、2018年的Google Coach,以及雀巢公司與京東集團(tuán)2017年在智能音箱“叮咚”上合作推出的雀巢小AI……
由是觀之,人工智能在人類健康問題上的探索之路正在不斷延伸。想要了解更多人工智能前沿技術(shù)與行業(yè)深度應(yīng)用? 2018 AI 開發(fā)者大會(huì)(AINEXTCon)來啦!
-
圖像處理
+關(guān)注
關(guān)注
27文章
1296瀏覽量
56824 -
人工智能
+關(guān)注
關(guān)注
1793文章
47535瀏覽量
239327 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5511瀏覽量
121355
原文標(biāo)題:人工智能靈魂注入,燃燒你的卡路里——2018,你AI了嗎???
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論