性巴克安装下载app,性高朝久久久久久久久久

近日，在第二屆視覺(jué)對(duì)話競(jìng)賽Visual Dialogue Challenge中，阿里AI擊敗了微軟、首爾大學(xué)等十支參賽隊(duì)伍，獲得冠軍。

(阿里AI在視覺(jué)對(duì)話競(jìng)賽中得冠)

據(jù)了解，視覺(jué)對(duì)話競(jìng)賽由美國(guó)佐治亞理工大學(xué)、Facebook人工智能實(shí)驗(yàn)室(FAIR)等機(jī)構(gòu)聯(lián)合全球視覺(jué)技術(shù)領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議CVPR發(fā)起，是目前視覺(jué)對(duì)話領(lǐng)域最權(quán)威的競(jìng)賽之一。

該競(jìng)賽要求參賽的AI在看完近萬(wàn)張圖片后，回答出人類對(duì)于任一圖片任一內(nèi)容的提問(wèn)。競(jìng)賽結(jié)果顯示，阿里AI以74.57%的準(zhǔn)確率獲得冠軍，將上一屆比賽的紀(jì)錄提高了16.82%。在相同的數(shù)據(jù)集中，人類的準(zhǔn)確率僅為64.27%。

傳統(tǒng)的視覺(jué)AI主要針對(duì)目標(biāo)的檢測(cè)和識(shí)別，例如識(shí)別出圖片是否是一只貓，但對(duì)復(fù)雜場(chǎng)景中目標(biāo)之間的邏輯關(guān)系理解、推理能力較弱，無(wú)法回答“這只貓旁邊的男生穿了什么顏色的衣服”等復(fù)雜問(wèn)題，也難以將圖片信息轉(zhuǎn)化為人類理解的語(yǔ)言輸出。

阿里AI的突破在于提出了“遞歸探索對(duì)話模型”，綜合集成了圖像識(shí)別、關(guān)系推理與自然語(yǔ)言理解三大能力，它通過(guò)高效利用標(biāo)注信息學(xué)習(xí)出模仿人類認(rèn)知復(fù)雜場(chǎng)景的思維方式，能夠有效識(shí)別圖片里的實(shí)體以及它們之間的關(guān)系，推理出圖片所描述的事件內(nèi)容，并通過(guò)對(duì)上下文進(jìn)行有效建模，理解人類提出的問(wèn)題及真實(shí)意圖，給出自然準(zhǔn)確的回復(fù)。

視覺(jué)對(duì)話是近年來(lái)快速崛起的AI研究方向，目的在于教會(huì)機(jī)器用自然語(yǔ)言與人類討論視覺(jué)內(nèi)容。如果說(shuō)視覺(jué)識(shí)別技術(shù)，讓機(jī)器具備了視覺(jué)能力;那么視覺(jué)對(duì)話技術(shù)，則使得機(jī)器擁有了對(duì)真實(shí)視覺(jué)世界的理解與推斷能力，意味著AI的認(rèn)知能力將邁上新的臺(tái)階。

據(jù)了解，這項(xiàng)技術(shù)未來(lái)將被應(yīng)用在人機(jī)交互諸多場(chǎng)景：地震后在廢墟中尋找幸存者的救援機(jī)器人，能夠更加及時(shí)、高效地綜合指揮指令和場(chǎng)景信息作出行動(dòng);視障人士可以通過(guò)提問(wèn)阿里AI，理解網(wǎng)絡(luò)照片中的內(nèi)容，了解自身所處的周圍環(huán)境;無(wú)人駕駛車輛對(duì)影響因子的意圖理解會(huì)更為準(zhǔn)確，乘客的乘坐體驗(yàn)更好。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴