6月 18日上午,CVPR 2019會議開幕式暨頒獎儀式在美國洛杉磯舉行,經(jīng)過 CVPR 2019 專門的最佳論文獎評選委員會(Best Paper Award Committee)評審,評委們從50 篇最佳論文候選名單中評選出 4 篇獲獎?wù)撐?,分別是 2 篇最佳論文榮譽提名、1 篇最佳學生論文和 1 篇最佳論文。
結(jié)果顯示,華人幾乎包攬了最佳論文、最佳學生論文和最具影響力論文獎,分別由來自CMU的辛書冕等人、加州大學圣巴巴拉分校的王鑫等人和李飛飛團隊等人摘得!
華人包攬三大獎項第一作者
此次 CVPR 獲獎?wù)撐闹杏腥螵勴椀牡谝蛔髡呔腥A人在列,包括最佳論文、最佳學生論文和最具影響力論文獎,辛書冕、王鑫、李飛飛等眾多華人的名字出現(xiàn)在獲獎?wù)呙麊沃凶屓诵老灿钟∠笊羁獭?/p>
▌最佳論文:非視線內(nèi)的物體形狀重建
題目:A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction
非視線形狀重建的費馬路徑理論
作者:辛書冕, Sotiris Nousias, Kiriakos N. Kutulakos, Aswin C. Sankaranarayanan, Srinivasa G. Narasimhan and Ioannis Gkioulekas
我們在這篇論文的第一作者辛書冕的個人主頁上發(fā)現(xiàn),原來這是一位卡內(nèi)基梅隆大學機器人研究所的二年級的博士生,研究興趣主要在于計算機視覺和計算攝影領(lǐng)域,師從 Srinivasa Narasimhan 和 Ioannis Gkioulekas 教授。2016年12月,辛書冕在CMU獲得電氣和計算機工程碩士學位,在去美國之前獲得了西安交通大學電氣工程學士學位。
作者機構(gòu):卡內(nèi)基梅隆大學、多倫多大學、倫敦大學學院
論文地址:
https://www.ri.cmu.edu/publications/a-theory-of-fermat-paths-for-non-line-of-sight-shape-reconstruction/
摘要:
我們提出了一個新的理論,即在一個已知的可見場景和一個不在瞬態(tài)相機視線范圍內(nèi)的未知物體之間的費馬路徑(fermat path)。這些光路或者遵守鏡面反射,或者被物體的邊界反射,從而編碼隱藏物體的形狀。
(注:費馬原理(Fermat's principle)最早由法國科學家皮埃爾·德·費馬在1662年提出:光傳播的路徑是光程取極值的路徑。這個極值可能是最大值、最小值,甚至是函數(shù)的拐點。 最初提出時,又名“最短時間原理”:光線傳播的路徑是需時最少的路徑。)
我們證明費馬路徑對應于瞬態(tài)測量中的不連續(xù)性。基于此,我們推導出一種新的約束,它將這些不連續(xù)處的路徑長度的空間導數(shù)與表面法線相關(guān)聯(lián)。
基于這一理論,我們提出了一種名為Fermat Flow的算法來估計非視距物體的形狀。我們的方法第一次實現(xiàn)復雜對象的精確形狀恢復,范圍從隱藏在拐角處以及隱藏在漫射器后面的漫反射到鏡面反射。
最后,我們的方法與用于瞬態(tài)成像的特定技術(shù)無關(guān)。因此,我們展示了使用SPAD和超快激光從皮秒級瞬態(tài)恢復的毫米級形狀,以及使用干涉測量法從飛秒級瞬態(tài)微米級重建。我們相信,這項工作是非視距成像技術(shù)的重大進步。
獲獎理由:這篇論文作出重大進步的問題是非視線內(nèi)的物體形狀重建,換句話說就是能看到墻角后面的東西。這篇論文的理論部分非常優(yōu)美,而且同樣非常給人帶來激勵。它把計算機視覺所能解決的問題的邊界繼續(xù)向前推進了一步。
▌最佳學生論文:有效地提高強化學習的表現(xiàn)
這篇論文是 UC Santa Barbara 大學(加州大學圣巴巴拉分校)與微軟研究院、Duke 大學合作完成,第一作者系 UC Santa Barbara 大學的王鑫。
據(jù) UC Santa Barbara 計算機科學系助理教授王威廉在其個人微博上發(fā)表的喜訊,這篇論文的一作是其組內(nèi)的成員,獲得了 3 個 Strong Accept,在 5165 篇投稿文章中審稿得分排名第一,并且這篇論文已經(jīng)確定將在 6 月的 CVPR 會議上進行報告。
這篇論文解決的任務(wù) vision-language navigation(VLN),針對跨模態(tài)的基標對準(cross-modal grounding)、不適定反饋(ill-posed feedback)這兩個難點,論文提出了一種全新的強化型跨模態(tài)匹配(RCM)方法,用強化學習方法將局部和全局的場景聯(lián)系起來,針對第三個難點泛化能力問題提出了一種自監(jiān)督模仿學習(Self-supervised Imitation Learning, SIL),其目的是讓智能體能夠自主的探索未知的環(huán)境。
題目:Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation
面向語言視覺導航(VLN)的強化交叉模型匹配和半監(jiān)督模仿學習
作者:王鑫,Qiuyuan Huang,AsliCelikyilmaz,Jianfeng Gao,Dinghan Shen,Yuan-Fang Wang,王威廉,Lei Zhang
作者機構(gòu):王鑫,Yuan-FangWang,William Yang Wang 加州大學圣芭芭拉分校
Qiuyuan Huang,Asli Celikyilmaz,Jianfeng Gao,Lei Zhang 微軟研究院
Dinghan Shen 杜克大學
摘要:
視覺語言導航(VLN)是對真實智能體在真實 3D 環(huán)境內(nèi)執(zhí)行自然語言指令的任務(wù)。本文研究了如何解決這項任務(wù)的三個關(guān)鍵挑戰(zhàn):跨模態(tài)基礎(chǔ)、不適定反饋和泛化問題。
首先,我們提出了一種基于強化學習的新的強化交叉模型匹配(RCM)方法。我們將匹配的批評內(nèi)容作為內(nèi)在獎勵,以促進指令和智能體運動軌跡之間的全局性匹配,并利用推理導航器在本地視覺場景中執(zhí)行跨模態(tài) grounding。對 VLN 基準數(shù)據(jù)集的評估表明,我們的 RCM 模型在 SPL 上顯著優(yōu)于以前的方法,性能提升 10%,并達到了最先進的性能。
為了提高學習政策的可泛化性,文章進一步引入了自我監(jiān)督模仿學習(SIL)方法,通過模仿自己過去的高質(zhì)量決策來探索未見過的環(huán)境。結(jié)果表明,SIL 方法可以近似地獲得更好、更有效的策略,極大地降低了已見過和未見過的環(huán)境之間的成功率上的性能差距(由 30.7%降低至 11.7%)。
亮點:據(jù)加州大學圣芭芭拉分校計算機科學系助理教授William Yang Wang在微博的介紹,這篇文章的亮點在于該論文提出的自監(jiān)督獎勵函數(shù)很大程度上影響了有效獎勵的密度,從而有效地提高了強化學習的表現(xiàn)。另外,自監(jiān)督模仿學習也能很好地提高視覺語言導航系統(tǒng)的泛化能力。
▌經(jīng)典論文獎:李飛飛團隊計算機視覺奠基之作——ImageNet
Longuet-Higgins 獎是 IEEE 計算機協(xié)會模式分析與機器智能(PAMI)技術(shù)委員會在每年的 CVPR 頒發(fā)的 “計算機視覺基礎(chǔ)貢獻獎”,表彰十年前對計算機視覺研究產(chǎn)生了重大影響的 CVPR 論文。該獎項以理論化學家和認知科學家 H. Christopher Longuet-Higgins 命名。
今年的 Longuet-Higgins 獎由 Jia Deng、Wei Dong、Richard Socher、李佳、Kai Li 和李飛飛于 2009 年發(fā)表在 CVPR 大會的論文《ImageNet: A Large-Scale Hierarchical Image Database》摘得。
ImageNet 在計算機視覺領(lǐng)域大名鼎鼎,推動了計算機視覺領(lǐng)域的賽事 ImageNet 挑戰(zhàn)賽成為領(lǐng)域標桿,可謂促進了計算機視覺領(lǐng)域的突破性進展。這篇論文發(fā)表于2009 年 CVPR,目前引用量高達 11508 次,獲獎實至名歸。
▌最佳論文榮譽提名
此次獲得榮譽論文提名的有兩篇,分別是:
1. A Style-Based Generator Architecture for Generative Adversarial Networks
作者:Tero Karras、Samuli Laine、Timo Aila,來自英偉達
論文鏈接:https://arxiv.org/abs/1812.04948
2. Learning the Depths of Moving People by Watching Frozen People
作者:Zhengqi Li、Tali Dekel、Forrester Cole、Richard Tucker、Ce Liu、Bill Freeman、Noah Snavely,來自Google Research
論文鏈接:https://arxiv.org/abs/1904.11111
▌計算機先驅(qū)獎
最后,大會還頒發(fā)了計算機先驅(qū)獎(Computer Pioneer Award),獲獎的是加州大學伯克利分校電氣工程和計算機科學專業(yè)、生物工程專業(yè)教授 Jitendra Malik。他的主要研究領(lǐng)域是計算機視覺,特別是在人類視覺、計算機圖形學和生物圖像分析方面有很多突出成果,一些知名的理論和算法就出自 Malik 教授和他領(lǐng)導團隊的研究,包括各向異性擴散(anisotropic diffusion)、歸一化分割(normalzied cut)、高動態(tài)范圍成像(high dynamic range imaging)等。
計算機先驅(qū)獎于 1981 年由 IEEE 計算機協(xié)會設(shè)立,用于表彰至少在十五年以前對計算機領(lǐng)域發(fā)展做出突出貢獻的個人。
▌萬人參加,中國影響力顯露
據(jù)官方統(tǒng)計,注冊的參會者數(shù)量也是達到了空前的 9227 人,來自全球世界各地。其中來自美國的參會者仍然最多,達 4743人,有 1044人來自中國大陸。
據(jù)程序主席之一的 UIUC教授Derek Hoiem介紹道,CVPR 2019共收到了 5165 篇有效提交論文,比去年 CVPR 2018 增加了 56%,增速提高了 26%。有趣的是,這些提交的論文大多數(shù)來自亞洲,且有39%的論文來自中國。
據(jù)官網(wǎng)統(tǒng)計,今年CVPR一共收到創(chuàng)紀錄的5165篇有效投稿,比去年的3309篇多出近2000篇。在 5165 篇投稿中,共有 1294 篇被接收,接收論文數(shù)量也首次超過了一千篇,接收率達到了接近 25.5%。
值得一提的是,今年的 CVPR 特意設(shè)立了 Ethic Chair倫理主席和監(jiān)察員,旨在維護并改善會議期間的氣氛、減少歧視以及其它各種不良行為的發(fā)生。但是由于白宮的政策,許多希望參會的學者被拒簽,注冊申請也未獲通過,CVPR 2019組委會也為此專門發(fā)送了郵件表明學術(shù)自由的立場,并表示明年將考慮換一家不受影響的供應商。
作為計算機視覺的頂級會議,CVPR 2019 盛況依然,中國學者斬獲頗豐也代表了中國學術(shù)影響力的不斷提高,計算機視覺還是研究的一大熱門領(lǐng)域,但同時我們也注意到,CVPR 2019 的論文接收率仍比去年的 29% 有所下降,可以看出,近年來人工智能頂級會議的錄取困難程度在不斷提升。期待來年中國學者在頂級賽事上繼續(xù)高歌前進!
-
計算機視覺
+關(guān)注
關(guān)注
8文章
1699瀏覽量
46049 -
論文
+關(guān)注
關(guān)注
1文章
103瀏覽量
14969 -
李飛飛
+關(guān)注
關(guān)注
0文章
20瀏覽量
3642
原文標題:西交出身,辛書冕獲CVPR 2019最佳論文,李飛飛團隊獲經(jīng)典論文獎
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論