本科物理、博士電子工程,還研究過一年藏藥的李飛飛最終卻一頭扎進了人工智能的浪潮。在 ACM 的一次訪談中,斯坦福大學教授李飛飛談到了自己在計算機視覺和神經(jīng)科學之路上的探索歷程以及未來的目標。
斯坦福大學的教授李飛飛在距今最近的一次人工智能寒冬期間開始了她的職業(yè)生涯,但是她提供了一個幫助寒冬解凍的想法。通過創(chuàng)建包含一千五百萬張圖像的層級組織圖像數(shù)據(jù)庫 Image-Net,她證明了豐富的數(shù)據(jù)集在開發(fā)算法方面的重要性——并發(fā)布了一項競賽,使得 Geoffrey Hinton、Ilya Sutskever 和 Alex Krizhevsky 在深度卷積神經(jīng)網(wǎng)絡(luò)方面的工作得到了廣泛關(guān)注。最近被評為ACM fellow的李飛飛如今主管著斯坦福人工智能實驗室(Stanford Artificial Intelligence Lab)和斯坦福視覺與學習實驗室(Stanford Vision and Learning Lab),致力于開發(fā)能夠使計算機和機器人會看、會思考的智能算法。在本次采訪中,她談到了計算機視覺和神經(jīng)科學,以及如何增加這一領(lǐng)域的多樣性。
記者:您的本科專業(yè)是物理學,您的博士研究方向是電子工程。是什么吸引您進入計算機視覺和人工智能領(lǐng)域的呢?
李飛飛:在普林斯頓讀本科的時候,我有很大的學術(shù)自由。上大二那一年,我就為 20 世紀早期物理學家的著作而著迷——薛定諤、愛因斯坦等人在職業(yè)生涯的后期都對生命和智能有很強的好奇心。然后我做了幾個關(guān)于神經(jīng)科學和建模的研究項目;我被迷住了。我決定攻讀結(jié)合認知神經(jīng)科學和計算機視覺的博士學位——我們那時還不管它叫 AI。
那是在所謂的 AI 寒冬時期,當時的人們意識到技術(shù)沒有達到他們炒作的高度,于是對 AI 的興趣和投資都冷卻下去。
那時候我正在博士學習階段,確實是一段有趣的時間。機器學習在計算機視覺領(lǐng)域成為了一個非常重要的工具,所以我也屬于那一代在這個學科領(lǐng)域接受了大量訓練的學生。
記者:那種訓練有助于明確一個后來被證明對人工智能領(lǐng)域非常關(guān)鍵的思想,即創(chuàng)建更好的數(shù)據(jù)集能夠幫助計算機做出更好的決策。這促使您建立了 ImageNet 這個層級組織的圖像數(shù)據(jù)庫,其中每一個節(jié)點都由成百上千張圖片描述。
李飛飛:在人工智能領(lǐng)域,有一些每個人都會遇到的重要問題;我們稱其為「圣杯問題」。其中之一就是目標理解,它是視覺智能的構(gòu)造模塊。人類特別擅長識別成千上萬甚至上百萬的目標,而且依據(jù)常識就能不費吹灰之力地做到。所以我在博士階段以及作為助理教授的前幾年和領(lǐng)域內(nèi)的很多人一起研究過這個問題。那個時期,人們付出了巨大的努力來設(shè)計能夠識別物體的機器學習算法。我們也必須尋找合理的方式來測試它們的性能。那時候也有一些很好的數(shù)據(jù)集,但是通常都比較小,只有一二十種不同的物體。
那時候數(shù)據(jù)集很小,限制了能夠開發(fā)的模型類別,因為沒辦法訓練出能夠識別多樣性的算法,即使是像「貓」這樣的單個對象。
盡管人們在那個年代一直在取得進步,但是這個領(lǐng)域似乎陷入了困境,因為算法無法令人滿意。所以大約在 2006 年左右,我的學生和我開始思考解決目標識別問題的不同方式。我們認為,與其設(shè)計出在小規(guī)模數(shù)據(jù)集上過擬合的模型,我們更愿意考慮規(guī)模非常大的數(shù)據(jù)集,例如上百萬個對象,這將推動機器學習模型朝著完全不同的方向發(fā)展。
記者:所以您開始了 ImageNet 的工作,這在那個時候看上去很瘋狂。
李飛飛:我們的目標是整理出英語語言中的所有名詞,然后采集成百上千張圖片來描述每一個對象的變化,例如蘋果或德國牧羊犬。我們最后下載并篩選了至少十億張圖片,最終通過眾包將 ImageNet 整合在一起。這個數(shù)據(jù)集有 1500 萬張圖片,22000 個物體類別。
記者:在斯坦福視覺和學習實驗室的研究中,您不僅僅與技術(shù)專家密切合作,與神經(jīng)科學家也有合作。您能談一談這種合作是如何進行的嗎?
李飛飛:從根本上來說,AI 是一個技術(shù)領(lǐng)域。它的最終目標是賦予機器以智能。但是由于人類的智能與這個領(lǐng)域有如此緊密的關(guān)聯(lián),因此擁有神經(jīng)科學和認知科學的背景和合作者非常有幫助。以今天的深度學習革命為例,我們今天在神經(jīng)網(wǎng)絡(luò)中所用的算法正是受到了上世紀五六十年代關(guān)于神經(jīng)科學的經(jīng)典研究的啟發(fā),那個時候科學家發(fā)現(xiàn)神經(jīng)元是以分層的方式連在一起的,并且以這種方式發(fā)送信息。同時,認知科學一直是指引 AI 尋求不同種類的任務(wù)的重要組成部分。例如,很多計算機科學家都在其啟發(fā)之下進行目標識別的研究,因為認知科學家已經(jīng)在這方面做了一些工作。
「我們的目標是整理出英語語言中的所有名詞,然后采集...... 圖片來描述每一個對象的變化,例如蘋果和德國牧羊犬?!?/p>
記者:您目前的交叉學科合作之一就是一個實現(xiàn)了好奇心驅(qū)動學習的神經(jīng)網(wǎng)絡(luò)。
李飛飛:人類的小孩通過對世界的探索進行學習。我們嘗試創(chuàng)建具有這些功能的算法——計算機由好奇心來驅(qū)動,而不是在類似于有標簽的圖像一樣的傳統(tǒng)任務(wù)進行訓練。
記者:您之前講過需要從人文角度來思考人工智能,而不是僅僅從技術(shù)角度去思考,而且您也幫助啟動了斯坦福大學以人為本的人工智能倡議(HAI)。您能否談?wù)勛约旱哪繕四兀?/p>
李飛飛:我們希望建立一個致力于增強人類能力的技術(shù)的研究所。以機器人為例,機器能夠做人類不能做的事情。機器可以去危險的地方。它們可以潛入到深水區(qū),去拆除爆炸設(shè)備。機器也擁有人類沒有的精確度和力量。但是人類有更多的穩(wěn)定性和理解力,并且能夠更容易地與彼此合作。
我們可以想象未來很多潛在的場景,在這些場景中,機器人在輔助或者增強人類的工作,而并非取代他們。
記者:您也一直在談?wù)撔枰谟嬎銠C科學和人工智能研究中加入更加多元的聲音。
李飛飛:如果我們相信機器的價值代表了人類的價值,我們就需要相信我們完全代表了人類,因為我們開發(fā)并部署了我們的技術(shù)。所以鼓勵具有不同背景的學生參與到這個領(lǐng)域是很重要的。此刻,意識到技術(shù)的社會影響力在提升同樣重要。此時的風險高于以往任何時候,因此我們也需要邀請具有不同背景的未來商業(yè)領(lǐng)袖、政策制定者、人本主義者、社會科學家,使他們具備技術(shù)背景,與科技界進行互動,將多元的思想引入這個過程中。
記者:您能給我講講斯坦福大學為高中生開設(shè)的 AI4All 項目嗎?聽說它來源于斯坦福大學人工智能實驗室的早期外展暑期計劃(SAILORS)?
李飛飛:AI4ALL 的目標是通過針對來自各種經(jīng)濟和文化背景的學生來增加人工智能領(lǐng)域的多樣性。這是一個我們感到非常自豪并且非常樂意支持的社區(qū)。名叫 Amy Jin 的高中生是我們最早的 SAILORS 學生之一,她在我的實驗室持續(xù)做關(guān)于手術(shù)培訓視頻的工作。然后,她就和我的團隊一起撰寫了一篇論文,并最終被 NIPS2017 選中。更重要的是,她在 150 篇論文中獲得了最佳論文獎。我們還有學生在他們的學校啟動了機器人實驗室,舉辦以女孩為中心的黑客馬拉松。他們中的很多人正在專注于將 AI 用于良好的社會用途的應用,從優(yōu)化救護車部署到癌癥研究和網(wǎng)絡(luò)欺凌。
-
人工智能
+關(guān)注
關(guān)注
1792文章
47497瀏覽量
239214 -
計算機視覺
+關(guān)注
關(guān)注
8文章
1699瀏覽量
46050 -
機器學習
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132837
原文標題:李飛飛ACM訪談:機器在輔助并增強人類的工作,而并非取代人類
文章出處:【微信號:aicapital,微信公眾號:全球人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論