0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)/人工智能領(lǐng)域一些非常有創(chuàng)意的突破

電子工程師 ? 來源:lq ? 2019-05-19 10:49 ? 次閱讀

本文介紹了近期在機(jī)器學(xué)習(xí)/人工智能領(lǐng)域一些非常有創(chuàng)意的突破,每一個(gè)都腦洞大開,不管是否是相關(guān)從業(yè)人員都值得一讀。并附上一些論文、視頻鏈接和簡要總結(jié)。

與其他領(lǐng)域相比,機(jī)器學(xué)習(xí)/人工智能現(xiàn)在發(fā)展的非???,經(jīng)常有一些有趣的突破。讓你不由自主的發(fā)出“wow”甚至“人間值得”的感嘆!(兩分鐘論文作者的口頭禪)

兩分鐘論文

https://www.youtube.com/channel/UCbfYPyITQ-7l4upoX8nvctg

免責(zé)聲明:我并沒有對“振奮人心”或“突破”進(jìn)行嚴(yán)格的定義;這只是一個(gè)非正式的清單。我會(huì)用可能不那么嚴(yán)格的術(shù)語來讓這篇文章更通俗易懂。

從看似不可用的信息中得出驚人的準(zhǔn)確估計(jì)

透過墻對人體姿態(tài)做估計(jì)

麻省理工學(xué)院研究人員的網(wǎng)站/視頻(2018年)

http://rfpose.csail.mit.edu/

我們可以根據(jù)某人對WiFi信號(hào)的擾亂,準(zhǔn)確地估計(jì)此人在墻壁另一側(cè)是如何站著/坐著/走路的。

從視頻中測量材料的物理特性

麻省理工學(xué)院研究人員的文章/視頻(2015年)

http://news.mit.edu/2015/visual-microphone-identifies-structural-defects-0521

研究人員在2014年首次展示了根據(jù)振動(dòng)情況從薯片包裝袋的視頻(沒有聲音)中重現(xiàn)人類的語音。該成果沒有涉及機(jī)器學(xué)習(xí)。2015年,他們使用機(jī)器學(xué)習(xí),并展示了通過視頻來估計(jì)材料的剛度、彈性、單位面積的重量等(在某些情況下,僅僅空氣正常循環(huán)引起的振動(dòng)就足夠了)。

從鍵盤旁邊的智能手機(jī)估計(jì)鍵盤敲擊

論文,2015

https://www.sigmobile.org/mobicom/2015/papers/p142-liuA.pdf

研究人員發(fā)現(xiàn),從一臺(tái)放在鍵盤旁邊的智能手機(jī)中錄制的音頻,可以以94%的準(zhǔn)確率估計(jì)鍵盤敲擊。與以前在鍵盤周圍放置許多麥克風(fēng)的情況下使用有監(jiān)督的深度學(xué)習(xí)方法不同,這篇論文實(shí)際上使用了相對簡單的機(jī)器學(xué)習(xí)技術(shù)(k-均值聚類)和無監(jiān)督學(xué)習(xí)。

生成模型

逼真的面部生成、樣式混合和移植

Nvidia研究人員的論文/視頻(2018年)

論文

https://arxiv.org/abs/1812.04948

視頻

https://www.youtube.com/watch?v=kSLJriaOumA

研究人員將一種新的結(jié)構(gòu)與大量的GPU結(jié)合起來,創(chuàng)造出極其逼真的人造人臉,這些人臉是其他人臉之間的移植,或者是一個(gè)人臉到另一個(gè)人臉的“樣式”應(yīng)用。這項(xiàng)工作建立在過去關(guān)于生成對抗網(wǎng)絡(luò)(GANs)的工作之上。GANs是在2014年發(fā)明的,從那時(shí)起對它的研究就出現(xiàn)了爆炸式增長。GANs最基本的解釋是兩個(gè)相互對抗的神經(jīng)網(wǎng)絡(luò)(例如,一個(gè)是將圖像分類為“真實(shí)”或“假冒”的神經(jīng)網(wǎng)絡(luò),另一個(gè)是以試圖“欺騙”第一個(gè)神經(jīng)網(wǎng)絡(luò)將假冒圖像錯(cuò)誤分類為真實(shí)的方式生成圖像的神經(jīng)網(wǎng)絡(luò)……因此,第二個(gè)神經(jīng)網(wǎng)絡(luò)是第一個(gè)的“對手”)。

總的來說,關(guān)于對抗性機(jī)器學(xué)習(xí)有很多很酷的研究,已經(jīng)存在了十多年。對網(wǎng)絡(luò)安全等也有許多令人毛骨悚然的影響,但我再講就跑題了。

很酷的研究

https://github.com/yenchenlin/awesome-adversarial-machine-learning

教機(jī)器繪圖

Google Brain的博客帖子(2017年)

https://ai.googleblog.com/2017/04/teaching-machines-to-draw.html

兩幅圖之間的插值

我在Google Brain的好朋友David Ha用一個(gè)生成循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)來繪制基于矢量的圖形(除了自動(dòng)以外,我認(rèn)為這就是Adobe Illustrator)。

David Ha

https://twitter.com/hardmaru

把炫酷的舞步遷移給不會(huì)跳舞的人

加州大學(xué)伯克利分校研究人員的網(wǎng)站/視頻(2018年)

網(wǎng)站

https://carolineec.github.io/everybody_dance_now/

視頻

https://www.youtube.com/watch?v=PCBTZh41Ris

想想“舞蹈版的Auto-Tune”。通過姿勢估計(jì)和生成對抗訓(xùn)練,研究人員能夠制作任何真人(“目標(biāo)”人物)跳舞的假冒視頻,視頻中的人舞技精湛。所需輸入僅為:

一段舞蹈高手的跳舞短視頻

幾分鐘目標(biāo)人物跳舞的視頻(通常很糟,因?yàn)榇蠖鄶?shù)人都不擅長跳舞)

我還看到了Nvidia的首席執(zhí)行官黃延森(Jensen Huang)展示了一段自己像邁克爾杰克遜一樣跳舞的視頻(用這種技術(shù))。很高興我之前參加了GPU技術(shù)大會(huì),哈哈。

強(qiáng)化學(xué)習(xí)

世界模型-人工智能在自己的夢里學(xué)習(xí)

Google Brain網(wǎng)站(2018年)

https://worldmodels.github.io/

人類并不真正了解或思考我們生活的世界里的所有細(xì)節(jié)。我們的行為基于我們頭腦中世界的抽象。例如,如果我騎在自行車上,我不會(huì)想到自行車的齒輪/螺母/螺栓;我只是大致了解車輪、座椅和把手的位置以及如何與它們交互。為什么不對人工智能使用類似的方法呢?

這種“世界模型”方法(同樣,由David Ha等人創(chuàng)建)允許“agent”(例如,在賽車游戲中控制汽車的人工智能)創(chuàng)建一個(gè)世界/周圍環(huán)境的生成模型,這是對實(shí)際環(huán)境的簡化/抽象。所以,你可以把這個(gè)世界模型看作是一個(gè)存在人工智能頭腦中的夢。然后人工智能可以通過強(qiáng)化學(xué)習(xí)在這個(gè)“夢”中得到更好的表現(xiàn)。因此,這種方法實(shí)際上是將生成性機(jī)器學(xué)習(xí)與強(qiáng)化學(xué)習(xí)相結(jié)合。通過這種方式,研究人員能夠在特定的電子游戲任務(wù)上實(shí)現(xiàn)目前最先進(jìn)的水平。

[2019/2/15更新]在上述“世界模型”方法的基礎(chǔ)上,谷歌剛剛發(fā)布了PlaNet:Deep Planning Network for Reinformation Learning,與以前的方法相比,數(shù)據(jù)效率提高了5000%。

PlaNet:Deep Planning Network for Reinformation Learning

https://ai.googleblog.com/2019/02/introducing-planet-deep-planning.html

AlphaStar——擊敗頂級(jí)職業(yè)玩家的星際爭霸II AI

DeepMind(Google)的博客文章,e-sports-ish視頻,2019年

博客文章

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

e-sports-ish視頻

https://www.youtube.com/watch?v=cUTMhmVh1qs

我們在李世石和DeepMind AlphaGo之間的歷史性圍棋比賽之后已經(jīng)走了很長的路,這場比賽震撼了全世界,它僅僅發(fā)生在3年前的2016年(看看NetFlix紀(jì)錄片,讓一些人哭泣)。更令人驚訝的是,盡管沒有使用任何來自人類比賽的訓(xùn)練數(shù)據(jù),2017年的AlphaZero在圍棋方面比AlphaGo更好(也比國際象棋、日本象棋等領(lǐng)域的其他算法更好)。但2019年的AlphaStar更驚人。

李世石和DeepMind AlphaGo之間的歷史性圍棋比賽

https://en.wikipedia.org/wiki/AlphaGo_versus_Lee_Sedol

NetFlix紀(jì)錄片

https://www.netflix.com/sg/title/80190844

自1998年以來,作為一名星際迷,我很了解星際的精髓“……需要平衡短期和長期目標(biāo),適應(yīng)意外情況……這是一個(gè)巨大的挑戰(zhàn)?!边@是一個(gè)真正困難和復(fù)雜的游戲,需要多層次的理解才能玩得好。自2009年以來,對星際游戲算法的研究一直在進(jìn)行。

AlphaStar基本上使用了監(jiān)督學(xué)習(xí)(來自人類比賽)和強(qiáng)化學(xué)習(xí)(與自身對抗)的組合來實(shí)現(xiàn)其結(jié)果。

人類訓(xùn)練機(jī)器人

通過一次人工演示將任務(wù)傳授給機(jī)器

Nvidia研究人員的文章/視頻(2018年)

文章

https://news.developer.nvidia.com/new-ai-technique-helps-robots-work-alongside-humans/

視頻

https://www.youtube.com/watch?time_continue=1&v=B7ZT5oSnRys

我可以想到三種典型的方法來教機(jī)器人做一些事情,但都需要大量的時(shí)間/勞力:

針對每種情況手動(dòng)編程機(jī)器人的關(guān)節(jié)旋轉(zhuǎn)等

讓機(jī)器人多次嘗試這個(gè)任務(wù)(強(qiáng)化學(xué)習(xí))

多次向機(jī)器人演示任務(wù)

通常對深度學(xué)習(xí)的一個(gè)主要批評(píng)是,產(chǎn)生數(shù)以百萬計(jì)的示例(數(shù)據(jù))是非常昂貴的。但是,有越來越多的方法不依賴如此昂貴的數(shù)據(jù)。

研究人員根據(jù)一個(gè)單一的人類演示視頻(一個(gè)實(shí)際的人類用手移動(dòng)方塊),找到了一種機(jī)器人手臂成功執(zhí)行任務(wù)的方法(例如“拿起方塊并將其堆疊起來,使它們按順序排列:紅色、藍(lán)色、橙色”),即使視頻是從不同角度拍攝的。該算法實(shí)際上生成了一個(gè)它計(jì)劃執(zhí)行的任務(wù)的可讀描述,這對于故障排除非常有用。該算法依賴于具有姿態(tài)估計(jì),合成訓(xùn)練數(shù)據(jù)生成和模擬到現(xiàn)實(shí)傳遞的對象檢測。

無監(jiān)督機(jī)器翻譯

Facebook人工智能研究博客(2018年)

https://code.fb.com/ai-research/unsupervised-machine-translation-a-novel-approach-to-provide-fast-accurate-translations-for-more-languages/

通常,你需要一個(gè)龐大的翻譯文檔訓(xùn)練數(shù)據(jù)集(例如聯(lián)合國議項(xiàng)的專業(yè)翻譯),以便很好地進(jìn)行機(jī)器翻譯(即監(jiān)督學(xué)習(xí))。然后,許多主題和語言之間沒有高質(zhì)量、豐富的訓(xùn)練數(shù)據(jù)。在這篇論文中,研究人員發(fā)現(xiàn),可以使用無監(jiān)督學(xué)習(xí)(即不使用翻譯數(shù)據(jù),只使用每種語言中不相關(guān)的語料庫),達(dá)到最先進(jìn)的監(jiān)督學(xué)習(xí)方法的翻譯質(zhì)量。Wow。

基本思想是,在任何語言中,某些單詞/概念往往會(huì)出現(xiàn)在很近的位置(例如“毛茸茸的”和“貓咪”)。他們把這描述為“不同語言中的詞嵌入具有相似的鄰域結(jié)構(gòu)?!焙冒?,我明白這個(gè)想法,但是使用這種方法,他們可以在沒有翻譯數(shù)據(jù)集的情況下達(dá)到如此高的翻譯質(zhì)量,仍然讓人吃驚。

結(jié)語

如果你之前沒有對機(jī)器學(xué)習(xí)/人工智能的發(fā)展感興趣的話,我希望這篇文章能幫到你。也許一年后我會(huì)再寫一篇類似的文章。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28506

    瀏覽量

    207491
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3265

    瀏覽量

    48918
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8425

    瀏覽量

    132769

原文標(biāo)題:腦洞大開!機(jī)器學(xué)習(xí)與AI突破(附鏈接)

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人工智能工程師高頻面試題匯總——機(jī)器學(xué)習(xí)

    隨著人工智能技術(shù)的突飛猛進(jìn),AI工程師成為了眾多求職者夢寐以求的職業(yè)。想要拿下這份工作,面試的時(shí)候得展示出你不僅技術(shù)過硬,還得能解決問題。所以,提前準(zhǔn)備一些面試常問的問題,比如機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 12-04 17:00 ?891次閱讀
    <b class='flag-5'>人工智能</b>工程師高頻面試題匯總——<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>篇

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是種特殊的系統(tǒng),它通常被嵌入到其他設(shè)備或機(jī)器中,以實(shí)現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強(qiáng)的適應(yīng)性和靈活性,能夠根據(jù)用戶需求進(jìn)行定制化設(shè)計(jì)。它
    發(fā)表于 11-14 16:39

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中
    發(fā)表于 10-24 17:22 ?2507次閱讀
    <b class='flag-5'>人工智能</b>、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    Anthropic在人工智能領(lǐng)域取得重大突破

     10月23日消息,美國當(dāng)?shù)貢r(shí)間周二,人工智能初創(chuàng)企業(yè)Anthropic宣布了項(xiàng)重大進(jìn)展。這家由前OpenAI高管創(chuàng)立并獲得亞馬遜支持的公司,在人工智能領(lǐng)域取得了新的
    的頭像 發(fā)表于 10-23 14:56 ?478次閱讀

    人工智能的應(yīng)用領(lǐng)域有自動(dòng)駕駛嗎

    的核心技術(shù) 自動(dòng)駕駛汽車的核心依賴于人工智能,尤其是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)。這些技術(shù)使得汽車能夠通過傳感器收集大量數(shù)據(jù),并實(shí)時(shí)進(jìn)行分析。以下是一些
    的頭像 發(fā)表于 10-22 16:18 ?606次閱讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得好書,特此來分享。感謝平臺(tái),感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    非常高興本周末收到本新書,也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。 這是本挺好的書,包裝精美,內(nèi)容詳實(shí),干活滿滿。 關(guān)于《AI for Science:人工
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    ,無疑為讀者鋪設(shè)了條探索人工智能(AI)如何深刻影響并推動(dòng)科學(xué)創(chuàng)新的道路。在閱讀這章后,我深刻感受到了人工智能技術(shù)在科學(xué)領(lǐng)域的廣泛應(yīng)用潛
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V和Arm內(nèi)核及其定制的機(jī)器學(xué)習(xí)和浮點(diǎn)運(yùn)算單元,用于處理復(fù)雜的人工智能圖像處理任務(wù)。 四、未來發(fā)展趨勢 隨著人工智能技術(shù)的不斷發(fā)展和普及,RISC-V在
    發(fā)表于 09-28 11:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加
    發(fā)表于 07-29 17:05

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機(jī)器學(xué)習(xí)(Machine Learning, ML)和深度學(xué)習(xí)(Deep Learning,
    的頭像 發(fā)表于 07-03 18:22 ?1330次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    ://t.elecfans.com/v/27221.html *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識(shí)別案例_V2-20240506.pdf 人工智能 語音對話機(jī)器人案例 26分03秒 https
    發(fā)表于 05-10 16:46

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為個(gè)熱門領(lǐng)域,涉及到多個(gè)行業(yè)和領(lǐng)域,例如語音識(shí)別、機(jī)器翻譯、圖像識(shí)別等。 在編程中進(jìn)行
    的頭像 發(fā)表于 04-04 08:41 ?345次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識(shí)別案例.pdf 人工智能 語音對話機(jī)器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:語音對話機(jī)
    發(fā)表于 04-01 10:40

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下,眾多名企也紛紛在嵌入式人工智能
    發(fā)表于 02-26 10:17