(文章來源:讀芯術(shù))
FAIR一直是深度學(xué)習(xí)領(lǐng)域研究和開源框架的定期貢獻(xiàn)者。從PyTorch到ONNX, FAIR團(tuán)隊為實現(xiàn)深度學(xué)習(xí)應(yīng)用程序的簡化做出了不可思議的貢獻(xiàn)。在過去幾周里,F(xiàn)AIR增加了三個新的系列開源框架。Polygames是一個開源的研究框架,通過自我游戲的方式來訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)。Polygames基于著名的“零學(xué)習(xí)”概念,即允許代理無需進(jìn)行任何預(yù)先設(shè)定的訓(xùn)練,而是通過與環(huán)境交互來掌握環(huán)境。
乍看之下,Polygames似乎與Alpha Zero或ELF OpenGo等其他游戲?qū)W習(xí)框架類似,但FAIR堆棧也有自己的貢獻(xiàn)。對于初學(xué)者來說,Polygames支持更廣泛的戰(zhàn)略游戲列表,如Hex、Havannah、Minishogi、Connect6、Minesweeper、Mastermind、EinStein wurfelt nicht!、Nogo和Othello。他們?yōu)檠芯咳藛T提供了更廣泛的環(huán)境來測試深度學(xué)習(xí)網(wǎng)絡(luò)。
此外,Polygames還以一個巧妙的架構(gòu)擴(kuò)展了傳統(tǒng)的零學(xué)習(xí)概念,該架構(gòu)結(jié)合了深度神經(jīng)網(wǎng)絡(luò)和蒙特卡羅樹搜索方法。這種架構(gòu)允許網(wǎng)絡(luò)泛化到更多的任務(wù)和環(huán)境。Polygames框架的一個意想不到的好處是代理中神經(jīng)可塑性的創(chuàng)建。Polygames的模型是漸進(jìn)式的——框架帶有一個用于添加新層和通道或增加內(nèi)核寬度的腳本——它們能夠進(jìn)行熱啟動訓(xùn)練,允許神經(jīng)網(wǎng)絡(luò)隨訓(xùn)練成長。
從編程模型的角度來看,Polygames提供了一個包含游戲的庫,以及一個實現(xiàn)游戲的單文件API。開發(fā)人員的經(jīng)驗是基于PyTorch的,因此易于上手。
FAIR團(tuán)隊在Polygames上取得了一些里程碑式的成績,包括在Hex19游戲中擊敗人類頂級玩家。該游戲由詩人、數(shù)學(xué)家皮特·海因(Piet Hein)、 約翰·納什(John Nash)和經(jīng)濟(jì)學(xué)家于20世紀(jì)40年代開發(fā),它挑戰(zhàn)了一些傳統(tǒng)的人類游戲思維過程。規(guī)則很簡單。黑色和白色依次填充一個空單元格。如果把北方和南方連接起來,黑人就贏了;如果把西方和東方連接起來,白人就贏了。餡餅規(guī)則使游戲更加公平:在第二次移動時,第二個玩家可以決定交換顏色。這款游戲之所以困難,是因為作為一款連接游戲,它的獎勵是基于全局而非局部的標(biāo)準(zhǔn)。
在一系列的實驗中,Polygames在Hex游戲中擊敗了人類中的頂尖玩家。結(jié)果如下圖所示,在圖中,人類玩家操縱白色棋子。第一個圖像表示Hex的開局。在游戲的第二階段,人類(白色)似乎贏了——兩個堅實的組分別連接到東和西,并互相互靠近連接。然而,Polygames能夠扭轉(zhuǎn)這種局面,創(chuàng)造了一個相當(dāng)復(fù)雜的中心位置。隨著Polygames使用兩個可能的路徑之一,它找到了一個成功的組合并展開了這個位置。
PyTorch3D是一個用于在3D環(huán)境中訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)的框架。盡管有大量的視覺智能系統(tǒng)需要在現(xiàn)實環(huán)境中運行,但在3D環(huán)境中訓(xùn)練這類智能體的工具和框架仍然受到高度限制。PyTorch3D是一個高度模塊化和優(yōu)化的庫,具有獨特的功能,旨在讓使用PyTorch的3D深度學(xué)習(xí)更容易。PyTorch3D為快速可微的3D數(shù)據(jù)提供了一組常用的3D操作符和損失函數(shù),以及一個模塊化可微繪制API,使研究人員能夠立即將這些函數(shù)導(dǎo)入當(dāng)前最先進(jìn)的深度學(xué)習(xí)系統(tǒng)。
PyTorch3D利用了最近在3D深度學(xué)習(xí)方面的幾個最新里程碑,如FAIR的MeshR-CNN,它實現(xiàn)了復(fù)雜室內(nèi)空間圖像的完整3D對象重建。該框架還使用Detectron2,這是一個高度優(yōu)化的2D識別庫,可以成功將對象理解推向第三維。PyTorch3D處理旋轉(zhuǎn)和3D轉(zhuǎn)換的功能也是創(chuàng)建C3DPO的核心,C3DPO是一種使用較少注釋的訓(xùn)練數(shù)據(jù)學(xué)習(xí)圖像和3D形狀之間關(guān)聯(lián)的新方法。
探索高維數(shù)據(jù)是深度學(xué)習(xí)應(yīng)用的挑戰(zhàn)之一。HiPlot是一個交互式可視化工具,它幫助人工智能研究人員發(fā)現(xiàn)高維數(shù)據(jù)中的相關(guān)性和模式,并使用平行圖和其他圖形方式來表示信息。HiPlot使用一種稱為平行圖的技術(shù),這是一種可視化和過濾高維數(shù)據(jù)的方便做法。
從功能的角度來看,HiPlot與其他可視化工具相比有以下幾個優(yōu)勢:交互性:在HiPlot中,平行圖是交互式的,這使得在不同的場景中可視化很容易。例如,你可以專注于沿著一個或多個軸獲取范圍或值,根據(jù)另一個軸設(shè)置配色方案,重新排序或刪除軸,或提取特定的數(shù)據(jù)選擇。簡潔性:使用Hiplot只需要幾行代碼。通過帶有“Hiplot”命令的服務(wù)器,就可以通過一個給定的URL訪問它,并使用它來可視化、管理和共享實驗?;诜N群的訓(xùn)練可視化:HiPlot提供了一種簡單的方法來可視化XY圖中基于種群的訓(xùn)練實驗,該圖中,不同數(shù)據(jù)點之間是有邊緣的。這種可視化在深度學(xué)習(xí)實驗中非常普遍。
在深度學(xué)習(xí)的幾個領(lǐng)域,F(xiàn)acebook的FAIR團(tuán)隊還在繼續(xù)創(chuàng)新,并積極為開源社區(qū)做出貢獻(xiàn)。PyTorch3D、Polygames和HiPlot是FAIR的最新貢獻(xiàn),旨在實現(xiàn)深度學(xué)習(xí)應(yīng)用程序的簡化。
(責(zé)任編輯:fqj)
-
Facebook
+關(guān)注
關(guān)注
3文章
1429瀏覽量
54842 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5510瀏覽量
121345
發(fā)布評論請先 登錄
相關(guān)推薦
評論