本月的最熱機(jī)器學(xué)習(xí)項(xiàng)目出來(lái)了!Mybridge對(duì)過(guò)去一個(gè)月的近250個(gè)機(jī)器學(xué)習(xí)開源項(xiàng)目進(jìn)行了排名,甄選出GitHub星數(shù)最多的10大熱門項(xiàng)目。開源項(xiàng)目是機(jī)器學(xué)習(xí)研究的寶庫(kù),你一定能從中找到一個(gè)能啟發(fā)你的有趣項(xiàng)目。
Mybridge對(duì)過(guò)去一個(gè)月的近250個(gè)機(jī)器學(xué)習(xí)開源項(xiàng)目進(jìn)行了排名,甄選出GitHub星數(shù)最多的Top 10熱門項(xiàng)目。
這個(gè)列表中10個(gè)項(xiàng)目的平均GitHub星星數(shù):1041??
主題包括:DensePose,圖像分類, Mulit-Scale訓(xùn)練,移動(dòng)AI計(jì)算引擎,衛(wèi)星圖像,NLP,Python包,Word detection,NCRF,DALI。
開源項(xiàng)目對(duì)程序員來(lái)說(shuō)是很有幫助的。希望你能從中找到一個(gè)能啟發(fā)你的有趣項(xiàng)目。
No.1:DensePose:密集人體姿態(tài)估計(jì)
DensePose是一種實(shí)時(shí)的方法,可以將所有2D RGB圖像的人體像素映射到身體的3D表面模型。[Github 2901顆星]來(lái)自Facebook的研究
密集人體姿態(tài)估計(jì)(Dense human pose estimation)的目的是將RGB圖像的所有人體像素映射到人體的3D表面。DensePose-RCNN是在Detectron框架中實(shí)現(xiàn)的,使用的是Caffe2。
作者在這個(gè)GitHub存儲(chǔ)庫(kù)中提供了訓(xùn)練和評(píng)估DensePose-RCNN的代碼。同時(shí)還提供了notebook,用于可視化收集的DensePose-COCO數(shù)據(jù)集,并展示與SMPL模型的對(duì)應(yīng)關(guān)系。
DensePose-COCO注釋的可視化
項(xiàng)目地址:
https://github.com/facebookresearch/DensePose
No.2:Darts:卷積網(wǎng)絡(luò)和循環(huán)網(wǎng)絡(luò)的可微分架構(gòu)搜索
[Github 1128顆星],來(lái)自CMU Hanxiao Liu,Yiming Yang以及DeepMind Karen Simonyan等人的研究。
這個(gè)GitHub庫(kù)提供了他們的論文“DARTS: Differentiable Architecture Search”中的代碼。在這篇論文中,研究者提出通過(guò)以可微分的方式表示任務(wù)來(lái)解決架構(gòu)搜索可擴(kuò)展性的挑戰(zhàn)。該方法基于架構(gòu)表示的連續(xù)松弛(continuous relaxation),允許使用梯度下降來(lái)有效搜索架構(gòu)。
該方法能夠有效地設(shè)計(jì)用于圖像分類的高性能卷積網(wǎng)絡(luò)架構(gòu)(在CIFAR-10和ImageNet上)和用于語(yǔ)言建模的循環(huán)網(wǎng)絡(luò)架構(gòu)(在Penn Treebank和WikiText-2上), 并且只使用一個(gè)GPU,比最先進(jìn)的非可微分技術(shù)快幾個(gè)數(shù)量級(jí)。
隨時(shí)間推進(jìn),卷積網(wǎng)絡(luò)架構(gòu)的搜索
隨時(shí)間推進(jìn),卷積網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)架構(gòu)的搜索
項(xiàng)目地址:
https://github.com/quark0/darts
[Github 1352顆星]
SNIPER是一種高效的多尺度(multi-scale)訓(xùn)練方法,用于實(shí)例級(jí)的識(shí)別任務(wù),例如目標(biāo)檢測(cè)和實(shí)例級(jí)分割。SNIPER不是在圖像金字塔中處理所有像素,而是有選擇地處理ground truth對(duì)象周圍(也就是芯片)的上下文區(qū)域。這大大加快了在低分辨率芯片上運(yùn)行的多尺度訓(xùn)練。由于其內(nèi)存的設(shè)計(jì)十分高效,SNIPER可以在訓(xùn)練過(guò)程中受益于batch normalization,并且可以在單個(gè)GPU上完成更大batch-sizes 的實(shí)例級(jí)識(shí)別任務(wù)。因此,我們不需要跨GPU同步batch-normalization 數(shù)據(jù),我們可以訓(xùn)練對(duì)象檢測(cè)器,就像做圖像分類一樣!
項(xiàng)目地址:
https://github.com/mahyarnajibi/SNIPER
No.4:Mace:專為移動(dòng)端異構(gòu)計(jì)算平臺(tái)優(yōu)化的深度學(xué)習(xí)推理框架
[Github 2118顆星]。 來(lái)自小米
Mobile AI Compute Engine (MACE)是小米開源的移動(dòng)端深度學(xué)習(xí)框架,它針對(duì)移動(dòng)芯片特性進(jìn)行了大量?jī)?yōu)化,目前在小米手機(jī)上已廣泛應(yīng)用,如人像模式、場(chǎng)景識(shí)別等。
Mace主要從以下的角度做了專門的優(yōu)化:
性能
代碼經(jīng)過(guò)NEON指令,OpenCL以及Hexagon HVX專門優(yōu)化,并且采用Winograd算法來(lái)進(jìn)行卷積操作的加速。 此外,還對(duì)啟動(dòng)速度進(jìn)行了專門的優(yōu)化。
功耗
支持芯片的功耗管理,例如ARM的big.LITTLE調(diào)度,以及高通Adreno GPU功耗選項(xiàng)。
系統(tǒng)響應(yīng)
支持自動(dòng)拆解長(zhǎng)時(shí)間的OpenCL計(jì)算任務(wù),來(lái)保證UI渲染任務(wù)能夠做到較好的搶占調(diào)度, 從而保證系統(tǒng)UI的相應(yīng)和用戶體驗(yàn)。
內(nèi)存占用
通過(guò)運(yùn)用內(nèi)存依賴分析技術(shù),以及內(nèi)存復(fù)用,減少內(nèi)存的占用。另外,保持盡量少的外部 依賴,保證代碼尺寸精簡(jiǎn)。
模型加密與保護(hù)
模型保護(hù)是重要設(shè)計(jì)目標(biāo)之一。支持將模型轉(zhuǎn)換成C++代碼,以及關(guān)鍵常量字符混淆,增加逆向的難度。
硬件支持范圍
支持高通,聯(lián)發(fā)科,以及松果等系列芯片的CPU,GPU與DSP(目前僅支持Hexagon)計(jì)算加速。 同時(shí)支持在具有POSIX接口的系統(tǒng)的CPU上運(yùn)行。
項(xiàng)目地址:
https://github.com/XiaoMi/mace
No. 5:Robosat:用于航空和衛(wèi)星圖像的語(yǔ)義分割工具
[Github 886顆星]。由Salesforce打造
RoboSat是用Python 3編寫的一個(gè)端到端的pipeline,用于從航空?qǐng)D像和衛(wèi)星圖像中提取特征。特征可以是任何視覺上可區(qū)分的東西,例如:建筑物,停車場(chǎng),道路,或汽車。
RoboSat提供的工具可分為以下幾類:
數(shù)據(jù)準(zhǔn)備:為訓(xùn)練特征提取模型創(chuàng)建數(shù)據(jù)集
訓(xùn)練和建模:用于圖像中特征提取的分割模型
post-processing:將分割結(jié)果轉(zhuǎn)換為簡(jiǎn)潔的幾何圖形
項(xiàng)目地址:
https://github.com/mapbox/robosat
No.6 decaNLP:處理自然語(yǔ)言任務(wù),一個(gè)頂十個(gè)
[Github 776顆星]
自然語(yǔ)言十項(xiàng)全能(decaNLP)的目標(biāo)是構(gòu)建一個(gè)能夠完成十項(xiàng)自然語(yǔ)言任務(wù)的通用模型,這些任務(wù)包括:問答、機(jī)器翻譯、摘要、自然語(yǔ)言推理、情感分析、語(yǔ)義角色標(biāo)注、關(guān)系抽取、目標(biāo)導(dǎo)向?qū)υ挕⒄Z(yǔ)義分析、常識(shí)代詞消解。每個(gè)任務(wù)都被轉(zhuǎn)換為問答問題,以便使用新的多任務(wù)問題應(yīng)答網(wǎng)絡(luò)(Multitask Question Answering Network,MQAN)。該模型聯(lián)合學(xué)習(xí)decaNLP中的所有任務(wù),并且在多任務(wù)設(shè)置中不使用任何特定于任務(wù)的模塊或者參數(shù)。
項(xiàng)目地址:
https://github.com/salesforce/decaNLP
No.7 Magnitude:一個(gè)快速、高效的通用矢量嵌入實(shí)用包
[Github 427顆星]
Magnitude是一個(gè)功能豐富的Python包和矢量存儲(chǔ)的文件格式,用于以快速、高效、簡(jiǎn)單的方式使用機(jī)器學(xué)習(xí)模型中的向量嵌入(由Plasticity開發(fā))。它逐漸成為“輕量版”的Gensim,但卻可以用于NPL之外的領(lǐng)域,作為一種通用的關(guān)鍵向量(key-vector)存儲(chǔ)。
項(xiàng)目地址:
https://github.com/plasticityai/magnitude
No.8 Porcupine:由深度學(xué)習(xí)驅(qū)動(dòng)的設(shè)備喚醒詞檢測(cè)引擎
[Github 373顆星]
Porcupine是一款自助式,高精度,輕量級(jí)的喚醒字檢測(cè)引擎。它使開發(fā)人員能夠構(gòu)建始終監(jiān)聽(always-listening)語(yǔ)音的應(yīng)用程序/平臺(tái)。
自助式:開發(fā)人員有權(quán)在幾秒鐘內(nèi)選擇任何喚醒詞并構(gòu)建其模型。
在現(xiàn)實(shí)場(chǎng)景中用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練
由于它緊湊且計(jì)算效率高,使其適用于物聯(lián)網(wǎng)的應(yīng)用
跨平臺(tái):它是在純定點(diǎn)ANSI C中實(shí)現(xiàn)的。目前支持Raspberry Pi、Android、iOS、watchOS,Linux,Mac和Windows。
可擴(kuò)展性:它可以同時(shí)檢測(cè)數(shù)十個(gè)喚醒詞,幾乎不增加CPU/內(nèi)存占用。
開源:在這個(gè)存儲(chǔ)庫(kù)中找到的任何東西都是Apache 2.0許可的。
項(xiàng)目地址:
https://github.com/Picovoice/Porcupine
No.9 NCRF:神經(jīng)條件隨機(jī)場(chǎng),檢測(cè)腫瘤轉(zhuǎn)移
[Github 290顆星]
由百度深度學(xué)習(xí)研究院提出,其文章結(jié)構(gòu)如下(附代碼和數(shù)據(jù)):
NCRF介紹
準(zhǔn)備工作
數(shù)據(jù)介紹
模型介紹
訓(xùn)練
測(cè)試
項(xiàng)目地址:
https://github.com/baidu-research/NCRF
No.10:NVIDIA DALI
這是一個(gè)包含高度優(yōu)化的構(gòu)建模塊和用于深度學(xué)習(xí)應(yīng)用中數(shù)據(jù)預(yù)處理執(zhí)行引擎的庫(kù)。NVIDIA DALI可加速深度學(xué)習(xí)應(yīng)用程序的輸入數(shù)據(jù)預(yù)處理。 DALI 提供加速不同數(shù)據(jù)管道的性能和靈活性,作為一個(gè)單獨(dú)的庫(kù),可以輕松集成到不同的深度學(xué)習(xí)訓(xùn)練和推理應(yīng)用程序中。
DALI的主要亮點(diǎn)包括:
從磁盤讀取到準(zhǔn)備訓(xùn)練/推理的完整的數(shù)據(jù)流水線;
可配置圖形和自定義操作員的靈活性;
支持圖像分類和分割工作量;
通過(guò)框架插件和開源綁定輕松實(shí)現(xiàn)集成;
具有多種輸入格式的便攜式訓(xùn)練工作流 - JPEG,LMDB,RecordIO,TFRecord;
通過(guò)開源許可證可擴(kuò)展以滿足用戶的特定需求
-
圖像
+關(guān)注
關(guān)注
2文章
1088瀏覽量
40515 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132838 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1208瀏覽量
24749
原文標(biāo)題:【干貨】7月機(jī)器學(xué)習(xí)Top 10,GitHub平均1041星!
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論