現(xiàn)在,不了解一些機器學(xué)習(xí)技能,可能都會覺得自己有些out了。但過去苦于沒有數(shù)據(jù)、沒有GPU,沒有算法,很多感興趣的朋友就望而卻步了。今天就不同了,開放的數(shù)據(jù)比比皆是,算力也逐漸強大,還有數(shù)不清的線上課程資料。如果你想開啟機器學(xué)習(xí)的大門,就和我們一起來看看這份豐富的資源清單吧!我們將從數(shù)據(jù)、算力、算法和在線教育等四個方面,為你進入機器學(xué)習(xí)的大門掃清障礙,大步向前!
數(shù)據(jù)
數(shù)據(jù)是算法的養(yǎng)料,可以說這一波深度學(xué)習(xí)的革命就來源于豐富的數(shù)據(jù)給予的充足養(yǎng)分,才滋養(yǎng)了人工智能再一次的蓬勃發(fā)展!
數(shù)據(jù)集嘛,圖像、文本、語音,你想要的應(yīng)該都能找到。包括圖像領(lǐng)域著名的ImageNet,kitti等數(shù)據(jù)集
也包括推薦系統(tǒng)方面的IMDb和Million Song
還包括自然語言處理方面的MS MARCO datasets等等著名的數(shù)據(jù)。
Github上的小伙伴已經(jīng)為我們準備好了一份數(shù)據(jù)大餐,如果你想要數(shù)據(jù)可以到這里盡情下載,除了深度學(xué)習(xí)數(shù)據(jù)外,還包括經(jīng)濟、醫(yī)學(xué)、農(nóng)業(yè)等等各個行業(yè)的豐富數(shù)據(jù),總有一款適合你的興趣。
https://github.com/awesomedata/awesome-public-datasets
如果這還嫌不夠,Kaggle還有一些令人驚喜的優(yōu)質(zhì)數(shù)據(jù)集。
https://www.kaggle.com/datasets
這里有著名的鳶尾花數(shù)據(jù)集
也有精彩大片的數(shù)據(jù)集
還有可愛的小蘑菇,讓機器學(xué)習(xí)看看能不能吃:
甚至還有美國大選的數(shù)據(jù)集:
無論是使用公開的數(shù)據(jù)集,還是通過Python從web上抓取數(shù)據(jù),現(xiàn)在每個人都可以有機會訪問高質(zhì)量的數(shù)據(jù)集。當(dāng)然,大型科技公司會把數(shù)據(jù)私有化以便從中挖掘出最大的價值,但卻還有很多人不斷的努力為世界創(chuàng)造出更多開放的優(yōu)質(zhì)數(shù)據(jù),讓初學(xué)者、工程師和數(shù)據(jù)科學(xué)家們都能利用這些數(shù)據(jù)訓(xùn)練模型、開啟機器學(xué)習(xí)的大門。
計算
有了數(shù)據(jù)后要找地方進行計算也是個頭疼的問題。雖然對于普通的機器學(xué)習(xí)問題來說,你的筆記本就能夠搞定,但是對于深度學(xué)習(xí)任務(wù)或者大數(shù)據(jù)量的數(shù)據(jù)集,小本本的算力就捉襟見肘了。這時候,似乎只有眼饞別人實驗室的GPU了。神經(jīng)網(wǎng)絡(luò)需要使用大規(guī)模并行計算,GPU非常適合這個工作。不幸的是,GPU還是比較貴的。
如果你的筆記本有可以使用的顯卡,那就十分愉快啦。如果沒有的話,可以考慮入手一塊1050之類的入門版GPU來開啟你的加速之旅,或者也可以通過亞馬遜、谷歌、微軟以及國內(nèi)各家云服務(wù)廠商提供的GPU實例來進行計算,一頓飯錢就可以跑好長時間了。
當(dāng)然,還有免費的午餐,谷歌的Colab和kaggle的kernel中,你可以申請開啟GPU來運行自己的算法處理數(shù)據(jù)。更為方便的是,它們都是基于notebook的格式,使得程序的編寫變得更加直觀方便。
另外各大高校內(nèi)一般都設(shè)有計算中心,校內(nèi)價格也十分便宜,對于學(xué)生來說是一個不錯的選擇。
算法
有人說,算法是一種充滿價值的商品,一個優(yōu)秀的算法可能價值連城。幸運的是,機器學(xué)習(xí)領(lǐng)域已經(jīng)建立了開源共享的良好文化。無論是在NIPS還是ICLR會議上,研究人員非常樂意分享他們成果。像Github和reddit一樣的社區(qū)在源源不斷地交流、碰撞出各種新思想和新方法,這里的代碼可以作為你學(xué)習(xí)和研究的起點。
對于學(xué)術(shù)型的小伙伴來說,如果想跟上最新的研究,可以到Arxiv閱讀最新的論文,幾乎覆蓋了全球范圍內(nèi)各個研究團隊的最新研究結(jié)果。
教育
有了代碼,也有了數(shù)據(jù),有了計算能力,現(xiàn)在只需要學(xué)習(xí)如何使用它們。你可以從coursera上開始你的機器學(xué)習(xí)入門之旅,有包括吳恩達在內(nèi)的名師指路,學(xué)習(xí)一定會有個好的開始。同時也可以在網(wǎng)站上找到各種優(yōu)秀的機器學(xué)習(xí)入門書籍,深入學(xué)習(xí)后你會發(fā)現(xiàn)無窮的魅力!
同時網(wǎng)上豐富的視頻教程也能讓你學(xué)習(xí)到無數(shù)的實踐、思想和機器學(xué)習(xí)的無數(shù)技巧~
是不是有點小激動呢?這是一個不可思議的時代。在這個飛速變化的時代里,機器學(xué)習(xí)可以幫助我們以另一種我們不擅長的方式理解這個世界。它可以幫助我們比以往更有效地創(chuàng)造和發(fā)現(xiàn)無數(shù)的新事物?,F(xiàn)在我們獲得了這種神力了,聰明的你一定會善加利用的!
-
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8429瀏覽量
132854 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1208瀏覽量
24760 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5511瀏覽量
121355
原文標題:掃盲貼 | 再也沒有借口不學(xué)機器學(xué)習(xí)了!全方位資源消滅你不學(xué)習(xí)的接口
文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論