這年頭不學(xué)點(diǎn)AI知識(shí),可能都不好意思說(shuō)自己是新時(shí)代的接班人了。
人工智能風(fēng)頭正盛,無(wú)論你是支持還是懷疑,AI對(duì)這個(gè)時(shí)代的影響都已逐漸滲透到各行各業(yè)當(dāng)中,哪怕身處非互聯(lián)網(wǎng)行業(yè),也能感受到AI的滾滾浪潮。
學(xué)習(xí)已成剛需,不過(guò)對(duì)于初學(xué)者而言,要正正經(jīng)經(jīng)上手機(jī)器學(xué)習(xí),如何入門就有點(diǎn)讓人頭大了。
好在計(jì)算機(jī)領(lǐng)域向來(lái)有和諧互助之風(fēng),德國(guó)程序猿Michiel Mulders近日就精心炮制了一份機(jī)器學(xué)習(xí)入門新手指南。一起來(lái)看看AI大法該當(dāng)如何修煉吧。
入門指南
欲練此功,首先要知道,紙上談兵是本門大忌。
吳恩達(dá)就曾經(jīng)說(shuō)到,想要入門機(jī)器學(xué)習(xí),應(yīng)該進(jìn)行一些項(xiàng)目實(shí)踐。所以入門第一步,從選擇一個(gè)數(shù)據(jù)集開始:
找到一個(gè)大小合宜,并且相對(duì)容易分析的數(shù)據(jù)集。UCL ML Repository和Kaggle盛產(chǎn)此物。
對(duì)數(shù)據(jù)集進(jìn)行試驗(yàn)。挑幾個(gè)頂級(jí)的機(jī)器學(xué)習(xí)算法跑一跑這些數(shù)據(jù),看看數(shù)據(jù)的表現(xiàn),了解一下每種算法的性能。
挑選表現(xiàn)最佳的算法,調(diào)教它。
這就完事了?no,no,no,本份指南還貼心奉上五佳項(xiàng)目,任君挑選?!?/p>
TOP 5
項(xiàng)目:監(jiān)督式機(jī)器學(xué)習(xí)數(shù)據(jù)集:鳶尾花數(shù)據(jù)集
鳶尾花數(shù)據(jù)集堪稱機(jī)器學(xué)習(xí)領(lǐng)域的“Hello World”。對(duì)數(shù)據(jù)一無(wú)所知?那么選擇它就對(duì)了。
這個(gè)數(shù)據(jù)集的好處是足夠小,僅僅只有150行,并且它只有四個(gè)屬性:花瓣長(zhǎng)度,花瓣寬度,萼片長(zhǎng)度和萼片寬度。
通過(guò)判別四個(gè)已知屬性,四種不同類型的鳶尾花在數(shù)據(jù)集中被標(biāo)記出來(lái),所以你可以拿它來(lái)學(xué)學(xué)監(jiān)督式機(jī)器學(xué)習(xí)。
這里建議使用多元分類訓(xùn)練方法。
另外,記得給自己設(shè)立一個(gè)小目標(biāo):根據(jù)花瓣和萼片的大小對(duì)三種花進(jìn)行分類。
相關(guān)鏈接:
UCI機(jī)器學(xué)習(xí)倉(cāng)庫(kù)(UCI ML Repository):https://archive.ics.uci.edu/ml/index.php
Kaggle數(shù)據(jù)集:https://www.kaggle.com/datasets項(xiàng)目:交易預(yù)測(cè)平臺(tái):GNY
很多流行的機(jī)器學(xué)習(xí)服務(wù)價(jià)格高昂,對(duì)于新手十分不友好。不如選擇GNY團(tuán)隊(duì)的機(jī)器學(xué)習(xí)平臺(tái),這個(gè)平臺(tái)挺好挺強(qiáng)大,最重要的是提供免費(fèi)的下載安裝。
GNY團(tuán)隊(duì)還發(fā)布了一個(gè)通過(guò)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)零售交易的demo,正式版本將在今夏登陸,還將提供定制服務(wù)。
對(duì)于機(jī)器學(xué)習(xí)新人小白來(lái)說(shuō),這個(gè)demo不失為一個(gè)有趣的入門項(xiàng)目。你可以到MLWave上找一個(gè)數(shù)據(jù)集,根據(jù)消費(fèi)歷史來(lái)預(yù)測(cè)哪些人會(huì)成為回頭客。
相關(guān)鏈接:
GNY機(jī)器學(xué)習(xí)平臺(tái):https://www.gny.io/
MLWave回頭客數(shù)據(jù)集:https://mlwave.com/predicting-repeat-buyers-vowpal-wabbit/
項(xiàng)目:情緒分析數(shù)據(jù)集:twitter
情緒分析是機(jī)器學(xué)習(xí)里非常有趣的一種應(yīng)用,檢索數(shù)據(jù)也很容易獲得,Reddit、Facebook和Linkedln都提供了易于使用的API。不過(guò)首選還是Twitter的數(shù)據(jù),Twitter平臺(tái)上的數(shù)據(jù)格式一致,預(yù)處理也要容易得多。
首先!pipinstallPython-twitter,然后就開動(dòng)吧,不過(guò)過(guò)度使用可是會(huì)被列入黑名單的喲。
再列幾個(gè)具體的方向以供參考:
分析對(duì)新發(fā)布電影的情緒,并將其與IMDB和其他評(píng)級(jí)網(wǎng)站上的評(píng)論進(jìn)行比較。
分析圍繞特定選舉或任何其他政治話題的情緒。
根據(jù)推文的情緒預(yù)測(cè)前50種加密貨幣未來(lái)的價(jià)格。
相關(guān)鏈接:
Twitter數(shù)據(jù)集:https://github.com/shaypal5/awesome-twitter-data
項(xiàng)目:推薦系統(tǒng)數(shù)據(jù)集:Movielens
想必沒(méi)有人會(huì)對(duì)推薦系統(tǒng)感到陌生。
推薦系統(tǒng)是機(jī)器學(xué)習(xí)技術(shù)在商業(yè)中最成功和最廣泛的應(yīng)用之一,幾乎滲入到了日常生活的每一個(gè)角落。網(wǎng)易云音樂(lè)的個(gè)性推薦,神奇的抖音算法都屬于這一范疇。
關(guān)于推薦系統(tǒng),可以使用兩種算法:
基于內(nèi)容推薦算法:尋找內(nèi)容的相似性。
協(xié)作過(guò)濾算法:尋找交互中的相似性。即對(duì)一大群人進(jìn)行分析,確認(rèn)品位相近的人。
Movielens是最受歡迎的電影評(píng)級(jí)數(shù)據(jù)集之一,對(duì)初學(xué)者來(lái)說(shuō)是試驗(yàn)推薦算法的理想數(shù)據(jù)集。
于是你可以再立一個(gè)小目標(biāo)了:根據(jù)用戶評(píng)分來(lái)預(yù)測(cè)他們會(huì)喜歡哪部電影。
項(xiàng)目:股票價(jià)格預(yù)測(cè)數(shù)據(jù)集:Quandl
對(duì)于股民來(lái)說(shuō),如果能預(yù)測(cè)股票價(jià)格,那豈不是亦可賽艇?但不管你是不是股民,都可以試試用機(jī)器學(xué)習(xí)來(lái)實(shí)現(xiàn)股票價(jià)格預(yù)測(cè)。
我們先來(lái)列列關(guān)鍵字:
波動(dòng)率指數(shù)
歷史價(jià)格
全球宏觀經(jīng)濟(jì)指標(biāo)
基本面分析
指標(biāo)技術(shù)分析
股票市場(chǎng)具有更短的反饋周期,也就是預(yù)測(cè)的結(jié)果可以更快被驗(yàn)證,十分適合新手學(xué)習(xí)。
選擇一個(gè)簡(jiǎn)單的機(jī)器學(xué)習(xí)示例,到Quandl.com上下載股票市場(chǎng)數(shù)據(jù)集,就可以動(dòng)手預(yù)測(cè)未來(lái)6個(gè)月的股票價(jià)格變化了。友情提醒:AI只負(fù)責(zé)產(chǎn)生結(jié)果,不對(duì)結(jié)果負(fù)責(zé)。
相關(guān)鏈接:
Quandl數(shù)據(jù)集:https://www.quandl.com/
新手向TOP 5項(xiàng)目介紹完畢??吹竭@里,是不是已經(jīng)摩拳擦掌,感覺自己可以分分鐘入門AI啦?快拎上數(shù)據(jù)集,AI江湖等你亮劍~
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7113瀏覽量
89303 -
AI
+關(guān)注
關(guān)注
87文章
31319瀏覽量
269664 -
人工智能
+關(guān)注
關(guān)注
1792文章
47530瀏覽量
239276
原文標(biāo)題:如何入門AI?五大新手項(xiàng)目奉上
文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論