編者按:Feedly聯(lián)合創(chuàng)始人、大數(shù)據(jù)與機(jī)器學(xué)習(xí)主管Kireet Reddy分享了自己入門機(jī)器學(xué)習(xí)的經(jīng)驗(yàn)。
上大學(xué)前,我原以為自己將來(lái)會(huì)去計(jì)算機(jī)硬件行業(yè)工作,比如Intel之類。不過(guò),到了CMU后,我發(fā)現(xiàn)計(jì)算機(jī)科學(xué)課程要有趣得多,看起來(lái)這些課程我也學(xué)得更好,這恐怕不是一個(gè)巧合。我真的很享受幾乎每一門參加的CS課程。實(shí)際上,只有一門例外:機(jī)器學(xué)習(xí)入門!我對(duì)這門課程很感興趣,不幸的是,看起來(lái)這門課的教授對(duì)教授這門課程的不感興趣程度和我的感興趣程度差不多,教得也不好。所以長(zhǎng)期以來(lái)機(jī)器學(xué)習(xí)不在我的關(guān)注范圍之內(nèi)。
不過(guò),幾年前,我注意到機(jī)器學(xué)習(xí)真的吸引了很多注意力,這再次激起了我的好奇心。這次我從吳恩達(dá)的MOOC開始,吳是一個(gè)很棒的教授。和以前的區(qū)別是,我原來(lái)白天上課,現(xiàn)在網(wǎng)上上課。我一下子就著迷了,開始在網(wǎng)上搜索更多可以參加的課程。下面是我在學(xué)習(xí)過(guò)程中收獲的一些經(jīng)驗(yàn)和竅門。
追趕ML潮流是不是好主意?
毫無(wú)疑問(wèn),機(jī)器學(xué)習(xí)將經(jīng)久不衰。這一領(lǐng)域的活躍已經(jīng)有一段時(shí)間了,發(fā)展也很快,我可以說(shuō),夸大宣傳背后確實(shí)有實(shí)質(zhì)性的進(jìn)展。解決有些問(wèn)題,機(jī)器就是比人類更擅長(zhǎng)。
但這并不意味著機(jī)器學(xué)習(xí)適合每個(gè)人。機(jī)器學(xué)習(xí)方面的工作和其他軟件工程領(lǐng)域很不一樣。它更帶研究性和猜測(cè)性。如果你喜歡事先一段一段地計(jì)劃好工作,在x周之后一切就緒,那也許機(jī)器學(xué)習(xí)不怎么適合你。如果你喜歡處理數(shù)據(jù),持續(xù)學(xué)習(xí)新技術(shù),(真心)喜歡數(shù)學(xué),那么機(jī)器學(xué)習(xí)也許是一個(gè)很棒的轉(zhuǎn)職方向。
多久能趕上進(jìn)度?
這個(gè)問(wèn)題有太多答案。我首先想到的回答是“永遠(yuǎn)不能”。機(jī)器學(xué)習(xí)的范圍相當(dāng)廣泛,同時(shí)正以驚人的速度發(fā)展。如果你碰巧和我一樣需要睡眠,那么你大概無(wú)法跟上這一領(lǐng)域的每項(xiàng)進(jìn)展。但另一個(gè)更樂(lè)觀的答案也許是4個(gè)月(每周10小時(shí))。例如,這些時(shí)間足夠你完成fast.ai的課程了(很棒的課程)。
這并不是微不足道的投入,因?yàn)槟愦蟾庞性S多時(shí)間要花在工作和生活上。不過(guò),以我的個(gè)人經(jīng)歷為證,這是有可能做到的,如果你愿意投入的話,其實(shí)并不難。
好課程有哪些?
這真取決于你打算如何學(xué)習(xí)。就我個(gè)人而言,之所以喜歡機(jī)器學(xué)習(xí),是因?yàn)樗鼉?yōu)雅地組合了數(shù)學(xué)和計(jì)算機(jī)科學(xué)的許多領(lǐng)域:概率論、線性代數(shù)、微積分、優(yōu)化,等等。所以我很自然地偏向?qū)W術(shù)性課程。
斯坦福的CS231n是一個(gè)極好的學(xué)術(shù)性課程。我看了Andrej Karpathy的授課視頻,講得非常好。課程作業(yè)的設(shè)置也很好,可以遠(yuǎn)程完成。盡管課程主要內(nèi)容為圖像問(wèn)題和卷積網(wǎng)絡(luò),課程其實(shí)是“從頭開始”的,同樣覆蓋了前饋網(wǎng)絡(luò)和循環(huán)網(wǎng)絡(luò)。
如果你更喜歡偏實(shí)踐的課程,那fast.ai的課程很不錯(cuò)。Jeremy Howard從非?;A(chǔ)、系統(tǒng)的角度講授所有內(nèi)容,課程的設(shè)計(jì)讓任何具有一定技術(shù)背景的人可以參與。另外他們的論壇也是一個(gè)很不錯(cuò)的社區(qū)。
之前提到的吳恩達(dá)后來(lái)又在Coursera開了新的課程系列。我沒(méi)有親自嘗試這些課程,但我確信其中一定包含很多好東西。我感覺這門課程也是以偏向?qū)嵺`的方法教授的,不過(guò)也涉及一些背后的數(shù)學(xué)。
我建議你嘗試多門課程,然后挑選一門最能吸引你的注意力的課程。不過(guò)我鼓勵(lì)你至少逐漸完成一門實(shí)踐性課程和一門理論性課程,這是一個(gè)很好的互補(bǔ)。為了理解論文(警告:你需要閱讀學(xué)術(shù)論文),學(xué)術(shù)性課程將幫助你適應(yīng)長(zhǎng)篇的技術(shù)內(nèi)容。實(shí)踐性課程則將提供一些直覺,幫助你做出ML項(xiàng)目中的各種決策。
如果你需要溫習(xí)一下數(shù)學(xué),或者想學(xué)得更深入一點(diǎn),MIT有幾門很棒的課程。任何ML工作都絕對(duì)需要對(duì)概率學(xué)良好的理解,John Tsitsiklis教授的6.041/6.431講得超棒。John將復(fù)雜問(wèn)題逐步分解,直到答案顯而易見的地步,這種授課方法完全是藝術(shù)。
MIT的線性代數(shù)課程(18.06)也很有意思。這門課的教授同樣很出色,風(fēng)格獨(dú)特。不過(guò)這門課程并不是真的很有必要,因?yàn)榇蠖鄶?shù)ML任務(wù)只需要理解矩陣乘法。
如果我不懂編程該怎么辦?
去學(xué)。
大多數(shù)ML工作基于Python完成,幸運(yùn)的是,Python相當(dāng)容易上手。大多數(shù)ML工作也真不需要你是一個(gè)世界級(jí)的程序員。但我還是建議你在進(jìn)行任何ML方面的工作前參加一門關(guān)于編程的速成線上課程。一下子學(xué)習(xí)編程和機(jī)器學(xué)習(xí)的概念(更別說(shuō)還需要重新學(xué)習(xí)你大概已經(jīng)忘掉了的一堆數(shù)學(xué))是災(zāi)禍之因。給自己一個(gè)循序漸進(jìn)的機(jī)會(huì)。
我有一定基礎(chǔ),現(xiàn)在該怎么做?
好,現(xiàn)在到了開始建模的時(shí)候了!一般來(lái)說(shuō)有兩條路可走:1) 在工作中找一個(gè)項(xiàng)目,或者進(jìn)行一個(gè)個(gè)人項(xiàng)目;2) 找一個(gè)Kaggle競(jìng)賽。這取決于你的具體情況,不過(guò)我建議選Kaggle,主要原因如下:
問(wèn)題是明確定義的。恰當(dāng)?shù)亟Y(jié)構(gòu)化真實(shí)生活中的ML問(wèn)題可能需要一定的技巧。Kaggle就不存在這個(gè)問(wèn)題。
類似地,有時(shí)候自己創(chuàng)建的數(shù)據(jù)集可能包含一些難以診斷的缺陷。而Kaggle競(jìng)賽會(huì)給你提供數(shù)據(jù)。
Kaggle提供了一個(gè)處理同樣問(wèn)題的社區(qū)。如果你陷入困境或者需要一點(diǎn)指引,有地方可去。
另一方面,如果你在工作中能碰到為ML方案量身定做的問(wèn)題(比如圖像分類),那么也許工作項(xiàng)目是給你的同事留下深刻印象并說(shuō)服老板讓你在機(jī)器學(xué)習(xí)上投入更多時(shí)間的快捷方式。
所以,如果你正考慮鉆研機(jī)器學(xué)習(xí),請(qǐng)勇往直前!機(jī)器學(xué)習(xí)最棒的一點(diǎn)是人們?cè)跁r(shí)間和知識(shí)方面真的很慷慨。一旦開始,你能在網(wǎng)上找到很棒的支持系統(tǒng),幫助你前行。
-
計(jì)算機(jī)科學(xué)
+關(guān)注
關(guān)注
1文章
144瀏覽量
11381 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8435瀏覽量
132887
原文標(biāo)題:Feedly創(chuàng)始人是如何入門機(jī)器學(xué)習(xí)的
文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論