組建一個(gè)出色的數(shù)據(jù)團(tuán)隊(duì)都需要哪些角色?Google 的首席決策工程師 Cassie Kozyrkov 在這一問題上有自己獨(dú)到的見解。在她看來,一個(gè)好的 AI 和數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要 10 種不同的角色。無論你是公司的管理者、招聘者,還是想在數(shù)據(jù)科學(xué)領(lǐng)域工作的求職者,都可以在這篇文章中找到對(duì)自己有用的信息。
Google 的 Geoffrey Hinton 是我的偶像,也是深度學(xué)習(xí)領(lǐng)域的開山鼻祖,
但我不希望一個(gè)團(tuán)隊(duì)中有10個(gè) Geoffrey Hinton 這樣的成員而沒有其他角色。
應(yīng)用數(shù)據(jù)科學(xué)是高度跨學(xué)科的領(lǐng)域,依賴于整個(gè)團(tuán)隊(duì)的共同協(xié)作,多角度的觀點(diǎn)尤為重要。事實(shí)上,觀點(diǎn)和態(tài)度的重要性僅次于教育和經(jīng)驗(yàn)。
如果你想要通過智能的工程決策方法使數(shù)據(jù)變得有用,并且希望從事相關(guān)的職業(yè),那么下面我對(duì)團(tuán)隊(duì)發(fā)展中的角色順序(從0開始)提出的看法或許對(duì)你會(huì)有幫助。
▌0.數(shù)據(jù)工程師
在數(shù)據(jù)分析之前,你要獲取所需的數(shù)據(jù)。如果你需要處理的是小型數(shù)據(jù)集,那么數(shù)據(jù)工程實(shí)際上就是在電子表格中輸入一些數(shù)字。但當(dāng)你需要處理大規(guī)模數(shù)據(jù)時(shí),數(shù)據(jù)工程本身就成為了一門復(fù)雜的學(xué)科。就需要團(tuán)隊(duì)中有一個(gè)人來專門負(fù)責(zé)處理棘手的工程問題,以便團(tuán)隊(duì)中其他人基于此協(xié)同工作。
▌1.決策者
在你想聘請(qǐng)一位博士畢業(yè)的數(shù)據(jù)科學(xué)家前,其實(shí)更需要擁有一位了解數(shù)據(jù)驅(qū)動(dòng)決策的科學(xué)決策者。
他主要負(fù)責(zé)決定哪些問題可以用數(shù)據(jù)來解決,進(jìn)行初步規(guī)劃,并從商業(yè)角度來確定所需的分析級(jí)別。一位深思熟慮的人,他不會(huì)一直說,“哦,哎呀,我在思考這個(gè)決定時(shí)甚至都沒有想到這種狀況。” 作為決策者要考慮周到,思考所有可能的情況并作出決策。
▌2.分析師
數(shù)據(jù)分析師是你下一個(gè)需要考慮的角色。他有能力查看數(shù)據(jù)、了解數(shù)據(jù)結(jié)構(gòu)并從中獲得靈感,唯一的不足是他可能對(duì)這項(xiàng)工作中需要使用的軟件并不熟悉。如果你看過數(shù)碼照片,那么你已經(jīng)接觸過數(shù)據(jù)可視化及分析了。
學(xué)習(xí)使用 R 和 Python 等工具只是對(duì) MS Paint 進(jìn)行數(shù)據(jù)可視化的升級(jí);它們是用來查看多類別數(shù)據(jù)集的一種多功能可視化工具,而不僅僅是 RGB 像素矩陣。
分析師可以利用飯后時(shí)間多觀察數(shù)據(jù),從中找到些靈感,肯定比不做這些要好。如果整個(gè)團(tuán)隊(duì)的成員都這么做的話,那么你一定可以比其它不這樣做的團(tuán)隊(duì)更能把握行業(yè)的命脈。
Nessie 1934:這是數(shù)據(jù),請(qǐng)明智地給出結(jié)論。
有一點(diǎn)非常重要,作為一名數(shù)據(jù)分析師,所做出的任何結(jié)論都不能脫離數(shù)據(jù)。這是一種需要專業(yè)訓(xùn)練的技能,就如上面的照片一樣,你可以說:“這就是我的數(shù)據(jù)所要展示的內(nèi)容。”但不要因此給出結(jié)論,如“尼斯湖水怪真的存在”這樣的言論。
▌3.專業(yè)分析師
這是一個(gè)節(jié)奏很快的角色。勝任這份工作的人要能夠更快速地查看更多數(shù)據(jù)。快速處理數(shù)據(jù),并善于探索發(fā)現(xiàn)有趣的東西是這類人才所需的技能!同時(shí),這一角色不需要給出小心嚴(yán)謹(jǐn)?shù)囊庖?,而是幫助團(tuán)隊(duì)盡可能多地關(guān)注數(shù)據(jù)本身,以便讓決策者了解真正值得關(guān)注的因素。
這可能與我們的直覺想法不同,但不要把這樣的工作交給你最信任的,那些很會(huì)寫代碼的工程師去做。我們需要的不僅是能夠快速工作的人才,還盡可能快地發(fā)現(xiàn)數(shù)據(jù)背后潛在的信息,而對(duì)于那些樂于編程的工程師來說,觀察數(shù)據(jù)可能是比較難的,因此也就很難勝任這份角色的工作。
我曾見過一名分析師被工程文化濃厚的團(tuán)隊(duì)欺負(fù),因?yàn)閳F(tuán)隊(duì)成員顯然沒有意識(shí)到所謂“優(yōu)秀代碼”很難用描述性分析進(jìn)行解釋。正是如此,這里的“優(yōu)秀”指的是“高效和謙虛”。如果一個(gè)高效但粗心的程序員無法融入團(tuán)隊(duì),他們自然會(huì)離開,而這也證明了自己對(duì)業(yè)務(wù)反應(yīng)敏捷。
▌4.統(tǒng)計(jì)學(xué)家
現(xiàn)在,我們已經(jīng)找到幫助我們分析數(shù)據(jù)的員工了,而統(tǒng)計(jì)學(xué)家能夠協(xié)助決策者在分析數(shù)據(jù)后得到嚴(yán)謹(jǐn)、有依據(jù)的結(jié)論。
我們最好還是控制一下這種"喂數(shù)據(jù)"的瘋狂。如果你能克制住學(xué)習(xí)真實(shí)情況之外的沖動(dòng)的話,那么看“Nessie”這張圖沒問題。但是你會(huì)克制住嗎?盡管人類非常擅長于合理分析圖片,但其他數(shù)據(jù)類型似乎無法用常理解釋。所以,統(tǒng)計(jì)學(xué)家的出現(xiàn)可能有助于團(tuán)隊(duì)在分析數(shù)據(jù)后得到嚴(yán)謹(jǐn)、有據(jù)的結(jié)論。
例如,如果你的機(jī)器學(xué)習(xí)系統(tǒng)正在一個(gè)數(shù)據(jù)集上工作,那么所有你能得出的結(jié)論都是基于該數(shù)據(jù)集的。換句話說,你的系統(tǒng)在該數(shù)據(jù)集上是起作用的,但它在生產(chǎn)過程中也一定會(huì)起作用嗎?你能得出這個(gè)結(jié)論嗎?這時(shí)候你就需要一些額外的技能來處理這些問題,統(tǒng)計(jì)方面的知識(shí)或許能幫到你。
靈感是很便宜,但嚴(yán)謹(jǐn)?shù)膽B(tài)度是昂貴的。很多時(shí)候我們可以用純粹的靈感來滿足自己。
在你需要認(rèn)真做出一個(gè)決定之前,如果還沒有完全地認(rèn)識(shí)到事實(shí)真相的話,那么請(qǐng)放慢速度,謹(jǐn)慎思考。
▌5.應(yīng)用型機(jī)器學(xué)習(xí)工程師
對(duì)于一個(gè)應(yīng)用型的 AI /機(jī)器學(xué)習(xí)工程師來說,最好的品質(zhì)并不是知曉算法如何工作。工程師的日常工作是使用這種算法,而不是構(gòu)建它們 (這是研究人員所做的事)。我們需要的是那些擁有與現(xiàn)有算法匹配的編程能力,并應(yīng)用于數(shù)據(jù)集的工程能力。
除了需要快速編程的能力,這類工程師還需要具備能應(yīng)對(duì)失敗的品質(zhì)。你可能永遠(yuǎn)不會(huì)知道你正在做什么,即使你的意識(shí)里覺得自己正在做。通過算法盡可能快地運(yùn)行數(shù)據(jù),并查看算法是否能夠正常工作......在這過程中你可能會(huì)經(jīng)歷遠(yuǎn)多于成功的失敗過程。這類工作很大一部分需要工程師去不斷地嘗試,因此你需要不斷應(yīng)對(duì)失敗的過程;同時(shí),具備從容應(yīng)對(duì)失敗的能力,將讓你更好地勝任這份工作。
由于日常所碰到的業(yè)務(wù)問題是無法在教科書中找到,因此你事先也無法知道什么算法會(huì)起作用,你也不能期望在第一時(shí)間獲得完美的結(jié)果。你只能盡可能快地嘗試很多方法,并不斷迭代以找到最好的解決方案。
談到“針對(duì)什么數(shù)據(jù)用什么算法”這個(gè)問題,對(duì)于分析師而言,他們會(huì)認(rèn)為這些輸入很有意思。這也不難理解為什么要先有數(shù)據(jù)分析師了。
雖然在問題解決過程會(huì)碰到很多磕磕絆絆,但機(jī)器學(xué)習(xí)工程師必須要嚴(yán)謹(jǐn)?shù)厣钊敕椒ㄔu(píng)估這個(gè)至關(guān)重要的部分。得到的解決方案是否真的適用于新數(shù)據(jù)呢?幸運(yùn)的是,你在之前已經(jīng)有了一個(gè)明智的決定,現(xiàn)在需要做的是將這個(gè)接力棒傳給統(tǒng)計(jì)學(xué)家。
此外,最強(qiáng)的應(yīng)用型 ML 工程師要非常清楚應(yīng)用不同方法所需要的時(shí)間。
▌6.數(shù)據(jù)科學(xué)家
在這里,我所說的數(shù)據(jù)科學(xué)家,是具備前面提到的三個(gè)角色技能的全面專家。不是每個(gè)人都使用我這里的定義,也有具備三選一的專家能力時(shí)也自稱自己是“數(shù)據(jù)科學(xué)家”,在這里需要注意區(qū)分一下。
在數(shù)據(jù)科學(xué)團(tuán)隊(duì)中,我將這個(gè)角色排在第6位,因?yàn)槟軌蚱刚?qǐng)到一個(gè)真正集三者技能于一身的數(shù)據(jù)科學(xué)家,是一個(gè)昂貴的選擇。如果你有足夠的預(yù)算,那么這是一個(gè)不錯(cuò)的選擇。但如果沒有充裕的經(jīng)費(fèi),可以考慮培養(yǎng)現(xiàn)在具備單一技能的專家。
▌7.分析經(jīng)理/數(shù)據(jù)科學(xué)領(lǐng)導(dǎo)
分析經(jīng)理是一個(gè)是數(shù)據(jù)科學(xué)家和決策者的混合體角色。他們?cè)趫F(tuán)隊(duì)中的角色是凝聚整個(gè)團(tuán)隊(duì)的力量,以確保團(tuán)隊(duì)中的人員不會(huì)分崩瓦解,而不是為日常業(yè)務(wù)增加價(jià)值。這是一個(gè)非常少見、也非常難雇傭的角色。
每天他都需要保持清醒的頭腦,思考諸如“如何設(shè)計(jì)問題更合理? 如何做決策?如何最好地分配我們的專家?什么值得做?技能和數(shù)據(jù)是否符合要求?如何確保輸入數(shù)據(jù)的質(zhì)量?”等問題。
如果你能夠聘請(qǐng)到一位這樣的分析經(jīng)理,那么恭喜你和你的團(tuán)隊(duì),你們很幸運(yùn),請(qǐng)盡可能地留住這樣的人才,永遠(yuǎn)不要讓他離去。
▌8.定性專家/社會(huì)科學(xué)家
有時(shí)候,你的決策者是一名優(yōu)秀杰出的領(lǐng)導(dǎo)者,經(jīng)理人,激勵(lì)者,影響者或?qū)Ш秸?.....但他們?cè)谧鰶Q策時(shí)可能并不具備藝術(shù)性和科學(xué)性。做決策不僅僅需要天分。如果你的決策者在這方面沒有很扎實(shí)的能力,那么他們帶來的損害可能多與收益。
請(qǐng)不要解雇一個(gè)技能不夠純熟的決策者,你可以通過專家定性幫助他們提升自身技能。
這類人通常具有社會(huì)科學(xué)和數(shù)據(jù)科學(xué)的背景,如行為經(jīng)濟(jì)學(xué)家,神經(jīng)經(jīng)濟(jì)學(xué)家和接受過專業(yè)培訓(xùn)的 JDM 心理學(xué)家,而那些自學(xué)成才的人也能夠擅長這份角色。這項(xiàng)工作是幫助決策者理清思路,審視所有角度,并將模棱兩可的直覺感受轉(zhuǎn)化為成熟的、語言形式的指令,使團(tuán)隊(duì)的其他成員也能夠輕松地執(zhí)行。
通常,定性專家在會(huì)完全了解并掌握所有的情況的基礎(chǔ)上,幫助決策者進(jìn)行決策,而不是片面地對(duì)某些情況。他們是值得信賴的顧問,頭腦風(fēng)暴的伙伴,以及決策者的參謀人。他們的參與可以確保項(xiàng)目朝著正確的方向進(jìn)行。
▌9.研究者
許多經(jīng)理在招聘時(shí)認(rèn)為,團(tuán)隊(duì)的第一個(gè)成員需要有過當(dāng)教授的經(jīng)驗(yàn),但實(shí)際上你并不需要那些博士學(xué)位的人才,除非你已經(jīng)知道這一領(lǐng)域的現(xiàn)有算法都已經(jīng)不能滿足你的需求了。但大多數(shù)的團(tuán)隊(duì)通常都不會(huì)提前知道,因此只能按照正常招聘流程,這就好比你想在太空中使用一支筆之前,你得先保證這支筆是能夠正常地工作。你可以先試著開始,當(dāng)現(xiàn)有的方法都不能解決你的問題時(shí),再考慮聘請(qǐng)相關(guān)的研究人員。
不要給研究者貼上特殊的標(biāo)簽。最好的是,等到團(tuán)隊(duì)發(fā)展到一定程度,足以意識(shí)到需要研究人員的時(shí)候再考慮請(qǐng)他們加入。但這樣也會(huì)存在一個(gè)問題,換句話說,等到你用完所有可用的工具之后,再雇用你所需要的人,通常需要更昂貴的成本。
在發(fā)明在太空筆之前,請(qǐng)檢查現(xiàn)有筆是否能夠正常工作并滿足我們的需求。
▌10+額外人員
除了以上提到的這些角色,下面我還列舉了一些我比較喜歡的角色,這些角色也將在未來的智能決策項(xiàng)目中發(fā)揮重要的重要:
領(lǐng)域?qū)<?/p>
倫理專家
軟件工程師
可靠性工程師
UX 設(shè)計(jì)師
交互式可視化/圖形設(shè)計(jì)師
數(shù)據(jù)收集專家
數(shù)據(jù)產(chǎn)品經(jīng)理
項(xiàng)目經(jīng)理
許多項(xiàng)目離不開這些角色,之所以沒將這些列入前10名,主要是因?yàn)樽鰶Q策并不是他們的主要業(yè)務(wù)。相反,他們都是各自學(xué)科的人才,并能為各自領(lǐng)域項(xiàng)目的數(shù)據(jù)學(xué)習(xí)和決策制定做出有用的工作??梢园堰@些角色想像成各自領(lǐng)域的專家,并對(duì)智能決策充滿興趣。
▌大團(tuán)隊(duì) or 小團(tuán)隊(duì)?
讀到這里,你可能已經(jīng)不堪重負(fù)了。這么多需要了解的角色!深吸一口氣,根據(jù)自己的需要,你可以從前幾個(gè)角色中獲得足夠多有價(jià)值的信息。
我曾將應(yīng)用型機(jī)器學(xué)習(xí)比作在廚房中烘焙:如果您個(gè)人想要開一家工業(yè)規(guī)模的比薩店,那么你需要一個(gè)大的制作團(tuán)隊(duì)或需要與一些供應(yīng)商/顧問合作。如果你想利用周末時(shí)間制作一兩個(gè)獨(dú)特的披薩,如焦糖鳳尾魚披薩,那么你仍需要考慮我們所提到的所有角色,包括你要決定做什么 (角色1),使用哪些配料 (角色2和3),在哪里獲得配料 (角色0),如何定制食譜 (角色5),以及如何測(cè)試披薩的口味 (角色4),以便制成品能給人留下深刻印象。但如果你只是想用來消遣的話,你可以自己承擔(dān)所有的工作。當(dāng)然,如果你的目標(biāo)只是制作標(biāo)準(zhǔn)的傳統(tǒng)披薩,那么你甚至不需要上述提到的這一切:你只需要拿來別人已經(jīng)嘗試和測(cè)試過的配方和配料(無需親自重復(fù)發(fā)明),就可以開始烤披薩啦!
-
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1458瀏覽量
34095 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1208瀏覽量
24760 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5511瀏覽量
121355
原文標(biāo)題:Google首席決策師告訴你AI和數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要哪10種角色?
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論