數(shù)據(jù)科學團隊中的每個角色都很重要。你需要了解這些角色以及正確發(fā)揮他們的作用,以從對數(shù)據(jù)科學家的巨額投資中獲得價值,而不是為表現(xiàn)不佳的團隊支付過多費用。
Deloitte AI Institute執(zhí)行董事Beena Ammanath說:“我們不應該說‘讓我們來聘請數(shù)據(jù)科學家,以及讓我們來建立數(shù)據(jù)團隊’,而是應該關聯(lián)業(yè)務挑戰(zhàn),例如流程優(yōu)化、成本節(jié)省、新產(chǎn)品線或競爭對手的業(yè)務?!?/p>
誰在數(shù)據(jù)科學團隊中?
顯然,數(shù)據(jù)科學家是數(shù)據(jù)科學團隊的重要組成部分。很多數(shù)據(jù)科學家通常具有數(shù)據(jù)或統(tǒng)計學方面的高學位,并具有R或Python的編碼技能,但他們還必須了解企業(yè)想要實現(xiàn)的目標。他們的工作往往具有探索性和迭代性。
俄羅斯數(shù)據(jù)科學咨詢公司BroutonLab的首席技術官兼創(chuàng)始人Michael Yurushkin表示,企業(yè)想要實現(xiàn)的目標將確定其聘用的數(shù)據(jù)科學家的類型。
Yurushkin說:“如果你的目標是改善內(nèi)容發(fā)現(xiàn)、廣告定位、收入優(yōu)化和搜索結果,則應雇用機器學習專家。如果你的目標是測試你的產(chǎn)品設計–使用帶有最小偏差的受控實驗,那么你需要專門從事實驗設計和因果推斷的統(tǒng)計人員小組。”
廣告植入和許可公司Branded Entertainment Network的AI主管Tyler Folkman說,他是全棧數(shù)據(jù)科學的忠實擁護者,其中數(shù)據(jù)科學家收集自己的數(shù)據(jù)、對其進行清理、對其進行處理、建立模型、將這些模型投入生產(chǎn),并確保它們?yōu)樽罱K用戶提供價值。
但是,數(shù)據(jù)科學家需要可靠的數(shù)據(jù)。這正是數(shù)據(jù)工程師的用武之地。他們建立數(shù)據(jù)管道并管理數(shù)據(jù)。
Folkman說:“數(shù)據(jù)工程師構建工具,使數(shù)據(jù)科學家能夠輕松有效地全棧工作。我還沒有找到開箱立即提供所需一切功能的供應商,因此讓數(shù)據(jù)工程師構建自己的平臺非常有價值,這個平臺應整合內(nèi)部工具、開源工具甚至企業(yè)工具。”
大多數(shù)專家表示,數(shù)據(jù)分析師通常是在數(shù)據(jù)分析師團隊或業(yè)務部門工作,而不是數(shù)據(jù)科學團隊。不管他們屬于哪個部門,他們的技術水平都不及數(shù)據(jù)科學家和數(shù)據(jù)工程師,而且他們專注于數(shù)據(jù)科學的后期階段,即分析和共享見解。
Folkman認為數(shù)據(jù)分析師和研究科學家應作為數(shù)據(jù)科學團隊結構的一部分。分析師擁有數(shù)據(jù),有助于確保數(shù)據(jù)健康,并為整個公司提供見解。研究科學家們不斷提高技術水平,并投資基礎研究。
BroutonLab的Yurushkin還認為需要數(shù)據(jù)戰(zhàn)略家,他作為業(yè)務與數(shù)據(jù)科學團隊之間的橋梁。他還認為那些計劃建立大型數(shù)據(jù)科學團隊的企業(yè)要有數(shù)據(jù)架構師。
大數(shù)據(jù)研究所董事總經(jīng)理Jesse Anderson推薦三種數(shù)據(jù)團隊:數(shù)據(jù)科學、數(shù)據(jù)工程和運營。他也是即將出版的《Data Teams: A Unified Management Model for Successful Data-Focused Teams》的作者。
Anderson說:“運營工程師具有專門的能力來監(jiān)視和管理這些大數(shù)據(jù)系統(tǒng)。”
但是,當沒有數(shù)據(jù)工程團隊時,沒有人會注意架構或代碼質(zhì)量問題,這會造成多年的技術負擔。Anderson說,而當缺少運營團隊時,企業(yè)可能會采用在生產(chǎn)中無法正常運行的模型和代碼。
公民數(shù)據(jù)科學家的作用以及他們使用的工具
公民數(shù)據(jù)科學家是業(yè)務領域的超級用戶。與真正的數(shù)據(jù)科學家不同,他們往往缺乏深厚的統(tǒng)計知識,不會使用R或Python進行編程,也不了解機器學習的工作原理。
增強型分析工具供應商表示,他們正在使數(shù)據(jù)科學民主化,這意味著他們將提供簡單、功能強大的工具,讓公民數(shù)據(jù)科學家可以用來解決相對簡單的問題,例如了解為什么某個地區(qū)或某個季度銷售額下降。增強分析工具使用AI和機器學習來簡化數(shù)據(jù)準備和分析等任務。相比之下,數(shù)據(jù)科學家使用專家級工具來幫助解決復雜問題。
Anderson說:“公民數(shù)據(jù)科學將能夠訪問企業(yè)用于決策的相同數(shù)據(jù),而無需等待支持?!?/p>
目前有兩種方法可以應對公民數(shù)據(jù)科學。首先是讓數(shù)據(jù)科學團隊為大家建立或提供自助服務工具。另一種方法是讓業(yè)務部門獲取自己的工具。前一種方法可最大程度地減少工具蔓延。還可以最大程度降低風險–通過確保對數(shù)據(jù)和數(shù)據(jù)使用進行管理和保護。
Ammanath說:“如果你在此過程中處于非常領先的地位,那么在整個企業(yè)中擁有公民數(shù)據(jù)科學是至關重要的,因為你希望他們能夠進行自己的數(shù)據(jù)探索。但是,如果你還處于早期階段,那么讓每個人都可使用數(shù)據(jù)可能是沒有意義,因為你需要了解數(shù)據(jù)的質(zhì)量和背景信息?!?/p>
數(shù)據(jù)科學家向誰報告?
數(shù)據(jù)科學團隊可以向首席執(zhí)行官、首席運營官、首席財務官、首席信息官、首席技術官,首席行政官、首席數(shù)據(jù)官或其他高級管理人員或副總裁報告。該團隊向誰報告將影響該團隊所做的工作。根據(jù)Anderson的說法,首席營銷官可能過于關注產(chǎn)品,首席財務官可能專注于規(guī)避風險,而首席技術官或工程副總裁可能不了解數(shù)據(jù)科學與軟件工程的區(qū)別。
Ammanath說,數(shù)據(jù)科學團隊應該向CAO或CDO報告,因為擁有集中的數(shù)據(jù)科學職能非常重要。否則,該舉措會變得狹窄而迷失。
該團隊向誰報告通常取決于其組織方式。有些企業(yè)創(chuàng)建集中的數(shù)據(jù)科學團隊。在其他公司中,業(yè)務部門雇用自己的數(shù)據(jù)科學家。對于更成熟的組織,第三個選擇是將這兩種結構組合成中心輻射型模型,該模型具有卓越中心,由具有特定業(yè)務領域專業(yè)知識的數(shù)據(jù)科學家或數(shù)據(jù)科學團隊支持。
你需要CAO還是CDO?
CAO和CDO的角色經(jīng)常被混淆。企業(yè)可能會混淆使用這兩個職位頭銜,而沒有考慮它們之間的差異。大公司可能同時兼有這兩個職位。
Anderson說:“首席分析官通常具有很高的分析背景,而首席數(shù)據(jù)官則可能具有數(shù)據(jù)工程背景,也許是數(shù)據(jù)倉庫甚至是DBA(數(shù)據(jù)庫管理員)背景?!?/p>
你是否應該雇用CAO還是CDO?答案是肯定的,如果你的企業(yè)足夠成熟,你可以適當?shù)刂С诌@些職位,而且你會意識到需要這種級別的責任。大公司往往會創(chuàng)建該職位,他們會發(fā)現(xiàn)對該職位的需求很明顯。
責編AJX
-
數(shù)據(jù)采集
+關注
關注
39文章
6200瀏覽量
113831 -
大數(shù)據(jù)
+關注
關注
64文章
8899瀏覽量
137578 -
數(shù)據(jù)科學
+關注
關注
0文章
165瀏覽量
10081
發(fā)布評論請先 登錄
相關推薦
評論