0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何建立一個強大的數(shù)據(jù)科學團隊?

如意 ? 來源:TechTarget中國 ? 作者:鄒錚 ? 2020-08-31 14:31 ? 次閱讀

數(shù)據(jù)科學團隊中的每個角色都很重要。你需要了解這些角色以及正確發(fā)揮他們的作用,以從對數(shù)據(jù)科學家的巨額投資中獲得價值,而不是為表現(xiàn)不佳的團隊支付過多費用。

Deloitte AI Institute執(zhí)行董事Beena Ammanath說:“我們不應該說‘讓我們來聘請數(shù)據(jù)科學家,以及讓我們來建立數(shù)據(jù)團隊’,而是應該關聯(lián)業(yè)務挑戰(zhàn),例如流程優(yōu)化、成本節(jié)省、新產(chǎn)品線或競爭對手的業(yè)務?!?/p>

誰在數(shù)據(jù)科學團隊中?

顯然,數(shù)據(jù)科學家是數(shù)據(jù)科學團隊的重要組成部分。很多數(shù)據(jù)科學家通常具有數(shù)據(jù)或統(tǒng)計學方面的高學位,并具有R或Python的編碼技能,但他們還必須了解企業(yè)想要實現(xiàn)的目標。他們的工作往往具有探索性和迭代性。

俄羅斯數(shù)據(jù)科學咨詢公司BroutonLab的首席技術官兼創(chuàng)始人Michael Yurushkin表示,企業(yè)想要實現(xiàn)的目標將確定其聘用的數(shù)據(jù)科學家的類型。

Yurushkin說:“如果你的目標是改善內(nèi)容發(fā)現(xiàn)、廣告定位、收入優(yōu)化和搜索結果,則應雇用機器學習專家。如果你的目標是測試你的產(chǎn)品設計–使用帶有最小偏差的受控實驗,那么你需要專門從事實驗設計和因果推斷的統(tǒng)計人員小組。”

廣告植入和許可公司Branded Entertainment Network的AI主管Tyler Folkman說,他是全棧數(shù)據(jù)科學的忠實擁護者,其中數(shù)據(jù)科學家收集自己的數(shù)據(jù)、對其進行清理、對其進行處理、建立模型、將這些模型投入生產(chǎn),并確保它們?yōu)樽罱K用戶提供價值。

但是,數(shù)據(jù)科學家需要可靠的數(shù)據(jù)。這正是數(shù)據(jù)工程師的用武之地。他們建立數(shù)據(jù)管道并管理數(shù)據(jù)。

Folkman說:“數(shù)據(jù)工程師構建工具,使數(shù)據(jù)科學家能夠輕松有效地全棧工作。我還沒有找到開箱立即提供所需一切功能的供應商,因此讓數(shù)據(jù)工程師構建自己的平臺非常有價值,這個平臺應整合內(nèi)部工具、開源工具甚至企業(yè)工具。”

大多數(shù)專家表示,數(shù)據(jù)分析師通常是在數(shù)據(jù)分析師團隊或業(yè)務部門工作,而不是數(shù)據(jù)科學團隊。不管他們屬于哪個部門,他們的技術水平都不及數(shù)據(jù)科學家和數(shù)據(jù)工程師,而且他們專注于數(shù)據(jù)科學的后期階段,即分析和共享見解。

Folkman認為數(shù)據(jù)分析師和研究科學家應作為數(shù)據(jù)科學團隊結構的一部分。分析師擁有數(shù)據(jù),有助于確保數(shù)據(jù)健康,并為整個公司提供見解。研究科學家們不斷提高技術水平,并投資基礎研究。

BroutonLab的Yurushkin還認為需要數(shù)據(jù)戰(zhàn)略家,他作為業(yè)務與數(shù)據(jù)科學團隊之間的橋梁。他還認為那些計劃建立大型數(shù)據(jù)科學團隊的企業(yè)要有數(shù)據(jù)架構師。

大數(shù)據(jù)研究所董事總經(jīng)理Jesse Anderson推薦三種數(shù)據(jù)團隊:數(shù)據(jù)科學、數(shù)據(jù)工程和運營。他也是即將出版的《Data Teams: A Unified Management Model for Successful Data-Focused Teams》的作者。

Anderson說:“運營工程師具有專門的能力來監(jiān)視和管理這些大數(shù)據(jù)系統(tǒng)。”

但是,當沒有數(shù)據(jù)工程團隊時,沒有人會注意架構或代碼質(zhì)量問題,這會造成多年的技術負擔。Anderson說,而當缺少運營團隊時,企業(yè)可能會采用在生產(chǎn)中無法正常運行的模型和代碼。

公民數(shù)據(jù)科學家的作用以及他們使用的工具

公民數(shù)據(jù)科學家是業(yè)務領域的超級用戶。與真正的數(shù)據(jù)科學家不同,他們往往缺乏深厚的統(tǒng)計知識,不會使用R或Python進行編程,也不了解機器學習的工作原理。

增強型分析工具供應商表示,他們正在使數(shù)據(jù)科學民主化,這意味著他們將提供簡單、功能強大的工具,讓公民數(shù)據(jù)科學家可以用來解決相對簡單的問題,例如了解為什么某個地區(qū)或某個季度銷售額下降。增強分析工具使用AI和機器學習來簡化數(shù)據(jù)準備和分析等任務。相比之下,數(shù)據(jù)科學家使用專家級工具來幫助解決復雜問題。

Anderson說:“公民數(shù)據(jù)科學將能夠訪問企業(yè)用于決策的相同數(shù)據(jù),而無需等待支持?!?/p>

目前有兩種方法可以應對公民數(shù)據(jù)科學。首先是讓數(shù)據(jù)科學團隊為大家建立或提供自助服務工具。另一種方法是讓業(yè)務部門獲取自己的工具。前一種方法可最大程度地減少工具蔓延。還可以最大程度降低風險–通過確保對數(shù)據(jù)和數(shù)據(jù)使用進行管理和保護。

Ammanath說:“如果你在此過程中處于非常領先的地位,那么在整個企業(yè)中擁有公民數(shù)據(jù)科學是至關重要的,因為你希望他們能夠進行自己的數(shù)據(jù)探索。但是,如果你還處于早期階段,那么讓每個人都可使用數(shù)據(jù)可能是沒有意義,因為你需要了解數(shù)據(jù)的質(zhì)量和背景信息?!?/p>

數(shù)據(jù)科學家向誰報告?

數(shù)據(jù)科學團隊可以向首席執(zhí)行官、首席運營官、首席財務官、首席信息官、首席技術官,首席行政官、首席數(shù)據(jù)官或其他高級管理人員或副總裁報告。該團隊向誰報告將影響該團隊所做的工作。根據(jù)Anderson的說法,首席營銷官可能過于關注產(chǎn)品,首席財務官可能專注于規(guī)避風險,而首席技術官或工程副總裁可能不了解數(shù)據(jù)科學與軟件工程的區(qū)別。

Ammanath說,數(shù)據(jù)科學團隊應該向CAO或CDO報告,因為擁有集中的數(shù)據(jù)科學職能非常重要。否則,該舉措會變得狹窄而迷失。

該團隊向誰報告通常取決于其組織方式。有些企業(yè)創(chuàng)建集中的數(shù)據(jù)科學團隊。在其他公司中,業(yè)務部門雇用自己的數(shù)據(jù)科學家。對于更成熟的組織,第三個選擇是將這兩種結構組合成中心輻射型模型,該模型具有卓越中心,由具有特定業(yè)務領域專業(yè)知識的數(shù)據(jù)科學家或數(shù)據(jù)科學團隊支持。

你需要CAO還是CDO?

CAO和CDO的角色經(jīng)常被混淆。企業(yè)可能會混淆使用這兩個職位頭銜,而沒有考慮它們之間的差異。大公司可能同時兼有這兩個職位。

Anderson說:“首席分析官通常具有很高的分析背景,而首席數(shù)據(jù)官則可能具有數(shù)據(jù)工程背景,也許是數(shù)據(jù)倉庫甚至是DBA(數(shù)據(jù)庫管理員)背景?!?/p>

你是否應該雇用CAO還是CDO?答案是肯定的,如果你的企業(yè)足夠成熟,你可以適當?shù)刂С诌@些職位,而且你會意識到需要這種級別的責任。大公司往往會創(chuàng)建該職位,他們會發(fā)現(xiàn)對該職位的需求很明顯。
責編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦

    國外科研團隊在X射線科學領域取得了重大突破

    了兆赫茲級別,為超快電子動力學研究開辟了新領域。 此次團隊展示了單尖峰硬X射線脈沖,其脈沖能量超過100微焦耳,脈沖持續(xù)時間僅為幾百阿秒(1阿秒=10-18秒)。這時間尺度使科學家能夠捕捉到物質(zhì)中最快的電子運動。
    的頭像 發(fā)表于 12-20 09:11 ?171次閱讀

    中國科學技術大學團隊突破非接觸心臟活動感知技術

    近日,中國科學技術大學的陳彥教授團隊在非接觸心臟活動感知研究領域取得了重大突破。他們首次發(fā)現(xiàn)并成功利用了心臟機械活動諧波中的“拍頻效應”這關鍵物理現(xiàn)象,為遠程監(jiān)測心臟活動提供了全新的技術手段。 在
    的頭像 發(fā)表于 12-17 11:09 ?727次閱讀

    數(shù)據(jù)科學工作流原理

    數(shù)據(jù)科學工作流包括數(shù)據(jù)收集、數(shù)據(jù)預處理、數(shù)據(jù)探索與可視化、特征選擇與工程、模型選擇與訓練、模型評估與優(yōu)化、結果解釋與報告、部署與監(jiān)控等環(huán)節(jié)。
    的頭像 發(fā)表于 11-20 10:36 ?210次閱讀

    艾體寶產(chǎn)品 CircleCI:高效的CI/CD平臺,助力開發(fā)團隊加速交付!

    CircleCI是強大的CI/CD平臺,專為提高軟件開發(fā)效率而設計。它通過自動化測試、構建和部署,幫助開發(fā)團隊加速交付,減少手動錯誤。支持平行化測試、Docker容器化管理,并與多
    的頭像 發(fā)表于 11-20 10:22 ?237次閱讀
    艾體寶產(chǎn)品 CircleCI:高效的CI/CD平臺,助力開發(fā)<b class='flag-5'>團隊</b>加速交付!

    《AI for Science:人工智能驅動科學創(chuàng)新》第6章人AI與能源科學讀后感

    幸得好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅動科學創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學領域中的巨大潛力和廣泛應用。這
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅動科學創(chuàng)新》第4章-AI與生命科學讀后感

    閱讀這章后,我深感人工智能與生命科學的結合正引領著場前所未有的科學革命,以下是我個人的讀后感: 1. 技術革新與生命科學進步 這
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅動科學創(chuàng)新》第二章AI for Science的技術支撐學習心得

    的訓練和推理提供了強大的算力支持,使得AI在科學研究中的應用更加廣泛和深入。 3. 數(shù)據(jù)驅動的研究范式 第二章還強調(diào)了數(shù)據(jù)在AI for Science中的核心地位。
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅動科學創(chuàng)新》第章人工智能驅動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術,AI能夠處理和分析海量數(shù)據(jù)
    發(fā)表于 10-14 09:12

    如何使用PyTorch建立網(wǎng)絡模型

    PyTorch是基于Python的開源機器學習庫,因其易用性、靈活性和強大的動態(tài)圖特性,在深度學習領域得到了廣泛應用。本文將從PyTorch的基本概念、網(wǎng)絡模型構建、優(yōu)化方法、實際應用等多個方面,深入探討使用PyTorch
    的頭像 發(fā)表于 07-02 14:08 ?441次閱讀

    建立神經(jīng)網(wǎng)絡模型的三步驟

    建立神經(jīng)網(wǎng)絡模型是復雜的過程,涉及到多個步驟和細節(jié)。以下是對建立神經(jīng)網(wǎng)絡模型的三主要步驟的介紹: 第
    的頭像 發(fā)表于 07-02 11:20 ?1059次閱讀

    中國科學技術大學科研團隊取得量子計算研究新進展

    中國科學技術大學科研團隊取得量子計算研究新進展 據(jù)央視新聞報道,中國科學技術大學科研團隊利用自主研發(fā)的關鍵設備,利用“自底而上”的量子模擬方法,在國際上首次實現(xiàn)光子的反常分數(shù)量子霍爾態(tài)
    的頭像 發(fā)表于 05-08 16:40 ?752次閱讀

    如何快速建立PID控制程序

    回路輸出設置。選擇“模擬量”標定為“單極20%偏移量”,即輸出信號的int數(shù)據(jù)范圍也是5530~27648,對應電流為4~20mA,點擊“下一個”;
    發(fā)表于 03-20 09:39 ?1248次閱讀
    如何快速<b class='flag-5'>建立</b><b class='flag-5'>一</b><b class='flag-5'>個</b>PID控制程序

    日本上市企業(yè)Toppan Holdings計劃在新加坡建立半導體封裝基板工廠

    HNPCA消息 日本上市企業(yè)Toppan Holdings (7911.T)計劃在新加坡建立半導體封裝基板工廠,并計劃于2026年底開始運營。
    的頭像 發(fā)表于 03-14 11:22 ?1643次閱讀

    比亞迪智駕團隊規(guī)模超4000人

    在比亞迪的夢想日活動上,比亞迪集團總裁王傳福宣布了項令人矚目的消息:比亞迪的智駕團隊規(guī)模已經(jīng)超過4000人。這龐大的團隊包括了1000多名算法工程師和3000多名軟件工程師,展示了
    的頭像 發(fā)表于 01-19 18:26 ?1716次閱讀

    鴻蒙原生應用/元服務實戰(zhàn)-AGC團隊賬戶

    內(nèi)部和跨部門之間的數(shù)據(jù)共享和流轉問題,實現(xiàn)高效開發(fā)、分發(fā)、推廣、變現(xiàn)。每個團隊團隊成員的上限為200。 本文主要參考引用華為開發(fā)者聯(lián)盟官方文檔
    發(fā)表于 01-18 16:38