0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新數(shù)據(jù)科學(xué)家的供過于求,數(shù)據(jù)科學(xué)存在有誤導(dǎo)性的工作需求

電子工程師 ? 來源:lp ? 2019-03-05 17:06 ? 次閱讀

數(shù)據(jù)科學(xué)剛剛度過了它的黃金五年。

自2012年以來,這個行業(yè)發(fā)展迅速。它幾乎完整經(jīng)歷了Gartner技術(shù)成熟度曲線的每個階段。

度過了初期使用階段、有關(guān)AI和偏見的負(fù)面新聞、Facebook等公司的第二三輪風(fēng)投。現(xiàn)在的數(shù)據(jù)科學(xué)正處于高增長使用階段:即使是銀行、醫(yī)療保健公司和落后市場五年的其他100強企業(yè),也在招聘機器學(xué)習(xí)中的數(shù)據(jù)科學(xué)崗位。

但現(xiàn)實正在發(fā)生巨大的變化。

來自captech基金的資深數(shù)據(jù)科學(xué)家Vicki Boykis發(fā)布了一篇《數(shù)據(jù)科學(xué)不一樣了》的文章,引起了廣泛討論。五年前被譽為“最性感“職業(yè)的數(shù)據(jù)科學(xué)家,正在進(jìn)入一個新的階段。

我們該如何應(yīng)對?一起看看。

大數(shù)據(jù)(還記得Hadoop和Pig嗎?)已經(jīng)出局,R語言的采用率急劇上升,Python在《經(jīng)濟學(xué)人》雜志中被表揚多次,“云”已經(jīng)再次改變了一切。

不幸的是,大眾媒體在數(shù)據(jù)科學(xué)領(lǐng)域的炒作始終沒有改變。

直到今天,在各類不負(fù)責(zé)任的媒體口中,數(shù)據(jù)科學(xué)家依然是“21世紀(jì)最性感最容易找工作的職業(yè)”。而事實上,希望進(jìn)入這個行業(yè)的初級數(shù)據(jù)科學(xué)家已經(jīng)供過于求,他們一旦獲得夢寐的“數(shù)據(jù)科學(xué)家”稱號后,實際展現(xiàn)出來的能力并不能達(dá)到預(yù)期的那樣。

新數(shù)據(jù)科學(xué)家的供過于求

首先,我們來談?wù)劤跫墧?shù)據(jù)科學(xué)家的供過于求。

圍繞數(shù)據(jù)科學(xué)的持續(xù)媒體炒作極大地提高了過去五年市場上的初級人才數(shù)量。

這純粹是傳聞,你大可不必相信。但是,基于我參與篩選簡歷、做剛?cè)腴T的數(shù)據(jù)科學(xué)家的導(dǎo)師、做采訪者和受訪者以及與處于類似職位的朋友和同事們的對話的經(jīng)歷,可以初步感受到,每個數(shù)據(jù)科學(xué)職位而言,特別是入門級的職位,候選人都已經(jīng)從20個增加到100個或更多。

我最近和一個朋友談話,他的一個開放職位收到了500份簡歷。

這并不奇怪。更多的傳聞是來自像機器學(xué)習(xí)教父吳恩達(dá)的職位空缺,他的AI創(chuàng)業(yè)公司每周要求70-80小時的工作時間。

即便如此,他依然收到了很多人試圖免費為他志愿工作。截止到目前,據(jù)他所說,他的辦公室已經(jīng)全部坐滿。

正確估計市場供需當(dāng)然不容易,但Wired的一篇文章可以提供一些線索:

”對2018年4月份招聘廣告的研究發(fā)現(xiàn),美國有超過10000個職位空缺,面向有人工智能或機器學(xué)習(xí)技能的人。“

文章繼續(xù)表明:

”超過10萬人開始學(xué)習(xí)Fast.ai提供的深度學(xué)習(xí)課程,F(xiàn)ast.ai是一家專注于擴大人工智能應(yīng)用的創(chuàng)業(yè)公司。“

讓我們做一道簡單的數(shù)學(xué)題。

假設(shè)MOOC(慕課)的平均完成率約為7%,那意味著,這一年會有7000人可以填補這10000個工作崗位。這一年如此,但明年又如何呢?我們是否假設(shè)數(shù)據(jù)科學(xué)的就業(yè)率穩(wěn)定?如果是這樣,數(shù)據(jù)科學(xué)的就業(yè)市場看起來就會縮小很多。

我們再來看一項更廣泛的研究,LinkedIn表示市場上缺少151,717個具有數(shù)據(jù)科學(xué)技能的人才。雖然目前還不清楚這是指數(shù)據(jù)科學(xué)家還是僅具有部分技能的人,但我們假設(shè)是前者。那樣的話,該國數(shù)據(jù)科學(xué)家有150000個職位空缺。

鑒于有100000人已經(jīng)開始了數(shù)據(jù)科學(xué)課程,我們假設(shè)其中有7000人能完成課程。

但是,這些數(shù)字還都沒有考慮到所有創(chuàng)造新的數(shù)據(jù)科學(xué)候選人的計劃和途徑:有像Coursera這樣的Fast.ai之外的MOOC,有超過10個像Metis和GA(General Assembly)這樣的每季度25人參加的全國性訓(xùn)練營,還有像加州大學(xué)洛杉磯分校等地的遠(yuǎn)程學(xué)位——分析和數(shù)據(jù)科學(xué)的學(xué)士學(xué)位,YouTube等,還有大量無法在極其緊張的就業(yè)市場找到工作、正從學(xué)術(shù)界轉(zhuǎn)向數(shù)據(jù)科學(xué)的博士們。

這里有第三個確鑿證據(jù),來自PWC,它指出2015年數(shù)據(jù)科學(xué)家有4萬個職位空缺。它還從總體上估計,認(rèn)為分析技能的市場供應(yīng)(再次說明,它比數(shù)據(jù)科學(xué)范圍更大,但也是一個比較點)到2018年將會使市場過度擁擠。

將此與數(shù)百個數(shù)據(jù)科學(xué)課程的訓(xùn)練營相結(jié)合,如果有人要進(jìn)入某個行業(yè),你將看到一場大風(fēng)暴。

根據(jù)我在業(yè)內(nèi)工作并與100多名同事交談的直覺,這兩條推特最終使我確信數(shù)據(jù)科學(xué)行業(yè)存在供應(yīng)泡沫。

首先,是這個有關(guān)入門數(shù)據(jù)科學(xué)課程的推特:

Cal的入門數(shù)據(jù)科學(xué)課程是Data 8,這門課很受歡迎,位于澤勒巴赫教室。開課時間是2018年秋季學(xué)期第一天。

和UVA開設(shè)數(shù)據(jù)科學(xué)學(xué)院的消息:

UVA很自豪地宣布計劃中的數(shù)據(jù)科學(xué)學(xué)院成立,它將滿足社會增長最快的需求之一

由于在適應(yīng)工業(yè)界的新趨勢上,學(xué)術(shù)界通常是滯后的,因此這個趨勢真的該引起初級數(shù)據(jù)科學(xué)家們的重視,所有人都希望找一個數(shù)據(jù)科學(xué)的職位??紤]到他們在市場上的競爭者數(shù)量,剛獲得數(shù)據(jù)科學(xué)學(xué)位的人很難找到真的入行。

在三、四年前情況還并非如此,然而現(xiàn)在數(shù)據(jù)科學(xué)已經(jīng)從一個流行詞匯轉(zhuǎn)變?yōu)楣韫扰菽飧蟮墓菊衅傅穆毼?,相關(guān)的職位不僅更加正式化,而且有著更嚴(yán)格的準(zhǔn)入要求(即傾向于曾經(jīng)具備數(shù)據(jù)科學(xué)工作經(jīng)驗的人)。數(shù)據(jù)科學(xué)職位的面試仍然難以把握,并且與工作完全不匹配。

正如許多博客文章指出的那樣,你未必在第一次嘗試時就能找到理想工作。 因此,就業(yè)市場相當(dāng)艱難,對于大量入門者來說更加困難重重。

Hinton對于機器學(xué)習(xí)領(lǐng)域現(xiàn)狀的想法:

“我們應(yīng)該采取全新的想法。我們都知道從長遠(yuǎn)來看,一個全新的想法將比一個個微小的改進(jìn)更有效。當(dāng)我們這個群體只有一些資深人士和一大批青少年時,這就是缺點?!?/p>

數(shù)據(jù)科學(xué)存在有誤導(dǎo)性的工作需求

第二個問題是,一旦這些初學(xué)者進(jìn)入市場,他們會對數(shù)據(jù)科學(xué)的工作模式產(chǎn)生不切實際的期望。每個人都認(rèn)為他們將進(jìn)行機器學(xué)習(xí)、深度學(xué)習(xí)和貝葉斯模擬。

這并不是他們的錯,這正是一些數(shù)據(jù)科學(xué)課程和技術(shù)媒體們一直以來強調(diào)的內(nèi)容。自從很久之前我第一次過分樂觀地瀏覽Hacker News 上邏輯回歸的帖子以來,情況并沒有發(fā)生多大變化。

現(xiàn)實情況是,“數(shù)據(jù)科學(xué)”從未像機器學(xué)習(xí)那樣關(guān)注數(shù)據(jù)清洗,數(shù)據(jù)轉(zhuǎn)換以及將數(shù)據(jù)從一個地方移動到另一個地方。

我最近進(jìn)行的極其非科學(xué)的調(diào)查問卷證實了這一點:

作者2019年1月在推特上做的調(diào)查溫暖:

近一段時間以來對此非常好奇,所以我決定創(chuàng)建一個調(diào)查問卷:

“作為2019年被稱為'數(shù)據(jù)科學(xué)家'的人,我花了大部分時間在(60%以上):”

選擇了(“其他”)也歡迎在回復(fù)中添加。

調(diào)查結(jié)果:

6% 選擇特性/模型

67% 清理數(shù)據(jù)/移動數(shù)據(jù)

4% 在產(chǎn)品中部署模型

23% 分析/呈現(xiàn)數(shù)據(jù)

許多行業(yè)專家發(fā)送的推文也是如此:

“在我最近的幾個機器學(xué)習(xí)項目中,復(fù)雜的地方不再是建模或培訓(xùn)里;二是在在輸入預(yù)處理中。我發(fā)現(xiàn)自己耗盡的是CPU而不是GPU,并且在一個項目中我真的不確定如何進(jìn)一步優(yōu)化python(我也正在考慮c ++)?!?/p>

— mat kelcey

“我在初級ML/ CV工程師身上看到的最失敗的一面是對構(gòu)建數(shù)據(jù)集完全缺乏興趣。雖然這是一項無聊的工作,但我認(rèn)為在整理數(shù)據(jù)集時能夠?qū)W習(xí)到很多東西。這就像是問題的一半?!?/p>

— Katherine Scott

伴隨著數(shù)據(jù)清洗,當(dāng)炒作周期繼續(xù)發(fā)揮著它的效應(yīng)時,更加清晰的是,數(shù)據(jù)工具和將模型投入生產(chǎn)變得比在一臺機器上從頭開始構(gòu)建ML算法更加重要,特別是隨著云資源可用性的爆炸式增長。

顯而易見的是,在炒作周期的后期階段,數(shù)據(jù)科學(xué)將逐漸接近工程學(xué),而數(shù)據(jù)科學(xué)家需要的技能不再主要基于可視化和統(tǒng)計學(xué),而是更符合傳統(tǒng)的計算機科學(xué)課程:像單元測試和持續(xù)集成這樣的概念,很快就成了術(shù)語,并被用作數(shù)據(jù)科學(xué)家和從事ML工程的數(shù)值科學(xué)家常用的工具集。

這也導(dǎo)致了幾件事的發(fā)生:首先是“機器學(xué)習(xí)工程師”這個頭銜的崛起,在過去的3-4年里,它帶來了更多的聲望和更高的收入潛力。

其次,它導(dǎo)致了數(shù)據(jù)科學(xué)家職稱的嚴(yán)重縮水。由于數(shù)據(jù)科學(xué)家職稱的聲望,像Lyft這樣的公司會招聘這類職位,但要求擁有數(shù)據(jù)分析師的技能,這就造成了別扭的情況——數(shù)據(jù)科學(xué)的職位究竟需要做什么,又有多少職位提供給新入職的工作者。

我們作為資深從業(yè)者、記者、經(jīng)理、行業(yè)會議發(fā)言人、撰寫工作要求的人力資源經(jīng)理,仍然不能很好地解決這個重要的難題。

給新數(shù)據(jù)科學(xué)家的建議

因此,本著繼續(xù)為初學(xué)者提供建議的精神,我將給任何在2019年向我咨詢?nèi)绾芜M(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域的人發(fā)送這封郵件。

這是一個兩步計劃:

不要一味追求數(shù)據(jù)科學(xué)的工作

為成為數(shù)據(jù)科學(xué)家做好準(zhǔn)備,而不是單單為了數(shù)據(jù)科學(xué)。調(diào)整你的技能組合。

這些聽起來真是令人沮喪!但是,讓我來詳細(xì)說明這兩個問題,希望它們看起來不那么黯淡。

謹(jǐn)慎選擇數(shù)據(jù)科學(xué)

鑒于每個初級崗位有50或100或200個人投簡歷,因此不要與那些人競爭。不必攻讀數(shù)據(jù)科學(xué)學(xué)位,不必參加訓(xùn)練營(邊注:我見過的大多數(shù)訓(xùn)練營都是效率低下的,他們在很短的時間內(nèi)讓求職者處理太多的信息,使得求職者無法有效地對數(shù)據(jù)科學(xué)有所了解,在這里我就不細(xì)說了)。

不要做別人正在做的事情,因為這樣不能使你脫穎而出。你是在和一個堆積如山、過度飽和的行業(yè)競爭,這只會讓事情變得更困難。在我之前提到的那份PWC報告中,數(shù)據(jù)科學(xué)職位的數(shù)量估計為5萬。數(shù)據(jù)工程職位的數(shù)量為50萬。而數(shù)據(jù)分析師的數(shù)量是12.5萬。

通過“后門”進(jìn)入數(shù)據(jù)科學(xué)和技術(shù)的職位要容易得多,比如從做初級開發(fā)人員開始,或者從DevOps、項目管理開始,以及從事最相關(guān)的數(shù)據(jù)分析師、信息管理員等類似職位,而不是直接申請其他人也同時競爭的5個崗位。這將花費更長的時間,但是在你從事數(shù)據(jù)科學(xué)工作的同時,也在學(xué)習(xí)對你的整個職業(yè)生涯至關(guān)重要的IT技能。

了解當(dāng)今數(shù)據(jù)科學(xué)所需的技能

下面是一些你在數(shù)據(jù)空間中實際需要處理的問題:

創(chuàng)建Python包

將R語句投入實際生產(chǎn)

優(yōu)化Spark工作,使其更有效地運行

版本控制數(shù)據(jù)

使模型和數(shù)據(jù)可復(fù)制

版本控制SQL

在數(shù)據(jù)湖中建立和維護干凈的數(shù)據(jù)

大規(guī)模時間序列預(yù)測工具

擴展Jupyter筆記本的共享

考慮清洗數(shù)據(jù)的系統(tǒng)

大量的JSON

雖然在數(shù)據(jù)科學(xué)中有許多有趣的統(tǒng)計問題需要考慮,但這些博客鏈接都沒有解決它們。盡管調(diào)整模型、可視化和分析占據(jù)了你作為數(shù)據(jù)科學(xué)家的部分時間,但數(shù)據(jù)科學(xué)一直主要的工作是如何得到可以直接使用的干凈數(shù)據(jù)。

所有這些博客文章有什么共同之處?那就是良好的數(shù)據(jù)背景下的各個工程技能。

你該如何準(zhǔn)備解決這些問題,并為工作做好準(zhǔn)備?學(xué)習(xí)以下三種技能,它們都是基礎(chǔ)技能,并且相互之間有關(guān)聯(lián),從入門到精通。

所有這些技能的真正關(guān)鍵之處在于,它們對于數(shù)據(jù)科學(xué)之外的軟件開發(fā)也是基礎(chǔ)和重要的,這意味著如果你找不到數(shù)據(jù)科學(xué)相關(guān)的工作,也可以快速地過渡到軟件開發(fā)或devops。我認(rèn)為這種靈活性與針對特定數(shù)據(jù)相關(guān)任務(wù)的培訓(xùn)同樣重要。

1.學(xué)習(xí)SQL

首先,我建議無論目標(biāo)是成為數(shù)據(jù)工程師、ML專家還是AI 專家,每個人都需要學(xué)習(xí)SQL。

SQL并不吸引人,它也不是我剛才列出的問題的解決方案。但實際上,為了理解如何訪問數(shù)據(jù),你極有可能在某個地方遇到需要編寫一些SQL查詢并獲得答案的數(shù)據(jù)庫。

SQL非常強大且受歡迎,以至于NoSQL和鍵值存儲解決方案也在復(fù)現(xiàn)它。只需查看Presto、Athena,它們由Presto、BigQuery、KSQL、Pandas和Spark等等提供支持。如果你發(fā)現(xiàn)自己被大量的數(shù)據(jù)工具所淹沒,那么很可能有SQL是適合你的。而且,一旦你理解了SQL范式,就能更容易理解其他查詢語言,從而開辟一個全新的領(lǐng)域。

在學(xué)好SQL之后,下一步是了解數(shù)據(jù)庫如何工作以及為什這樣就可以學(xué)習(xí)優(yōu)化查詢。你不會成為數(shù)據(jù)庫開發(fā)人員,但是許多概念將延續(xù)到你的其他編程生活中。

2.學(xué)好編程語言、學(xué)習(xí)編程概念

前文我們談?wù)撨^如何學(xué)習(xí)SQL的問題,當(dāng)你使用SQL的時候,你會有這樣一個疑問,這樣的數(shù)據(jù)庫處理軟件,它是不是一個編程語言呢?答案是肯定的,不過它屬于聲明式編程。你可以指定所需要的輸出(就是你想從數(shù)據(jù)表中把哪幾列提取出來),但沒法控制它用什么方式把結(jié)果反饋。SQL抽象出大量發(fā)生在數(shù)據(jù)庫內(nèi)的信息。

與之相對的,如果你需要一種可以指定數(shù)據(jù)從哪里、用什么方式被選取出來。像Java、Python、Scala、R、Go等等這些都是現(xiàn)在流行的面向?qū)ο蟮倪^程化語言。

大家現(xiàn)在對用哪種語言去做數(shù)據(jù)科學(xué)依舊有很多爭論,當(dāng)然也不會在這里指定一種語言是最合適的。但我想說的是,在我的日常工作中,Python對我的幫助真的很大。作為一個初學(xué)者來說,Python很容易上手,而且也是數(shù)據(jù)領(lǐng)域里最流行的編程語言。為什么這么說呢,因為它可以處理很多數(shù)據(jù)問題,如構(gòu)建一個模型放入到scikitlearn里、訪問AWS API云平臺服務(wù)接口、制作網(wǎng)頁服務(wù)應(yīng)用、清洗數(shù)據(jù)、創(chuàng)建深度學(xué)習(xí)模型等等。而在統(tǒng)計領(lǐng)域里,R還是更為廣泛使用。

但同樣的,我還是建議不用去深究統(tǒng)計領(lǐng)域,Python基本可以滿足編程需求了。

當(dāng)然Python在大規(guī)模應(yīng)用、打包依賴關(guān)系、一些特定數(shù)字處理、特別是時間序列和R那樣開包即用(Python不像R有很多成型的功能包、更細(xì)致的統(tǒng)計功能模型) 等等問題上也不是很適用。

如果你不選擇Python,那也沒什么問題。但你應(yīng)該選擇一門語言讓你在數(shù)據(jù)科學(xué)之外的領(lǐng)域,一樣可以大展拳腳。舉個例子來說,如果你的第一份工作是數(shù)據(jù)分析師、質(zhì)量保障員、初級的軟件開發(fā)人員或者其他崗位,這都將是作為你進(jìn)入這個行業(yè)的敲門磚。

如果說一旦你選擇掌握某種編程語言,就會開始學(xué)習(xí)它的范式,研究它與整個計算機生態(tài)系統(tǒng)的關(guān)系。

在開始研究之后,你就會面對這樣一系列問題。如何用你掌握的編程語言進(jìn)行面向?qū)ο缶幊蹋∣OP)?什么是面向?qū)ο缶幊蹋咳绾巫屇愕拇a更簡化?你使用的語言是通過什么樣依賴關(guān)系工作的?對你寫好的代碼如何打包,怎樣進(jìn)行版本控制、持續(xù)集成、模型部署?到哪里去找這種語言社區(qū)去交流學(xué)習(xí),他們什么時候進(jìn)行交流研討會?

然后你需要做的就是不斷地了解這門語言,知道它的優(yōu)缺點,然后用這門語言做些有趣的編程,找到其中的樂趣。

然后就像武俠小說里練就奇功一樣,當(dāng)你打通任通二脈,這種編程語言能力成為你身體的一部分,然后你就去學(xué)習(xí)第二種編程語言,它將會教給你更多關(guān)于語言設(shè)計、算法和模式的內(nèi)容,了解這個更豐富有趣的語言世界。

3.學(xué)會如何在云平臺進(jìn)行操作

現(xiàn)在你知道如何進(jìn)行編程,那下一步要做的就是把這些能力和理論推廣到云平臺上,跟其他編程者進(jìn)行共享。

現(xiàn)在云服務(wù)無處不在,很有可能你的下一份工作就是需要在云平臺上完成的。有了云技術(shù),如果能夠搶先一步,就越容易走到前列,就比如現(xiàn)在有越來越多的機器學(xué)習(xí)范例轉(zhuǎn)移到了云服務(wù)供應(yīng)商(如亞馬遜的SageMaker、谷歌的Cloud AI、微軟的Azure Machine Learning),那上面會有更多現(xiàn)成的模板來實現(xiàn)你想要的算法、也有更多的公司數(shù)據(jù)會存儲在云上。

當(dāng)然你也有機會跟AWS行業(yè)領(lǐng)導(dǎo)者合作,但越來越多的地方開始使用Google Cloud云服務(wù),還有一些較為保守的傳統(tǒng)企業(yè)也開始用Microsoft Azure云服務(wù)。我的建議是對這上文提到的三家云服務(wù)公司做一個用戶調(diào)查,然后選擇一個更適合你們的。云設(shè)計范式是通用的,所以你應(yīng)該更關(guān)心如何將服務(wù)連接在一起、如何將你使用的部分與云上其他應(yīng)用做邏輯隔離,以及如何解析處理大量的JSON。

一個很酷的事情是,現(xiàn)在三家云服務(wù)供應(yīng)商都開始提供他們的產(chǎn)品認(rèn)證。我通常不太相信認(rèn)證是知識獲取的標(biāo)志,但是你可以通過認(rèn)證學(xué)到云平臺很重要的工作原理,這也是工程里另一個組成部分——網(wǎng)絡(luò)。

所以在你找到下一份工作之前,可以有時間充分學(xué)習(xí)一下這三家的證書,并且在云平臺上自由發(fā)揮一下,也是不錯的選擇。

還有一大部分我們沒有講到,就是“軟技能”(知道如何構(gòu)建、知道如何在工作環(huán)境下交流、知道其他人的需求)。這種能力與技術(shù)能力同樣重要,也有很多博客專門提到這種能力。

4、最后一步

現(xiàn)在深呼吸,我知道你已經(jīng)做好準(zhǔn)備了。

如果說上面說的內(nèi)容已經(jīng)足夠打動你,說明在2019年,你已經(jīng)做好成為一名數(shù)據(jù)科學(xué)家、或機器學(xué)習(xí)工程師、或云專家、AI法師的準(zhǔn)備了。

請記住,遵循這些建議的最終目標(biāo)是打敗那些具有數(shù)據(jù)科學(xué)學(xué)位、通過訓(xùn)練營和通過教程的工作人員。

你想進(jìn)入這個行業(yè),得到一個數(shù)據(jù)相關(guān)職位,朝你期待的工作而努力,并且盡可能多的了解整個科技行業(yè)的發(fā)展。

我的最后一點誠懇建議和鼓勵是:這些東西對任何一個人來說都相當(dāng)困難,而且看起來你需要了解成百上千的事情,永遠(yuǎn)不要失去信心。(不忘初心)

就像上面這個博客里,這個作者學(xué)習(xí)MOOC一開始都是幺蛾子,每個都是新東西,而且并沒有接觸過除了Windows以外其他操作系統(tǒng),也沒有接觸過終端,但是經(jīng)過努力終于做出了自己想要的分類器。

所以她也說到,在這個領(lǐng)域?qū)τ诿總€人來說都不容易,任何事情都是挑戰(zhàn),但是最終你都會克服并且一點點解決掉,你會發(fā)現(xiàn)車到山前必有路,柳暗花明又一村。

不要被分析問題的困難所擊倒。從一個小問題入手,積跬步以至千里,最終問題會迎刃而解。告訴大家請記住,你的第一份在數(shù)據(jù)科學(xué)領(lǐng)域的工作不一定就是數(shù)據(jù)科學(xué)家。

我最喜歡的其中一本書是安妮.拉莫特的《Bird By Bird》,是一本關(guān)于寫作的書。很有趣的是,這本書的書名是作者的哥哥當(dāng)年不得不寫的一份讀書報告。

“三十年前,我十歲的哥哥正在努力寫一份關(guān)于鳥類的研究報告。他本來有三個月的時間進(jìn)行寫作,但是明天就要交了。我們在柏林阿斯的家里小屋里,哥哥他絞盡腦汁地寫那份報告,幾乎要留下眼淚,而他被這艱巨的任務(wù)禁錮在廚房餐桌旁,周圍散落著活頁紙、鉛筆和一些沒有開封過的鳥類書籍。這時候父親來到旁邊坐下,抱住哥哥的肩膀說道,“Bird by bird,孩子。就是把鳥一個個列出來””

后來他就完成了。

不要讓天花亂墜宣傳信息壓倒你。不要因為那些時髦的詞或者帶著MacBook那種時尚人士形象所蒙蔽。集中在一只鳥的身上,從那里開始。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:被擠爆的數(shù)據(jù)科學(xué)行業(yè)!五年前“最性感的職業(yè)”怎么了?

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    深開鴻亮相“小小科學(xué)家”品牌發(fā)布暨科學(xué)探索研學(xué)營開營活動

    為在青少年中營造學(xué)科學(xué)、愛科學(xué)、用科學(xué)的濃厚氛圍,1月14日,由市委組織部、市委教育工委、團市委共同主辦的“小小科學(xué)家”品牌發(fā)布暨科學(xué)探索研
    的頭像 發(fā)表于 01-15 21:17 ?164次閱讀
    深開鴻亮相“小小<b class='flag-5'>科學(xué)家</b>”品牌發(fā)布暨<b class='flag-5'>科學(xué)</b>探索研學(xué)營開營活動

    AI 推動未來科學(xué) 晶泰科技共襄未來科學(xué)大獎周

    科學(xué)家,探討學(xué)科交叉與學(xué)術(shù)創(chuàng)新,傾力打造兼具權(quán)威、專業(yè)和國際影響力的科學(xué)盛會。 未來科學(xué)大獎由未來論壇于 2016 年創(chuàng)設(shè),被譽為"中
    的頭像 發(fā)表于 12-18 09:58 ?161次閱讀
    AI 推動未來<b class='flag-5'>科學(xué)</b> 晶泰科技共襄未來<b class='flag-5'>科學(xué)</b>大獎周

    西湖大學(xué):科學(xué)家+AI,科研新范式的樣本

    研究,創(chuàng)新科研新范式。這一點在西湖大學(xué)的科研項目中已得到體現(xiàn)。 成立于2018年的西湖大學(xué)是由施一公院士領(lǐng)銜創(chuàng)辦的、聚焦前沿科學(xué)研究的研究型大學(xué),該校鼓勵科學(xué)家們探索AI與各學(xué)科交叉融合,為科研創(chuàng)新提速。為此,西湖大學(xué)在浪潮信息等企業(yè)助力下打造
    的頭像 發(fā)表于 12-12 15:59 ?219次閱讀
    西湖大學(xué):<b class='flag-5'>科學(xué)家</b>+AI,科研新范式的樣本

    數(shù)據(jù)科學(xué)工作流原理

    數(shù)據(jù)科學(xué)工作流包括數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)探索與可視化、特征選擇與工程、模型選擇與訓(xùn)練、模型評估與優(yōu)化、結(jié)果解釋與報告、部署與監(jiān)控等環(huán)節(jié)。
    的頭像 發(fā)表于 11-20 10:36 ?216次閱讀

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    了傳統(tǒng)學(xué)科界限,使得科學(xué)家們能夠從更加全面和深入的角度理解生命的奧秘。同時,AI技術(shù)的引入也催生了一種全新的科學(xué)研究范式,即數(shù)據(jù)驅(qū)動的研究范式,這種范式強調(diào)從大量數(shù)據(jù)中提取有價值的信息
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    和數(shù)量直接影響到模型的準(zhǔn)確和可靠。因此,數(shù)據(jù)獲取、處理、分析和質(zhì)量控制在AI for Science中至關(guān)重要。此外,數(shù)據(jù)驅(qū)動的研究范式也促使
    發(fā)表于 10-14 09:16

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    如何激發(fā)科學(xué)家的創(chuàng)新思維。AI不僅僅是工具,更是一種思維方式,它鼓勵我們跳出傳統(tǒng)框架,以數(shù)據(jù)為驅(qū)動,探索未知。這種思維方式的轉(zhuǎn)變,不僅促進(jìn)了科學(xué)方法的革新,也為解決全球挑戰(zhàn)提供了新的
    發(fā)表于 10-14 09:12

    中國科學(xué)家發(fā)現(xiàn)新型高溫超導(dǎo)體

    據(jù)新華社報道,我國科學(xué)家再立新功,又一新型高溫超導(dǎo)體被發(fā)現(xiàn)。 復(fù)旦大學(xué)物理學(xué)系趙俊團隊利用高壓光學(xué)浮區(qū)技術(shù)成功生長了三層鎳氧化物,成功證實在鎳氧化物中具有壓力誘導(dǎo)的體超導(dǎo)電,而且超導(dǎo)體積分?jǐn)?shù)達(dá)到
    的頭像 發(fā)表于 07-19 15:14 ?749次閱讀

    新華社:突破成果!祝賀我國科學(xué)家成功研發(fā)這一傳感器!

    6月25日,新華社以《突破成果!祝賀我國科學(xué)家》為標(biāo)題,報道了由我國科學(xué)家研發(fā)的傳感器成果。 我國科學(xué)家研發(fā)高通道神經(jīng)探針實現(xiàn)獼猴全腦尺度神經(jīng)活動監(jiān)測 神經(jīng)探針是一種用來記錄神經(jīng)活動
    的頭像 發(fā)表于 06-27 18:03 ?542次閱讀
    新華社:突破<b class='flag-5'>性</b>成果!祝賀我國<b class='flag-5'>科學(xué)家</b>成功研發(fā)這一傳感器!

    前OpenAI首席科學(xué)家創(chuàng)辦新的AI公司

    消息在業(yè)界引起了廣泛關(guān)注,因為蘇茨克維曾是OpenAI的聯(lián)合創(chuàng)始人及首席科學(xué)家,并在去年在OpenAI董事會上扮演了重要角色。
    的頭像 發(fā)表于 06-21 10:42 ?545次閱讀

    科學(xué)家研制出一款新型柔性X射線探測器

    英國科學(xué)家開發(fā)出一種有機半導(dǎo)體材料,并利用其研制出一款新型柔性X射線探測器。這種探測器不僅“身段”更柔軟,可貼合需要掃描物體的形狀,從而提高患者篩查的準(zhǔn)確,降低腫瘤成像和放射治療的風(fēng)險,而且成本
    的頭像 發(fā)表于 06-13 06:29 ?340次閱讀

    助力科學(xué)發(fā)展,NVIDIA AI加速HPC研究

    科學(xué)家和研究人員正在利用 NVIDIA 技術(shù)將生成式 AI 應(yīng)用于代碼生成、天氣預(yù)報、遺傳學(xué)和材料科學(xué)領(lǐng)域的 HPC 工作。
    的頭像 發(fā)表于 05-14 09:17 ?440次閱讀
    助力<b class='flag-5'>科學(xué)</b>發(fā)展,NVIDIA AI加速HPC研究

    本源量子參與的國家重點研發(fā)計劃青年科學(xué)家項目啟動會順利召開

    2024年4月23日,國家重點研發(fā)計劃“先進(jìn)計算與新興軟件”重點專項“面向復(fù)雜物理系統(tǒng)求解的量子科學(xué)計算算法、軟件、應(yīng)用與驗證”青年科學(xué)家項目啟動會暨實施方案論證會在合肥順利召開。該項目由合肥綜合國家
    的頭像 發(fā)表于 05-11 08:22 ?793次閱讀
    本源量子參與的國家重點研發(fā)計劃青年<b class='flag-5'>科學(xué)家</b>項目啟動會順利召開

    NVIDIA首席科學(xué)家Bill Dally:深度學(xué)習(xí)硬件趨勢

    Bill Dally于2009年1月加入NVIDIA擔(dān)任首席科學(xué)家,此前在斯坦福大學(xué)任職12年,擔(dān)任計算機科學(xué)系主任。Dally及其斯坦福團隊開發(fā)了系統(tǒng)架構(gòu)、網(wǎng)絡(luò)架構(gòu)、信號傳輸、路由和同步技術(shù),在今天的大多數(shù)大型并行計算機中都可以找到。
    的頭像 發(fā)表于 02-25 16:16 ?1241次閱讀
    NVIDIA首席<b class='flag-5'>科學(xué)家</b>Bill Dally:深度學(xué)習(xí)硬件趨勢

    谷歌DeepMind科學(xué)家欲建AI初創(chuàng)公司

    據(jù)知情人士透露,谷歌人工智能部門DeepMind的兩名杰出科學(xué)家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立一家新的人工智能初創(chuàng)公司的事宜。
    的頭像 發(fā)表于 01-22 14:41 ?525次閱讀