0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習(xí)不需要數(shù)學(xué),調(diào)包就行?

jmiy_worldofai ? 來源:未知 ? 作者:胡薇 ? 2018-09-30 10:38 ? 次閱讀

不抖機靈,想從接觸過機器學(xué)習(xí)學(xué)術(shù)圈但已投身工業(yè)界的角度來回答。

我認為:大部分機器學(xué)習(xí)從業(yè)者不需要過度的把時間精力放在數(shù)學(xué)上,而該用于熟悉不同算法的應(yīng)用場景和掌握一些調(diào)參技巧。好的數(shù)學(xué)基礎(chǔ)可以使你的模型簡潔高效,但絕非必要的先決條件。

原因如下:

1. 即使你有了一定的數(shù)學(xué)功底,還是不知道怎么調(diào)參或者進行優(yōu)化。

這話說的雖然有點自暴自棄,但捫心自問在座的各位,當你發(fā)現(xiàn) accuracy 不好、loss 很高、模型已經(jīng) overfitting 了,你唰唰唰列列公式玩玩矩陣就知道問題出在哪里了嗎?不一定。誠然,懂得更多的統(tǒng)計原理可以幫助推測問題出在了哪里,你可能換了一個 loss function 或者加了新的 regularizer,但結(jié)果不一定會更好 :(數(shù)學(xué)基礎(chǔ)之于機器學(xué)習(xí)從業(yè)者很像 debugger 之于碼農(nóng),它給了你方向,但不能保證你一定可以解決問題。那怎么能解決問題?只有經(jīng)驗經(jīng)驗經(jīng)驗,別無他法,有時候甚至靠的是直覺。數(shù)學(xué)基礎(chǔ)是好的內(nèi)功基礎(chǔ),但你調(diào)包調(diào)多了,其實也慢慢能抓到一些感覺,不必看不起 “調(diào)包俠”。

2. 工業(yè)界可以應(yīng)用的模型是很有限的,可調(diào)的參數(shù)也是有限的。

工業(yè)界選擇模型非??粗乜山忉屝?,效率,以及和整個系統(tǒng)的整合能力。舉例,在我的工作中,大部分時間都在使用 Regression 和 Decision Tree 相關(guān)的算法(如 Random Forests)。是因為這兩個算法最好么?不,恰恰是因為這兩個算法穩(wěn)定及高效,而且容易解釋。對于這樣的模型,你即使數(shù)學(xué)能力很強,能調(diào)整的參數(shù)也是有限的。根據(jù)網(wǎng)上的例子和經(jīng)驗,大量的工程師可以在數(shù)學(xué)基礎(chǔ)稍弱的情況下做到很好的效果。

3. 數(shù)學(xué) / 統(tǒng)計知識已經(jīng)成了既得利益者刻意為外來者建立的一道壁壘。

不知道大家有多少人是從事過 ML 研究的。我個人的觀察是做出成績的 ML 研究人員是有限的,科班出身的 researcher 更是遠遠無法工業(yè)界的空缺。所以大家沒有必要擔心會被轉(zhuǎn)行者搶了飯碗,也沒有必要刻意鼓吹一定要懂矩陣,凸優(yōu)化,等數(shù)學(xué)知識才配做機器學(xué)習(xí)。大家都是出來賣的,不必互相為難。說來慚愧,在工作中我常常跟老板說這個人不能用,你要用我這種科班出身的人,但我內(nèi)心是不贊同的。

每當我看到知乎上有人問機器學(xué)習(xí)怎么入門,結(jié)果大家立馬推薦第一本就看 PRML 和 Statitical Learning 以及一大堆公開課和數(shù)學(xué)課的時候,我的內(nèi)心是崩潰的。各位答主的目標是把所有人都嚇回去還是秀一下優(yōu)越感?

4. 理論模型和實際應(yīng)用分的是兩塊不同的蛋糕。

承接第 2,3 點,做理論研究的發(fā)力于突破,提出新的模型或者優(yōu)化方法,做應(yīng)用的致力于把模型應(yīng)用于數(shù)據(jù)上,攫取商業(yè)價值。這兩者不存在利益沖突,做理論的人有自帶正統(tǒng)光環(huán)的優(yōu)勢,所以更該顯得大度一些。只有 “調(diào)包” 的人越來越多,這個行業(yè)才會繁榮,因為證明技術(shù)落了地,可以帶來實際價值。

5. 行業(yè)的發(fā)展趨勢是降低工具的使用難度,這讓我們不必反復(fù)造輪子。

亞馬、遜谷歌、微軟等各大平臺都開放了他們的機器學(xué)習(xí)工具。以前人們還需要自己寫各種模型,好一些的調(diào)一下 sklearn,但現(xiàn)在 Azure ML Studio 已經(jīng)方便到零代碼了。年初的時候,我試了一下 ML studio,簡直方便的可怕,完全是圖形拖動連接就可以建立模型,那一刻我仿似看到了自己即將失業(yè)。

6. 文藝一點說,我們需要更包容的心態(tài),切勿文人相輕。

想要接觸了解一門學(xué)科,應(yīng)該先有興趣,才有探索的積極性。就像我們第一次看到 Hello word 出現(xiàn)的樣子,很多剛?cè)胄械娜说谝淮慰吹綑C器學(xué)習(xí)能解決實際問題時,會產(chǎn)生濃厚的興趣。

我怕的就是所謂的圈內(nèi)人都說你必須要會矩陣分解,必須要會用 trace 算導(dǎo)數(shù),必須會優(yōu)化,才能開始學(xué)習(xí)機器學(xué)習(xí)。這個周期太長,很多人連開始的勇氣都沒有~ 我覺得不管怎么樣,要先動手做起來,發(fā)現(xiàn)自己的不足,再去補充需要的東西。

既然學(xué)術(shù)是自由的,我們就打開大門,歡迎大家都進來坐坐。如果他 / 她不喜歡,歡迎到隔壁串門。但我們不要給自己家門壘了高高的臺階,說閑人勿進。久而久之,難免門可羅雀。

綜上,我覺得應(yīng)用機器學(xué)習(xí)模型和技巧既不能完全不懂數(shù)學(xué),兩眼一抹黑,也不該要求每個從業(yè)者都要精通各種數(shù)學(xué)理論。模型應(yīng)用者要長存對理論的敬畏之心,不要總想搞個大新聞?wù)f “機器學(xué)習(xí)也不過如此”,但做理論的也不必覺得高人一等,別人都是二等公民。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:如何看待「機器學(xué)習(xí)不需要數(shù)學(xué),很多算法封裝好了,調(diào)個包就行」這種說法?

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    深控技術(shù)研發(fā)的 “不需要點表的工業(yè)網(wǎng)關(guān)” 在 CNC 采集方面的應(yīng)用

    深控技術(shù)研發(fā)的 “不需要點表的工業(yè)網(wǎng)關(guān)” 在 CNC 采集領(lǐng)域展現(xiàn)出了顯著優(yōu)勢,通過有效的實施案例證明了其能夠切實解決眾多實際問題,為推動工業(yè)企業(yè)的智能化生產(chǎn)管理提供了有力支持。
    的頭像 發(fā)表于 11-19 14:31 ?229次閱讀
    深控技術(shù)研發(fā)的 “<b class='flag-5'>不需要</b>點表的工業(yè)網(wǎng)關(guān)” 在 CNC 采集方面的應(yīng)用

    不需要點表的工業(yè)網(wǎng)關(guān)應(yīng)用案例:如何提升工業(yè)企業(yè)生產(chǎn)效率與質(zhì)量?

    不需要點表的工業(yè)網(wǎng)關(guān)解決方案。技術(shù)團隊在車間各個關(guān)鍵設(shè)備節(jié)點安裝了新的工業(yè)網(wǎng)關(guān)。由于不需要點表,安裝過程極為簡便,技術(shù)人員僅需將網(wǎng)關(guān)與設(shè)備連接,并進行簡單的網(wǎng)絡(luò)設(shè)置,即可完成部署。整個車間的網(wǎng)關(guān)部署時間比之前預(yù)計縮短了 [X]%。
    的頭像 發(fā)表于 11-13 10:27 ?145次閱讀
    <b class='flag-5'>不需要</b>點表的工業(yè)網(wǎng)關(guān)應(yīng)用案例:如何提升工業(yè)企業(yè)生產(chǎn)效率與質(zhì)量?

    不需要點表的 PLC 工業(yè)網(wǎng)關(guān) 在印刷 / 包裝行業(yè)的實施案例

    深控技術(shù)的 “不需要點表的 PLC 工業(yè)網(wǎng)關(guān)” 被部署在各條關(guān)鍵生產(chǎn)設(shè)備上,通過標準的工業(yè)通信接口(如以太網(wǎng)、串口等)與 PLC 進行連接。由于其獨特的設(shè)計,無需人工繁瑣地配置點表,網(wǎng)關(guān)能夠自動識別 PLC 中的各類數(shù)據(jù)標簽,快速完成數(shù)據(jù)采集的初始化設(shè)置
    的頭像 發(fā)表于 11-06 09:58 ?211次閱讀
    <b class='flag-5'>不需要</b>點表的 PLC 工業(yè)網(wǎng)關(guān) 在印刷 / 包裝行業(yè)的實施案例

    C語言為什么不需要包含stdio.h

    我們在寫單片機程序的時候,第一行都會包含 reg51.h,于是就有同學(xué)提出了疑問,為什么不需要包含 stdio.h?
    的頭像 發(fā)表于 10-29 15:48 ?340次閱讀

    基于 “不需要點表的工業(yè)網(wǎng)關(guān)” 的工業(yè)自動化設(shè)備遠程監(jiān)控解決方案

    基于 “不需要點表的工業(yè)網(wǎng)關(guān)” 的工業(yè)自動化設(shè)備遠程監(jiān)控解決方案具有顯著的優(yōu)勢,能夠為工業(yè)企業(yè)提供高效、便捷、安全的設(shè)備遠程監(jiān)控服務(wù),助力企業(yè)提升生產(chǎn)效率和競爭力。
    的頭像 發(fā)表于 10-28 15:20 ?202次閱讀
    基于 “<b class='flag-5'>不需要</b>點表的工業(yè)網(wǎng)關(guān)” 的工業(yè)自動化設(shè)備遠程監(jiān)控解決方案

    深控技術(shù) “不需要點表的 Plc 網(wǎng)關(guān)”:功能、應(yīng)用與優(yōu)勢

    深控技術(shù)研發(fā)的 “不需要點表的 Plc 網(wǎng)關(guān)” 憑借其支持多品牌、靈活組網(wǎng)、強大總表讀取功能等優(yōu)勢,在食品行業(yè)等眾多領(lǐng)域展現(xiàn)出了卓越的應(yīng)用價值,為工業(yè)自動化的發(fā)展提供了有力的推動。
    的頭像 發(fā)表于 10-28 14:18 ?199次閱讀
    深控技術(shù) “<b class='flag-5'>不需要</b>點表的 Plc 網(wǎng)關(guān)”:功能、應(yīng)用與優(yōu)勢

    SMT 產(chǎn)線數(shù)據(jù)采集方案 —— 不需要點表的工業(yè)網(wǎng)關(guān)

    深控技術(shù)研發(fā)的 “不需要點表的工業(yè)網(wǎng)關(guān)” 為 SMT 產(chǎn)線的數(shù)據(jù)采集提供了一種高效、準確、便捷的解決方案。
    的頭像 發(fā)表于 10-21 10:31 ?293次閱讀
    SMT 產(chǎn)線數(shù)據(jù)采集方案 —— <b class='flag-5'>不需要</b>點表的工業(yè)網(wǎng)關(guān)

    深控技術(shù)研發(fā)的 “不需要點表的工業(yè)網(wǎng)關(guān)” 在工廠產(chǎn)線設(shè)備的應(yīng)用

    工廠產(chǎn)線設(shè)備的高效運行與數(shù)據(jù)交互至關(guān)重要。深控技術(shù)研發(fā)的 “不需要點表的工業(yè)網(wǎng)關(guān)” 為工廠產(chǎn)線帶來了創(chuàng)新性的解決方案,極大地提升了設(shè)備的互聯(lián)互通性、數(shù)據(jù)處理效率以及整體運營的智能化水平。
    的頭像 發(fā)表于 10-14 10:52 ?255次閱讀
    深控技術(shù)研發(fā)的 “<b class='flag-5'>不需要</b>點表的工業(yè)網(wǎng)關(guān)” 在工廠產(chǎn)線設(shè)備的應(yīng)用

    不需要點表的工業(yè)網(wǎng)關(guān)” 深控技術(shù)物聯(lián)網(wǎng)解決方案

    不需要點表的工業(yè)網(wǎng)關(guān)” 物聯(lián)網(wǎng)解決方案
    的頭像 發(fā)表于 09-29 15:43 ?368次閱讀
    “<b class='flag-5'>不需要</b>點表的工業(yè)網(wǎng)關(guān)” 深控技術(shù)物聯(lián)網(wǎng)解決方案

    OPA2171需不需要外部補償?

    如OPA2171這個運放,不知道需不需要外部補償?
    發(fā)表于 09-26 06:23

    選擇ths4631后需不需要用jfet呀?

    如圖所示的電荷靈敏前方電路,如果用ths4631作為運放A1,還需不需要用前端的Q1(Q1為jfet,型號為2sk152),如果需要時什么原因,如果不需要時什么原因。還有用Q1的作用是什么?
    發(fā)表于 09-23 07:20

    網(wǎng)線那幾根線不需要

    在網(wǎng)線中,哪幾根線不需要接主要取決于網(wǎng)絡(luò)的需求和類型。一般來說,在百兆網(wǎng)絡(luò)中,通常只需要用到其中的四根線,即第1、第2、第3、第6根線,它們分別承擔著數(shù)據(jù)的發(fā)送和接收功能。這四根線在網(wǎng)線中的顏色
    的頭像 發(fā)表于 09-04 09:40 ?1653次閱讀

    L6235Q VREF引腳要是不需要tacho測速功能需要怎么接?

    這個L6235Q VREF引腳要是不需要tacho測速功能需要怎么接,看數(shù)據(jù)手冊好像是說PWM電流控制器參考電壓,最小值為-0.1V,最大值為5V,設(shè)計時應(yīng)該怎
    發(fā)表于 03-28 08:17

    不需要License不需要燒錄器,板卡集成下載器和調(diào)試功能,盤古PGX-Lite 7K開發(fā)板

    不需要License不需要燒錄器,板卡集成下載器和調(diào)試功能,盤古PGX-Lite 7K開發(fā)板,紫光同創(chuàng)Compa系類低功耗CPLD,基于PGC7KD-6IMBG256,輕松掌握國產(chǎn)FPGA操作
    發(fā)表于 03-08 13:51

    六類屏蔽網(wǎng)線和六類非屏蔽網(wǎng)線都不需要接地嗎

    是的,一般情況下六類屏蔽網(wǎng)線和六類非屏蔽網(wǎng)線都不需要接地。在綜合布線工程中,通常采用免接地方式,即網(wǎng)線不需要直接接地。這是因為網(wǎng)線傳輸?shù)男盘栯妷狠^低,一般在12V左右,因此不需要通過接地來消除靜電等
    的頭像 發(fā)表于 03-08 10:01 ?3218次閱讀