0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)項(xiàng)目中提取簡(jiǎn)單有效的checklist

汽車玩家 ? 來(lái)源:AI公園 ? 作者:datarevenue ? 2020-05-04 11:44 ? 次閱讀

導(dǎo)讀

這個(gè)checklist能幫助你邁出做一個(gè)成功的機(jī)器學(xué)習(xí)項(xiàng)目第一步。

避免混淆,用這個(gè)簡(jiǎn)單的清單來(lái)計(jì)劃你的 AI 項(xiàng)目。

對(duì)許多人來(lái)說(shuō),機(jī)器學(xué)習(xí)仍然是一項(xiàng)新技術(shù),這可能會(huì)讓它難以管理。

項(xiàng)目經(jīng)理通常不知道如何與數(shù)據(jù)科學(xué)家談?wù)撍麄兊南敕ā?/p>

在我們規(guī)劃 30 多個(gè)機(jī)器學(xué)習(xí)項(xiàng)目的經(jīng)驗(yàn)中,我們提煉出了一個(gè)簡(jiǎn)單有效的checklist。

1. 項(xiàng)目動(dòng)機(jī)

明確你的項(xiàng)目的更廣泛的意義。

你要解決的問(wèn)題是什么?What is theproblemyou want to solve?

相關(guān)聯(lián)的目標(biāo)策略是什么?

如果項(xiàng)目團(tuán)隊(duì)不理解你的動(dòng)機(jī),那么他們就很難提出好的建議。

有很多方法可以解決機(jī)器學(xué)習(xí)的問(wèn)題。所以幫助你的團(tuán)隊(duì)以你最感興趣的方式工作 —— 退一步告訴他們?yōu)槭裁催@個(gè)項(xiàng)目是重要的。

2. 問(wèn)題定義

你想要預(yù)測(cè)的具體輸出是什么?

對(duì)于給定的輸入,你的機(jī)器學(xué)習(xí)模型將理想地學(xué)會(huì)預(yù)測(cè)非常具體的輸出。

所以這里你要盡可能的清楚?!邦A(yù)測(cè)機(jī)器故障”可能意味著很多事情 —— “告訴我,在未來(lái) 24 小時(shí)內(nèi),意外停機(jī)的風(fēng)險(xiǎn)何時(shí)增加 50%以上”更好。

你的算法有什么輸入數(shù)據(jù)?

模型預(yù)測(cè)輸出的唯一方法是從模型的輸入因子中派生出來(lái)。所以,為了有機(jī)會(huì)做出好的預(yù)測(cè),你必須有與輸出相關(guān)的數(shù)據(jù)。數(shù)據(jù)越多越好。

什么是預(yù)測(cè)你的具體輸出的最相關(guān)因素?

算法不能理解我們的世界。重要的是,你要給數(shù)據(jù)科學(xué)家一些提示,告訴他哪些數(shù)據(jù)實(shí)際上是相關(guān)的,這樣他就可以用算法能夠理解的方式選擇和分割數(shù)據(jù)。

你能提供多少訓(xùn)練樣本?

一個(gè)算法需要的練習(xí)比一個(gè)人要多得多。你最少需要 200 個(gè)樣本。越多越好。

3. 性能度量

你怎么知道什么是好的結(jié)果?

你有一個(gè)簡(jiǎn)單的基準(zhǔn)測(cè)試來(lái)比較你的結(jié)果嗎?

有沒(méi)有一種簡(jiǎn)單的方法來(lái)利用你已有的數(shù)據(jù)進(jìn)行預(yù)測(cè)?也許你可以根據(jù)去年的數(shù)字預(yù)測(cè)銷售額,或者通過(guò)計(jì)算客戶上一次登錄后的天數(shù)來(lái)評(píng)估客戶離開(kāi)的風(fēng)險(xiǎn)。一個(gè)簡(jiǎn)單的基準(zhǔn)測(cè)試可以為你的團(tuán)隊(duì)提供有價(jià)值的問(wèn)題洞察力。它給你一些東西來(lái)衡量模型。

你將如何衡量預(yù)測(cè)的準(zhǔn)確性?

你期望的最低準(zhǔn)確度是多少?

你希望預(yù)測(cè)的準(zhǔn)確率平均在 5% 以內(nèi),還是更重要的是預(yù)測(cè)誤差不超過(guò) 10%?你的模型可以以任何一種方式進(jìn)行調(diào)優(yōu)。哪種方式更好取決于什么對(duì)你來(lái)說(shuō)是重要的。

一個(gè)完美的解決方案是什么樣的?

即使這對(duì)你來(lái)說(shuō)是顯而易見(jiàn)的,把它寫(xiě)在紙上也能幫助你理清思路。

是否有參考解決方案(如研究論文)?

如果有人以前解決過(guò)類似的問(wèn)題,就把他們的解決方案當(dāng)作靈感。這為每個(gè)人提供了一個(gè)共同的起點(diǎn),這樣他們就可以看到要使用哪些數(shù)據(jù),可能會(huì)出現(xiàn)哪些問(wèn)題,以及要嘗試哪些算法。

4. 時(shí)間線

一個(gè)性能驗(yàn)證項(xiàng)目的時(shí)間線示例。

是否有截止日期需要注意?

你什么時(shí)候需要看到第一個(gè)結(jié)果?

你想什么時(shí)候有一個(gè)完整的解決方案?

人工智能解決方案可以無(wú)限地改進(jìn)。明確的最后期限有助于讓團(tuán)隊(duì)集中精力。

5. 聯(lián)系人

誰(shuí)負(fù)責(zé)項(xiàng)目(PM)?

誰(shuí)可以授權(quán)訪問(wèn)數(shù)據(jù)集?

誰(shuí)能幫助理解當(dāng)前的流程和/或簡(jiǎn)單的基準(zhǔn)測(cè)試(領(lǐng)域?qū)<??

在一個(gè)項(xiàng)目的過(guò)程中會(huì)出現(xiàn)許多問(wèn)題。明確你的工程師可以向誰(shuí)求助。

6. 合作

在業(yè)務(wù)和工程團(tuán)隊(duì)之間建立一個(gè)雙/周的更新。

每周安排一次會(huì)議來(lái)查看當(dāng)前的結(jié)果,并討論那些不需要通過(guò)電子郵件來(lái)回答的問(wèn)題。

應(yīng)該涉及誰(shuí)?

他們應(yīng)該學(xué)什么?

在學(xué)習(xí)如何管理人工智能方面,沒(méi)有什么比實(shí)際項(xiàng)目的實(shí)踐經(jīng)驗(yàn)更有價(jià)值。如果你想讓你的團(tuán)隊(duì)的其他成員學(xué)習(xí),從一開(kāi)始就要說(shuō)清楚。

定義代碼和問(wèn)題的位置以及如何訪問(wèn)代碼。

讓所有的開(kāi)發(fā)從一開(kāi)始就透明。這樣任何人都可以很容易地加入,給出提示,并檢查進(jìn)展。

回答這個(gè)清單上的問(wèn)題,并與大家分享

世界仍在研究如何最好地運(yùn)行人工智能/機(jī)器學(xué)習(xí)項(xiàng)目。填寫(xiě)這份清單將會(huì)給你所有成功的機(jī)器學(xué)習(xí)項(xiàng)目的要素之一:理解。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31097

    瀏覽量

    269425
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8424

    瀏覽量

    132764
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    構(gòu)建云原生機(jī)器學(xué)習(xí)平臺(tái)流程

    構(gòu)建云原生機(jī)器學(xué)習(xí)平臺(tái)是一個(gè)復(fù)雜而系統(tǒng)的過(guò)程,涉及數(shù)據(jù)收集、處理、特征提取、模型訓(xùn)練、評(píng)估、部署和監(jiān)控等多個(gè)環(huán)節(jié)。
    的頭像 發(fā)表于 12-14 10:34 ?145次閱讀

    傅立葉變換在機(jī)器學(xué)習(xí)中的應(yīng)用 常見(jiàn)傅立葉變換的誤區(qū)解析

    傅里葉變換在機(jī)器學(xué)習(xí)中的應(yīng)用 傅里葉變換是一種將信號(hào)分解為其組成頻率分量的數(shù)學(xué)運(yùn)算,它在機(jī)器學(xué)習(xí)中的應(yīng)用日益廣泛。以下是一些主要的應(yīng)用領(lǐng)域: 信號(hào)處理 : 音頻處理:傅里葉變換有助于識(shí)
    的頭像 發(fā)表于 12-06 17:06 ?241次閱讀

    自然語(yǔ)言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語(yǔ)言處理的基本概念及步驟

    Learning,簡(jiǎn)稱ML)是人工智能的一個(gè)核心領(lǐng)域,它使計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)并做出預(yù)測(cè)或決策。自然語(yǔ)言處理與機(jī)器學(xué)習(xí)之間有著密切的關(guān)系,因?yàn)?b class='flag-5'>機(jī)器
    的頭像 發(fā)表于 12-05 15:21 ?528次閱讀

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    緊密。 NPU的起源與特點(diǎn) NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項(xiàng)目中提出,旨在為T(mén)ensorFlow框架提供專用的硬件加速。NPU的設(shè)計(jì)目標(biāo)是提高機(jī)器學(xué)習(xí)算法的運(yùn)行效率,特別是在處理
    的頭像 發(fā)表于 11-15 09:19 ?511次閱讀

    eda在機(jī)器學(xué)習(xí)中的應(yīng)用

    機(jī)器學(xué)習(xí)項(xiàng)目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過(guò)程中不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 11-13 10:42 ?326次閱讀

    【每天學(xué)點(diǎn)AI】KNN算法:簡(jiǎn)單有效機(jī)器學(xué)習(xí)分類器

    過(guò)程,其實(shí)就是一個(gè)簡(jiǎn)單的分類問(wèn)題,而KNN(K-NearestNeighbors)算法正是模仿這種人類決策過(guò)程的機(jī)器學(xué)習(xí)算法。|什么是KNN?KNN(K-NearestNeighbo
    的頭像 發(fā)表于 10-31 14:09 ?359次閱讀
    【每天學(xué)點(diǎn)AI】KNN算法:<b class='flag-5'>簡(jiǎn)單</b><b class='flag-5'>有效</b>的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>分類器

    智能照明控制系統(tǒng)在體育場(chǎng)館項(xiàng)目中的應(yīng)用

    與瞄準(zhǔn)、燈具眩光與外溢光控制;基本控制方式、區(qū)域控制、系統(tǒng)功能等方面,探討了體育場(chǎng)館項(xiàng)目中智能照明系統(tǒng)的應(yīng)用要點(diǎn)。 關(guān)鍵詞:體育場(chǎng)館;智能照明;照明控制 0、引言 在體育場(chǎng)館項(xiàng)目中應(yīng)用智能照明系統(tǒng),能夠優(yōu)化體育場(chǎng)館的運(yùn)行、管理與服
    的頭像 發(fā)表于 09-25 14:04 ?413次閱讀
    智能照明控制系統(tǒng)在體育場(chǎng)館<b class='flag-5'>項(xiàng)目中</b>的應(yīng)用

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取

    個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測(cè)任務(wù)。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問(wèn)題的特征,從而提高機(jī)器學(xué)習(xí)
    發(fā)表于 08-17 21:12

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來(lái)一點(diǎn)也不輕松,加油。 作者首先說(shuō)明了時(shí)間序列的信息提取是時(shí)間序列分析的一個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析
    發(fā)表于 08-14 18:00

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議

    這本書(shū)以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了機(jī)器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列

    收到《時(shí)間序列與機(jī)器學(xué)習(xí)》一書(shū),彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個(gè)讓我學(xué)習(xí)時(shí)間序列及應(yīng)用的機(jī)會(huì)! 前言第一段描述了編寫(xiě)背景: 由此可知,這是一本關(guān)于時(shí)間序列進(jìn)行大數(shù)
    發(fā)表于 08-11 17:55

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】全書(shū)概覽與時(shí)間序列概述

    數(shù)據(jù)中提取特征并將其轉(zhuǎn)化為交易策略,以及機(jī)器學(xué)習(xí)在其他金融領(lǐng)域(包括資產(chǎn)定價(jià)、資產(chǎn)配置、波動(dòng)率預(yù)測(cè))的應(yīng)用。 全書(shū)彩版印刷,內(nèi)容結(jié)構(gòu)嚴(yán)整,條理清晰,循序漸進(jìn),由淺入深,是很好的時(shí)間序列學(xué)習(xí)
    發(fā)表于 08-07 23:03

    原理圖及PCB Checklist大放送~

    進(jìn)行原理圖及PCB詳檢二、原理圖檢查清單細(xì)則原理圖CheckList電源電路自檢確認(rèn)項(xiàng)目確認(rèn)結(jié)果備注應(yīng)用設(shè)計(jì)模擬部分?jǐn)?shù)字部分是否隔離每個(gè)IC的電源引腳是否都有一個(gè)去
    的頭像 發(fā)表于 07-24 08:11 ?1122次閱讀
    原理圖及PCB <b class='flag-5'>Checklist</b>大放送~

    怎樣從STM32F407的UID碼中提取生產(chǎn)年份和月份信息?

    請(qǐng)問(wèn)怎樣從STM32F407的UID碼中提取生產(chǎn)年份和月份信息?
    發(fā)表于 06-03 06:28

    請(qǐng)問(wèn)PSoC? Creator IDE可以支持IMAGIMOB機(jī)器學(xué)習(xí)嗎?

    我的項(xiàng)目使用 POSC62 MCU 進(jìn)行開(kāi)發(fā),由于 UDB 模塊是需求的重要組成部分,所以我選擇了PSoC? Creator IDE 來(lái)進(jìn)行項(xiàng)目開(kāi)發(fā)。 但現(xiàn)在,由于需要擴(kuò)展,我不得不使用機(jī)器學(xué)
    發(fā)表于 05-20 08:06