0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺談機(jī)器學(xué)習(xí)技術(shù)中的隨機(jī)森林算法

454398 ? 來源:itpub技術(shù)棧 ? 作者:sandag ? 2020-09-29 15:34 ? 次閱讀

本次主題是隨機(jī)森林,杰里米(講師)提供了一些基本信息以及使用Jupyter Notebook的提示和技巧。

Jeremy談到的一些重要的事情是,數(shù)據(jù)科學(xué)并不等同于軟件工程。 在數(shù)據(jù)科學(xué)中,我們做的是設(shè)計(jì)模型。 雖然軟件工程有自己的一套實(shí)踐,但數(shù)據(jù)科學(xué)也有自己的一套最佳實(shí)踐。

模型構(gòu)建和原型設(shè)計(jì)需要一個(gè)交互的環(huán)境,是一個(gè)迭代的過程。 我們建立一個(gè)模型。 然后,我們采取措施來改善它。 重復(fù)直到我們對(duì)結(jié)果滿意為止。

隨機(jī)森林

我聽說過“隨機(jī)森林”這個(gè)詞,我知道它是現(xiàn)有的機(jī)器學(xué)習(xí)技術(shù)之一,但是老實(shí)說,我從來沒有想過要去了解它。 我一直熱衷于更多地了解深度學(xué)習(xí)技術(shù)。

從這次演講中,我了解到隨機(jī)森林確實(shí)很棒。

它就像一個(gè)通用的機(jī)器學(xué)習(xí)技術(shù),既可以用于回歸,也可以用于分類。 這意味著你可以使用隨機(jī)森林來預(yù)測(cè)股票價(jià)格以及對(duì)給定的醫(yī)療數(shù)據(jù)樣本進(jìn)行分類。

一般來說,隨機(jī)森林模型不會(huì)過擬合,即使它會(huì),它也很容易阻止過擬合。

對(duì)于隨機(jī)森林模型,不需要單獨(dú)的驗(yàn)證集。

隨機(jī)森林只有一些統(tǒng)計(jì)假設(shè)。 它也不假設(shè)你的數(shù)據(jù)是正態(tài)分布的,也不假設(shè)這些關(guān)系是線性的。

它只需要很少的特征工程。

因此,如果你是機(jī)器學(xué)習(xí)的新手,它可以是一個(gè)很好的起點(diǎn)。

其他概念

維數(shù)詛咒是一個(gè)概念,意思是你擁有的數(shù)據(jù)特征越多,數(shù)據(jù)點(diǎn)就會(huì)越分散。 這意味著兩點(diǎn)之間的距離沒有意義。

Jeremy確信,在實(shí)踐中,情況并非如此,事實(shí)上,你的數(shù)據(jù)擁有的特征越多,對(duì)模型的訓(xùn)練效果就越好。

沒有免費(fèi)午餐定理是這樣一個(gè)概念:沒有一個(gè)模型可以完美地適用于任何類型的數(shù)據(jù)。

技巧和竅門

你可以在Jupyter Notebook中使用!來執(zhí)行bash命令,例如。

!ls

!mkdir new_dr

Python 3.6中追加字符串的新方法。

name = ‘Sabina’

print(f‘Hello {name}’)no_of_new_msg = 11

print(f‘Hello {name}, you have {no_of_new_msg} new messages’)

不需要離開Jupyter notebook就可以查看python函數(shù)。在函數(shù)名前使用?獲取它的文檔。

from sklearn.ensemble import RandomForestClassifier?RandomForestClassifier.fit()

如果你想閱讀源代碼,可以使用??在函數(shù)名稱前。

from sklearn.ensemble import RandomForestClassifier??RandomForestClassifier.fit()

通過使用to_feather方法保存處理過的數(shù)據(jù)集,將數(shù)據(jù)集以存儲(chǔ)在RAM中的相同格式保存到磁盤。可以使用read_feather方法從保存的文件中讀取數(shù)據(jù)。注意,為了使用這些方法,你需要安feather-format庫。

import pandasdf = pd.DataFrame()

df.to_feather(‘filename’)saved_df= pd.read_feather(‘filename’)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    華為云 Flexus X 實(shí)例部署安裝 Jupyter Notebook,學(xué)習(xí) AI,機(jī)器學(xué)習(xí)算法

    前言 由于本人最近在學(xué)習(xí)一些機(jī)器算法,AI 算法的知識(shí),需要搭建一個(gè)學(xué)習(xí)環(huán)境,所以就在最近購買的華為云 Flexus X 實(shí)例上安裝了
    的頭像 發(fā)表于 01-02 13:43 ?87次閱讀
    華為云 Flexus X 實(shí)例部署安裝 Jupyter Notebook,<b class='flag-5'>學(xué)習(xí)</b> AI,<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>算法</b>

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章,我們介紹了機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語。在本文中,我們會(huì)介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多種算法
    的頭像 發(fā)表于 12-30 09:16 ?226次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    zeta在機(jī)器學(xué)習(xí)的應(yīng)用 zeta的優(yōu)缺點(diǎn)分析

    在探討ZETA在機(jī)器學(xué)習(xí)的應(yīng)用以及ZETA的優(yōu)缺點(diǎn)時(shí),需要明確的是,ZETA一詞在不同領(lǐng)域可能有不同的含義和應(yīng)用。以下是根據(jù)不同領(lǐng)域的ZETA進(jìn)行的分析: 一、ZETA在機(jī)器
    的頭像 發(fā)表于 12-20 09:11 ?266次閱讀

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門為深度學(xué)習(xí)
    的頭像 發(fā)表于 11-15 09:19 ?496次閱讀

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI有很多技術(shù),但其中一個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)
    發(fā)表于 10-24 17:22 ?2504次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    深度學(xué)習(xí)算法在集成電路測(cè)試的應(yīng)用

    隨著半導(dǎo)體技術(shù)的快速發(fā)展,集成電路(IC)的復(fù)雜性和集成度不斷提高,對(duì)測(cè)試技術(shù)的要求也日益增加。深度學(xué)習(xí)算法作為一種強(qiáng)大的數(shù)據(jù)處理和模式識(shí)別工具,在集成電路測(cè)試領(lǐng)域展現(xiàn)出了巨大的應(yīng)用潛
    的頭像 發(fā)表于 07-15 09:48 ?1041次閱讀

    機(jī)器學(xué)習(xí)的數(shù)據(jù)分割方法

    機(jī)器學(xué)習(xí),數(shù)據(jù)分割是一項(xiàng)至關(guān)重要的任務(wù),它直接影響到模型的訓(xùn)練效果、泛化能力以及最終的性能評(píng)估。本文將從多個(gè)方面詳細(xì)探討機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-10 16:10 ?1881次閱讀

    深度學(xué)習(xí)在工業(yè)機(jī)器視覺檢測(cè)的應(yīng)用

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,其在工業(yè)機(jī)器視覺檢測(cè)的應(yīng)用日益廣泛,并展現(xiàn)出巨大的潛力。工業(yè)機(jī)器視覺檢測(cè)是工業(yè)自動(dòng)化領(lǐng)域的重要組成部分,通過圖
    的頭像 發(fā)表于 07-08 10:40 ?1096次閱讀

    機(jī)器學(xué)習(xí)算法原理詳解

    機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,其目標(biāo)是通過讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能,而無需進(jìn)行明確的編程。本文將深入解讀幾種常見的機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 07-02 11:25 ?1117次閱讀

    機(jī)器學(xué)習(xí)在數(shù)據(jù)分析的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)量的爆炸性增長(zhǎng)對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過訓(xùn)練模型從數(shù)據(jù)中學(xué)習(xí)規(guī)律,為企業(yè)和組織提供了更高效、更準(zhǔn)確的數(shù)據(jù)分析能力。本文將深入探討機(jī)器
    的頭像 發(fā)表于 07-02 11:22 ?650次閱讀

    機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

    關(guān)于數(shù)據(jù)機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù),讓算法從數(shù)據(jù)尋找一種相應(yīng)的關(guān)系。Iris鳶尾花數(shù)據(jù)集是一個(gè)經(jīng)典數(shù)據(jù)集,在統(tǒng)計(jì)
    的頭像 發(fā)表于 06-27 08:27 ?1677次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的經(jīng)典<b class='flag-5'>算法</b>與應(yīng)用

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.35】如何用「時(shí)間序列與機(jī)器學(xué)習(xí)」解鎖未來?

    捕捉復(fù)雜非線性模式的場(chǎng)景顯得力不從心。 將時(shí)間序列的分析與預(yù)測(cè)用于大規(guī)模的數(shù)據(jù)生產(chǎn)一直存在諸多困難。 在這種背景下,結(jié)合機(jī)器學(xué)習(xí),特別是深度學(xué)習(xí)
    發(fā)表于 06-25 15:00

    深入探討機(jī)器學(xué)習(xí)的可視化技術(shù)

    機(jī)器學(xué)習(xí)可視化(簡(jiǎn)稱ML可視化)一般是指通過圖形或交互方式表示機(jī)器學(xué)習(xí)模型、數(shù)據(jù)及其關(guān)系的過程。目標(biāo)是使理解模型的復(fù)雜算法和數(shù)據(jù)模式更容易,
    發(fā)表于 04-25 11:17 ?428次閱讀
    深入探討<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的可視化<b class='flag-5'>技術(shù)</b>

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為一個(gè)熱門領(lǐng)域,涉及到多個(gè)行業(yè)和領(lǐng)域,例如語音識(shí)別、機(jī)器翻譯、圖像識(shí)別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機(jī)器學(xué)習(xí)算法,這是一類基于樣本數(shù)據(jù)和模型訓(xùn)練來進(jìn)行預(yù)測(cè)和判斷的
    的頭像 發(fā)表于 04-04 08:41 ?342次閱讀

    什么是隨機(jī)森林?隨機(jī)森林的工作原理

    隨機(jī)森林使用名為“bagging”的技術(shù),通過數(shù)據(jù)集和特征的隨機(jī)自助抽樣樣本并行構(gòu)建完整的決策樹。雖然決策樹基于一組固定的特征,而且經(jīng)常過擬合,但
    發(fā)表于 03-18 14:27 ?3608次閱讀
    什么是<b class='flag-5'>隨機(jī)</b><b class='flag-5'>森林</b>?<b class='flag-5'>隨機(jī)</b><b class='flag-5'>森林</b>的工作原理