0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三種回歸算法及其優(yōu)缺點,將會為我們理解和選擇算法提供很好的幫助

nlfO_thejiangme ? 來源:未知 ? 作者:李倩 ? 2018-03-23 15:38 ? 次閱讀

任何一個機(jī)器學(xué)習(xí)問題都有著不止一種算法來解決,在機(jī)器學(xué)習(xí)領(lǐng)域“沒有免費的午餐”的意思就是沒有一個對于所有問題都很好的算法。機(jī)器學(xué)習(xí)算法的表現(xiàn)很大程度上與數(shù)據(jù)的結(jié)構(gòu)和規(guī)模有關(guān)。所以判斷算法性能最好的辦法就是在數(shù)據(jù)上運行比較結(jié)果。

不過與此同時我們對于算法的優(yōu)缺點有一定的了解可以幫助我們找需要的算法。本文將會介紹三種回歸算法及其優(yōu)缺點,將會為我們理解和選擇算法提供很好的幫助。

線性和多項式回歸

在這一簡單的模型中,單變量線性回歸的任務(wù)是建立起單個輸入的獨立變量與因變量之間的線性關(guān)系;而多變量回歸則意味著要建立多個獨立輸入變量與輸出變量之間的關(guān)系。除此之外,非線性的多項式回歸則將輸入變量進(jìn)行一系列非線性組合以建立與輸出之間的關(guān)系,但這需要擁有輸入輸出之間關(guān)系的一定知識。訓(xùn)練回歸算法模型一般使用隨機(jī)梯度下降法(SGD)。

優(yōu)點:

建模迅速,對于小數(shù)據(jù)量、簡單的關(guān)系很有效;

線性回歸模型十分容易理解,有利于決策分析。

缺點:

對于非線性數(shù)據(jù)或者數(shù)據(jù)特征間具有相關(guān)性多項式回歸難以建模;

難以很好地表達(dá)高度復(fù)雜的數(shù)據(jù)。

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)由一系列稱為神經(jīng)元的節(jié)點通過內(nèi)部網(wǎng)絡(luò)連接而成,數(shù)據(jù)的特征通過輸入層被逐級傳遞到網(wǎng)絡(luò)中,形成多個特征的線性組合,每個特征會與網(wǎng)絡(luò)中的權(quán)重相互作用。隨后神經(jīng)元對線性組合進(jìn)行非線性變化,這使得神經(jīng)網(wǎng)絡(luò)模型具有對多特征復(fù)雜的非線性表征能力。神經(jīng)網(wǎng)絡(luò)可以具有多層結(jié)構(gòu),以增強(qiáng)對于輸入數(shù)據(jù)特征的表征。人們一般利用隨機(jī)梯度下降法和反向傳播法來對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,請參照上述圖解。

優(yōu)點:

多層的非線性結(jié)構(gòu)可以表達(dá)十分復(fù)雜的非線性關(guān)系;

模型的靈活性使得我們不需要關(guān)心數(shù)據(jù)的結(jié)構(gòu);

數(shù)據(jù)越多網(wǎng)絡(luò)表現(xiàn)越好。

缺點:

模型過于復(fù)雜,難以解釋;

訓(xùn)練過程需要強(qiáng)大算力、并且需要微調(diào)超參數(shù);

對數(shù)據(jù)量依賴大,但常規(guī)機(jī)器學(xué)習(xí)問題則使用較小量數(shù)據(jù)。

回歸樹和回歸森林

讓我們從最基本的概念出發(fā),決策樹是通過遍歷樹的分支并根據(jù)節(jié)點的決策選擇下一個分支的模型。樹型感知利用訓(xùn)練數(shù)據(jù)作為數(shù)據(jù),根據(jù)最適合的特征進(jìn)行拆分,并不斷進(jìn)行循環(huán)指導(dǎo)訓(xùn)練數(shù)據(jù)被分到一類中去。建立樹的過程中需要將分離建立在最純粹的子節(jié)點上,從而在分離特征的情況下保持分離數(shù)目盡可能的小。純粹性是來源于信息增益的概念,它表示對于一個未曾謀面的樣本需要多大的信息量才能將它正確的分類。實際上通過比較熵或者分類所需信息的數(shù)量來定義。而隨機(jī)森林則是決策樹的簡單集合,輸入矢量通過多個決策樹的處理,最終的對于回歸需要對輸出數(shù)據(jù)取平均、對于分類則引入投票機(jī)制來決定分類結(jié)果。

優(yōu)點:

具有很高的復(fù)雜度和高度的非線性關(guān)系,比多項式擬合擁有更好的效果;

模型容易理解和闡述,訓(xùn)練過程中的決策邊界容易實踐和理解。

缺點:

由于決策樹有過擬合的傾向,完整的決策樹模型包含很多過于復(fù)雜和非必須的結(jié)構(gòu)。但可以通過擴(kuò)大隨機(jī)森林或者剪枝的方法來緩解這一問題;

較大的隨機(jī)數(shù)表現(xiàn)很好,但是卻帶來了運行速度慢和內(nèi)存消耗高的問題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:如何為回歸問題選擇一個合適的算法呢?我們先從模型的優(yōu)缺點講起...

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    常見算法優(yōu)缺點比較

    ,并從優(yōu)中擇優(yōu)。但是每次都進(jìn)行這一操作不免過于繁瑣,下面小編來分析下各個算法優(yōu)缺點,以助大家有針對性地進(jìn)行選擇,解決問題。1.樸素貝葉斯樸素貝葉斯的思想十分簡單,對于給出的待分類項,求出在此項出現(xiàn)
    發(fā)表于 12-02 15:40

    FDTD和FEM算法各有什么優(yōu)缺點

    以下是兩位網(wǎng)友的回答,稍微有所調(diào)整:RanHe的回答:在討論電磁仿真前,先要敬仰前輩。計算電磁學(xué)從大的方向可以分為兩大類:全波仿真算法,高頻算法。全波仿真是一精確算法,但是非常消耗計
    發(fā)表于 08-04 09:06

    回歸算法之邏輯回歸的介紹

    回歸算法之邏輯回歸
    發(fā)表于 05-21 16:25

    回歸算法有哪些,常用回歸算法(3)詳解

    回歸是數(shù)學(xué)建模、分類和預(yù)測中最古老但功能非常強(qiáng)大的工具之一。回歸在工程、物理學(xué)、生物學(xué)、金融、社會科學(xué)等各個領(lǐng)域都有應(yīng)用,是數(shù)據(jù)科學(xué)家常用的基本工具。回歸通常是機(jī)器學(xué)習(xí)中使用的第一個算法
    發(fā)表于 07-28 14:36

    FOC中的三種電流采樣方式,你知道怎么選擇嗎?

    ,起一個拋磚引玉的作用,希望讀者能夠舉一反,有更優(yōu)的方式。圖一:三種采樣方式優(yōu)缺點對比本期內(nèi)容我們邀請了趙云老師來給大家分享原創(chuàng)內(nèi)容,詳細(xì)的干貨選型內(nèi)容我已上傳到附件,只需要1個積分
    發(fā)表于 03-19 13:46

    主流的三種RF方案及其優(yōu)缺點對比分析

    主流的三種RF方案及其優(yōu)缺點對比分析RF IC的主要性能是什么?
    發(fā)表于 05-25 06:34

    算法三種結(jié)構(gòu)介紹

    嵌入式學(xué)習(xí)日記2018.11.62018.11.16理論學(xué)習(xí)階段計算機(jī)科學(xué)導(dǎo)論(原書第二版)第8章 算法學(xué)到的新知識1算法三種結(jié)構(gòu):順序、判斷(選擇)和重復(fù)(循環(huán))2常用的
    發(fā)表于 11-08 07:12

    三種SPWM波形生成算法的分析與實現(xiàn)

    本文著重介紹三種SPWM波形生成算法的分析與實現(xiàn)
    發(fā)表于 08-24 16:30 ?12次下載

    如何提升示波器波形質(zhì)量 三種波形算法的應(yīng)用

    提到波形算法,容易想到示波器里數(shù)學(xué)運算功能math可以實現(xiàn)幾十算法,完全滿足應(yīng)用需要,其中有個特色算法就是實時的FFT算法,可以實時顯示
    發(fā)表于 04-28 09:10 ?3376次閱讀
    如何提升示波器波形質(zhì)量 <b class='flag-5'>三種</b>波形<b class='flag-5'>算法</b>的應(yīng)用

    常見算法優(yōu)缺點比較

    優(yōu)中擇優(yōu)。但是每次都進(jìn)行這一操作不免過于繁瑣,下面小編來分析下各個算法優(yōu)缺點,以助大家有針對性地進(jìn)行選擇,解決問題。
    發(fā)表于 02-02 15:48 ?6062次閱讀
    常見<b class='flag-5'>算法</b><b class='flag-5'>優(yōu)缺點</b>比較

    三種PCB電路板灌封膠的優(yōu)缺點

    PCB板灌封膠主要有三種,分別是聚氨酯灌封膠、環(huán)氧樹脂灌封膠、有機(jī)硅灌封膠。在制備PCB板過程中該如何選擇灌封膠呢?下面為大家具體分析下三種灌封膠的優(yōu)缺點。
    的頭像 發(fā)表于 09-14 10:22 ?2.2w次閱讀

    三種失電延裝置的構(gòu)成原理及優(yōu)缺點

    從安裝失電延釋裝置的必要性出發(fā),介紹了三種失電延裝置的構(gòu)成、原理、動作及優(yōu)缺點,其中的兩是采用設(shè)置高壓電解電容提供接觸器的吸合大電流,低壓電解電容
    的頭像 發(fā)表于 10-29 11:22 ?3275次閱讀
    <b class='flag-5'>三種</b>失電延裝置的構(gòu)成原理及<b class='flag-5'>優(yōu)缺點</b>

    機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是什么 機(jī)器學(xué)習(xí)算法優(yōu)缺點

    機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是什么?機(jī)器學(xué)習(xí)算法優(yōu)缺點? 機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是一
    的頭像 發(fā)表于 08-17 16:11 ?1928次閱讀

    光耦隔離 電容隔離 磁隔離這三種隔離方式各有什么優(yōu)缺點?

    光耦隔離、電容隔離和磁隔離是三種常見的隔離方式,它們各有優(yōu)缺點,適用于不同的應(yīng)用場景。
    的頭像 發(fā)表于 01-30 15:38 ?6031次閱讀

    神經(jīng)網(wǎng)絡(luò)算法優(yōu)缺點有哪些

    神經(jīng)網(wǎng)絡(luò)算法是一模擬人腦神經(jīng)元結(jié)構(gòu)的計算模型,廣泛應(yīng)用于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、圖像識別、語音識別等領(lǐng)域。然而,神經(jīng)網(wǎng)絡(luò)算法也存在一些優(yōu)缺點。本文將詳細(xì)分析神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-03 09:47 ?1423次閱讀