最常見的機器學(xué)習(xí)算法是學(xué)習(xí)映射Y = f(X)來預(yù)測新X的Y,這叫做預(yù)測建模或預(yù)測分析,我們的目標(biāo)是盡可能作出最準(zhǔn)確的預(yù)測。 我們不知道函數(shù)f的樣子或形式,如果知道的話,我們將會直接使用它,不需要用機器學(xué)習(xí)算法從數(shù)據(jù)中學(xué)習(xí)。
下面將概述常用的機器學(xué)習(xí)算法:
1、線性回歸
線性回歸的表示是一個方程,它通過找到輸入變量的特定權(quán)重(稱為系數(shù)B),來描述一條最適合表示輸入變量x與輸出變量y關(guān)系的直線??赡苁墙y(tǒng)計學(xué)和機器學(xué)習(xí)中最知名和最易理解的算法之一,預(yù)測建模主要關(guān)注最小化模型誤差或者盡可能作出最準(zhǔn)確的預(yù)測,以可解釋性為代價。
2、Logistic回歸
Logistic回歸與線性回歸相似,目標(biāo)都是找到每個輸入變量的權(quán)重,即系數(shù)值。與線性回歸不同的是,Logistic回歸對輸出的預(yù)測使用被稱為 logistic 函數(shù)的非線性函數(shù)進行變換。 它是一個快速的學(xué)習(xí)模型,并且對于二分類問題非常有效。
3、線性判別分析(LDA)
線性判別分析進行預(yù)測的方法是計算每個類別的判別值,并對具備最大值的類別進行預(yù)測。該技術(shù)假設(shè)數(shù)據(jù)呈高斯分布,因此最好預(yù)先從數(shù)據(jù)中刪除異常值。這是處理分類預(yù)測建模問題的一種簡單而強大的方法。
4、分類與回歸樹
決策樹的葉節(jié)點包含一個用于預(yù)測的輸出變量y,通過遍歷該樹的分割點,直到到達一個葉節(jié)點并輸出該節(jié)點的類別值就可以作出預(yù)測。決策樹模型的表示是一個二叉樹,學(xué)習(xí)速度和預(yù)測速度都很快,可以解決大量問題,并且不需要對數(shù)據(jù)做特別準(zhǔn)備。
5、樸素貝葉斯
樸素貝葉斯是一個簡單但是很強大的預(yù)測建模算法,該模型由兩種概率組成,這兩種概率都可以直接從訓(xùn)練數(shù)據(jù)中計算出來:1)每個類別的概率;2)給定每個x的值,每個類別的條件概率。如果數(shù)據(jù)是實值時,通常假設(shè)一個高斯分布,這樣可以簡單的估計這些概率。
6、K近鄰算法
KNN 算法在整個訓(xùn)練集中搜索K個最相似實例(近鄰)并匯總這 K 個實例的輸出變量,以預(yù)測新數(shù)據(jù)點。KNN需要大量內(nèi)存或空間來存儲所有數(shù)據(jù),但是只有在需要預(yù)測時才執(zhí)行計算(或?qū)W習(xí))。可以隨時更新和管理訓(xùn)練實例,以保持預(yù)測的準(zhǔn)確性。
7、學(xué)習(xí)向量量化
學(xué)習(xí)向量量化(簡稱 LVQ)是一種人工神經(jīng)網(wǎng)絡(luò)算法,它允許你選擇訓(xùn)練實例的數(shù)量,并精確地學(xué)習(xí)這些實例應(yīng)該是什么樣的。在學(xué)習(xí)之后,最相似的近鄰?fù)ㄟ^計算每個碼本向量和新數(shù)據(jù)實例之間的距離找到。然后返回最佳匹配單元的類別值作為預(yù)測。
8、支持向量機(SVM)
超平面是分割輸入變量空間的一條線,超平面和最近的數(shù)據(jù)點之間的距離被稱為間隔,分開兩個類別的最好的或最理想的超平面具備最大間隔。實際上,優(yōu)化算法用于尋找最大化間隔的系數(shù)的值。
9、Bagging
Bagging 是從數(shù)據(jù)樣本中估算數(shù)量的一種強大的統(tǒng)計方法。在訓(xùn)練數(shù)據(jù)中抽取多個樣本,然后對每個數(shù)據(jù)樣本建模。當(dāng)你需要對新數(shù)據(jù)進行預(yù)測時,每個模型都進行預(yù)測,并將所有的預(yù)測值平均以便更好的估計真實的輸出值。
10、隨機森林
隨機森林是對Bagging方法的一種調(diào)整,在隨機森林的方法中決策樹被創(chuàng)建以便于通過引入隨機性來進行次優(yōu)分割,而不是選擇最佳分割點。針對每個數(shù)據(jù)樣本創(chuàng)建的模型將會與其他方式得到的有所不同,可以更好的估計真實的輸出值。
-
算法
+關(guān)注
關(guān)注
23文章
4612瀏覽量
92900 -
建模
+關(guān)注
關(guān)注
1文章
305瀏覽量
60775 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8418瀏覽量
132646
原文標(biāo)題:機器學(xué)習(xí)十大算法
文章出處:【微信號:NeXt8060,微信公眾號:HALCON圖像處理與機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論