0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

adaboost運(yùn)行函數(shù)的算法怎么來(lái)的?基本程序代碼實(shí)現(xiàn)詳細(xì)

lviY_AI_shequ ? 2018-07-21 10:18 ? 次閱讀

一.Adaboost理論部分

1.1 adaboost運(yùn)行過(guò)程

注釋:算法是利用指數(shù)函數(shù)降低誤差,運(yùn)行過(guò)程通過(guò)迭代進(jìn)行。其中函數(shù)的算法怎么來(lái)的,你不用知道!當(dāng)然你也可以嘗試使用其它的函數(shù)代替指數(shù)函數(shù),看看效果如何。

1.2 舉例說(shuō)明算法流程

1.3 算法誤差界的證明

注釋:誤差的上界限由Zm約束,然而Zm又是由Gm(xi)約束,所以選擇適當(dāng)?shù)腉m(xi)可以加快誤差的減小。

二.代碼實(shí)現(xiàn)

2.1程序流程圖

2.2基本程序?qū)崿F(xiàn)

注釋:真是倒霉玩意,本來(lái)代碼全部注釋好了,突然Ubuntu奔潰了,全部程序就GG了。。。下面的代碼就是官網(wǎng)的代碼,部分補(bǔ)上注釋?,F(xiàn)在使用Deepin桌面版了,其它方面都比Ubuntu好,但是有點(diǎn)點(diǎn)卡。

from numpy import *

def loadDataSet(fileName): #general function to parse tab -delimited floats

numFeat = len(open(fileName).readline().split(' ')) #get number of fields

dataMat = []; labelMat = []

fr = open(fileName)

for line in fr.readlines():

lineArr =[]

curLine = line.strip().split(' ')

for i in range(numFeat-1):

lineArr.append(float(curLine[i]))

dataMat.append(lineArr)

labelMat.append(float(curLine[-1]))

return dataMat,labelMat

def stumpClassify(dataMatrix,dimen,threshVal,threshIneq):#just classify the data

retArray = ones((shape(dataMatrix)[0],1))

if threshIneq == 'lt':

retArray[dataMatrix[:,dimen] <= threshVal] = -1.0

else:

retArray[dataMatrix[:,dimen] > threshVal] = -1.0

return retArray

def buildStump(dataArr,classLabels,D):

dataMatrix = mat(dataArr); labelMat = mat(classLabels).T

m,n = shape(dataMatrix)

numSteps = 10.0; bestStump = {}; bestClasEst = mat(zeros((m,1)))

minError = inf #init error sum, to +infinity

for i in range(n):#loop over all dimensions

rangeMin = dataMatrix[:,i].min(); rangeMax = dataMatrix[:,i].max();

stepSize = (rangeMax-rangeMin)/numSteps

for j in range(-1,int(numSteps)+1):#loop over all range in current dimension

for inequal in ['lt', 'gt']: #go over less than and greater than

threshVal = (rangeMin + float(j) * stepSize)

predictedVals = stumpClassify(dataMatrix,i,threshVal,inequal)#call stump classify with i, j, lessThan

errArr = mat(ones((m,1)))

errArr[predictedVals == labelMat] = 0

weightedError = D.T*errArr #calc total error multiplied by D

#print "split: dim %d, thresh %.2f, thresh ineqal: %s, the weighted error is %.3f" % (i, threshVal, inequal, weightedError)

if weightedError < minError:

minError = weightedError

bestClasEst = predictedVals.copy()

bestStump['dim'] = i

bestStump['thresh'] = threshVal

bestStump['ineq'] = inequal

return bestStump,minError,bestClasEst

def adaBoostTrainDS(dataArr,classLabels,numIt=40):

weakClassArr = []

m = shape(dataArr)[0]

D = mat(ones((m,1))/m) #init D to all equal

aggClassEst = mat(zeros((m,1)))

for i in range(numIt):

bestStump,error,classEst = buildStump(dataArr,classLabels,D)#build Stump

#print "D:",D.T

alpha = float(0.5*log((1.0-error)/max(error,1e-16)))#calc alpha, throw in max(error,eps) to account for error=0

bestStump['alpha'] = alpha

weakClassArr.append(bestStump) #store Stump Params in Array

#print "classEst: ",classEst.T

expon = multiply(-1*alpha*mat(classLabels).T,classEst) #exponent for D calc, getting messy

D = multiply(D,exp(expon)) #Calc New D for next iteration

D = D/D.sum()

#calc training error of all classifiers, if this is 0 quit for loop early (use break)

aggClassEst += alpha*classEst

#print "aggClassEst: ",aggClassEst.T

aggErrors = multiply(sign(aggClassEst) != mat(classLabels).T,ones((m,1)))

errorRate = aggErrors.sum()/m

print ("total error: ",errorRate)

if errorRate == 0.0: break

return weakClassArr,aggClassEst

def adaClassify(datToClass,classifierArr):

dataMatrix = mat(datToClass)#do stuff similar to last aggClassEst in adaBoostTrainDS

m = shape(dataMatrix)[0]

aggClassEst = mat(zeros((m,1)))

for i in range(len(classifierArr)):

classEst = stumpClassify(dataMatrix,classifierArr[i]['dim'],

classifierArr[i]['thresh'],

classifierArr[i]['ineq'])#call stump classify

aggClassEst += classifierArr[i]['alpha']*classEst

#print aggClassEst

return sign(aggClassEst)

def plotROC(predStrengths, classLabels):

import matplotlib.pyplot as plt

cur = (1.0,1.0) #cursor

ySum = 0.0 #variable to calculate AUC

numPosClas = sum(array(classLabels)==1.0)#標(biāo)簽等于1的和(也等于個(gè)數(shù))

yStep = 1/float(numPosClas); xStep = 1/float(len(classLabels)-numPosClas)

sortedIndicies = predStrengths.argsort()#get sorted index, it's reverse

sortData = sorted(predStrengths.tolist()[0])

fig = plt.figure()

fig.clf()

ax = plt.subplot(111)

#loop through all the values, drawing a line segment at each point

for index in sortedIndicies.tolist()[0]:

if classLabels[index] == 1.0:

delX = 0; delY = yStep;

else:

delX = xStep; delY = 0;

ySum += cur[1]

#draw line from cur to (cur[0]-delX,cur[1]-delY)

ax.plot([cur[0],cur[0]-delX],[cur[1],cur[1]-delY], c='b')

cur = (cur[0]-delX,cur[1]-delY)

ax.plot([0,1],[0,1],'b--')

plt.xlabel('False positive rate'); plt.ylabel('True positive rate')

plt.title('ROC curve for AdaBoost horse colic detection system')

ax.axis([0,1,0,1])

plt.show()

print ("the Area Under the Curve is: ",ySum*xStep)

注釋:重點(diǎn)說(shuō)明一下非均衡分類的圖像繪制問(wèn)題,想了很久才想明白!

都是相對(duì)而言的,其中本文說(shuō)的曲線在左上方就為好,也是相對(duì)而言的,看你怎么定義個(gè)理解!

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4625

    瀏覽量

    93123
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4812

    瀏覽量

    68830

原文標(biāo)題:《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》AdaBoost算法(手稿+代碼)

文章出處:【微信號(hào):AI_shequ,微信公眾號(hào):人工智能愛(ài)好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于NXP MCXA153 MCU實(shí)現(xiàn)RT-Thread的MTD NOR Flash驅(qū)動(dòng)

    在嵌入式系統(tǒng)中,片上Flash存儲(chǔ)器是一個(gè)關(guān)鍵組件,用于存儲(chǔ)程序代碼和關(guān)鍵數(shù)據(jù)。本文將詳細(xì)介紹如何在NXPMCXA153 MCU上實(shí)現(xiàn)RT-Thread的MTD (Memory Technology Device) NOR Fl
    的頭像 發(fā)表于 11-09 14:00 ?550次閱讀
    基于NXP MCXA153 MCU<b class='flag-5'>實(shí)現(xiàn)</b>RT-Thread的MTD NOR Flash驅(qū)動(dòng)

    【RA-Eco-RA2E1-48PIN-V1.0開(kāi)發(fā)板試用】原創(chuàng)測(cè)量代碼運(yùn)行時(shí)間

    詳細(xì)說(shuō)明。最后通過(guò)串口打印輸出算法模塊函數(shù)的執(zhí)行時(shí)間,來(lái)展示給大家。 1.打開(kāi)我之前的項(xiàng)目工程FPU文件夾目錄,打開(kāi)keil 打開(kāi)pack insall 安裝管理器,安裝perf_c
    發(fā)表于 11-06 15:32

    Pure path studio內(nèi)能否自己創(chuàng)建一個(gè)component,來(lái)實(shí)現(xiàn)特定的算法,例如LMS算法?

    TLV320AIC3254EVM-K評(píng)估模塊, Pure path studio軟件開(kāi)發(fā)環(huán)境。 問(wèn)題:1.Pure path studio 內(nèi)能否自己創(chuàng)建一個(gè)component,來(lái)實(shí)現(xiàn)特定的算法
    發(fā)表于 11-01 08:25

    單片機(jī)燒錄程序的線比單片機(jī)上的少還能燒錄嗎

    單片機(jī)燒錄原理 單片機(jī)燒錄是指將編寫(xiě)好的程序代碼通過(guò)一定的方式傳輸?shù)絾纹瑱C(jī)的存儲(chǔ)器中,使其能夠按照程序的指令運(yùn)行。這個(gè)過(guò)程通常需要使用燒錄器或者編程器等設(shè)備,通過(guò)一定的接口與單片機(jī)進(jìn)行通信。 單片機(jī)
    的頭像 發(fā)表于 09-02 09:54 ?571次閱讀

    LKT(LCS)代碼移植芯片優(yōu)勢(shì)

    所謂代碼移植就是客戶可以把自定義的程序一部分關(guān)鍵代碼函數(shù)移植到加密芯片中運(yùn)行。用戶采用標(biāo)準(zhǔn)C語(yǔ)言編寫(xiě)代碼
    的頭像 發(fā)表于 08-22 10:03 ?826次閱讀

    怎樣用Arduino測(cè)試鋰電池容量

    本文詳細(xì)介紹了如何用Arduino測(cè)量鋰電池的容量。并附有電路圖和Arduino的程序代碼。
    的頭像 發(fā)表于 07-30 09:14 ?969次閱讀
    怎樣用Arduino測(cè)試鋰電池容量

    ESP32C3通過(guò)QSPI flash來(lái)片外運(yùn)行代碼,如果頻繁地存儲(chǔ)錄音音頻數(shù)據(jù),會(huì)影響程序運(yùn)行嗎?

    ESP32C3通過(guò)QSPI flash 來(lái)片外運(yùn)行代碼,如果頻繁地存儲(chǔ)錄音音頻數(shù)據(jù),會(huì)影響程序運(yùn)行嗎?有這個(gè)風(fēng)險(xiǎn)嗎?
    發(fā)表于 06-20 08:28

    運(yùn)動(dòng)控制器的代碼運(yùn)行順序是什么

    運(yùn)動(dòng)控制器是一種用于控制機(jī)械運(yùn)動(dòng)的設(shè)備,它可以接收輸入信號(hào)并根據(jù)這些信號(hào)控制機(jī)械的運(yùn)動(dòng)。運(yùn)動(dòng)控制器的代碼運(yùn)行順序?qū)τ?b class='flag-5'>實(shí)現(xiàn)精確的運(yùn)動(dòng)控制至關(guān)重要。本文將詳細(xì)介紹運(yùn)動(dòng)控制器的
    的頭像 發(fā)表于 06-13 09:25 ?507次閱讀

    探討AI編寫(xiě)代碼技術(shù),以及提高代碼質(zhì)量的關(guān)鍵:靜態(tài)代碼分析工具Perforce Helix QAC &amp; Klocwork

    的過(guò)程,并回答這個(gè)問(wèn)題: AI會(huì)取代程序員嗎? 什么是AI代碼生成? 近年來(lái),生成式AI的應(yīng)用呈爆炸式增長(zhǎng),這主要因?yàn)楝F(xiàn)在有足夠的計(jì)算能力來(lái)運(yùn)行深度學(xué)習(xí)
    的頭像 發(fā)表于 06-05 14:10 ?435次閱讀

    CubeMx生成的代碼優(yōu)化等級(jí)調(diào)低不能運(yùn)行怎么解決?

    一個(gè)簡(jiǎn)單的測(cè)試程序,開(kāi)發(fā)環(huán)境: 芯片STM32F103+MDK 5.14+CubeMx 4.25生成一個(gè)通過(guò)串口2 printf函數(shù)打印hello world。 現(xiàn)象:直接生成的代碼添加串口
    發(fā)表于 04-25 06:23

    在stm32的運(yùn)行程序中,初始函數(shù)明明沒(méi)有在while函數(shù)里面,為什么能反復(fù)運(yùn)行?

    在stm32的運(yùn)行程序中,好多初始函數(shù)明明沒(méi)有在while函數(shù)里面,但是,他卻能反復(fù)的,不斷地去運(yùn)行,這是為什么呢? 就像是這個(gè)程序,對(duì)于設(shè)
    發(fā)表于 04-08 08:15

    使用STM32CubeMX初始化STM32F103程序代碼默認(rèn)打開(kāi)了哪些中斷?是否可以暫時(shí)性關(guān)閉?

    使用STM32CubeMX初始化STM32F103程序代碼,在不使用任何外設(shè)中斷的情況下,系統(tǒng)會(huì)默認(rèn)打開(kāi)哪些中斷?這些中斷又可以怎樣暫時(shí)性關(guān)閉?
    發(fā)表于 03-11 07:22

    verilog function函數(shù)的用法

    Verilog 中被廣泛用于對(duì)電路進(jìn)行模塊化設(shè)計(jì),以簡(jiǎn)化和組織代碼。 本文將詳細(xì)介紹 Verilog 函數(shù)的用法,并探討函數(shù)在硬件設(shè)計(jì)中的重要性和實(shí)際應(yīng)用場(chǎng)景。 一. Verilog
    的頭像 發(fā)表于 02-22 15:49 ?5948次閱讀

    如何使用exit()、_exit()和_Exit()來(lái)終止程序運(yùn)行呢?

    在Linux系統(tǒng)下,你可以使用 exit()、_exit() 和 _Exit() 來(lái)終止程序運(yùn)行,特別是在出現(xiàn)錯(cuò)誤或執(zhí)行失敗的情況下。
    的頭像 發(fā)表于 02-22 12:20 ?977次閱讀

    TC275用STM做定時(shí)器中斷,主函數(shù)中while (1) rifeace 的代碼無(wú)法運(yùn)行怎么解決?

    TC275 芯片段,用STM做定時(shí)器中斷。中斷里面的程序可以正常執(zhí)行,但是主函數(shù)中while (1) rifeace 的代碼無(wú)法運(yùn)行。求助,非常感謝!
    發(fā)表于 01-23 08:23