資料介紹
本文針對(duì)快速、多變量、強(qiáng)非線性的復(fù)雜系統(tǒng)的控制問(wèn)題,在強(qiáng)化學(xué)習(xí)方式的基礎(chǔ)上,提出一種新的自適應(yīng)控制方法。該方法在沒有先驗(yàn)知識(shí)的條件下,基于遞歸神經(jīng)網(wǎng)絡(luò)并結(jié)合強(qiáng)化學(xué)習(xí)的自調(diào)節(jié)能力,通過(guò)自身神經(jīng)網(wǎng)絡(luò)的在線學(xué)習(xí),有效控制不穩(wěn)定的非線性系統(tǒng)。本文以一級(jí)倒立擺系統(tǒng)為實(shí)驗(yàn)對(duì)象,仿真實(shí)驗(yàn)結(jié)果表明:所提出的控制方法具有非常好的控制效果和穩(wěn)定精度,抗干擾能力強(qiáng)。
隨著智能控制研究的不斷深入,人們通過(guò)模擬人的決策過(guò)程,將強(qiáng)化學(xué)習(xí)方式融入控制
策略,用來(lái)解決復(fù)雜非線性系統(tǒng)的控制問(wèn)題。強(qiáng)化學(xué)習(xí)(Reinforcement Learning)是一種試探學(xué)習(xí)方式,外界沒有明顯的教師信號(hào)給出正確的指令,只通過(guò)與環(huán)境的交互得到評(píng)價(jià)信息來(lái)學(xué)習(xí)如何執(zhí)行恰當(dāng)?shù)膭?dòng)作。近年來(lái),強(qiáng)化學(xué)習(xí)在算法和應(yīng)用上已取得了大量的研究成果,如用靜態(tài)神經(jīng)網(wǎng)絡(luò)控制倒立擺系統(tǒng)[1,2]、多種動(dòng)態(tài)規(guī)劃算法的提出[3,4]等。
遞歸神經(jīng)網(wǎng)絡(luò)(RNN)由于存在輸出變量到輸入端的反饋,因而其變量中包含時(shí)間延時(shí)網(wǎng)
絡(luò),是真正的動(dòng)態(tài)網(wǎng)絡(luò)系統(tǒng),為動(dòng)態(tài)系統(tǒng)的辨識(shí)和控制開辟了一個(gè)極有前途的領(lǐng)域。本文在強(qiáng)化學(xué)習(xí)方式的基礎(chǔ)上,提出一種基于遞歸神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法。該控制方法采用的強(qiáng)化學(xué)習(xí)學(xué)習(xí)方式基于“動(dòng)作網(wǎng)絡(luò)/評(píng)價(jià)網(wǎng)絡(luò)”的框架結(jié)構(gòu)。其中,動(dòng)作網(wǎng)絡(luò)部分由BP 神經(jīng)網(wǎng)絡(luò)構(gòu)成的,它將系統(tǒng)狀態(tài)量映射為一個(gè)可能的實(shí)際動(dòng)作;評(píng)價(jià)網(wǎng)絡(luò)部由遞歸神經(jīng)網(wǎng)絡(luò)構(gòu)成的,根據(jù)系統(tǒng)狀態(tài)和系統(tǒng)的控制量來(lái)評(píng)價(jià)系統(tǒng)的運(yùn)行狀態(tài),檢驗(yàn)當(dāng)前的控制效果,產(chǎn)生“獎(jiǎng)勵(lì)/懲罰”值作為反饋,以進(jìn)行自適應(yīng)學(xué)習(xí)。通過(guò)對(duì)一級(jí)倒立擺系統(tǒng)的控制實(shí)驗(yàn)仿真研究,驗(yàn)證了所提控制方法的可行性。
隨著智能控制研究的不斷深入,人們通過(guò)模擬人的決策過(guò)程,將強(qiáng)化學(xué)習(xí)方式融入控制
策略,用來(lái)解決復(fù)雜非線性系統(tǒng)的控制問(wèn)題。強(qiáng)化學(xué)習(xí)(Reinforcement Learning)是一種試探學(xué)習(xí)方式,外界沒有明顯的教師信號(hào)給出正確的指令,只通過(guò)與環(huán)境的交互得到評(píng)價(jià)信息來(lái)學(xué)習(xí)如何執(zhí)行恰當(dāng)?shù)膭?dòng)作。近年來(lái),強(qiáng)化學(xué)習(xí)在算法和應(yīng)用上已取得了大量的研究成果,如用靜態(tài)神經(jīng)網(wǎng)絡(luò)控制倒立擺系統(tǒng)[1,2]、多種動(dòng)態(tài)規(guī)劃算法的提出[3,4]等。
遞歸神經(jīng)網(wǎng)絡(luò)(RNN)由于存在輸出變量到輸入端的反饋,因而其變量中包含時(shí)間延時(shí)網(wǎng)
絡(luò),是真正的動(dòng)態(tài)網(wǎng)絡(luò)系統(tǒng),為動(dòng)態(tài)系統(tǒng)的辨識(shí)和控制開辟了一個(gè)極有前途的領(lǐng)域。本文在強(qiáng)化學(xué)習(xí)方式的基礎(chǔ)上,提出一種基于遞歸神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法。該控制方法采用的強(qiáng)化學(xué)習(xí)學(xué)習(xí)方式基于“動(dòng)作網(wǎng)絡(luò)/評(píng)價(jià)網(wǎng)絡(luò)”的框架結(jié)構(gòu)。其中,動(dòng)作網(wǎng)絡(luò)部分由BP 神經(jīng)網(wǎng)絡(luò)構(gòu)成的,它將系統(tǒng)狀態(tài)量映射為一個(gè)可能的實(shí)際動(dòng)作;評(píng)價(jià)網(wǎng)絡(luò)部由遞歸神經(jīng)網(wǎng)絡(luò)構(gòu)成的,根據(jù)系統(tǒng)狀態(tài)和系統(tǒng)的控制量來(lái)評(píng)價(jià)系統(tǒng)的運(yùn)行狀態(tài),檢驗(yàn)當(dāng)前的控制效果,產(chǎn)生“獎(jiǎng)勵(lì)/懲罰”值作為反饋,以進(jìn)行自適應(yīng)學(xué)習(xí)。通過(guò)對(duì)一級(jí)倒立擺系統(tǒng)的控制實(shí)驗(yàn)仿真研究,驗(yàn)證了所提控制方法的可行性。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制及其發(fā)展應(yīng)用 11次下載
- 基于不同神經(jīng)網(wǎng)絡(luò)的文本分類方法研究對(duì)比 48次下載
- 基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)的PID控制移相方法 11次下載
- 一種改進(jìn)的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索方法 3次下載
- 一種新型的自適應(yīng)神經(jīng)網(wǎng)絡(luò)遙感場(chǎng)景分類模型 5次下載
- 基于擴(kuò)展反向傳播神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法 0次下載
- 基于自適應(yīng)果蠅算法的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練 0次下載
- 基于神經(jīng)網(wǎng)絡(luò)自適應(yīng)諧波電流抑制方法 14次下載
- 加工過(guò)程的神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)控制
- 一種基于自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)的VSLMS算法及應(yīng)用
- 半主動(dòng)懸架神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制研究
- 基于神經(jīng)網(wǎng)絡(luò)的拉絲機(jī)恒張力自適應(yīng)控制
- 基于神經(jīng)網(wǎng)絡(luò)PID控制的交流伺服系統(tǒng)
- 一種基于PID神經(jīng)網(wǎng)絡(luò)的解耦控制方法的研究
- 自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)研究
- 遞歸神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu) 295次閱讀
- 遞歸神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)方法 186次閱讀
- 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的構(gòu)建方法 375次閱讀
- 人工神經(jīng)網(wǎng)絡(luò)的工作原理和基本特征 314次閱讀
- 電機(jī)控制系統(tǒng)的神經(jīng)網(wǎng)絡(luò)優(yōu)化策略 380次閱讀
- 基于單個(gè)自適應(yīng)神經(jīng)元的非模型直接控制方法在汽車懸架系統(tǒng)中的應(yīng)用 1845次閱讀
- 基于神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)實(shí)現(xiàn)混合動(dòng)力汽車電子差速控制系統(tǒng)的設(shè)計(jì) 3527次閱讀
- 一種新型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):膠囊網(wǎng)絡(luò) 5679次閱讀
- 一種基于FPGA的神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)方案詳解 1.3w次閱讀
- 一種遞歸神經(jīng)網(wǎng)絡(luò)在FPGA平臺(tái)上的實(shí)現(xiàn)方案詳解 2119次閱讀
- BP神經(jīng)網(wǎng)絡(luò)概述 4.4w次閱讀
- 什么是神經(jīng)網(wǎng)絡(luò)?學(xué)習(xí)人工智能必會(huì)的八大神經(jīng)網(wǎng)絡(luò)盤點(diǎn) 2.5w次閱讀
- 自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)的交通燈控制系統(tǒng)的設(shè)計(jì) 2984次閱讀
- 基于FPGA的神經(jīng)網(wǎng)絡(luò)算法的設(shè)計(jì) 5524次閱讀
- 一種基于模糊神經(jīng)網(wǎng)絡(luò)的機(jī)器人控制技術(shù) 1863次閱讀
下載排行
本周
- 1HFSS電磁仿真設(shè)計(jì)應(yīng)用詳解PDF電子教程免費(fèi)下載
- 24.30 MB | 126次下載 | 1 積分
- 2H橋中的電流感測(cè)
- 545.39KB | 7次下載 | 免費(fèi)
- 3雷達(dá)的基本分類方法
- 1.25 MB | 4次下載 | 4 積分
- 4I3C–下一代串行通信接口
- 608.47KB | 3次下載 | 免費(fèi)
- 5電感技術(shù)講解
- 827.73 KB | 2次下載 | 免費(fèi)
- 6從 MSP430? MCU 到 MSPM0 MCU 的遷移指南
- 1.17MB | 2次下載 | 免費(fèi)
- 7有源低通濾波器設(shè)計(jì)應(yīng)用說(shuō)明
- 1.12MB | 2次下載 | 免費(fèi)
- 8RA-Eco-RA2E1-48PIN-V1.0開發(fā)板資料
- 35.59 MB | 2次下載 | 免費(fèi)
本月
- 12024年工控與通信行業(yè)上游發(fā)展趨勢(shì)和熱點(diǎn)解讀
- 2.61 MB | 763次下載 | 免費(fèi)
- 2HFSS電磁仿真設(shè)計(jì)應(yīng)用詳解PDF電子教程免費(fèi)下載
- 24.30 MB | 126次下載 | 1 積分
- 3繼電保護(hù)原理
- 2.80 MB | 36次下載 | 免費(fèi)
- 4正激、反激、推挽、全橋、半橋區(qū)別和特點(diǎn)
- 0.91 MB | 32次下載 | 1 積分
- 5labview實(shí)現(xiàn)DBC在界面加載配置
- 0.57 MB | 21次下載 | 5 積分
- 6在設(shè)計(jì)中使用MOSFET瞬態(tài)熱阻抗曲線
- 1.57MB | 15次下載 | 免費(fèi)
- 7GBT 4706.1-2024家用和類似用途電器的安全第1部分:通用要求
- 7.43 MB | 13次下載 | 免費(fèi)
- 8PADS-3D庫(kù)文件
- 2.70 MB | 10次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935113次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420061次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233084次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191360次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183329次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81578次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73804次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65985次下載 | 10 積分
評(píng)論
查看更多