亚洲国产精品无码久久久秋霞1,97人妻碰碰照片免费上线

作者：丁夏蕾，郭秀才，程勇

引言

為了滿足各種乘客的出行需求，隨著互聯(lián)網(wǎng)的發(fā)展，滴滴打車等在線打車平臺(tái)應(yīng)運(yùn)而生，這些服務(wù)使得乘客的出行需求向更靈活的公共交通工具發(fā)展，例如出租車、共享汽車和自行車。至關(guān)重要的是，移動(dòng)隨需應(yīng)變系統(tǒng)可以進(jìn)一步開(kāi)發(fā)，以預(yù)測(cè)全市范圍內(nèi)的乘客出行需求（即載客和空載頻率），這將大大有助于定制有效的車輛分配和調(diào)度策略，以實(shí)現(xiàn)需求和資源平衡。值得一提的是，如果車輛分布與乘客需求分布不匹配，容易造成交通擁堵、資源浪費(fèi)等問(wèn)題，更重要的是會(huì)降低客戶滿意度。

已存在的預(yù)測(cè)網(wǎng)約車需求的方法主要包括三類：基于統(tǒng)計(jì)分析的預(yù)測(cè)方法（如整合移動(dòng)平均自回歸模型）、機(jī)器學(xué)習(xí)方法（如隨機(jī)森林）和深度學(xué)習(xí)方法（如長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)）。文獻(xiàn)[1]使用梯度提升回歸樹(shù)對(duì)網(wǎng)約出租車需求進(jìn)行預(yù)測(cè)。文獻(xiàn)[2]對(duì)傳統(tǒng)的梯度提升算法進(jìn)行優(yōu)化進(jìn)而預(yù)測(cè)網(wǎng)約車需求。文獻(xiàn)[3]使用隱馬爾科夫預(yù)測(cè)短時(shí)交通狀況。文獻(xiàn)[4]使用灰狼優(yōu)化算法對(duì)LSTM優(yōu)化。文獻(xiàn)[5]使用歷史數(shù)據(jù)并結(jié)合天氣、POI等構(gòu)建多特征 LSTM 模型。文獻(xiàn)[6]提出一種基于多層卷積神經(jīng)網(wǎng)絡(luò)的城市交通流量模型，并使用殘差網(wǎng)絡(luò)防止模型過(guò)擬合。文獻(xiàn)[7]使用基于卷積和卷積LSTM的編碼器?解碼器框架捕獲時(shí)空特征，通過(guò)引入一個(gè)多層次注意力模型，包括全局注意力和時(shí)間注意力挖掘潛在的城市交通流動(dòng)性規(guī)律的影響并捕獲相關(guān)的時(shí)間依賴性。文獻(xiàn)[8]提出一種出發(fā)地?目的地交通需求預(yù)測(cè)模型，使用卷積神經(jīng)網(wǎng)絡(luò)和LSTM捕獲空間特征和時(shí)間特征。文獻(xiàn)[9]使用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)共享單車短時(shí)需求量。文獻(xiàn)[10]使用量子行為粒子群算法優(yōu)化徑向基神經(jīng)網(wǎng)絡(luò)，進(jìn)而對(duì)網(wǎng)約車需求量進(jìn)行預(yù)測(cè)。文獻(xiàn)[11]利用短時(shí)交通流組合模型預(yù)測(cè)。文獻(xiàn)[12]使用改進(jìn)型貝葉斯組合模型預(yù)測(cè)短時(shí)交通流量。文獻(xiàn)[13]使用傳統(tǒng)時(shí)間序列預(yù)測(cè)方法ARMA和卡爾曼濾波預(yù)測(cè)短時(shí)交通流量。

雖然目前對(duì)于網(wǎng)約車需求預(yù)測(cè)在預(yù)測(cè)方法和預(yù)測(cè)精度上有了很大提高，但由于網(wǎng)約車訂單數(shù)據(jù)通常具有多維特征，如時(shí)間特征（例如每天中的不同時(shí)刻、周內(nèi)周末）、空間特征、天氣影響等，由于每個(gè)單一的時(shí)間序列預(yù)測(cè)模型都有自身的特點(diǎn)，同時(shí)又不可避免地具有應(yīng)用局限性，反映數(shù)據(jù)信息也存在一定差異，使用單一模型進(jìn)行預(yù)測(cè)難免會(huì)丟失部分?jǐn)?shù)據(jù)信息[13]，要準(zhǔn)確預(yù)測(cè)網(wǎng)約車需求是非常有挑戰(zhàn)性的。使用多個(gè)預(yù)測(cè)模型相結(jié)合的組合預(yù)測(cè)模型，可以彌補(bǔ)單個(gè)模型的缺點(diǎn)，同時(shí)使用多模型組合預(yù)測(cè)也逐步成為研究發(fā)展的趨勢(shì)。本文使用歷史平均、ARIMA、LSTM三種模型對(duì)時(shí)間序列建模，分別挖掘時(shí)間序列數(shù)據(jù)的周期性規(guī)律、差分變化規(guī)律和其他復(fù)雜規(guī)律，從不同角度挖掘數(shù)據(jù)信息，然后用GWO（灰狼算法）對(duì)幾種單一模型權(quán)重進(jìn)行尋優(yōu)，最后對(duì)未來(lái)時(shí)間段的網(wǎng)約車需求進(jìn)行預(yù)測(cè)。

1、相關(guān)研究

1.1 灰狼算法

灰狼優(yōu)化算法是文獻(xiàn)[14?15]在2014年提出的一種群智能優(yōu)化算法。該算法是受到灰狼捕食獵物活動(dòng)的啟發(fā)而開(kāi)發(fā)的一種優(yōu)化搜索方法，與其他優(yōu)化算法相比，灰狼優(yōu)化算法具有較強(qiáng)的收斂性能、參數(shù)少、易實(shí)現(xiàn)等特點(diǎn)，近年來(lái)受到了學(xué)者的廣泛關(guān)注，它己被成功地應(yīng)用到了車間調(diào)度、參數(shù)優(yōu)化、圖像分類等領(lǐng)域中?；依撬惴ǖ暮诵乃枷胧峭ㄟ^(guò)模仿灰狼的社會(huì)等級(jí)制度，將捕食任務(wù)分配給不同等級(jí)的灰狼群體，以完成包圍、追捕和攻擊，從而實(shí)現(xiàn)全局最優(yōu)的過(guò)程。

1.2 LSTM

一般的循環(huán)神經(jīng)網(wǎng)絡(luò)，如RNN通常會(huì)因?yàn)闀r(shí)間相隔較遠(yuǎn)之間的依賴問(wèn)題難以學(xué)習(xí)，LSTM 通過(guò)對(duì)輸入信息進(jìn)行門(mén)控處理，很好地解決了時(shí)間序列數(shù)據(jù)長(zhǎng)期依賴問(wèn)題。LSTM 的 cell單元結(jié)構(gòu)如圖1所示。

LSTM模型內(nèi)部使用輸入門(mén)it、忘記門(mén)ft、輸出門(mén)ot對(duì)信息進(jìn)行相應(yīng)的處理。其中：ht-1表示模型上一次輸出的結(jié)果；xt表示模型當(dāng)前輸入的信息。對(duì)于單元狀態(tài)中的每個(gè)數(shù)字 ct-1，用1代表完全保留ct-1，而用0代表完全拋棄ct-1 。tanh是雙曲正切激活函數(shù)，σ (?)是Sigmoid激活函數(shù)。

1.3 ARIMA

差分整合移動(dòng)平均自回歸模型(AutoregressiveIntegrated Moving Average Model，ARIMA)是一種傳統(tǒng)的、在時(shí)間序列預(yù)測(cè)問(wèn)題中經(jīng)常被使用的模型，對(duì)于平穩(wěn)數(shù)據(jù)能夠很好的預(yù)測(cè)。ARIMA包括三部分：自回歸項(xiàng) 、積分項(xiàng) 、移動(dòng)平均項(xiàng) ，用符號(hào) 可以將其表示為ARIMA(p,d,q)，其中，p代表原始數(shù)據(jù)本身的滯后數(shù)，d是積分次數(shù)，表示原始數(shù)據(jù)經(jīng)過(guò)d次積分可以變?yōu)榉€(wěn)定數(shù)據(jù)，q表示預(yù)測(cè)誤差的滯后數(shù)。ARIMA（p, d, q）模型用公式可以表示為：

式中L是滯后算子。

1.4 隨機(jī)森林

隨機(jī)森林（Random Forest，RF）是以決策樹(shù)為基學(xué)習(xí)器的一種集成學(xué)習(xí)方法，與 Bagging（裝袋算法）不同的是，RF 引入了隨機(jī)屬性選擇，具體來(lái)說(shuō)，RF 在選擇劃分屬性時(shí)，首先在當(dāng)前節(jié)點(diǎn)的屬性集合中隨機(jī)選擇k個(gè)，然后再?gòu)倪@k個(gè)屬性中選擇最優(yōu)屬性進(jìn)行劃分，這樣做增強(qiáng)了模型的泛化能力。

2、網(wǎng)約車影響因素分析及特征提取

首先對(duì)影響網(wǎng)約車需求的相關(guān)因素進(jìn)行分析并可視化，然后使用隨機(jī)森林回歸算法分別對(duì)網(wǎng)約車日需求量和網(wǎng)約車小時(shí)需求量建模，從而對(duì)影響網(wǎng)約車需求的相關(guān)因素進(jìn)行排名，進(jìn)而選擇重要的影響因素，為后面的網(wǎng)約車需求預(yù)測(cè)做準(zhǔn)備。

2.1 網(wǎng)約車影響因素分析

網(wǎng)約車需求通常受時(shí)間（不同時(shí)刻、周內(nèi)周末等）、空間、天氣（溫度、天氣狀況等）等多種因素影響，通過(guò)對(duì)獲取到的海口市2017年5—10月網(wǎng)約車訂單數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析，進(jìn)而分析不同因素對(duì)網(wǎng)約車需求的影響。

?？谑?—10月網(wǎng)約車日訂單量變化圖如圖2a）所示，從圖中可以看出，隨著時(shí)間的推移網(wǎng)約車需求量也在逐步增加，同時(shí)可以看出，網(wǎng)約車需求量具有周期性特征。網(wǎng)約車訂單量工作日、非工作日變化圖如圖2b），圖2c）所示，圖中展示的是5月8日—12日（周一至周五）及5月13日—14日（周六、周天）一周的網(wǎng)約車訂單量。從圖中可以看出，工作日和非工作日的網(wǎng)約車訂單需求模式有很大不同，工作日需求量有3個(gè)峰值（早9點(diǎn)、下午14點(diǎn)、晚上18點(diǎn)），反映了人們一天當(dāng)中的通勤模式，而非工作日沒(méi)有工作日那么明顯的需求峰值。

從天氣預(yù)報(bào)網(wǎng)爬取到的天氣數(shù)據(jù)示例如表 1所示。天氣狀況劃分為5種類型，分別為多云、雷陣雨、中雨、大雨、暴雨，其中 6 個(gè)月中天氣狀況以雷陣雨和多云為主。對(duì)于天氣數(shù)據(jù)中的風(fēng)力風(fēng)向，考慮其每一條數(shù)據(jù)幾乎無(wú)差異，所以考慮不將其作為有效特征。

通過(guò)關(guān)聯(lián)天氣狀況數(shù)據(jù)與網(wǎng)約車訂單數(shù)據(jù)，分析天氣狀況對(duì)網(wǎng)約車需求量的影響。天氣對(duì)網(wǎng)約車需求的影響如圖3所示，圖中展示的是9月12日—14 日和9月19日—21日的網(wǎng)約車需求量小時(shí)變化圖，兩個(gè)時(shí)間段均是周二至周四，兩個(gè)時(shí)間段除了9 月14日下雨，其余時(shí)間均是多云?？梢园l(fā)現(xiàn)，9月14日網(wǎng)約車需求明顯少于同期水平，說(shuō)明天氣狀況是影響網(wǎng)約車需求的一個(gè)重要因素，尤其是下雨天網(wǎng)約車訂單量會(huì)減少。

2.2 特征提取及特征選擇

特征選擇可以精簡(jiǎn)掉無(wú)用的特征，以降低最終模型的復(fù)雜性，它的最終目的是得到一個(gè)簡(jiǎn)約模型，在不降低預(yù)測(cè)準(zhǔn)確率或?qū)︻A(yù)測(cè)準(zhǔn)確率影響不大的情況下提高計(jì)算速度。為了得到這樣的模型，有些特征選擇技術(shù)需要訓(xùn)練不止一個(gè)待選模型。目前主流的特征選擇技術(shù)可以分為以下三類：

1）過(guò)濾式

過(guò)濾式方法中的一種典型方法是變量排序法，該方法獨(dú)立于后續(xù)的建模方法。過(guò)濾式方法的關(guān)鍵就是找到一種能度量特征重要性的方法，比如Pearson相關(guān)系數(shù)、信息論理論中的互信息等。

2）包裹式包裹式方法的核心思想在于，給定了某種模型及預(yù)測(cè)效果評(píng)價(jià)的方法，然后針對(duì)特征空間中的不同子集，計(jì)算每個(gè)子集的預(yù)測(cè)效果，效果最好的即作為最終被挑選出來(lái)的特征子集。包裹式的特點(diǎn)是計(jì)算量大。

3）嵌入式嵌入式方法將特征選擇融合在模型訓(xùn)練的過(guò)程中，比如決策樹(shù)在分枝的過(guò)程中，就是使用嵌入式特征選擇方法，其內(nèi)在還是根據(jù)某個(gè)度量指標(biāo)對(duì)特征進(jìn)行排序。

本文使用嵌入式方法中的隨機(jī)森林算法進(jìn)行特征選擇，隨機(jī)森林是一種非常流行的特征選擇方法，該方法易于使用，一般不需要特征工程、調(diào)參等繁瑣的步驟。

對(duì)于 2.1節(jié)中分析可視化的網(wǎng)約車影響因素包含月份、周內(nèi)周末、星期幾、小時(shí)、天氣狀況、溫度，對(duì)這些影響因素進(jìn)行特征編碼。對(duì)于月份、星期幾這幾個(gè)因素直接使用對(duì)應(yīng)數(shù)字構(gòu)成特征，將周內(nèi)編碼為0，周末編碼為1，對(duì)于5種類型的天氣狀況分別將其編碼為0~5。表2為相關(guān)特征示例。

由于爬取到的天氣數(shù)據(jù)較為粗糙，溫度只有一天當(dāng)中的最高溫度和最低溫度，所以分別采用隨機(jī)森林算法對(duì)日訂單量的影響因素特征和小時(shí)訂單量的影響因素特征進(jìn)行排名。

使用隨機(jī)森林算法對(duì)特征進(jìn)行排名，參數(shù)全部使用默認(rèn)參數(shù)，其中基學(xué)習(xí)器數(shù)量為10個(gè)，max_features為auto，對(duì)每日訂單量的影響因素做特征排名。相關(guān)特征包括：月份（month）、是否工作日（is Weekday）、周幾（dow）、天氣狀況（wea）、溫度平均值（tem_mean）。實(shí)驗(yàn)結(jié)果圖 4a）所示。

用相同的方法對(duì)每小時(shí)訂單量的影響因素做特征排名。提取的特征包括：月份（month）、是否工作日（isWeekday）、周幾（dow）、天氣狀況（wea）、溫度平均值（tem_mean）、小時(shí)（hour）。實(shí)驗(yàn)結(jié)果如圖4b）所示。

從上面兩個(gè)實(shí)驗(yàn)結(jié)果可以看出：影響網(wǎng)約車需求最重要的特征是小時(shí)（即一天中的不同時(shí)刻），在小時(shí)訂單量特征重要性實(shí)驗(yàn)中達(dá)到0.9；其次是月份，訂單量特征重要性實(shí)驗(yàn)中達(dá)到0.56；最不重要的特征是周幾，在兩個(gè)實(shí)驗(yàn)中特征重要性排名均最低，可以認(rèn)為周幾是不重要的特征，所以將周幾這一特征剔除。其他特征，如是否工作日、天氣狀況、溫度平均值予以保留。

3、組合預(yù)測(cè)模型

3.1 相關(guān)定義及問(wèn)題描述

定義1（網(wǎng)約車需求）：對(duì)于網(wǎng)約車訂單數(shù)據(jù)，每個(gè)訂單中包括( ppick , pdrop , tpick , tdrop )等信息，表示用戶在時(shí)間為tpick、位置為ppick 點(diǎn)上車，在時(shí)間為 tdrop、位置為pdrop點(diǎn)下車，用τ表示訂單集合，用Gλ={gii∈[1,n]}表示所有區(qū)域集合（本文按照行政區(qū)域劃分）。對(duì)于任一點(diǎn)p(xp,yp)，如果p在區(qū)域gi中，記作p∈gi，給出時(shí)間段[st,et]，對(duì)所有訂單數(shù)據(jù)實(shí)行等時(shí)段同區(qū)域需求量聚合，可以計(jì)算出上車需求，其滿足{|T∈τ|?|Tppick∈gi∧Ttpick∈[st,et]}，其中δpt,i表示在時(shí) 間間隔[st,et]從區(qū)域gi出發(fā)的需求量。

問(wèn)題描述：網(wǎng)約車需求可以表示為時(shí)間序列Xt，目標(biāo)是給出網(wǎng)約車歷史需求數(shù)據(jù){Xti=t-n+1,?,t|}來(lái)預(yù)測(cè)未來(lái)需求量Xt-1，其中n表示序列長(zhǎng)度。

3.2 組合預(yù)測(cè)模型構(gòu)建

本文提出一種組合預(yù)測(cè)模型，模型融合了歷史平均、ARIMA和LSTM三種方法的優(yōu)勢(shì)，以灰狼算法搜索最優(yōu)加權(quán)組合預(yù)測(cè)模型。組合預(yù)測(cè)結(jié)構(gòu)圖如圖5所示。

首先通過(guò)使用歷史平均、ARIMA、LSTM三種模型對(duì)時(shí)間序列建模，分別挖掘時(shí)間序列數(shù)據(jù)的周期性規(guī)律、差分變化規(guī)律和其他復(fù)雜規(guī)律；然后用灰狼算法對(duì)三種模型進(jìn)行組合，計(jì)算最優(yōu)組合參數(shù)；最后對(duì)未來(lái)時(shí)間段的網(wǎng)約車需求進(jìn)行預(yù)測(cè)。根據(jù)最優(yōu)化理論，將損失函數(shù)定義為預(yù)測(cè)誤差平方和最小，計(jì)算式為：

式（2）要求適應(yīng)度函數(shù)（均方誤差）最小，式（3）為約束條件。式中：yrteal是t時(shí)刻真實(shí)值；ytpred是t時(shí)刻預(yù)測(cè)值；，fHA，fARIMA，fLSTM分別是三種方法的預(yù)測(cè)值；w1，w2，w3為對(duì)應(yīng)的權(quán)重。使用灰狼算法搜索權(quán)重wj的最優(yōu)解，操作步驟如下：

步驟1（初始化模型參數(shù)）：設(shè)定狼群規(guī)模N，最大迭代次數(shù) imax，組合的模型數(shù)量 m = 3，適應(yīng)度函數(shù)取 RMSE（均方誤差），產(chǎn)生N個(gè)m維[0，1]區(qū)間上的隨機(jī)數(shù)向量。對(duì)每一個(gè)向量執(zhí)行 wni∑i =1mwni，即對(duì)三個(gè)模型權(quán)重做歸一化處理，使其權(quán)重和為1。初始化α，β，δ狼的適應(yīng)度值α_score，β_score，δ_score為inf（inf表示無(wú)窮大），初始化α，β，δ狼的位置向量Xα，Xβ，Xδ為[inf，inf，inf]。

步驟2（單一模型預(yù)測(cè)）：分別利用三種單一模型預(yù)測(cè)時(shí)間序列數(shù)據(jù)，調(diào)整單一模型參數(shù)至最佳狀態(tài)，得到每個(gè)模型的預(yù)測(cè)結(jié)果。

步驟3（社會(huì)等級(jí)分層）：把N個(gè)狼群分別代入組合模型中，求出N個(gè)ypred，計(jì)算適應(yīng)度，將狼群中適應(yīng)度最好的3個(gè)適應(yīng)度值分別賦給α_score，β_score，δ_score，同時(shí)將最好的位置向量分別賦給Xα，Xβ，Xδ。

步驟4（包圍獵物和狩獵）：灰狼搜索獵物時(shí)會(huì)逐漸接近獵物并包圍它，搜索過(guò)程主要靠α，β，δ狼指引，根據(jù)當(dāng)前種群中適應(yīng)度最好的三只灰狼α，β，δ 的位置信息Xα，Xβ，Xδ更新其他狼的位置，公式如式（4）~式（10）所示：

式中：Xα，Xβ，Xδ分別表示當(dāng)前種群中α，β，δ 的位置向量；Dα，Dβ，Dδ是位置更新后的位置向量；Ai，Ci是協(xié)同系數(shù)向量；X 是當(dāng)前灰狼的位置向量；X (t+1)是更新后的灰狼位置向量。

步驟5：再次執(zhí)行做歸一化處理。

步驟6：如果迭代結(jié)果趨于穩(wěn)定或達(dá)到最大迭代次數(shù)，則停止迭代，輸出 Xα 并可視化迭代過(guò)程；否則，重復(fù)步驟3~步驟 5。

4、實(shí)驗(yàn)分析

4.1 實(shí)驗(yàn)數(shù)據(jù)及預(yù)處理

實(shí)驗(yàn)使用的數(shù)據(jù)分為兩部分：海口市網(wǎng)約車訂單數(shù)據(jù)和?？谑行姓^(qū)域劃分?jǐn)?shù)據(jù)。海口市網(wǎng)約車訂單數(shù)據(jù)中包含了?？谑?83天的網(wǎng)約車訂單數(shù)據(jù)，其中包括約1400萬(wàn)條用戶乘車訂單記錄，每條記錄的主要信息包括用戶上下車時(shí)間、用戶上下車位置（經(jīng)緯度），具體信息如表3所示。滴滴出行數(shù)據(jù)起點(diǎn)Google Earth 分布圖如圖6所示。

在進(jìn)行實(shí)驗(yàn)之前，先設(shè)置實(shí)驗(yàn)參數(shù)，時(shí)間粒度取1 h，并以時(shí)間粒度為時(shí)間間隔，將時(shí)間軸劃分成多個(gè)時(shí)間段，并統(tǒng)計(jì)每個(gè)時(shí)間段內(nèi)各區(qū)域的上車訂單數(shù)量作為網(wǎng)約車需求量。實(shí)驗(yàn)使用最后7天（168 h）作為測(cè)試集，其他數(shù)據(jù)作為訓(xùn)練集。實(shí)驗(yàn)運(yùn)行環(huán)境為：Intel Xeon E5?2620CPU，2.4 GHz，內(nèi)存 32 GB，操作系統(tǒng)為Windows7,所有實(shí)驗(yàn)均用集成開(kāi)發(fā)環(huán)境 Anaconda（Python 3.7）完成，主要用到的第三包括Keras、TensorFlow、statsmodels等。

實(shí)驗(yàn)采用五種評(píng)價(jià)標(biāo)準(zhǔn)：MSE（均方誤差）、RMSE（均方根誤差）、MAE（平均絕對(duì)誤差）、MAPE（平均絕對(duì)百分比誤差）、MSPE（均方百分比誤差）。五種評(píng)價(jià)標(biāo)準(zhǔn)計(jì)算如下：

式中：yrteal為t時(shí)間段的真實(shí)值；ytpred為相應(yīng)的預(yù)測(cè)值。

4.2 單種模型仿真驗(yàn)證

歷史平均法：歷史平均法使用歷史上相同時(shí)刻的平均值作為未來(lái)網(wǎng)約車預(yù)測(cè)值，比如要預(yù)測(cè)星期一 12：00—13：00 的交通量，那么就將歷史上星期一12：00—13：00的交通量做平均后作為預(yù)測(cè)值。

LSTM：在2.2節(jié)中最后提取的特征包括月份（month）、是否工作日（is Weekday）、周幾（dow）、天氣狀況（wea）、溫度平均值（tem_mean），使用這5個(gè)外部特征和前5個(gè)歷史時(shí)刻網(wǎng)約車需求量共10個(gè)特征一同構(gòu)成多元單步LSTM的輸入向量。使用多元單步 LSTM 模型進(jìn)行網(wǎng)約車需求預(yù)測(cè)分為三步：首先對(duì)原始數(shù)據(jù)做縮放處理，使所有數(shù)據(jù)在同一量綱下，并對(duì)縮放后的序列數(shù)據(jù)使用滑動(dòng)時(shí)間窗法分割數(shù)據(jù)，構(gòu)建 feature?target對(duì)，將問(wèn)題轉(zhuǎn)化為監(jiān)督學(xué)習(xí)問(wèn)題；然后搭建多元單步LSTM模型；最后對(duì)未來(lái)網(wǎng)約車需求進(jìn)行預(yù)測(cè)。本文設(shè)置輸入數(shù)據(jù)時(shí)間步取10，輸出時(shí)間步取1（即 10 個(gè)預(yù)測(cè)1個(gè)），模型采用三層LSTM，每層隱含層神經(jīng)元個(gè)數(shù)取50個(gè)，批處理大小 batch_size 取32，使用 Early Stopping 機(jī)制防止模型過(guò)擬合并能獲得最好的泛化性能。使用 Adam 優(yōu)化器優(yōu)化模型參數(shù)。

ARIMA：為了搜索ARIMA的最優(yōu)參數(shù)，本文使用AIC（赤池信息準(zhǔn)則）評(píng)價(jià)標(biāo)準(zhǔn)評(píng)估模型優(yōu)劣，AIC越低，模型性能越好，AIC越高，模型性能越差。同時(shí)，為了提高預(yù)測(cè)準(zhǔn)確性、減少迭代次數(shù)，從集合{1，2，4，6，8}中選擇p和q，從集合{0，1，2}中選擇參數(shù) d。通過(guò)實(shí)驗(yàn)得到最優(yōu)參數(shù)為ARIMA（4，1，2）。

三種單一模型的預(yù)測(cè)結(jié)果如圖7所示。從實(shí)驗(yàn)結(jié)果可以看出，三種獨(dú)立方法均可以在一定程度上反映?？谑芯W(wǎng)約車需求的變化趨勢(shì)。歷史平均算法能在很大程度上反映周期性規(guī)律，在低需求量時(shí)段能很好的預(yù)測(cè)，但對(duì)需求量高峰時(shí)段不能很好的預(yù)測(cè)。歷史平均算法、LSTM 算法在低需求量時(shí)段能很好的預(yù)測(cè)，而且在需求量高峰時(shí)段，LSTM算法要好于歷史平均算法。ARIMA模型在低需求量時(shí)段預(yù)測(cè)不如歷史平均和LSTM，但在需求量高峰時(shí)段要好于以上兩種方法，這主要是因?yàn)锳RIMA能較好地處理序列數(shù)據(jù)的差分變化，捕獲數(shù)據(jù)的差分變化規(guī)律。

4.3 組合預(yù)測(cè)模型仿真驗(yàn)證

為了驗(yàn)證本文所提出組合模型的優(yōu)越性，使用RMSE（均方根誤差）為適應(yīng)度函數(shù)對(duì)三種模型進(jìn)行組合，結(jié)果如表4所示。可以看出，在單一模型中，LSTM模型在不同評(píng)價(jià)標(biāo)準(zhǔn)下結(jié)果均優(yōu)于歷史平均方法和ARIMA方法，同時(shí)，相比于單一模型，組合預(yù)測(cè)模型在五種不同誤差尺度下均好于三種單一模型，在網(wǎng)約車需求預(yù)測(cè)問(wèn)題上具有更好的預(yù)測(cè)精度。

為了驗(yàn)證模型的魯棒性，在不同的適應(yīng)度函數(shù)下進(jìn)行實(shí)驗(yàn)，結(jié)果如表5所示。結(jié)果顯示，在不同適應(yīng)度函數(shù)下，組合模型在不同評(píng)價(jià)標(biāo)準(zhǔn)下的誤差均優(yōu)于單一模型，驗(yàn)證了模型的魯棒性。

5、結(jié) 論

本文通過(guò)將歷史平均、ARIMA、LSTM三種時(shí)間序列預(yù)測(cè)方法用灰狼算法進(jìn)行加權(quán)組合，分別挖掘時(shí)間序列數(shù)據(jù)的周期性規(guī)律、差分變化規(guī)律和其他復(fù)雜規(guī)律，然后用灰狼算法對(duì)三種模型進(jìn)行組合尋優(yōu)，計(jì)算最優(yōu)參數(shù)，最后對(duì)?？谑芯W(wǎng)約車需求量進(jìn)行預(yù)測(cè)。通過(guò)在真實(shí)數(shù)據(jù)集上驗(yàn)證組合模型的有效性并與其他單一模型進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明，采用組合模型能夠準(zhǔn)確地預(yù)測(cè)網(wǎng)約車需求且優(yōu)于其他單一模型，這對(duì)于網(wǎng)約車公司預(yù)先調(diào)配車量來(lái)滿足網(wǎng)約車用戶需求和提高用戶體驗(yàn)具有重要意義。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1209

瀏覽量
24777
決策樹(shù)

決策樹(shù)

+關(guān)注

關(guān)注
3

文章
96

瀏覽量
13570

原文標(biāo)題：論文速覽 | 多尺度多方法組合的網(wǎng)約車需求預(yù)測(cè)方法研究

文章出處：【微信號(hào)：現(xiàn)代電子技術(shù)，微信公眾號(hào)：現(xiàn)代電子技術(shù)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

網(wǎng)約車新政出臺(tái)后的幾天，看看約車平臺(tái)、出租車租賃公司和司機(jī)們的故事！

的變化，亮點(diǎn)在于給予了過(guò)渡區(qū)間?？梢灶A(yù)見(jiàn)，接下來(lái)多地的網(wǎng)約車新規(guī)會(huì)給網(wǎng)約

發(fā)表于 11-03 15:50

基于多新息隨機(jī)梯度算法的網(wǎng)側(cè)變流器參數(shù)辨識(shí)方法研究

基于多新息隨機(jī)梯度算法的網(wǎng)側(cè)變流器參數(shù)辨識(shí)方法研究_張敏

發(fā)表于 01-02 15:24 ?20次下載

多尺度形態(tài)濾波模態(tài)混疊抑制方法

多尺度形態(tài)濾波模態(tài)混疊抑制方法_曹瑩

發(fā)表于 01-07 18:21 ?0次下載

基于加權(quán)多尺度張量子空間的人臉圖像特征提取方法_王仕民

發(fā)表于 01-08 10:57 ?1次下載

基于大數(shù)據(jù)的多尺度系統(tǒng)軟測(cè)量方法及其應(yīng)用_楊彬

發(fā)表于 01-12 19:56 ?0次下載

一種多尺度多視點(diǎn)特性視圖生成方法的研究和應(yīng)用_謝冰

發(fā)表于 03-15 09:27 ?0次下載

基于多斷面的區(qū)間預(yù)測(cè)方法

傳統(tǒng)的交通流短期預(yù)測(cè)方法以點(diǎn)預(yù)測(cè)為主，文中提出了基于多斷面相關(guān)性的區(qū)間預(yù)測(cè)方法。

發(fā)表于 11-06 17:49 ?7次下載

多尺度數(shù)據(jù)挖掘方法

多尺度理論已被引入到數(shù)據(jù)挖掘領(lǐng)域，但人們對(duì)其研究仍不夠深入和完善，缺乏普適性理論與方法．隨著大數(shù)據(jù)處理應(yīng)用的不斷深入，其研究變得更加迫切．針

發(fā)表于 01-05 10:58 ?0次下載

加權(quán)系數(shù)的短期風(fēng)電功率組合預(yù)測(cè)方法

預(yù)測(cè)時(shí)間尺度變化的問(wèn)題，提出了不同時(shí)間斷面差異化的組合預(yù)測(cè)方法，并根據(jù)風(fēng)電功率的波動(dòng)特性，恰當(dāng)引入天氣變化的持續(xù)信息，優(yōu)化了15 min-4 h預(yù)測(cè)

發(fā)表于 01-12 16:09 ?6次下載

基于LSTM模型的多時(shí)間尺度融合預(yù)測(cè)方法

性，提出基于LSTM模型的多時(shí)間尺度融合預(yù)測(cè)方法。利用帶內(nèi)網(wǎng)絡(luò)遙測(cè)技術(shù)獲取并轉(zhuǎn)換網(wǎng)絡(luò)細(xì)粒度參數(shù)，為預(yù)測(cè)模型提供延時(shí)和利用率特征，構(gòu)建基于長(zhǎng)短期記憶網(wǎng)絡(luò)（LSTM）的多時(shí)間

發(fā)表于 03-19 10:31 ?19次下載

結(jié)合多尺度邊緣保持分解與PCNN的圖像融合方法

在醫(yī)學(xué)圖像融合過(guò)程中，傳統(tǒng)多尺度分析方法多采用線性濾波器，由于無(wú)法保留圖像邊緣特征導(dǎo)致分解階段的強(qiáng)邊緣處岀現(xiàn)模糊，從而產(chǎn)生光暈。為提髙融合圖像的視覺(jué)感知效果，通過(guò)結(jié)合

發(fā)表于 03-23 15:54 ?16次下載

一種跨項(xiàng)目克隆代碼一致性維護(hù)需求預(yù)測(cè)方法

究人員嘗試?yán)脵C(jī)器學(xué)習(xí)方法開(kāi)展克隆代碼一致性維護(hù)需求預(yù)測(cè)硏究，通過(guò)預(yù)測(cè)尭隆代碼的變化是否會(huì)導(dǎo)致額外的維護(hù)代價(jià)，來(lái)幫助軟件質(zhì)量保障團(tuán)隊(duì)更有效地分配維護(hù)資源，從而提高工作效率并降低運(yùn)維成本。然而，在軟件開(kāi)發(fā)的

發(fā)表于 05-07 10:14 ?5次下載

引入需求預(yù)測(cè)過(guò)程的主動(dòng)服務(wù)推薦方法

，通過(guò)引入需求預(yù)測(cè)過(guò)程，提出一種主動(dòng)服務(wù)推薦方法。利用矩陣分解算法從大量歷史服務(wù)使用數(shù)據(jù)中提取用戶特征和服務(wù)特征，據(jù)此訓(xùn)練深度學(xué)習(xí)模型并預(yù)測(cè)用戶的服務(wù)需求，進(jìn)而為用戶推薦其所需要的服務(wù)

發(fā)表于 05-12 16:55 ?3次下載

基于多分辨率濾波通道的多尺度行人檢測(cè)方法

利用單尺度特征映射進(jìn)行多尺度行人檢測(cè)存在準(zhǔn)確率和效率較低的問(wèn)題。為此，提出一種基于多分辨率濾波通道的多尺度檢測(cè)

發(fā)表于 05-27 16:30 ?7次下載

多尺度分析方法在動(dòng)力電池衰減研究中的應(yīng)用

本文主要介紹多尺度分析方法在動(dòng)力電池衰減分析中的應(yīng)用，多尺度分析方法主要從三個(gè)層級(jí)入手：?jiǎn)误w、電

發(fā)表于 01-04 15:47 ?1133次閱讀

搜索歷史

多尺度多方法組合的網(wǎng)約車需求預(yù)測(cè)方法研究

評(píng)論

網(wǎng)約車新政出臺(tái)后的幾天，看看約車平臺(tái)、出租車租賃公司和司機(jī)們的故事！

基于多新息隨機(jī)梯度算法的網(wǎng)側(cè)變流器參數(shù)辨識(shí)方法研究

多尺度形態(tài)濾波模態(tài)混疊抑制方法

基于加權(quán)多尺度張量子空間的人臉圖像特征提取方法_王仕民

基于大數(shù)據(jù)的多尺度系統(tǒng)軟測(cè)量方法及其應(yīng)用_楊彬

一種多尺度多視點(diǎn)特性視圖生成方法的研究和應(yīng)用_謝冰

基于多斷面的區(qū)間預(yù)測(cè)方法

多尺度數(shù)據(jù)挖掘方法

加權(quán)系數(shù)的短期風(fēng)電功率組合預(yù)測(cè)方法

基于LSTM模型的多時(shí)間尺度融合預(yù)測(cè)方法

結(jié)合多尺度邊緣保持分解與PCNN的圖像融合方法

一種跨項(xiàng)目克隆代碼一致性維護(hù)需求預(yù)測(cè)方法

引入需求預(yù)測(cè)過(guò)程的主動(dòng)服務(wù)推薦方法

基于多分辨率濾波通道的多尺度行人檢測(cè)方法

多尺度分析方法在動(dòng)力電池衰減研究中的應(yīng)用