作者:徐翔斌,馬中強(qiáng)
訂單揀選是將商品從其存儲(chǔ)位置揀出以滿足客戶訂單需求的過程,訂單揀選是典型的勞動(dòng)密集型作業(yè),占倉(cāng)庫(kù)運(yùn)作總成本的60% ~ 70%[1]。隨著客戶需求從大批量少批次向小批量個(gè)性化轉(zhuǎn)變,客戶對(duì)訂單的配送時(shí)限和服務(wù)質(zhì)量要求越來越高,提升訂單揀選效率已成為當(dāng)今學(xué)術(shù)界和工業(yè)界共同關(guān)心的難題?;谝苿?dòng)機(jī)器人的揀貨系統(tǒng)(Robotic mobile fulfillment systems,RMFS)的訂單揀選效率是傳統(tǒng)揀貨系統(tǒng)的2 ~ 3倍[2–3],徹底顛覆了傳統(tǒng)倉(cāng)庫(kù)的揀貨作業(yè)模式,為倉(cāng)庫(kù)的廣泛應(yīng)用和研究開辟了新途徑。
RMFS系統(tǒng)2003年由Kiva公司最先開發(fā),2012年亞馬遜收購(gòu)Kiva后在其北美各大配送中心開始部署[4–5],國(guó)內(nèi)已有菜鳥、京東和快倉(cāng)等公司成功應(yīng)用RMFS。RMFS的核心思想是利用移動(dòng)機(jī)器人將存儲(chǔ)商品的移動(dòng)式貨架搬運(yùn)到揀貨站臺(tái),揀貨人員揀取商品后再由機(jī)器人將貨架送回存儲(chǔ)區(qū)存儲(chǔ)。相比傳統(tǒng)揀貨系統(tǒng),RMFS提高了揀貨效率、準(zhǔn)確性以及倉(cāng)庫(kù)空間利用率,縮短了倉(cāng)庫(kù)部署和調(diào)試時(shí)間,并可根據(jù)客戶需求的變化實(shí)時(shí)、動(dòng)態(tài)調(diào)整倉(cāng)庫(kù)布局結(jié)構(gòu),特別適合需求波動(dòng)性大、時(shí)效性強(qiáng)的電商企業(yè)的訂單揀選[2–3,6]。
與傳統(tǒng)揀貨系統(tǒng)類似,RMFS也面臨貨位指派、訂單分批、任務(wù)分配以及路徑規(guī)劃等方面的問題,但在實(shí)際運(yùn)作過程中,RMFS與傳統(tǒng)揀貨系統(tǒng)相比存在諸多不同,面臨一些新的亟需解決的問題。鑒于此,本文對(duì)RMFS訂單揀選過程的幾個(gè)關(guān)鍵問題進(jìn)行綜述研究,并給出未來的研究方向,為RMFS的實(shí)踐應(yīng)用及學(xué)術(shù)研究提供參考。
01? RMFS簡(jiǎn)介
RMFS的倉(cāng)庫(kù)布局可分為存儲(chǔ)區(qū)、揀選區(qū)和運(yùn)輸區(qū)(如圖1(a)所示),訂單揀選作業(yè)主要在揀選區(qū)進(jìn)行(如圖1(b)~(d)所示)。 倉(cāng)庫(kù)一般采用柵格化布局,利用條碼、RFID等技術(shù)實(shí)現(xiàn)信息識(shí)別,并利用室內(nèi)GPS和傳感器技術(shù)進(jìn)行導(dǎo)航、定位和避障[6-8]。 RMFS的貨架為移動(dòng)式貨架,有運(yùn)輸貨架和存貨貨架兩種,運(yùn)輸貨架是存放訂單容器的貨架,存貨貨架又可分為托盤貨架和單品貨架,托盤貨架的作用是存放和揀選整箱商品,單品貨架則存放零揀商品[4,6]。 補(bǔ)貨站臺(tái)位于存儲(chǔ)區(qū)和揀選區(qū)之間,揀選站臺(tái)位于揀選區(qū)和運(yùn)輸區(qū)之間,揀貨和補(bǔ)貨人員分別位于揀選站臺(tái)和補(bǔ)貨站臺(tái),他們只需要站在原地等待移動(dòng)機(jī)器人搬運(yùn)貨架到來,并根據(jù)系統(tǒng)指示進(jìn)行訂單揀選或倉(cāng)庫(kù)補(bǔ)貨作業(yè)。 RMFS的作業(yè)流程為:系統(tǒng)先按照一定策略將商品分配到各存儲(chǔ)貨架(貨位指派問題),在收到客戶訂單后,基于特定的訂單分配分批和任務(wù)分配策略將訂單分批,再分配給相應(yīng)的揀選站臺(tái)(訂單分批和分配問題),同時(shí)向運(yùn)輸機(jī)器人發(fā)布運(yùn)輸任務(wù)(多機(jī)器人任務(wù)分配問題),機(jī)器人將目標(biāo)貨架從其存儲(chǔ)位置搬運(yùn)到指定的揀選站臺(tái)(多機(jī)器人路徑規(guī)劃問題),揀選人員按照系統(tǒng)指示依次進(jìn)行揀選、掃描確認(rèn)、存放等作業(yè),完成商品揀選后,運(yùn)輸機(jī)器人再將貨架送回存儲(chǔ)區(qū)存儲(chǔ)(多機(jī)器人路徑規(guī)劃問題),需要說明的是,貨架返回后的存儲(chǔ)位置不一定是其原來的存儲(chǔ)位置(貨架儲(chǔ)位動(dòng)態(tài)分配問題)[2]。RMFS的整個(gè)作業(yè)流程如圖2所示,有關(guān)圖2的具體說明可參考文獻(xiàn)[2]。
圖1 RMFS揀貨區(qū)域布局圖
圖2 RMFS訂單揀選作業(yè)流程 從圖2的作業(yè)流程可以發(fā)現(xiàn)RMFS的幾個(gè)關(guān)鍵的優(yōu)化和研究方向:首先,RMFS的正常運(yùn)作依靠自動(dòng)識(shí)別技術(shù)、傳感器及通信等技術(shù)的支撐,可以對(duì)這些使能技術(shù)進(jìn)行研究[9]。其次,與傳統(tǒng)揀貨系統(tǒng)類似,貨位指派[4]、訂單分批[10]、任務(wù)分配[11]、路徑規(guī)劃[12]等問題的優(yōu)化研究也是提升RMFS效率的關(guān)鍵途徑。再次,RMFS本質(zhì)上是一個(gè)自組織模式運(yùn)營(yíng)的分布式多機(jī)器人系統(tǒng),可基于分布式、去中心化的思路進(jìn)行系統(tǒng)優(yōu)化,這與傳統(tǒng)揀貨系統(tǒng)有很大的不同[13]。總的來說,RMFS的優(yōu)化可從使能技術(shù)、倉(cāng)庫(kù)布局設(shè)計(jì)、貨位指派、訂單分批、路徑規(guī)劃、分區(qū)揀選以及多機(jī)器人任務(wù)分配及協(xié)作等方面開展研究[1,14] (如圖3所示)。RMFS的優(yōu)化研究可分為系統(tǒng)實(shí)現(xiàn)、系統(tǒng)作業(yè)以及研究方法三個(gè)層面,其優(yōu)化理論框架如圖4所示。
圖3?RMFS揀貨優(yōu)化流程
圖4 RMFS優(yōu)化理論框架 02? RMFS研究現(xiàn)狀
RMFS的相關(guān)研究主要涉及貨位指派、訂單分批、任務(wù)分配與調(diào)度、路徑規(guī)劃以及系統(tǒng)設(shè)計(jì)與評(píng)估等問題,相關(guān)問題的研究文獻(xiàn)總結(jié)如表1所示。
表1?RMFS研究文獻(xiàn)匯總
2.1 貨位指派
傳統(tǒng)意義上的貨位指派是指將商品分配到倉(cāng)庫(kù)中的合適儲(chǔ)位,使訂單分揀過程行走的距離最短[1]。 RMFS的貨位指派可分為商品儲(chǔ)位指派和貨架儲(chǔ)位動(dòng)態(tài)指派,商品儲(chǔ)位指派是指在考慮商品銷售關(guān)聯(lián)性的情況下,將關(guān)聯(lián)商品指派到同一貨架存儲(chǔ),最終實(shí)現(xiàn)貨架存儲(chǔ)商品的關(guān)聯(lián)度最大,降低訂單揀選搬運(yùn)的貨架總次數(shù),圖5(a)為商品儲(chǔ)位指派的示意圖;在構(gòu)建商品儲(chǔ)位指派數(shù)學(xué)模型時(shí),需考慮所有商品必須被指派到貨架存儲(chǔ)、同一類商品可以存儲(chǔ)于多個(gè)貨架以及貨架的存儲(chǔ)容量等約束條件。貨架儲(chǔ)位動(dòng)態(tài)指派是在訂單揀選的過程中,為搬運(yùn)貨架重新分配儲(chǔ)位,例如將存儲(chǔ)暢銷商品的貨架指派到靠近揀貨站臺(tái)的儲(chǔ)位,同時(shí)將存儲(chǔ)滯銷商品的貨架指派到遠(yuǎn)離揀貨站臺(tái)的儲(chǔ)位,實(shí)現(xiàn)訂單揀選過程的機(jī)器人行走距離最短,圖5(b)為貨架儲(chǔ)位動(dòng)態(tài)指派的示意圖;在構(gòu)建貨架儲(chǔ)位動(dòng)態(tài)指派數(shù)學(xué)模型時(shí),需考慮所有貨架必須被指派到儲(chǔ)位,儲(chǔ)位的狀態(tài)(占用儲(chǔ)位或開放儲(chǔ)位)以及倉(cāng)庫(kù)布局的連續(xù)動(dòng)態(tài)變化關(guān)系等約束條件。
圖5 RMFS貨位指派示意圖 貨位指派是典型廣義指派問題(Generalized assignment problem,GAP)[50],最基本的貨位指派的數(shù)學(xué)模型為:
在模型1中,表示將商品(或貨架)存儲(chǔ)在位置,否則;表示將商品(或貨架)存儲(chǔ)在貨架或位置的揀貨代價(jià)(或收益);式(1)為目標(biāo)函數(shù),根據(jù)選取的不同,可分為求最小值或最大值(例如揀貨時(shí)間或距離最小、揀貨效率最大等);式(2)和(3)為約束條件,表示商品(或貨架)與儲(chǔ)位之間的存儲(chǔ)關(guān)系;式(4)為變量及取值范圍。 科學(xué)的貨位指派方法可以縮短行走距離、降低搜尋時(shí)間、減少工作量以及提高倉(cāng)庫(kù)揀貨效率[51–52]。Hausman等[53]最早提出定位存儲(chǔ)、隨機(jī)存儲(chǔ)和分類存儲(chǔ)三種基本的貨位指派策略,隨后的文獻(xiàn)分別從需求相關(guān)性[54–55]、出貨量[56]、COI[57]、周轉(zhuǎn)率[58]以及需求和結(jié)構(gòu)相關(guān)性[59–60]等方面對(duì)貨位指派問題進(jìn)行了研究,根據(jù)問題類型、指派策略以及優(yōu)化目標(biāo)的不同,大量文獻(xiàn)基于模型1進(jìn)行了深入廣泛的研究。
RMFS與傳統(tǒng)揀貨系統(tǒng)的貨位指派問題不同在于: 1)傳統(tǒng)揀貨系統(tǒng)的貨位指派與路徑策略密切相關(guān)[61],RMFS的貨位指派則與路徑策略沒有必然聯(lián)系。 2)指派目的地不同:傳統(tǒng)貨位指派只需將商品指派到某一分區(qū)或巷道,RMFS既要將商品指派到具體的貨架,還需考慮將關(guān)聯(lián)商品指派到同一貨架來降低揀貨成本。 3)優(yōu)化目標(biāo)不同:傳統(tǒng)揀貨系統(tǒng)將揀貨行走的時(shí)間或距離作為貨位指派問題的優(yōu)化目標(biāo),RMFS則可將貨架搬運(yùn)次數(shù)、機(jī)器人利用率等作為優(yōu)化目標(biāo)[23]。 4)指派復(fù)雜度不同:傳統(tǒng)揀貨系統(tǒng)的貨位指派只需對(duì)商品進(jìn)行儲(chǔ)位指派,RMFS則還需考慮貨架的儲(chǔ)位指派(即貨架在倉(cāng)庫(kù)中的位置),這是一個(gè)更加復(fù)雜的動(dòng)態(tài)指派問題。 5)靜態(tài)與動(dòng)態(tài)指派的不同:傳統(tǒng)貨位指派基于“一次指派、分批出庫(kù)”的思路,RMFS的貨位指派過程是一種“動(dòng)態(tài)優(yōu)化、逐步求精”的過程。
RMFS的貨位指派可從以下幾個(gè)方面借鑒傳統(tǒng)貨位指派問題的研究理論和方法: 1)考慮商品需求關(guān)聯(lián)性和頻率:傳統(tǒng)揀貨系統(tǒng)考慮商品需求關(guān)聯(lián)性、頻率等因素進(jìn)行貨位指派研究[54–55],RMFS也需考慮此類因素對(duì)商品和貨架儲(chǔ)位指派優(yōu)化的影響。 2)考慮逐步求精的動(dòng)態(tài)貨位調(diào)整:動(dòng)態(tài)貨位調(diào)整比一次性長(zhǎng)遠(yuǎn)規(guī)劃的貨位指派更為簡(jiǎn)單有效[62],可基于逐步求精、漸進(jìn)式優(yōu)化的思路研究RMFS的商品和貨架的動(dòng)態(tài)調(diào)整問題。 3)考慮人因及設(shè)備等因素:傳統(tǒng)揀貨系統(tǒng)中人的因素對(duì)訂單揀選效率影響巨大[63],貨位指派需考慮人員的工作負(fù)荷[64]、技能[65]以及擁堵[66]等因素,RMFS貨位指派優(yōu)化過程中也應(yīng)考慮機(jī)器人擁堵、空閑率、電量以及作業(yè)人員技能、效率等因素。 4)借鑒已有研究方法:譬如可用動(dòng)態(tài)規(guī)劃[67]、啟發(fā)式[68]、數(shù)據(jù)挖掘[69]和聚類分析[70]等方法來研究RMFS貨位指派問題。
RMFS的貨位指派研究可分為商品儲(chǔ)位指派研究和貨架儲(chǔ)位指派研究,現(xiàn)有文獻(xiàn)主要利用排隊(duì)論、整數(shù)規(guī)劃、仿真、啟發(fā)式規(guī)則以及智能優(yōu)化等方法進(jìn)行建模和求解。研究文獻(xiàn)根據(jù)問題和方法分類綜述如下:
1)商品儲(chǔ)位指派研究
a)利用排隊(duì)論方法
Lamballais等[3]構(gòu)建了RMFS系統(tǒng)效能評(píng)估的排隊(duì)網(wǎng)絡(luò)模型,分別以最大訂單吞吐量、平均訂單揀選周期以及機(jī)器人利用率等指標(biāo)評(píng)價(jià)了不同存儲(chǔ)策略的系統(tǒng)績(jī)效,結(jié)果表明采用基于貨架周轉(zhuǎn)率的商品分區(qū)存儲(chǔ)策略可使系統(tǒng)的最大吞吐量提高50%左右,不足之處是文中假設(shè)每個(gè)貨架只存儲(chǔ)一種商品。在此基礎(chǔ)上,Onal等[15]提出了一種爆炸存儲(chǔ)的商品儲(chǔ)位指派策略,構(gòu)建了商品儲(chǔ)位指派的排隊(duì)論模型,結(jié)果表明隨著爆炸水平的提高,訂單揀選時(shí)間最多可降低16%。
b)利用混合整數(shù)規(guī)劃方法
Xiang等[20]在考慮爆炸存儲(chǔ)策略和商品關(guān)聯(lián)性的情況下,構(gòu)建了RMFS商品儲(chǔ)位指派與路徑規(guī)劃協(xié)同優(yōu)化的混合整數(shù)規(guī)劃模型,設(shè)計(jì)的變鄰域搜索算法在解的質(zhì)量和求解時(shí)間方面比遺傳算法分別好6.0%和3.3%,但未考慮缺貨和補(bǔ)貨的情況。藺一帥等[21]也利用改進(jìn)的協(xié)同優(yōu)化遺傳算法對(duì)RMFS的商品儲(chǔ)位指派和路徑規(guī)劃問題進(jìn)行了協(xié)同優(yōu)化,構(gòu)建了商品儲(chǔ)位指派與路徑規(guī)劃協(xié)同優(yōu)化的混合整數(shù)規(guī)劃模型。
2)貨架儲(chǔ)位指派研究
a)利用排隊(duì)論方法
Nigam等[4]利用排隊(duì)論模型研究了RMFS隨機(jī)空位存儲(chǔ)與最近空位存儲(chǔ)策略的效率問題,結(jié)果表明隨機(jī)空位存儲(chǔ)的RMFS系統(tǒng)空間利用率較高,而最近空位存儲(chǔ)的RMFS系統(tǒng)吞吐量較高。Yuan等[17]進(jìn)一步研究了隨機(jī)存儲(chǔ)、基于速度和基于類的貨架儲(chǔ)位指派策略,構(gòu)建了不同存儲(chǔ)策略績(jī)效評(píng)估的排隊(duì)模型,結(jié)果發(fā)現(xiàn)基于類的策略魯棒性較強(qiáng),可以適應(yīng)不同倉(cāng)庫(kù)配置、布局的RMFS。
b)利用(混合)整數(shù)規(guī)劃方法
在基于策略的貨位指派研究中,文獻(xiàn)[24,71]提出一種可顯著提高RMFS揀貨效率的共享存儲(chǔ)策略,文獻(xiàn)[19]發(fā)現(xiàn)分區(qū)存儲(chǔ)策略也能顯著的提高RMFS的揀貨效率,在此基礎(chǔ)上,Weidinger等[18]對(duì)RMFS的貨架儲(chǔ)位動(dòng)態(tài)指派問題進(jìn)行了研究,構(gòu)建了混合整數(shù)規(guī)劃模型,并利用自適應(yīng)規(guī)劃方法求解模型,將機(jī)器人的揀貨總行程和編隊(duì)數(shù)量分別降低了3.49%和2.17%,提高了RMFS的揀貨效率,但未構(gòu)建反映貨架儲(chǔ)位動(dòng)態(tài)變化關(guān)系的理論模型,文獻(xiàn)[22]進(jìn)一步構(gòu)建了反映貨架儲(chǔ)位動(dòng)態(tài)變化關(guān)系的混合整數(shù)規(guī)劃模型,該動(dòng)態(tài)優(yōu)化模型可縮短30%左右的揀貨距離。
此外也有文獻(xiàn)利用仿真來研究RMFS問題,仿真技術(shù)具有可視化效果好、人機(jī)交互靈活等優(yōu)點(diǎn),特別適合用于模型和優(yōu)化效果的驗(yàn)證,例如Zou等[28]利用仿真方法驗(yàn)證了半開放排隊(duì)網(wǎng)絡(luò)模型的正確性,Merschformann等[29]則在規(guī)劃模型基礎(chǔ)上,利用仿真平臺(tái)RAWSim-O對(duì)RMFS的隨機(jī)、固定、最近空位以及基于類這幾種典型的貨架儲(chǔ)位指派策略進(jìn)行了對(duì)比研究,結(jié)果表明基于類的指派策略的效果更加顯著。
綜上所述,有關(guān)RMFS貨位指派的研究成果顯著,但主要集中在對(duì)商品和貨架儲(chǔ)位指派的系統(tǒng)績(jī)效評(píng)估方面,較少涉及商品儲(chǔ)位指派和貨架儲(chǔ)位指派的協(xié)同優(yōu)化,并且一般采用仿真驗(yàn)證指派策略的有效性。由于RMFS與傳統(tǒng)揀貨系統(tǒng)在貨位指派方面存在諸多不同,建議重點(diǎn)關(guān)注: 1)考慮集成多種指派策略、并尋找最優(yōu)策略的貨位指派方法。 2)由于RMFS需要分別對(duì)商品和貨架存儲(chǔ)進(jìn)行雙重指派,應(yīng)重點(diǎn)關(guān)注商品關(guān)聯(lián)性對(duì)商品、貨架儲(chǔ)位指派的影響,重點(diǎn)研究商品和貨架儲(chǔ)位的雙重指派這二者之間的內(nèi)在聯(lián)系和相關(guān)影響。 3)特別關(guān)注動(dòng)態(tài)貨位指派問題,可基于逐步求精、漸進(jìn)式優(yōu)化的思想研究RMFS的商品與貨架的動(dòng)態(tài)儲(chǔ)位指派問題。 4)在模型1的基礎(chǔ)上,根據(jù)RMFS貨位指派問題的特性,分別對(duì)商品和貨架的(動(dòng)態(tài))貨位指派模型進(jìn)行研究,構(gòu)建RMFS貨位指派問題的理論模型。
2.2 訂單分批
訂單分批是指為了提高訂單揀選效率而把多個(gè)訂單合并揀選的過程,其目的是為了降低訂單揀選時(shí)貨架的搬運(yùn)次數(shù)、機(jī)器人的行走距離或時(shí)間[1]。RMFS的訂單分批示意圖如圖6所示,在RMFS訂單分批優(yōu)化過程中,需考慮每個(gè)訂單只能被指派到一個(gè)訂單批次、每個(gè)批次包含的訂單數(shù)不能超過規(guī)定的數(shù)量以及該批次所有商品必須都被揀選等約束條件,一般將貨架搬運(yùn)次數(shù)、機(jī)器人行走距離以及同批次內(nèi)訂單關(guān)聯(lián)度等指標(biāo)作為優(yōu)化目標(biāo)。
圖6 RMFS訂單分批示意圖 最基本的訂單分批問題的數(shù)學(xué)模型為[72]:
在模型2中,表示客戶訂單,;為訂單集合,;為每批次訂單最大容量;表示揀取批次所有商品的代價(jià)(例如時(shí)間、距離);表示訂單被分配到批次,否則,;式(5)為目標(biāo)函數(shù),根據(jù)的不同可取最大值或最小值(例如貨架搬運(yùn)次數(shù)最小、系統(tǒng)吞吐量最大等);式(6)為訂單批次合理性約束;式(7)表示每個(gè)訂單都必須被指派到一個(gè)批次;式(8)為變量和參數(shù)取值。 訂單分批問題最早由Ackerman[73]提出,相比貨位指派,訂單分批優(yōu)化對(duì)揀貨效率的提升更加明顯[74]。根據(jù)訂單信息是否已知,訂單分批可分為在線訂單分批和離線訂單分批,其中在線訂單分批更加符合實(shí)際情況。訂單分批問題為NP難題[75],一般利用(元)啟發(fā)式算法[76–77]、數(shù)據(jù)挖掘[78]以及聚類和仿真[79]等方法研究離線訂單分批問題,而在線訂單分批問題則利用時(shí)間窗、啟發(fā)式等方法研究[10],對(duì)離線訂單分批問題的研究方法進(jìn)行改進(jìn)也可用于在線訂單分批問題的研究[80],國(guó)內(nèi)的馬士華等[81]、李詩(shī)珍等[79]也對(duì)這方面的問題進(jìn)行了深入研究。 RMFS訂單分批的目的是使貨架搬運(yùn)次數(shù)、訂單揀選時(shí)間或延遲率等指標(biāo)最小,該問題可分為兩種情況:一是先對(duì)訂單分批處理,然后將訂單批次分配至揀貨站臺(tái);二是先將訂單分配至揀貨站臺(tái),再進(jìn)行訂單分批處理。RMFS與傳統(tǒng)揀貨系統(tǒng)的訂單分批問題的不同表現(xiàn)在: 1)分批對(duì)象不同:RMFS既可直接對(duì)訂單分批,還可根據(jù)待揀商品的存儲(chǔ)位置對(duì)機(jī)器人進(jìn)行分批。 2)考慮因素不同:傳統(tǒng)揀貨系統(tǒng)的訂單分批問題一般只考慮揀貨車容量、揀貨員的工作負(fù)荷、擁堵以及路徑策略等因素[77,82-83],RMFS則還需要考慮機(jī)器人死鎖、電量、故障以及利用率等問題。 3)優(yōu)化目標(biāo)不同:RMFS一般將商品貨架搬運(yùn)次數(shù)、機(jī)器人利用率等指標(biāo)作為優(yōu)化目標(biāo)[23]。 4)復(fù)雜度不同:RMFS的訂單分批需要考慮兩種不同的訂單分批情況,問題的復(fù)雜度更高。
RMFS的訂單分批可從以下幾個(gè)方面借鑒傳統(tǒng)訂單分批問題的研究成果: 1) RMFS訂單分批問題為NP難題,可利用(元)啟發(fā)式、數(shù)據(jù)挖掘、聚類等方法對(duì)RMFS的訂單分批進(jìn)行研究。 2)考慮揀貨人員的影響:傳統(tǒng)揀貨系統(tǒng)認(rèn)為揀貨員的技能可提高批次揀貨的效率[65],RMFS的訂單分批問題研究也需要考慮揀貨員的技能、效率以及工作負(fù)荷等因素的影響。 3)考慮訂單交貨期限:訂單交期對(duì)訂單揀選至關(guān)重要,與傳統(tǒng)揀貨系統(tǒng)類似[84],研究RMFS的訂單分批問題也應(yīng)考慮訂單交期問題。 4)考慮系統(tǒng)綜合優(yōu)化:為得到全局最優(yōu)的訂單分批方案,傳統(tǒng)揀貨系統(tǒng)將訂單分批與路徑規(guī)劃、任務(wù)分配等問題進(jìn)行協(xié)同優(yōu)化研究[85],綜合考慮RMFS多個(gè)子問題的協(xié)同優(yōu)化研究將是必然趨勢(shì)。 5)繼續(xù)釋放約束條件:與傳統(tǒng)揀貨系統(tǒng)類似,考慮揀貨過程中出現(xiàn)的突發(fā)情況和隨機(jī)因素(如插單、取消訂單等)對(duì)RMFS訂單分批問題的影響,使RMFS訂單分批的研究更加貼合實(shí)際情況。
現(xiàn)有文獻(xiàn)以批次訂單關(guān)聯(lián)性最大、貨架搬運(yùn)次數(shù)最小等指標(biāo)為優(yōu)化目標(biāo),主要利用排隊(duì)論、(混合)整數(shù)規(guī)劃、聚類等方法研究RMFS訂單分批問題,對(duì)RMFS訂單分批的文獻(xiàn)按照研究方法綜述如下:
1)利用排隊(duì)論方法
Yu等[86]在人工揀貨作業(yè)背景下,構(gòu)建了訂單分批與揀貨分區(qū)協(xié)同優(yōu)化的近似排隊(duì)網(wǎng)絡(luò)模型,該近似排隊(duì)網(wǎng)絡(luò)模型與仿真結(jié)果相比相對(duì)誤差小于10%??紤]到訂單分批策略對(duì)RMFS效率的影響與AS/RS類似,Hur等[87]設(shè)計(jì)了評(píng)估AS/RS系統(tǒng)績(jī)效的排隊(duì)網(wǎng)絡(luò)模型,仿真結(jié)果表明其設(shè)計(jì)的模型的誤差在0.1%到8.6%之間,這些研究為基于排隊(duì)論方法研究RMFS的訂單分批問題提供了理論基礎(chǔ)。
2)利用(混合)整數(shù)規(guī)劃方法
Xiang等[20]最先研究了RMFS的訂單分批問題,在模型2的基礎(chǔ)上構(gòu)建了RMFS訂單分批問題的混合整數(shù)規(guī)劃模型。
在模型3中,為訂單總數(shù);為貨架總數(shù);為商品種類總數(shù);為訂單批次總數(shù);為每批次包含的最大訂單數(shù);表示訂單編號(hào),;表示貨架編號(hào),;表示商品種類,;為訂單批次編號(hào),;表示訂單包括商品,否則,;表示商品存儲(chǔ)在貨架,否則;表示訂單被分配給批次,否則;表示因揀選批次而搬運(yùn)貨架,否則,;表示批次包含商品,否則,;式(9)為目標(biāo)函數(shù),表示批次揀貨過程貨架搬運(yùn)次數(shù)最??;式(10)表示每個(gè)訂單都必須被指派到一個(gè)訂單批次;式(11)表示分配到批次的訂單總數(shù)不能超過規(guī)定的最大數(shù)量;式(12)表示商品的批次歸屬;式(13)表示被搬運(yùn)的貨架必須存儲(chǔ)該批次所有的商品;式(14)表示變量取值。 此外Xiang等[20]還設(shè)計(jì)了可變鄰域搜索算法進(jìn)行求解,結(jié)果表明貨位指派與訂單分批的協(xié)同優(yōu)化顯著降低了貨架的搬運(yùn)次數(shù)。Boysen等[24]則將該問題擴(kuò)展為訂單分批、訂單排序以及貨架在揀貨站臺(tái)排序三個(gè)子問題,結(jié)果表明較優(yōu)的訂單調(diào)度與貨架排序可使機(jī)器人運(yùn)行時(shí)間最少可降低21%。AS/RS與RMFS同為“物至人”揀貨系統(tǒng),在訂單分批方面存在諸多相同之處,王艷艷等[88]對(duì)AS/RS和Carousel揀貨系統(tǒng)的訂單分批問題進(jìn)行研究,吳穎穎等[23]在此基礎(chǔ)上研究了物至人揀貨系統(tǒng)的訂單排序問題,將貨架出入庫(kù)頻率作為優(yōu)化目標(biāo),優(yōu)化后的系統(tǒng)揀貨效率提高了15.9%。為了提高電商倉(cāng)庫(kù)的揀貨效率,王旭坪等[74]和Zhang等[10]在考慮訂單交貨期限的前提下對(duì)訂單分批與排序協(xié)同優(yōu)化問題進(jìn)行了研究,構(gòu)建了協(xié)同優(yōu)化的整數(shù)規(guī)劃模型,實(shí)現(xiàn)了80.365%的訂單配送率。 3)利用聚類的方法 訂單分批本質(zhì)上是一個(gè)聚類過程,因而聚類策略是訂單分批問題研究的重點(diǎn),Chen等[78]利用基于關(guān)聯(lián)規(guī)則的聚類方法研究了人工揀貨系統(tǒng)的訂單分批問題,構(gòu)建了訂單分批的0-1整數(shù)規(guī)劃模型,利用關(guān)聯(lián)規(guī)則算法進(jìn)行模型求解,優(yōu)化效果顯著。與文獻(xiàn)[78]不同,Al-Araidah等[89]則設(shè)計(jì)了訂單聚類的啟發(fā)式規(guī)則,最多可減少44%的揀貨時(shí)間。這些研究表明利用聚類、關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘方法進(jìn)行RMFS的訂單分批研究將是一種有效途徑。
綜上,上述文獻(xiàn)對(duì)RMFS的訂單分批問題做了初步研究,并取得了一定的優(yōu)化效果,特別是AS/RS的訂單分批研究對(duì)RMFS具有重要的借鑒意義。但RMFS與傳統(tǒng)揀貨系統(tǒng)的訂單分批問題存在諸多不同,應(yīng)重點(diǎn)關(guān)注: 1)研究不同分批策略對(duì)RMFS訂單分批效果的影響,并比較各分批策略的優(yōu)劣。 2)RMFS的訂單分批應(yīng)將商品關(guān)聯(lián)性、需求頻率以及貨架搬運(yùn)次數(shù)作為重要優(yōu)化指標(biāo),并考慮機(jī)器人特性、狀態(tài)(如電量、路徑等)等因素對(duì)訂單分批的影響。 3)考慮訂單取消以及插單等突發(fā)情況下的RMFS訂單分批問題。
2.3 任務(wù)分配及調(diào)度
傳統(tǒng)揀貨系統(tǒng)的任務(wù)分配是將揀貨任務(wù)按一定方式分配給揀貨員或堆垛機(jī),讓揀貨員或堆垛機(jī)將待揀商品從存儲(chǔ)位置揀出,目的是使揀貨的總代價(jià)最小[1]。與傳統(tǒng)揀貨系統(tǒng)不同,RMFS是一個(gè)多機(jī)器人系統(tǒng)(MRS),其任務(wù)分配是一個(gè)典型的多機(jī)器人任務(wù)分配(MRTA)問題,具體包括兩個(gè)方面,首先是將任務(wù)集分配給機(jī)器人群體,其次是協(xié)調(diào)機(jī)器人群體的行為,使其高效、可靠地完成任務(wù)[90]。 貨架與機(jī)器人的任務(wù)分配示意圖如圖7所示,在構(gòu)建貨架與機(jī)器人之間的分配模型時(shí),可將機(jī)器人的行走距離、訂單揀選效率以及機(jī)器人電量消耗等指標(biāo)作為優(yōu)化目標(biāo),并將機(jī)器人的電量限制、同一時(shí)刻貨架只能被一個(gè)機(jī)器人搬運(yùn)(反之亦然)等作為約束條件。 MRTA問題可建模為最優(yōu)分配、整數(shù)規(guī)劃、調(diào)度、網(wǎng)絡(luò)流等模型[91],也可將其視為多旅行商問題(Multiple traveling salesmen problem,MTSP)。MRTA問題本質(zhì)上也是一種廣義指派問題,其數(shù)學(xué)模型為[92]:
圖 7? RMFS的貨架與機(jī)器人分配示意圖
在模型4中,表示將任務(wù)分配給(Agent可為機(jī)器人或揀貨/補(bǔ)貨站臺(tái)),否則;表示將任務(wù)分配給的工作代價(jià)或收益;表示完成任務(wù)所需要的資源數(shù)量;和分別表示完成任務(wù)花費(fèi)的最小和最大資源;式(15)為目標(biāo)函數(shù),根據(jù)選取的不同,可以取最小值或最大值;式(16) ~ (17)為約束條件,表示任務(wù)與之間的分配關(guān)系;式(18)為變量和參數(shù)取值。 多數(shù)文獻(xiàn)將機(jī)器人完成任務(wù)的代價(jià)最小、利用率或產(chǎn)出率最大等作為優(yōu)化目標(biāo),并利用基于行為[93]、情感[94–95]、市場(chǎng)[96–97]和最優(yōu)化[11,98]等方法求解MRTA問題。其中基于市場(chǎng)和最優(yōu)化的方法應(yīng)用最為廣泛,基于市場(chǎng)的方法是利用拍賣的思想進(jìn)行任務(wù)分配,又可分為單物品拍賣和組合拍賣[90]兩種,相比其他拍賣形式,組合拍賣能夠提高拍賣效率,降低競(jìng)標(biāo)人風(fēng)險(xiǎn)。由于組合拍賣的勝者決定問題已被證明是NP難題,大多文獻(xiàn)都利用啟發(fā)式或元啟發(fā)式算法[11,99]求解MRTA問題,也有文獻(xiàn)利用聚類[100]和仿真[101]的方法,值得一提的是陳培友等[102]將混沌理論引入了組合拍賣的任務(wù)分配過程。 RMFS的任務(wù)分配問題與傳統(tǒng)MRTA問題存在諸多不同,主要有: 1)任務(wù)分配復(fù)雜度不同:相比傳統(tǒng)MRTA問題,RMFS是多任務(wù)多目標(biāo)的任務(wù)分配,涉及訂單與揀貨站臺(tái)、貨架與機(jī)器人以及揀貨(補(bǔ)貨)站臺(tái)與機(jī)器人三個(gè)方面[28–29],任務(wù)分配的復(fù)雜度更高。 2)決策方式不同:RMFS的任務(wù)分配采用去中心化的分布式智能體決策方式,相比傳統(tǒng)MRTA的集中決策控制系統(tǒng)魯棒性更強(qiáng)、效果更好[9,42]。 3)約束條件不同:RMFS的任務(wù)分配需要考慮訂單交貨時(shí)間、服務(wù)水平等特殊條件約束。 4)任務(wù)分配環(huán)境不同:RMFS的任務(wù)分配是在動(dòng)態(tài)環(huán)境中進(jìn)行,比靜態(tài)環(huán)境中的MRTA問題更加復(fù)雜。
RMFS的任務(wù)分配問題可以按照廣義指派問題進(jìn)行模型構(gòu)建,現(xiàn)有文獻(xiàn)主要利用排隊(duì)論、啟發(fā)式規(guī)則、智能優(yōu)化算法以及仿真等方法研究MRTA問題,相關(guān)研究文獻(xiàn)按照研究方法分類綜述如下:
1)利用排隊(duì)論方法
Zou等[28]以在線零售為背景,構(gòu)建了排隊(duì)網(wǎng)絡(luò)模型來研究RMFS的任務(wù)分配規(guī)則問題,并設(shè)計(jì)鄰域搜索方法尋找最優(yōu)分配規(guī)則,結(jié)果表明基于訂單處理速度的分配規(guī)則要比隨機(jī)分配規(guī)則更優(yōu),并且鄰域搜索方法可以找到接近最優(yōu)的分配規(guī)則,但文中未對(duì)機(jī)器人的分配規(guī)則進(jìn)行研究。 在此基礎(chǔ)上,Roy等[33]研究了多分區(qū)存儲(chǔ)模式的RMFS的機(jī)器人分配策略,構(gòu)建了兩階段排隊(duì)網(wǎng)絡(luò)隨機(jī)模型,結(jié)果表明,單個(gè)存儲(chǔ)區(qū)應(yīng)采用按批次分配機(jī)器人的方式,最短隊(duì)列的分配方式則在多分區(qū)存儲(chǔ)中系統(tǒng)吞吐量更大,最多可降低60%的訂單揀選時(shí)間,但缺乏對(duì)隨機(jī)模型參數(shù)更加廣泛的評(píng)估研究。Yuan等[27]則利用排隊(duì)網(wǎng)絡(luò)和共享協(xié)議研究了RMFS搬運(yùn)機(jī)器人的任務(wù)共享與分配問題。
2)利用啟發(fā)式規(guī)則與仿真方法
Zhou等[11]對(duì)RMFS中的MRTA問題進(jìn)行研究,提出了同時(shí)考慮基于拍賣和聚類策略的平衡啟發(fā)式機(jī)制,以機(jī)器人行走距離最小為目標(biāo),仿真發(fā)現(xiàn)平衡啟發(fā)式機(jī)制能縮短機(jī)器人行走距離,提高了機(jī)器人利用率,并且在解的質(zhì)量相近的情況下,平衡啟發(fā)式機(jī)制的求解時(shí)間降低了5% ~ 15%。 但文獻(xiàn)[11]在機(jī)器人完全自利、環(huán)境已知等條件假設(shè)的前提下研究了RMFS的MRTA問題,與實(shí)際RMFS的MRTA問題有一定的差距。Merschformann等[29]則從揀貨和補(bǔ)貨兩方面利用RAWSim-O仿真平臺(tái)研究了RMFS任務(wù)分配,指出工程人員應(yīng)該更加注重待揀訂單的分配決策問題。Ghassemi等[30]則進(jìn)一步利用仿真的方法對(duì)RMFS的任務(wù)分配問題進(jìn)行研究,比較了分散和集中分配兩種任務(wù)分配模式,結(jié)果表明,分散分配在保證解的質(zhì)量的情況下,求解速度比集中算法快1 ~ 3個(gè)數(shù)量級(jí)。RMFS揀貨過程的微觀問題同樣對(duì)揀貨效率具有重要影響,Gue等[42]利用仿真的方法研究了機(jī)器人系統(tǒng)的控制方法,設(shè)計(jì)了多機(jī)器人分散控制算法,結(jié)果表明分散控制相比集中控制方法更能避免機(jī)器人死鎖的發(fā)生。值得一提的是,Yoshitake等[34]利用實(shí)時(shí)全息調(diào)度方法研究了RMFS的機(jī)器人實(shí)時(shí)調(diào)度問題,將RMFS的生產(chǎn)率平均分別提高了6.7% (標(biāo)準(zhǔn)倉(cāng)庫(kù))和12.5% (大規(guī)模倉(cāng)庫(kù))。
3)利用智能優(yōu)化算法
文獻(xiàn)[25]在文獻(xiàn)[11]的基礎(chǔ)上研究了RMFS的任務(wù)調(diào)度問題,分別利用強(qiáng)化學(xué)習(xí)和遺傳算法進(jìn)行問題求解。沈博聞等[8]則利用智能調(diào)度算法研究了RMFS的任務(wù)分配調(diào)度問題,但對(duì)訂單的分配處理過于理想化。袁瑞萍等[32]進(jìn)一步研究了RMFS的任務(wù)調(diào)度問題,設(shè)計(jì)了改進(jìn)的共同進(jìn)化遺傳算法進(jìn)行問題求解,結(jié)果表明改進(jìn)的算法縮短了求解時(shí)間(同步揀選模式下算法的求解時(shí)間是異步模式下求解時(shí)間的50%)。隨后的Zhang等[35]也利用改進(jìn)的遺傳算法研究了RMFS的機(jī)器人分配問題,與傳統(tǒng)的基于規(guī)則的調(diào)度方法相比,改進(jìn)的遺傳算法更加有效。
綜上,RMFS的任務(wù)分配及調(diào)度研究成果豐碩,主要針對(duì)RMFS的MRTA問題的績(jī)效指標(biāo)評(píng)價(jià)、策略比較、揀貨調(diào)度以及任務(wù)分配問題進(jìn)行研究,但對(duì)MRTA與RMFS系統(tǒng)其他問題的協(xié)同優(yōu)化研究不多。RMFS任務(wù)分配及調(diào)度研究可借鑒傳統(tǒng)MRTA問題的研究理論和方法: 1)利用組合拍賣的方法:RMFS中訂單、揀選站臺(tái)、機(jī)器人以及貨架之間存在復(fù)雜的交互關(guān)系,組合拍賣的方法更適合RMFS的任務(wù)分配問題[103]。 2)考慮機(jī)器人能力:機(jī)器人數(shù)量、電量、速度以及停泊點(diǎn)等會(huì)影響RMFS的作業(yè)效率,在任務(wù)分配及調(diào)度研究過程中應(yīng)予以重點(diǎn)關(guān)注,尤其應(yīng)考慮機(jī)器人電量的影響[26–27,31,43]。 3)基于機(jī)器學(xué)習(xí)的方法:強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)等機(jī)器學(xué)習(xí)方法被廣泛的用于解決MRTA問題[104],可將其用于求解RMFS的任務(wù)分配及調(diào)度問題。
RMFS的任務(wù)分配及調(diào)度研究應(yīng)重點(diǎn)關(guān)注以下幾個(gè)方面的問題: 1)綜合研究訂單與揀貨站臺(tái)、貨架與機(jī)器人以及機(jī)器人與揀貨站臺(tái)之間的分配,作為多個(gè)雙向組合拍賣,相比傳統(tǒng)的拍賣方法更加復(fù)雜。 2)考慮訂單緊急程度及交貨期限,確定合理的RMFS訂單分配及調(diào)度規(guī)則。 3)考慮特殊情況下RMFS任務(wù)分配問題,如出現(xiàn)訂單取消、插單以及緊急訂單時(shí)的任務(wù)動(dòng)態(tài)分配及調(diào)度研究,還應(yīng)考慮機(jī)器人的電量、擁堵等對(duì)任務(wù)分配及調(diào)度的影響。 4)在模型4的基礎(chǔ)上構(gòu)建RMFS任務(wù)分配及調(diào)度的數(shù)學(xué)模型,為RMFS多機(jī)器人任務(wù)分配及調(diào)度研究提供理論基礎(chǔ)。
2.4 路徑規(guī)劃
路徑規(guī)劃是為揀貨人員規(guī)劃揀貨時(shí)的行走路徑,使最終的揀貨距離最短。揀貨員的路徑規(guī)劃問題一般視為旅行商問題(TSP),人工揀貨系統(tǒng)常用穿越、回轉(zhuǎn)、中點(diǎn)、最大間隙等策略規(guī)劃揀貨員的行走路徑[1]。 與傳統(tǒng)揀貨系統(tǒng)不同,RMFS的路徑規(guī)劃是一個(gè)多機(jī)器人路徑規(guī)劃(MRPP)問題,其目的是確保機(jī)器人在不發(fā)生碰撞、擁堵、死鎖以及滿足時(shí)間約束要求的前提下,同時(shí)對(duì)多個(gè)機(jī)器人進(jìn)行路徑規(guī)劃,最終使機(jī)器人揀貨行走的總距離最短,從而提高訂單揀選的效率[12]。 如圖8所示為RMFS的路徑規(guī)劃示意圖,圖中以揀貨過程(補(bǔ)貨過程路徑規(guī)劃類似)為例給出了一條機(jī)器人的行走路徑,機(jī)器人需要將位置的貨架搬運(yùn)到揀貨站臺(tái),然后再將貨架送到存儲(chǔ)區(qū)的位置存儲(chǔ),再將位置的貨架搬運(yùn)至揀貨站臺(tái)揀貨,隨后再送至位置存儲(chǔ),最終回到停泊區(qū)等待;RMFS的MRPP問題類似于TSP問題,需要機(jī)器人遍歷系統(tǒng)預(yù)先分配好的各個(gè)位置,使得機(jī)器人行走的路徑最短,此外RMFS的MRPP問題還應(yīng)考慮機(jī)器人避障、電量限制等約束條件。
圖 8? RMFS的路徑規(guī)劃示意圖 傳統(tǒng)的MRPP是一種多旅行商問題(Multi-Travelling salesman problem,MTSP)[105],其數(shù)學(xué)模型為:
MTSP一般被定義為圖,表示節(jié)點(diǎn)集合;表示邊的集合。在模型5中,表示旅行所需花費(fèi)的代價(jià);表示機(jī)器人從點(diǎn)到點(diǎn),否則,;式(19)為目標(biāo)函數(shù),式(20)和(21)表示這個(gè)機(jī)器人必須回到同一個(gè)起始地點(diǎn);式(22)、(23)和(25)為分配約束條件;式(24)為消除子回路的約束條件。MTSP及其各類建模方法可具體參考文獻(xiàn)[105]。 MRPP問題的求解方法有精確方法、啟發(fā)式以及人工智能等[106],靜態(tài)路徑規(guī)劃一般利用可視圖、Voronoi圖、柵格圖、人工勢(shì)場(chǎng)等路徑規(guī)劃方法,并通過深度優(yōu)先、廣度優(yōu)先、Dijkstra以及A*和D*等算法求解[107],動(dòng)態(tài)路徑規(guī)劃一般利用啟發(fā)式或元啟發(fā)式[108]、強(qiáng)化學(xué)習(xí)[109]等智能優(yōu)化方法求解,也有學(xué)者利用雙層模糊邏輯[110]、仿真技術(shù)[111]對(duì)多機(jī)器人路徑規(guī)劃問題進(jìn)行研究。
RMFS的路徑規(guī)劃與傳統(tǒng)的MRPP問題存在諸多不同,主要有: 1)復(fù)雜程度不同:傳統(tǒng)的MRPP是在開放空間內(nèi)的路徑規(guī)劃,較少考慮預(yù)設(shè)行走路徑,RMFS的路徑規(guī)劃分為載貨機(jī)器人路徑規(guī)劃(在巷道內(nèi)的路徑規(guī)劃)和空載機(jī)器人路徑規(guī)劃(在無限制情況下進(jìn)行路徑規(guī)劃,因?yàn)榭蛰d機(jī)器人可在巷道和貨架下自由行駛)[3]。 2)約束條件不同:RMFS的路徑規(guī)劃需考慮訂單交貨時(shí)間或優(yōu)先級(jí)等因素。 3)存在任務(wù)切換代價(jià):RMFS的路徑規(guī)劃需考慮任務(wù)切換的代價(jià),即機(jī)器人存儲(chǔ)貨架后再搬運(yùn)下一貨架所需行走的時(shí)間或距離[3]。 4)優(yōu)化目標(biāo)不同:相比傳統(tǒng)的MRPP問題,可將訂單延遲率、任務(wù)切換代價(jià)等作為優(yōu)化目標(biāo)。
RMFS的MRPP問題可建模為MTSP問題,已有文獻(xiàn)主要利用圖論、智能優(yōu)化、強(qiáng)化學(xué)習(xí)、精確算法以及啟發(fā)式方法研究RMFS的路徑規(guī)劃問題,涉及RMFS的MRPP問題的文獻(xiàn)按照研究方法分類綜述如下:
1)利用圖論的方法
傳統(tǒng)揀貨系統(tǒng)的路徑規(guī)劃問題通??衫脠D論的方法建模[112],一般是先對(duì)RMFS揀貨區(qū)域進(jìn)行柵格化的處理,然后將RMFS的MRPP問題視為柵格地圖上的路徑規(guī)劃問題,例如張丹露等[38]針對(duì)RMFS的MRPP問題提出了一種基于動(dòng)態(tài)加權(quán)地圖的方法,與預(yù)約表下改進(jìn)的A*算法相比,該方法能夠?qū)C(jī)器人行走時(shí)間降低17.4%。
2)利用智能優(yōu)化算法和強(qiáng)化學(xué)習(xí)
由于MRPP問題是NP難題,一般無法求得最優(yōu)解,更多利用智能優(yōu)化算法求解,夏清松等[39]利用蟻群算法研究RMFS的路徑規(guī)劃與避障的協(xié)同優(yōu)化問題,并設(shè)計(jì)了MRPP的避障規(guī)則,但文中有關(guān)機(jī)器人轉(zhuǎn)向次數(shù)較少的假設(shè)不符合實(shí)際情況,且未考慮動(dòng)態(tài)MRPP問題。 Lee等[44]對(duì)RMFS系統(tǒng)進(jìn)行了擴(kuò)展,用揀取機(jī)器人替代揀貨員揀取商品,并將RMFS的揀貨過程看作特殊的車輛路徑問題(Pick,place,and transport vehicle routing problem,PPTVRP)進(jìn)行了研究,并利用智能優(yōu)化算法求解。值得關(guān)注的是Dou等[25]利用強(qiáng)化學(xué)習(xí)方法研究了RMFS的MRPP問題,實(shí)驗(yàn)結(jié)果顯示其優(yōu)化效果與遺傳算法相近,但未進(jìn)行更廣泛的實(shí)例測(cè)試。
3)利用精確算法和啟發(fā)式規(guī)則
沈博聞等[8]和Merschformann等[12]利用A*及其改進(jìn)算法研究了RMFS的MRPP問題,主要關(guān)注生成的路徑有無堵塞和死鎖,但未考慮機(jī)器人電量對(duì)路徑規(guī)劃的影響。Kumar等[36]、Zhang等[37]、Lee等[40]以及于赫年等[41]針對(duì)無沖突的MRPP問題進(jìn)行了研究,主要利用Dijkstra、A*、啟發(fā)式規(guī)則等算法實(shí)現(xiàn)了多機(jī)器人無沖突的路徑規(guī)劃。
綜上,上述文獻(xiàn)對(duì)RMFS的MRPP問題進(jìn)行了初步研究,取得了一定的研究成果,但MRPP與RMFS其他問題的協(xié)同優(yōu)化研究不多,也很少有文獻(xiàn)研究動(dòng)態(tài)情況下RMFS的MRPP問題,并且當(dāng)前RMFS的MRPP問題研究一般采用仿真的方法,沒有在理論上給出相應(yīng)的數(shù)學(xué)模型。
RMFS的路徑規(guī)劃研究可借鑒傳統(tǒng)MRPP問題的研究理論和方法: 1)利用機(jī)器學(xué)習(xí)方法:強(qiáng)化學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法可將路徑規(guī)劃、避碰、避障、死鎖以及協(xié)作等問題統(tǒng)一解決,無須建立路徑規(guī)劃的環(huán)境模型和地圖[113],相比傳統(tǒng)方法具有更多優(yōu)勢(shì)。 2)釋放約束條件:考慮不確定環(huán)境及動(dòng)態(tài)情況下的MRPP問題,即考慮機(jī)器人故障、電量、障礙物等因素對(duì)MRPP的影響。 3)多類問題協(xié)同優(yōu)化:將MRPP問題與RMFS的訂單分批、任務(wù)分配等問題進(jìn)行協(xié)同優(yōu)化。 4)限定范圍的連續(xù)路徑規(guī)劃研究:與傳統(tǒng)MRPP問題類似,RMFS的路徑規(guī)劃為一定范圍(如圖8所示區(qū)域)內(nèi)的連續(xù)路徑規(guī)劃問題,例如Zhang等[37]、夏清松等[39]利用柵格圖法研究了RMFS在揀貨區(qū)域內(nèi)的連續(xù)路徑規(guī)劃。
RMFS路徑規(guī)劃問題在借鑒傳統(tǒng)MRPP問題研究的基礎(chǔ)上,應(yīng)重點(diǎn)關(guān)注: 1)設(shè)計(jì)載貨機(jī)器人和空載機(jī)器人的不同路徑規(guī)劃規(guī)則,尤其考慮空載機(jī)器人可在貨架下行駛的情況。 2)考慮訂單交期、退單、插單、退貨以及緊急訂單等情況對(duì)RMFS的MRPP問題的影響。 3)將強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)等方法用于RMFS的MRPP問題的研究。4)在模型5的基礎(chǔ)上對(duì)RMFS的MRPP問題進(jìn)行研究,提出符合RMFS實(shí)際情況的MRPP理論模型。
2.5 研究方法
RMFS系統(tǒng)建模和優(yōu)化方法主要涉及排隊(duì)論、圖論、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘以及Agent建模等方法,本節(jié)對(duì)這些建模和優(yōu)化方法進(jìn)行綜述,為RMFS系統(tǒng)的后續(xù)研究指明方向。
1)排隊(duì)論方法
排隊(duì)論是研究系統(tǒng)隨機(jī)聚散現(xiàn)象和隨機(jī)服務(wù)系統(tǒng)工作過程的數(shù)學(xué)理論和方法,RMFS的貨位指派、訂單分批、任務(wù)分配及調(diào)度等問題可利用排隊(duì)論進(jìn)行研究。 例如Lamballais等[3]、Onal等[15]、Nigam等[4]以及Yuan等[17]分別利用排隊(duì)論對(duì)商品和貨架的儲(chǔ)位指派策略進(jìn)行了研究;Yu等[86]和Hur等[87]均構(gòu)建了傳統(tǒng)揀貨系統(tǒng)訂單分批問題的排隊(duì)網(wǎng)絡(luò)評(píng)估模型,為利用排隊(duì)論研究RMFS的訂單分批問題提供了參考;Zou等[28]和Roy等[33]也都利用排隊(duì)網(wǎng)絡(luò)模型研究RMFS的任務(wù)分配和機(jī)器人分配問題。在利用排隊(duì)論方法對(duì)RMFS的優(yōu)化研究中,主要是針對(duì)研究的問題特性構(gòu)建系統(tǒng)績(jī)效評(píng)估的排隊(duì)網(wǎng)絡(luò)模型,并通過仿真對(duì)優(yōu)化策略和排隊(duì)模型進(jìn)行有效性驗(yàn)證,如圖9所示為RMFS系統(tǒng)績(jī)效評(píng)估的半開放排隊(duì)網(wǎng)絡(luò)模型。
圖9 RMFS績(jī)效評(píng)估的半開放排隊(duì)網(wǎng)絡(luò)模型 2)圖論方法
圖可直觀的表示出事物之間的關(guān)系,傳統(tǒng)揀貨系統(tǒng)的路徑規(guī)劃問題可利用圖論的方式進(jìn)行表示和研究[1],RMFS的路徑規(guī)劃作為一種多機(jī)器人的路徑規(guī)劃問題,也可利用圖論的方法進(jìn)行研究。例如張丹露等[38]針對(duì)RMFS的多機(jī)器人路徑規(guī)劃問題提出了一種基于動(dòng)態(tài)加權(quán)地圖的研究方法,Zhang等[37]和夏清松等[39]也利用圖的表示方式對(duì)多機(jī)器人的路徑規(guī)劃問題進(jìn)行了研究,如圖10為RMFS的路徑規(guī)劃及其圖表示。
圖10?RMFS路徑規(guī)劃及其圖表示 3)機(jī)器學(xué)習(xí)方法
機(jī)器學(xué)習(xí)作為一種基于經(jīng)驗(yàn)的學(xué)習(xí)方法,已經(jīng)成功地應(yīng)用于圖像識(shí)別和自然語言處理等領(lǐng)域,Dou等[25]最先利用強(qiáng)化學(xué)習(xí)方法研究了RMFS的路徑規(guī)劃問題,證明了將機(jī)器學(xué)習(xí)方法用于RMFS優(yōu)化研究的可行性和有效性,Zhang等[47]則進(jìn)一步將強(qiáng)化學(xué)習(xí)與進(jìn)化計(jì)算組合對(duì)RMFS快遞分揀倉(cāng)庫(kù)布局的自動(dòng)化設(shè)計(jì)進(jìn)行了研究,此外神經(jīng)網(wǎng)絡(luò)[114]、深度學(xué)習(xí)[115]等機(jī)器學(xué)習(xí)方法也被廣泛地用于求解多機(jī)器人任務(wù)分配、路徑規(guī)劃以及障礙物識(shí)別等問題,例如,Li等[116]和Zhu等[117]分別利用神經(jīng)網(wǎng)絡(luò)研究了多機(jī)器人的動(dòng)態(tài)路徑規(guī)劃和任務(wù)分配問題;Heo等[118]利用深度學(xué)習(xí)研究工業(yè)協(xié)作機(jī)器人的障礙物識(shí)別問題?;趶?qiáng)化學(xué)習(xí)的RMFS優(yōu)化框架如圖11所示,可以看出,RMFS系統(tǒng)中的機(jī)器人、貨架、商品、訂單、揀貨/補(bǔ)貨站臺(tái)以及揀貨員等要素可視為Agent,這里的環(huán)境為RMFS系統(tǒng),Agent執(zhí)行的動(dòng)作可以是貨位指派、訂單分批、任務(wù)分配以及路徑規(guī)劃的策略或規(guī)則,Agent通過動(dòng)作影響環(huán)境,更新環(huán)境狀態(tài),并從環(huán)境獲得反饋[119]。
圖11?基于強(qiáng)化學(xué)習(xí)的RMFS優(yōu)化框架 4)數(shù)據(jù)挖掘方法
RMFS的商品和貨架儲(chǔ)位指派需考慮商品銷售的關(guān)聯(lián)關(guān)系和暢銷程度,訂單分批也需知道商品之間的關(guān)聯(lián)強(qiáng)度,任務(wù)分配和路徑規(guī)劃則需預(yù)測(cè)任務(wù)及資源的可用性,這些問題均可用聚類、預(yù)測(cè)等數(shù)據(jù)挖掘方法進(jìn)行研究。例如Chen等[78]和Al-Araidah等[89]分別利用聚類的方法對(duì)訂單分批問題進(jìn)行了研究,Pang等[69]則進(jìn)一步利用關(guān)聯(lián)規(guī)則方法挖掘商品之間的需求關(guān)系,最終實(shí)現(xiàn)了商品儲(chǔ)位指派優(yōu)化。
5)Agent建模方法
基于Agent的建模方法(Agent-based modeling,ABM)是一種分布式的建模方法,可對(duì)主體的微觀行為進(jìn)行刻畫,并可以觀察宏觀層面涌現(xiàn)的系統(tǒng)特征,更適合對(duì)復(fù)雜系統(tǒng)的建模[120]。 RMFS作為分布式多Agent系統(tǒng),可利用ABM方法進(jìn)行建模研究,將整個(gè)揀貨系統(tǒng)中的移動(dòng)貨架、機(jī)器人、揀選(補(bǔ)貨)站臺(tái)等看作自主決策的Agent,每個(gè)Agent都具有特定的行為規(guī)則、特征和屬性,以一定規(guī)則在揀貨系統(tǒng)中獨(dú)立決策、自主運(yùn)行,并與系統(tǒng)中其它Agent和環(huán)境進(jìn)行交互。 ABM的目標(biāo)是對(duì)這些規(guī)則和交互關(guān)系進(jìn)行調(diào)整和優(yōu)化,實(shí)現(xiàn)整個(gè)揀貨系統(tǒng)的狀態(tài)最優(yōu)?;贏gent的RMFS多機(jī)器人運(yùn)作結(jié)構(gòu)如圖12所示,ABM可對(duì)RMFS的Agent個(gè)體與揀貨系統(tǒng)整體進(jìn)行協(xié)調(diào)優(yōu)化[121]。眾多文獻(xiàn)從建模分析[122]、死鎖、路徑規(guī)劃[123]等角度通過ABM方法研究多機(jī)器人系統(tǒng),利用ABM方法對(duì)RMFS進(jìn)行建模還需考慮機(jī)器人之間的協(xié)同合作、避障、時(shí)間約束等問題。 Alphabet Soup[124]、RAWSim-O[125]等開源RMFS仿真平臺(tái)均基于ABM方法,Bozer等[45]也利用ABM方法驗(yàn)證了RMFS相比傳統(tǒng)揀貨系統(tǒng)具有更高的揀貨效率和柔性。此外,Swarm、Repast、Netlogo等ABM的建模與仿真平臺(tái)也為RMFS的優(yōu)化研究提供了可靠的技術(shù)支撐。
圖12?基于Agent的RMFS多機(jī)器人運(yùn)作結(jié)構(gòu) 6)其他方法
值得特別關(guān)注的是,Petkovi?等[48]給出了研究RMFS的全新方法,文章利用隱馬爾科夫模型和心理理論對(duì)RMFS揀貨過程中人的意圖進(jìn)行評(píng)價(jià),并通過虛擬現(xiàn)實(shí)技術(shù)驗(yàn)證了模型的有效性,這涉及到機(jī)器學(xué)習(xí)、心理學(xué)等學(xué)科,表明了多學(xué)科交叉也是RMFS未來重要的研究方法,例如Keung等[126]利用基于云的網(wǎng)絡(luò)物理系統(tǒng)研究了RMFS的避障問題,進(jìn)一步說明了學(xué)科交叉研究的可行性和必要性。
03? 進(jìn)一步研究方向
有關(guān)RMFS的研究起步較晚,現(xiàn)有文獻(xiàn)研究主要集中在系統(tǒng)分析、設(shè)計(jì)優(yōu)化以及運(yùn)作規(guī)劃與控制方面,Azadeh等[127]給出了系統(tǒng)分析、設(shè)計(jì)優(yōu)化、運(yùn)作策略以及系統(tǒng)比較4個(gè)主要的研究方向,本文則提出以下更為具體的研究方向。
3.1 RMFS倉(cāng)庫(kù)布局及配置研究
從提升RMFS系統(tǒng)揀貨效率的角度出發(fā),針對(duì)RMFS的倉(cāng)庫(kù)布局及配置設(shè)計(jì)和各種設(shè)計(jì)方案的系統(tǒng)績(jī)效評(píng)估,提出的進(jìn)一步的研究方向有: 1)倉(cāng)庫(kù)存儲(chǔ)區(qū)形狀對(duì)揀貨效率的影響研究。 RMFS存儲(chǔ)區(qū)普遍為矩形布置方式(例如圖1(b)所示),在揀貨和補(bǔ)貨站臺(tái)位置固定的情況下,倉(cāng)庫(kù)存儲(chǔ)區(qū)的長(zhǎng)寬比一方面可能會(huì)影響揀貨過程機(jī)器人的路徑規(guī)劃和擁堵情況,導(dǎo)致揀貨效率下降;另一方面當(dāng)揀貨站臺(tái)一側(cè)對(duì)應(yīng)的存儲(chǔ)區(qū)寬度較窄時(shí),將造成較多存儲(chǔ)暢銷商品的貨架只能存儲(chǔ)在距離揀貨站臺(tái)較遠(yuǎn)的儲(chǔ)位,最終導(dǎo)致揀貨過程機(jī)器人搬運(yùn)貨架的距離加長(zhǎng)、揀貨效率降低。因此,對(duì)倉(cāng)庫(kù)存儲(chǔ)區(qū)布局的優(yōu)化是提升RMFS揀貨效率的重要研究方向。 2)揀貨站臺(tái)與補(bǔ)貨站臺(tái)的比例對(duì)揀貨效率的影響研究。 揀貨站臺(tái)與補(bǔ)貨站臺(tái)的數(shù)量比對(duì)訂單揀選效率、揀貨與補(bǔ)貨的平衡關(guān)系以及揀貨/補(bǔ)貨員的作業(yè)負(fù)荷都具有重要影響,例如揀貨站臺(tái)較少,則可能出現(xiàn)揀貨員作業(yè)負(fù)荷過大、訂單揀選時(shí)間長(zhǎng)以及部分補(bǔ)貨站臺(tái)空閑的情況;若補(bǔ)貨站臺(tái)較少,則會(huì)出現(xiàn)補(bǔ)貨員作業(yè)負(fù)荷過大、庫(kù)存商品短缺、訂單揀選時(shí)間長(zhǎng)以及部分揀貨站空閑的情況;因此,揀貨站臺(tái)和補(bǔ)貨站臺(tái)比例優(yōu)化對(duì)提升RMFS的揀貨效率具有重要意義。 3)機(jī)器人數(shù)量、速度、利用率、待命停泊點(diǎn)以及充電策略等因素對(duì)揀貨效率的影響研究。 在揀貨過程中,機(jī)器人的數(shù)量和速度決定了一次性最多能搬運(yùn)的貨架數(shù)量和機(jī)器人的行走時(shí)間;機(jī)器人停泊點(diǎn)則對(duì)連續(xù)作業(yè)機(jī)器人的行走距離具有重要影響;機(jī)器人充電策略則決定了機(jī)器人充電過程的調(diào)度方式,對(duì)機(jī)器人的可用率和貨架搬運(yùn)效率都具有重要影響。因此,在考慮揀貨成本、資源限制及利用率等因素的情況下,如何合理配置機(jī)器人數(shù)量、速度以及規(guī)劃?rùn)C(jī)器人的充電策略將是未來的重要研究方向。 4)機(jī)器人結(jié)構(gòu)設(shè)計(jì)與操作效能的提升研究。 RMFS機(jī)器人的結(jié)構(gòu)設(shè)計(jì)可分為硬件結(jié)構(gòu)設(shè)計(jì)和控制系統(tǒng)結(jié)構(gòu)設(shè)計(jì),其中硬件結(jié)構(gòu)設(shè)計(jì)決定了機(jī)器人搬運(yùn)貨架的方式、可承載的最大重量、行駛速度以及充電方式,控制系統(tǒng)結(jié)構(gòu)設(shè)計(jì)則涉及機(jī)器人控制方式(集中控制或分散控制)、避障規(guī)則、充電策略以及通信切換等問題。操作效能的提升涉及貨架的一體化設(shè)計(jì)、揀貨/補(bǔ)貨人員的技能熟練程度等人因問題研究。這方面涉及運(yùn)籌優(yōu)化、機(jī)械設(shè)計(jì)以及人因工程的交叉學(xué)科研究,對(duì)提升RMFS揀貨效率具有重要意義。
3.2 考慮隨機(jī)因素及動(dòng)態(tài)情況的RMFS優(yōu)化研究
從減少理想化假設(shè)條件、考慮隨機(jī)因素影響和動(dòng)態(tài)情況出發(fā),提出的主要研究方向有: 1)考慮動(dòng)態(tài)情況下的貨位指派、訂單分批、任務(wù)分配、路徑規(guī)劃研究。 相比靜態(tài)問題的研究,動(dòng)態(tài)貨位指派比一次性貨位優(yōu)化更具優(yōu)勢(shì),更能反映揀貨過程隨時(shí)間的變化規(guī)律;動(dòng)態(tài)貨位指派也更加符合實(shí)際情況,例如在線訂單分批能根據(jù)客戶的動(dòng)態(tài)需求進(jìn)行更加合理的訂單分批。因此,針對(duì)RMFS的商品和貨架儲(chǔ)位動(dòng)態(tài)指派、在線訂單分批、動(dòng)態(tài)任務(wù)分配以及動(dòng)態(tài)路徑規(guī)劃等問題的研究將是重要的優(yōu)化方向。2)考慮機(jī)器人死鎖、損壞等突發(fā)情況的研究。在揀貨過程中,機(jī)器人出現(xiàn)故障是難免的,為了保證揀貨過程順利進(jìn)行并提高機(jī)器人的利用率,對(duì)揀貨過程機(jī)器人死鎖、損壞等突發(fā)情況的研究十分必要。 3)考慮訂單取消、插單、退貨等情況的研究。 在電商環(huán)境下,客戶可能因多種原因出現(xiàn)取消訂單、催單(訂單加急)以及退貨等情況,雖然已有文獻(xiàn)對(duì)RMFS的靜態(tài)訂單分批問題進(jìn)行了初步研究,但未考慮訂單取消、插單等情況,建議在RMFS揀貨優(yōu)化過程中考慮訂單取消、插單、退貨等情況,此外訂單取消、插單對(duì)系統(tǒng)績(jī)效的影響評(píng)估也可作為一個(gè)重點(diǎn)研究方向。 4)考慮揀貨和補(bǔ)貨人員工作負(fù)荷、人因以及技能熟練程度對(duì)揀貨效率的影響研究。 揀貨和補(bǔ)貨人員的工作負(fù)荷、人因以及技能熟練程度對(duì)揀貨效率具有重要影響,例如較少的工作負(fù)荷容易造成揀貨和補(bǔ)貨人員空閑,較多則會(huì)引發(fā)疲勞、壓力過大等情況的出現(xiàn);長(zhǎng)時(shí)間固定姿勢(shì)的勞作容易造成人體機(jī)能和器官的損傷(例如揀貨和補(bǔ)貨人員經(jīng)常彎腰);揀貨人員和補(bǔ)貨人員的技能熟練程度決定了揀貨站臺(tái)和補(bǔ)貨站臺(tái)的服務(wù)速率,對(duì)站臺(tái)區(qū)域的擁堵情況和揀貨效率具有重要影響。雖然人因、技能熟練程度等指標(biāo)難以量化,但這方面的研究卻十分必要。
3.3 RMFS的資源調(diào)度研究
RMFS的調(diào)度問題涉及貨架、機(jī)器人、訂單、商品、揀貨站臺(tái)以及補(bǔ)貨站臺(tái)等多種資源,針對(duì)RMFS系統(tǒng)的資源調(diào)度問題,提出的主要研究方向有: 1)考慮需求關(guān)聯(lián)性的商品及貨架儲(chǔ)位調(diào)度研究。 將需求關(guān)聯(lián)性強(qiáng)的商品指派到相同貨架存儲(chǔ),可減少貨架搬運(yùn)次數(shù);將存儲(chǔ)暢銷商品的貨架指派到靠近揀貨站臺(tái)的位置存儲(chǔ),可降低貨架搬運(yùn)距離,因此考慮需求關(guān)聯(lián)性的商品及貨架的儲(chǔ)位調(diào)度研究是提高揀貨效率的重要優(yōu)化方向,這方面研究重點(diǎn)關(guān)注商品需求關(guān)聯(lián)性計(jì)算,貨架儲(chǔ)位動(dòng)態(tài)調(diào)度等。 2)訂單的分批策略及規(guī)則研究。 是采用在線訂單分批還是離線訂單分批、或者同時(shí)考慮這二者的混合策略,是將訂單分配給揀貨站臺(tái)后再分批還是先分批再分配給揀貨站臺(tái),是根據(jù)訂單的相似程度分批還是根據(jù)搬運(yùn)的貨架分批,都是目前RMFS訂單分批優(yōu)化中亟需解決的問題;并且在線訂單分批需考慮訂單的動(dòng)態(tài)變化關(guān)系,相比離線訂單分批更加復(fù)雜。 3)機(jī)器人與貨架、揀貨/補(bǔ)貨站臺(tái)以及充電設(shè)施的協(xié)同調(diào)度策略及規(guī)則研究。 機(jī)器人是RMFS的主要搬運(yùn)工具,在揀貨過程中,機(jī)器人與貨架、揀貨/補(bǔ)貨站臺(tái)以及充電設(shè)施之間存在復(fù)雜的協(xié)同調(diào)度關(guān)系,包括機(jī)器人任務(wù)分配和充電設(shè)施分配調(diào)度等一系列問題,因此,機(jī)器人與貨架、揀貨/補(bǔ)貨站臺(tái)以及充電設(shè)施的協(xié)同調(diào)度策略及規(guī)則研究是RMFS系統(tǒng)優(yōu)化必須面對(duì)的問題。
3.4 多問題協(xié)同優(yōu)化研究
RMFS作為復(fù)雜決策系統(tǒng),貨位指派、訂單分批、任務(wù)分配以及路徑規(guī)劃等問題之間存在緊密的內(nèi)在聯(lián)系,例如任務(wù)分配之前必須完成貨位指派和訂單分批,路徑規(guī)劃必須考慮商品及貨架的存儲(chǔ)位置。因此,多個(gè)問題的協(xié)同優(yōu)化更加符合RMFS的運(yùn)作過程,是實(shí)現(xiàn)系統(tǒng)全局最優(yōu)的關(guān)鍵,將成為RMFS優(yōu)化研究的重要趨勢(shì),但多個(gè)問題的協(xié)同優(yōu)化研究在問題描述、模型構(gòu)建、算法設(shè)計(jì)以及問題求解等方面都更加復(fù)雜,后續(xù)可重點(diǎn)對(duì)多目標(biāo)(問題)協(xié)同優(yōu)化模型構(gòu)建、算法設(shè)計(jì)及問題求解進(jìn)行深入研究。
3.5 優(yōu)化方法研究
針對(duì)RMFS的優(yōu)化方法研究提出兩點(diǎn)主要的研究方向: 1)在現(xiàn)有的RMFS仿真軟件的基礎(chǔ)上應(yīng)開發(fā)新的算法和優(yōu)化模塊。 RMFS的系統(tǒng)效能評(píng)估、各因素對(duì)揀貨效率的影響等問題可能無法構(gòu)建精確的優(yōu)化模型,只能通過離散仿真的方法進(jìn)行研究。因此,類似Alphabet Soup、RAWSim-O等仿真軟件的開發(fā)和應(yīng)用是必不可少的。 2)設(shè)計(jì)針對(duì)RMFS的求解大規(guī)模問題的智能優(yōu)化算法。 RMFS的應(yīng)用背景通常是大型電商企業(yè)(例如亞馬遜、京東),系統(tǒng)所包含的貨架、機(jī)器人、訂單等資源的數(shù)量龐大,尤其在面臨類似“雙十一”等促銷活動(dòng)時(shí),對(duì)RMFS的運(yùn)作效率和服務(wù)質(zhì)量都是極大的挑戰(zhàn),因此,研究求解大規(guī)模問題的智能優(yōu)化算法尤為重要。
3.6 RMFS與新一代人工智能的交叉研究
隨著通信和信息技術(shù)的發(fā)展,人工智能發(fā)展進(jìn)入了新階段,2017年7月國(guó)務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》將人工智能定位為國(guó)家戰(zhàn)略,明確指出“人工智能技術(shù)應(yīng)用成為改善民生的新途徑”、“人工智能成為帶動(dòng)我國(guó)產(chǎn)業(yè)升級(jí)和經(jīng)濟(jì)轉(zhuǎn)型的主要?jiǎng)恿Α薄?014年10月國(guó)務(wù)院發(fā)布的《物流業(yè)發(fā)展中長(zhǎng)期規(guī)劃(2014—2020年)》中將物流業(yè)定義為支撐國(guó)民經(jīng)濟(jì)發(fā)展的基礎(chǔ)性、戰(zhàn)略性產(chǎn)業(yè),而RMFS作為一種新型的智能物流倉(cāng)儲(chǔ)系統(tǒng),是智能物流的一個(gè)重要研究方向,也是我國(guó)物流業(yè)降本增效、產(chǎn)業(yè)升級(jí)的主要?jiǎng)恿?,其研究和?yīng)用離不開機(jī)器學(xué)習(xí)、多智能體、大數(shù)據(jù)、計(jì)算機(jī)視覺及自然語言處理等新一代人工智能技術(shù)的支撐。RMFS與新一代人工智能交叉的研究方向有: 1)基于深度強(qiáng)化學(xué)習(xí)(Deep reinforcement learning,DRL)的優(yōu)化研究。 強(qiáng)化學(xué)習(xí)能夠解決無模型序列決策問題,但在處理高維變量問題時(shí)常常會(huì)面臨巨大挑戰(zhàn),而深度學(xué)習(xí)則具備從高維變量中自動(dòng)學(xué)習(xí)表征的能力,DRL則將這兩者結(jié)合起來,為RMFS這類復(fù)雜高維問題的決策和優(yōu)化提供了端到端的解決方案,讓RMFS在需求多變的復(fù)雜環(huán)境中高效完成任務(wù);此外RMFS是一個(gè)典型的多Agent系統(tǒng),這些Agent之間相互合作或競(jìng)爭(zhēng),單一Agent系統(tǒng)無法滿足RMFS系統(tǒng)決策的需要,因此可進(jìn)一步基于多主體的深度強(qiáng)化學(xué)習(xí)(Multi-agent deep reinforcement learning,MARL)研究RMFS,對(duì)RMFS系統(tǒng)中Agent之間的感知發(fā)現(xiàn)、知識(shí)獲取、競(jìng)爭(zhēng)合作以及演化進(jìn)行深入研究,這將成為RMFS智能優(yōu)化的研究熱點(diǎn)[128]。 2)RMFS機(jī)器人操作技能學(xué)習(xí)研究。 RMFS機(jī)器人在完成揀貨和上架任務(wù)時(shí),需要執(zhí)行移動(dòng)、避障、抓取、放置、拆垛與碼垛等一系列復(fù)雜的動(dòng)作,RMFS機(jī)器人的操作技能、執(zhí)行動(dòng)作的精確度和效率是RMFS高效運(yùn)行的關(guān)鍵,目前機(jī)器人技能大多通過人工預(yù)定義的規(guī)則實(shí)現(xiàn),無法應(yīng)對(duì)動(dòng)態(tài)復(fù)雜的物流場(chǎng)景,讓RMFS機(jī)器人通過與環(huán)境交互得到經(jīng)驗(yàn)數(shù)據(jù),從經(jīng)驗(yàn)數(shù)據(jù)中自主學(xué)習(xí),一方面可以讓RMFS機(jī)器人具有自我優(yōu)化的能力,同時(shí)讓RMFS的任務(wù)部署更加靈活和用戶友好。RMFS機(jī)器人操作技能自主學(xué)習(xí)涉及構(gòu)建機(jī)器人操作技能模型、設(shè)計(jì)學(xué)習(xí)策略等關(guān)鍵問題,已有文獻(xiàn)從動(dòng)力學(xué)與學(xué)習(xí)算法相結(jié)合、DRL等方面開展研究[129],后續(xù)研究可關(guān)注RMFS機(jī)器人高效學(xué)習(xí)和模型的可解釋,在此基礎(chǔ)上構(gòu)建RMFS機(jī)器人操作技能學(xué)習(xí)框架。 3) RMFS系統(tǒng)自主學(xué)習(xí)能力研究。 RMFS機(jī)器人在高度動(dòng)態(tài)、復(fù)雜多變的環(huán)境(商品裝卸、貨架搬運(yùn)以及各機(jī)器人動(dòng)態(tài)移動(dòng))下工作,經(jīng)常會(huì)出現(xiàn)碰撞、失效、電量不足等突發(fā)情況,如何使RMFS機(jī)器人在長(zhǎng)期運(yùn)行中與復(fù)雜多變的環(huán)境相適應(yīng)是RMFS的一個(gè)研究熱點(diǎn),這方面涉及到RMFS機(jī)器人的環(huán)境地圖構(gòu)建與動(dòng)態(tài)維護(hù)、重定位及動(dòng)態(tài)場(chǎng)景感知與理解等基礎(chǔ)任務(wù)能力的研究。在RMFS的環(huán)境表征的研究方面,可基于數(shù)據(jù)融合與信息增強(qiáng),通過多層次傳感器數(shù)據(jù)融合得到的環(huán)境信息來提升RMFS環(huán)境表征能力,為RMFS機(jī)器人提供更可靠的決策信息,在此基礎(chǔ)上利用DRL的方法在RMFS機(jī)器人與環(huán)境的交互的基礎(chǔ)上進(jìn)行學(xué)習(xí),提升RMFS機(jī)器人自主環(huán)境適應(yīng)能力,這需要解決機(jī)器人基于在線獲取的弱標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)這一問題,它是使RMFS機(jī)器人具有長(zhǎng)期自主環(huán)境適應(yīng)能力的關(guān)鍵;在場(chǎng)景感知與理解方面建議基于深層次語義信息挖掘來獲取RMFS場(chǎng)景中物體間的屬性關(guān)聯(lián),來提升RMFS移動(dòng)機(jī)器人場(chǎng)景認(rèn)知能力[130]。 4)基于計(jì)算機(jī)視覺技術(shù)和自然語言處理的優(yōu)化研究。 近年來,機(jī)器視覺和自然語言處理研究均取得了重大的理論突破,并分別成功地運(yùn)用于自動(dòng)駕駛和機(jī)器翻譯等領(lǐng)域,計(jì)算機(jī)視覺技術(shù)可提升RMFS機(jī)器人識(shí)別商品的準(zhǔn)確度;基于語音識(shí)別的人機(jī)交互技術(shù)可提升揀貨效率,例如RMFS機(jī)器人通過語音與揀貨員(補(bǔ)貨員)交互降低揀貨(補(bǔ)貨)差錯(cuò)。 5)基于大數(shù)據(jù)的優(yōu)化研究。 大數(shù)據(jù)是實(shí)現(xiàn)智能決策的重要支撐,大數(shù)據(jù)分析可實(shí)現(xiàn)客戶畫像構(gòu)建、商品銷售分析以及RMFS系統(tǒng)存儲(chǔ)決策優(yōu)化,因而是RMFS優(yōu)化研究的重要方向,例如可利用數(shù)據(jù)挖掘的聚類和關(guān)聯(lián)規(guī)則等算法得到商品銷售頻率和需求關(guān)系性,來優(yōu)化RMFS的訂單分批和貨位指派。
04? 結(jié)論
RMFS作為一種新型的“物至人”揀貨系統(tǒng),相比傳統(tǒng)揀貨系統(tǒng)具有揀貨效率高、柔性強(qiáng)等諸多優(yōu)勢(shì),隨著電子商務(wù)的迅猛發(fā)展,RMFS已在物流行業(yè)取得成功的應(yīng)用,同時(shí)針對(duì)RMFS的優(yōu)化研究已成為熱點(diǎn)研究領(lǐng)域。 本文主要針對(duì)RMFS的貨位指派、訂單分批、任務(wù)分配、路徑規(guī)劃以及建模方法等問題進(jìn)行了文獻(xiàn)總結(jié)和述評(píng),并給出了未來的研究方向。 以上工作拋磚引玉,以期促進(jìn)RMFS揀貨效率的進(jìn)一步提升,使其更好地為電子商務(wù)的訂單揀選服務(wù)。
編輯:黃飛
?
評(píng)論
查看更多