苑嚴偉 孫國慶 劉陽春 王 猛 趙 博 汪鳳珠
(中國農業機械化科學研究院集團有限公司土壤植物機器系統技術國家重點實驗室,北京 100083)
近年來,冷鏈物流規模迅速發展[1]。冷鏈儲運環境的品質對貨物尤為重要,在眾多環境因子中,車廂內溫度和濕度為關鍵因素,異常的溫濕度環境會造成儲運環境內細菌滋生,污染貨物,從而嚴重影響貨物的品質。因此,研究高效、精準的冷鏈儲運環境監測方法是保證運輸物品安全和品質的重要前提。
目前國內外學者針對冷鏈監測進行了大量的研究[2-12],取得了一定的成果[13-16]。這些研究僅對冷鏈運輸當前環境因子實時監測,無法對環境因子的變化趨勢作出預判,只靠傳感器監測數據來決定制冷機組運行狀態,其數據采集的反饋與調控措施的生效都存在滯后性,致使冷藏車廂內的環境狀態低于臨界狀態時才進行補救,常造成經濟損失。通過試驗測試得到,在開啟制冷機組設備35 min后冷藏車廂環境可以得到明顯改善。因此,需要對冷藏車廂內環境因子變化提前預測,從而提前決定環境控制設備的運行狀態,實現環境優化控制、降低控制滯后效果。
近年來深度學習因其可以實現高維函數的逼近,并具有強大的函數映射能力,逐漸成為研究熱點[17-22]。在眾多深度學習算法中,長短時記憶神經網絡(LSTM)作為循環神經網絡的特殊變種,被廣泛地應用到各個領域,文獻[23]提出了基于主成分分析和LSTM神經網絡的水產養殖溶解氧預測模型;文獻[24]提出了基于LSTM和XGBoost的超短期電力組合預測模型;文獻[25]利用長短期記憶神經網絡預測某柴油機的NOx排放。LSTM神經網絡對于時序數據能夠很好地建模,適宜解決冷鏈環境溫濕度預測問題,能夠有效提高預測精度。
因此,在前人研究的基礎上,本文提出并構建基于K-medoids和LSTM的冷鏈運輸多步預測模型,該模型首先利用K-medoids算法將歷史溫濕度數據進行空間數據融合,然后采用LSTM網絡構建溫濕度變化預測模型,以此實現冷鏈儲運環境溫濕度變化的準確預測。
本試驗于舟山興業集團的大型重卡冷藏車內進行,冷鏈運輸路線:浙江省舟山市—北京市大興區。所選冷藏車長為14 m、寬為2.3 m、高為2.5 m,廂體材料為聚氨酯隔溫材料,運輸食品為舟山帶魚、梭子蟹。結合車廂大小、已有制冷設備和貨物擺放情況,選取15個點位安裝傳感器,具體分布示意圖如圖1所示。

圖1 傳感器分布示意圖Fig.1 Diagram of sensor distribution
采用自行設計的冷鏈運輸遠程監測系統獲取試驗冷藏車廂溫濕度數據,進行實時在線采集,其系統構架如圖2所示。

圖2 系統構架圖Fig.2 Structure diagram of monitoring system1.云服務器 2.基站 3.4G dtu 數據傳輸單元 4.溫濕度采集節點 5.北斗定位系統 6.車載終端 7.PC終端
試驗時間為2020年11月15日—12月13日,設定每1 min采集1次數據,24 h連續采樣。溫度傳感器測量范圍-40~60℃,測量精度±1℃,相對濕度傳感器測量范圍0~99%,測量精度±5%,因篇幅有限,僅展示2020年11月19日采集的部分原始數據,如表1所示。

表1 2020年11月19日采集的部分原始數據Tab.1 Part of experimental original data collected on November 19th,2020
采集節點長期處于低溫環境下,會使得傳感器在數據采集過程中發生偏差,傳感器精度會受到影響。同時,傳感器網絡的數據傳輸也會產生數據的丟包,這些問題都會造成數據的缺失異常,因此針對短時數據的缺失采用線性插值法對數據進行修復預處理,得到高質量的數據集。同時對各數據項進行歸一化處理,為接下來的數據處理提供基礎。
針對現有技術中無線傳感器感知數據量大、數據冗余度高,為減少數據的模糊性和不確定性,使用K-medoids算法進行空間數據融合。K-medoids算法是K-means(K均值)算法的一種改進聚類算法,K-means算法求取的是簇中“平均數”,而K-medoids算法求取的是簇中“中位數”,因此,K-medoids算法對于噪聲和孤立點更具有魯棒性[26]。通過使用K-medoids算法將溫濕度序列進行空間數據融合,實現數據維度壓縮和降低數據冗余,并且提高數據的準確性,以融合后的溫濕度時間序列代表整個冷藏車廂的溫濕度狀態,并以此構建預測模型的輸入時間序列樣本。

數據融合的基本思想是:在n個采集周期中,m個采集節點,將每個采集周期的數據設定為一個數據集合,從每個數據集合中找出1個數據中心點,以該中心點代表本次采集周期的所有數據。在實際應用中,以溫度數據融合為例,K-medoids數據融合算法步驟如下:
(2)在每個采集周期中,先隨機選擇一個中心點稱為tcenter,其他數據點稱為非中心tnon-center,然后隨機選取本周期中的非中心tnon-center不斷與中心點tcenter進行替換,成為新的中心,計算每次替換后中心點與其他非中心點的絕對差值和(Sum of absolute difference,SAD)。
若替換后的SAD小于替換前的SAD,則此次替換是更優的替換,原來的中心點將被此次的非中心點替換。算法迭代執行替換操作直到找到使SAD最小的一個節點,成為本次采集周期最終的中心點Oi。
(3)對每個采集周期進行步驟(2)計算,獲取一條時間序列(O1,O2,…,Oi,…,Om),以此來代表m個采集節點n個采集周期的溫度融合數據,相對濕度數據融合同理。
算法示意圖如圖3所示。

圖3 K-medoids數據融合示意圖Fig.3 Diagram of K-medoids data fusion
長短時記憶網絡(Long short-term memory,LSTM)是一種循環神經網絡(Recurrent neural network,RNN)的特殊類型,可以避免長期依賴的問題,通過設立門控機制,使其選擇性地存儲信息,以此來實現信息的保護和控制,其結構如圖4所示,本文利用長短時記憶網絡對融合后的時間序列(O1,O2,…,Oi,…,Om)進行預測分析[25-26]。

圖4 LSTM網絡結構Fig.4 Structure of LSTM network
LSTM擁有3個門,即輸入門、輸出門、遺忘門,以此決定每一時刻信息記憶與遺忘。輸入門決定有多少新的信息加入到細胞當中,遺忘門控制每一時刻信息是否會被遺忘,輸出門決定每一時刻是否有信息輸出[27-28]。
長短時記憶網絡計算公式為
ft=σ(Wf[ht-1,xt]+bf)
(1)
it=σ(Wi[ht-1,xt]+bi)
(2)
(3)
(4)
Ot=σ(W0[ht-1,xt]+b0)
(5)
ht=OttanhCt
(6)
式中it、ft、Ot——輸入門、遺忘門、輸出門
xt——t時刻的輸入值
σ——Sigmoid激活函數
Wi、Wf、W0——輸入門、遺忘門、輸出門權重
WC——候選向量權重
bf、bi、b0——輸入門、遺忘門、輸出門偏置
bC——候選向量偏置
Ct——t時刻的候選向量

ht、ht-1——t、t-1時刻模型的所有輸出
本文利用LSTM神經網絡預測多步溫濕度數據,采用遞歸預測策略,網絡結構為一輸入一輸出,訓練時輸入與輸出間隔一個時間步長,對網絡進行訓練、優化權重參數后,在每次計算時,使用上一次計算得到的預測值作為本次網絡的輸入值,獲取新的預測值,通過迭代計算得到多步預測值,獲取未來一段時間的溫濕度變化。
為提高預測模型的精度,將K-medoids算法和LSTM模型進行有機結合,構建了基于K-medoids和LSTM的冷鏈運輸多步預測模型。其基本思想為首先對冷鏈運輸環境數據進行修復處理,其次利用K-medoids算法作為長短時記憶網絡的前置數據處理系統,對冷鏈運輸環境溫濕度數據進行空間數據融合,簡化長短時記憶網絡預測模型結構,隨后對預測模型進行訓練和預測,獲得最終預測結果,有效提高了組合預測模型的預測精度。預測流程如圖5所示。

圖5 基于K-medoids和LSTM的冷鏈運輸環境預測方法流程圖Fig.5 Flow chart of environmental prediction method for cold chain transportation based on K-medoids and LSTM
冷鏈運輸環境溫濕度預測具體步驟為:
(1)設計試驗方案,通過冷鏈運輸遠程監測系統在線采集冷藏車廂內環境時間序列數據。
(2)對數據進行清洗,剔除重復、異常數據,補充缺失數據。
(3)采用K-medoids算法進行數據融合,消除冗余信息,降低神經網絡模型輸入參數的維度,精簡預測模型結構。
(4)對融合后的數據進行標準化,并劃分相應的訓練集和測試集。
(5)初始化LSTM神經網絡模型參數,將訓練集輸入至模型中,模型通過不斷進行參數優化,直至模型準確率達到最高或達到既定訓練輪數時為止。
(6)輸入測試集測試模型的精確度,通過模型的評價指標表,與其他模型進行對比,得出最優的冷鏈運輸溫濕度預測模型。
為了評價模型的預測效果與精度,選用均方根誤差(Root mean squard error,RMSE)、平均絕對誤差(Mean absolute error,MAE)以及平均絕對百分比誤差(Mean absolute percentage error,MAPE)3個指標對其進行評價,MAE、RMSE、MAPE越小,表明模型的預測效果更加精準。
3.1.1數據源
以某冷藏車內的溫濕度為研究對象,采用1.2節的冷鏈運輸遠程監測系統,試驗選取2020年11月17日16:00—19:20的15個采集節點獲取溫濕度數據,采用已經預處理過的試驗數據。最終實現1 h后的溫濕度預測,在線采集到的6 000條樣本數據為數據源,利用交叉驗證法驗證和測試模型性能。
3.1.2試驗平臺
試驗所使用的計算機硬件配置如下:處理器為Intel(R)Core(TM)i5-1035G1 CPU 1.00 GHz,內存16 GB(Samsung DDR4 3 200 MHz),操作系統為Windows 10(x64),GPU顯卡NVIDIA GeForce MX350 2GB。程序設計語言為Matlab(64-bit),集成開發環境為Matlab 2019a。
3.2.1數據融合結果
使用K-medoids算法對數據進行融合試驗,并將K-means算法作為對比算法。在數據采集和傳輸過程中會產生“垃圾”數據,如圖6a所示,在溫度原始數據中存在一個異常點,被圓圈標出,若在有異常點的采集周期中,采用K-medoids算法計算時,異常點的數值相較于其他簇內數據點較大,根據K-medoids算法取最小的點作為中心點這一規則會忽略掉異常點,而K-means算法會計算本次采集周期數據的平均值,會受到異常值的干擾。兩種算法的融合結果如圖6c所示,K-means算法異常計算結果用圓圈標出,所以K-medoids算法呈現更強的魯棒性,融合后的變化規律更加明顯,故本研究選擇K-medoids算法對溫濕度數據進行融合。

圖6 溫濕度原始數據及融合結果Fig.6 Raw temperature and humidity data and fusion results
3.2.2LSTM神經網絡預測結果
在K-medoids數據融合的基礎上,將融合后的數據按照7∶3比例劃分為訓練集和測試集,作為LSTM神經網絡的輸入,建立K-medoids結合LSTM冷藏車廂溫濕度預測模型。采用Adam算法進行優化,迭代次數為250次,其中輸入層節點數為1,輸出層節點數為1,5次試驗所對應的隱含層節點數、學習率和時間步長如表2所示。圖7為訓練后的誤差曲線和預測趨勢圖。

表2 預測模型參數對比Tab.2 Comparison of prediction model parameters
從圖7中可以看出,試驗1和3的溫度預測精度較高,試驗1和2的相對濕度預測精度較高,而試驗4和5溫濕度預測誤差波動較大。但從整體來看,各組試驗的預測結果總體趨勢與實際值較吻合。

圖7 K-medoids-LSTM模型的誤差曲線和預測趨勢Fig.7 Error curves and prediction trend of K-medoids-LSTM model
為了更加直觀比較預測模型的誤差,表3為5次試驗后得到的預測模型的平均相對誤差、平均誤差百分比和均方根誤差。從表3可以看出,試驗1最終取得的預測性能最好,溫度的MAE、MAPE、RMSE分別達到了0.273 0℃、1.51%、0.343 8℃,相對濕度的MAE、MAPE、RMSE分別達到了1.995 6%、3.53%、2.561 9%。此外,預測模型的整體預測精度較為理想,溫度MAE、MAPE、RMSE分別達到了0.752 6、4.12、0.629 7℃,相對濕度的MAE、MAPE、RMSE分別達到了2.874 5%、5.07%、3.385 7%,說明了K-medoids算法結合LSTM神經網絡預測模型具有較為理想的泛化能力。

表3 不同參數下預測誤差Tab.3 Prediction error under different parameters
3.2.3模型比對
本文設置了對照試驗。將K-medoids-RBF神經網絡、K-medoids-BP神經網絡、K-medoids-Elman神經網絡作為參照模型,分析和對比K-medoids-LSTM對預測性能的影響。各模型的預測值與真實值對比結果如圖8所示,各模型的誤差如表4所示。圖8顯示,各預測模型均能在不同程度上較好地實現冷藏車廂溫濕度的預測,溫濕度的預測變化趨勢與實際變化趨勢較為一致,但預測效果存在一定的差異。就整體預測結果而言,K-medoids-LSTM的預測結果比其他模型的擬合結果效果更好,變化起伏更小,預測效果更穩定,全局無較大起伏的波動點。結果表明提出的K-medoids和LSTM神經網絡預測模型的預測精度高、泛化能力強,能夠準確掌握冷藏車廂內未來1 h溫濕度的變化,達到了比較理想的預測效果,可以為調控提供策略依據。

圖8 各模型的預測結果Fig.8 Prediction results of each model

表4 不同預測模型的預測性能對比Tab.4 Comparison of prediction performance of different models
由表4可知,K-medoids-LSTM模型與K-medoids-RBF模型相比,溫度的MAE、MAPE、RMSE分別降低了55.9%、54.9%、55.4%,相對濕度的MAE、MAPE、RMSE分別降低了13.6%、8.5%、21.4%;與K-medoids-BP模型相比,溫度的MAE、MAPE、RMSE分別降低了59.8%、59.2%、55.4%,相對濕度的MAE、MAPE、RMSE分別降低了25.4%、25.2%、18.2%;與K-medoids-Elman模型相比,溫度的MAE、MAPE、RMSE分別降低了74.3%、74%、73.2%,相對濕度的MAE、MAPE、RMSE分別降低了41.9%、40.3%、38.5%。
從總體來看,K-medoids-LSTM組合預測模型的各項指標都優于其他預測模型,能更準確地預測冷鏈儲運環境溫濕度變化規律和變化趨勢。
(1)采用K-medoids算法對冷鏈運輸環境溫濕度數據進行數據融合,降低了模型輸入的維度,減小數據的模糊性和不確定性,有利于提升LSTM預測精度和穩定性。
(2)提出的K-medoids-LSTM模型能夠預測冷藏車廂內未來1 h溫濕度變化趨勢,預測精度和穩定性較高,優于傳統的BP、RBF、Elman神經網絡等淺層模型,解決了傳統預測方法預測精度低、魯棒性差等問題。