張智勇 吳宣達
華南理工大學電子商務學院
高值醫用耗材是直接作用于人體、風險高、對安全管理方面有嚴格要求且價值相對較高的醫用耗材[1]。醫療機構進行醫療耗材管理時,較為常見的方式是根據醫療耗材單位價值的高低,將醫療耗材分為高值耗材和低值耗材,采用不同的管理流程[2]。以往對高值耗材的需求預測通常采用時間序列預測法、季節指數平滑指數模型和ARIMA預測模型,近期有學者使用神經網絡[3]進行預測分析。這些預測方法本身存在一定的局限性。
時間序列預測法、季節指數平滑法以及ARIMA預測模型是[4]根據變量自身過去的變化規律預測未來的變化。這些方法要求時間序列具有穩定的變化趨勢,對于不確定需求的預測的可信度較差。神經網絡法[5]需要考慮預測對象自身的多個數字屬性進行分析,而在實際情況中,高值耗材供應商關于高值耗材數據中數字型屬性通常較少,不滿足高值耗材領域預測需求。
本文對高值耗材領域進行分析,基于實際需求手術包商品組合的特點,使用關聯分析挖掘商品組合,并根據商品組合特點對特定高值耗材銷量進行預測分析。
Apriori算法是常用的關聯規則算法,是一種通過逐層搜索實現的迭代方法。其核心思想通過迭代產生候選項集,再通過對候選項進行剪枝產生頻繁項集。
給定一數據集I={i1,i2,…,id}為購物籃數據中所有項的集合,而T={t1,t2,…,tN}是所有事務的集合。每個事務ti包含的項集都是I的子集。令Ck為候選k-項集的集合,而Fk為頻繁k-項集的集合,Ck中的每個元素需在交易數據庫中根據其是否滿足給定的最小支持度來決定其是否可以加入LK,然后遵循下圖算法操作。

圖1 Apriori算法思想
商品組合挖掘的迭代過程中需要設置的算法:
(1)規則置信度XYC→。表示在出現X的條件下出現Y的概率。規則置信度高,則表示Y關于X的條件概率高,規則的可信度高。其數學表達式為:
(2)規則支持度XYS→。表示X、Y同時出現的概率。以丨T丨表示總事務數,其數學表達式為:
(3)頻繁項集B(A)。指包含項目A的項集B,其支持度大于設定的最小支持度,即
本文使用控制變 量法進行合理設置。若設置最小置信度過高,會導致商品關聯組合為常規組合,組合中商品數目過小,不利于進行關聯分析。若最小置信度過小,會導致商品關聯組合將相關度不高的商品也輸出到商品組合中,導致組合中商品數目過大,不利于進行關聯分析,同時也會大大增加了信息搜尋成本,給之后的預測算法的設置增加難度。
2.組合組數的設置
設定最小置信度后,實驗取其中商品組合中數目最多的組合來進行預測,因為在一定的關聯度規則中,關聯信息越多,預測精度就越準確。
通過實地考察和對相關專業人員的咨詢發現,高值醫用耗材銷售物流與傳統商品物流有所不同,通常有正向物流和逆向物流兩個過程。當醫院需要進行手術,醫院方會將需求發送給醫院代表或相關聯系人。醫院代表或相關聯系人根據需求制作訂單并將訂單發送給供應商。供應商根據訂單需求進行緊急備貨并打包成手術包進行配送。醫院方消耗手術包中部分醫療器械,在手術完成后將經過部分消耗的手術包返還給供應商。
手術包本身即為商品組合(見圖2)。正向物流的手術包是基于歷史銷售訂單來進行備貨的,而通過分析逆向物流的手術包可以挖掘高值醫用耗材實際消耗情況。本文針對高值耗材的商品特性,通過正向物流和逆向物流兩個方面進行需求預測分析。

圖2 醫用高值耗材銷售過程
商品組合中商品間存在關聯性,以其中一個商品作為預測的對象,以其他的商品銷售數據作為預測對象的銷量影響因子,得出預測對象預測結果。
設關聯分析后商品組合為F={x1,x2,x3,…,xn},第i個商品銷售數據為Dxi={d1,d2,…,dm},指定xj作為預測對象,以{d1,d2,d3,…,dj-1,dj+1,…dm}作為輸入變量,以dj作為輸出變量,使用相關算法進行預測分析(見圖3)。

圖3 商品組合預測
本文分別使用簡單線性回歸、多元線性回歸和BP神經網絡對商品組合銷量進行預測分析。取損失函數作為衡量預測結果好壞的依據。本文設置銷量預測的損失函數為Lquad(f(x)-y)=(f(x)-y)2,對應于在最小平方誤差標準ESS。
本研究選取實際深圳市某醫藥供應商2021年1月—10月醫用高值耗材歷史銷售訂單數據進行數據分析,其中包含歷史銷售訂單5043份(其中同一個訂單有借出和歸還兩種操作),借出或歸還銷售記錄共91700條,包含醫用物料378種,商品編碼類型2108種(見表1)。

表1 醫用高值耗材歷史銷售記錄原始數據類型
基于商品組合的高值耗材需求預測的步驟為:
(1)對銷售歷史數據進行分析處理。基于正逆向物流將操作分別為借出和歸還的訂單分類整理,并以物料名稱屬性作為鍵進行區分,最后再以“月”為單位,對每種醫用物料的銷售日期進行處理;
(2)對處理后歷史銷售訂單信息中的高值耗材組合進行分析,使用Apriori算法挖掘高值耗材組合中的關聯性,并根據關聯性挖掘提取新的商品組合。
(3)基于挖掘出的商品組合,指定組合中一種高值耗材作為分析對象,運用相關算法(多元線性回歸、BP神經網絡)進行需求預測分析;
(4)對預測結果進行分析,并利用預測樣本對高值耗材商品未來銷量進行預測。本文分別用普通線性回歸方法、多元回歸方法和BP神經網絡方法對某醫藥企業某一類高值耗材的銷售量進行預測,并將三者預測結果進行比較(見圖3)。
在正向商品組合中,使用線性回歸的回歸平方誤差ESS為27547.89096,使用多元線性回歸的ESS為5917.228894,而使用神經網絡的ESS為3470。
在逆向商品組合中,使用線性回歸的回歸平方誤差ESS為4205503.194,使用多元線性回歸的ESS為22716.42768,而使用神經網絡的ESS為19477。

圖4 正向物流商品組合預測

圖5 逆向物流商品組合預測
無論是正向物流商品組合和逆向物流商品組合,神經網絡方法的預測精度最佳、而多元線性回歸方法的預測精度次之,而普通線性回歸方法的預測精度最差。
醫用高值耗材本身具有附加價值高、商品時效性強、需求不確定性明顯等特點,因此對醫用高值耗材的管理及需求預測成為急需研究的問題。Apriori算法是常用的關聯規則算法,其使用基于支持度的剪枝技術從數據集中有價值的數據組合,通過設置適當的支持度,可以對高值耗材手術包的組合進行優化。而實例證明,基于數據組合對單一高值耗材進行銷量需求預測時,神經網絡方法表現優于多元線性回歸方法,多元線性回歸方法優于普通線性回歸方法。后續可嘗試將本文的研究成果推廣到其他類型醫用耗材的庫存管理與采購策略制定中,以此優化醫用耗材供應商、分銷商以及醫院的庫存管理,在一定程度上減少不必要囤積或缺貨現象的發生,從而降低各個節點的運營成本,為醫院精細化管理提供科學的數據支撐。