王 煜,徐 彥,方 偉,王 亮
(1.中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 10081;2.中國鐵路總公司,北京 100844)
近年來,隨著高速鐵路(簡稱:高鐵)投資建設的持續高位運行,鐵路運輸企業面對的經營成本壓力越來越大;同時,鐵路旅客運輸市場供給側改革不斷深化,對發展質量的要求越來越高。鐵路運輸企業通過增強市場營銷能力,提高鐵路在全社會客運市場的份額,爭取更大的經濟效益成為必然選擇。此外,市場營銷的關鍵在產品和價格,就價格而言,通過擴大價格浮動空間,豐富價格調節手段,對滿足各類旅客需求、發揮價格對客流“削峰填谷”的作用,促進鐵路客流長期穩定增長有著極為重要的意義。長期以來,由于受到歷史、政策等多重因素影響,鐵路客運票價基本保持固定,很少浮動,很難獲得由于票價實際變動對旅客出行影響的準確、具體、可量化的數據,因而,既有研究價格對鐵路旅客出行選擇的影響這一命題更多是采用模擬推算、模型估計等方法,比如:張嵐等人[1]建立廣義費用函數,結合Logit模型,分析客票收入、客流分擔率、票價之間的關系,進而在鐵路公司收入最大化的基礎上,建立浮動定價模型,用逐步逼近法確定客流高峰期與非高峰期收入最大時的票價。曹國紅等人[2]基于差別定價模型研究了不同方案下鐵路旅客運輸邊際成本的差異;四兵鋒等人[3]利用靈敏度分析方法,分析鐵路票價的變動對客流量的影響,說明如何得出不同運輸方式條件下,鐵路客流量與旅客票價之間的相互關系;Ferrari P.[4]在彈性需求和能力約束條件下討論城市交通網的收費問題;高紅麗等人[5]利用 Logit 模型組合成效用函數,分析并得出模型參數,估算出鐵路的客運分擔率。
從中國近幾年交通運輸方式的發展來看,在中短途客運市場,鐵路面臨的主要競爭對手是公路運輸和自駕;在中長途運輸市場又面臨航空的激烈競爭,不同運輸方式間替代效應也越來越強,在短期內,各種運輸方式的方便性、舒適性、安全性等硬件條件因素變化較小,運行時間和票價成為左右旅客出行方式選擇的兩個重要影響因素。高鐵動臥雖然平均運行時間長于航空,但充分運用了“夕發朝至”的特點,所以旅行時間上與航空各有優劣,而高鐵動臥票價與航空折扣票價差距較小,甚至有時比同區段航空票價略高,因而高鐵動臥票價制定的科學性、針對性,以及浮動的靈活性就在一定程度上決定了與航空競爭的最終結果。
目前,高鐵動臥開行方向有京滬方向,京廣方向,京昆方向,滬西方向,滬昆方向。從2018年起開始實施動態化票價機制,進行靈活的浮動和調整,為獲得通過票價變化對旅客出行選擇影響的實證數據提供了可能。本文從分析動臥旅客對價格的敏感度出發,即通過調價前后旅客出行的頻次、購買動臥票價的金額、購票提前時間這3個指標的同比變化,對旅客出行選擇結果進行標識和衡量,分析旅客對于票價敏感度的強弱,并最終對動臥旅客群體進行識別和分類,為今后價格浮動提供參考依據。
過濾掉因為偶發原因乘坐高鐵動臥的旅客,以某時間段內乘坐高鐵動臥列車4次及以上的旅客作為樣本對象,計算每名旅客乘車次數同比幅度、平均每次購票金額的同比幅度、平均每次購票提前時間同比幅度這3個指標,并將這3個指標進行標準化處理,消除量綱的影響。
1.2.1 K-means聚類算法
K-means聚類算法是聚類算法的一種,將n個數據對象劃分為k個聚類,以便使得所獲得的聚類滿足條件:同一聚類中的對象相似度較高;不同聚類中的對象相似度較小。主要過程如下:
(1)隨機選取k個中心點;
(2)設置距離判別準則,將每個數據按照距離遠近劃入中心點中;
(3)計算每類的中心值,作為每類的新的中心點;
(4)重復以上過程,直到k個中心點不再變化,或者迭代次數達到閾值。
1.2.2 BP神經網絡
基于樣本特征值進行的判別分類有很多,本文選擇BP神經網絡。BP神經網絡算法已經在實際分類計算問題中得到了有效利用和驗證,具有較強的自我學習和自適應能力,再加上閾值函數的引用,具有非線性表達能力。BP神經網絡將輸出層的結果與期望值的誤差平方和作為整個神經網絡的誤差函數,根據誤差結果反向傳播,從輸出層、隱藏層、輸入層采用不同的形式對權值和偏移量進行調優。BP神經網絡在反向傳播中使用附加動量的梯度下降法,對調整之后的權重和偏移量進行正向傳播,計算出預測值,當誤差大于所設定的閾值時,則再次通過反向傳播進行參數調整,最終通過迭代使預測輸出逐漸收斂于期望輸出,即模型計算誤差小于給定的閾值后停止迭代。BP神經網絡主要結構如圖1所示。

圖1 BP神經網絡結構
正向傳播過程公式為:

式(1)為輸入層至隱藏層計算過程,X0,X1,X2為樣本的 3個特征值(指標),Wij(i=1,2,3)為權重,b為偏移量,Sj為對應隱藏層第j個節點的輸入,且經過式(3)的非線性變換;式(2)為隱藏層至輸出層過程,Vij(i=1,2,3)為權重,Oj為對應輸出層第j個節點的輸入,且同樣經過式(3)的非線性變換,最終輸出結果與預測值進行誤差計算(誤差平方和),并根據誤差結果反向傳播調整各層的權重和偏移量,直至誤差小于事先設置的閾值,停止迭代更新;式(3)為設置的tanh函數,其值域為[-1,1],用于輸出結果的非線性變換。
1.2.3 價格敏感度計算過程
為計算高鐵動臥旅客對票價變動的敏感度,以上述3個指標作為出行行為的特征值對樣本數據進行聚類,采用K-means聚類算法將樣本值聚類為兩類,為兩類群體進行價格敏感度的數字化賦值,即旅客出行行為變動較大的一類樣本是對價格較敏感(價格敏感度高)的群體,為這部分旅客樣本賦值為1,而對另一類旅客樣本賦值為-1。無監督的樣本數據經過聚類轉化為有監督樣本數據,作為訓練樣本代入BP神經網絡。利用BP神經網絡對所有選取的旅客群體進行價格敏感度的計算、標識和分類。具體過程如圖2所示。

圖2 高鐵動臥旅客價格敏感度計算、識別、分類過程
將動臥旅客按照其價格敏感度分類的關鍵是對該名旅客進行識別和評價得分,利用K-means作為前導算法進行預處理,其目的是將無監督的樣本數據轉化成有監督的樣本數據,這樣便完成了對旅客樣本的標識和評分,避免在BP神經網絡訓練中因樣本大而引發的網絡結構復雜、收斂性差、泛化能力低等問題。最終,以訓練后的BP神經網絡對所有動臥旅客樣本進行價格敏感度計算[6-7],并根據計算結果進行分類和識別。
根據前文數據選擇與預處理的要求,選取部分高鐵動臥旅客樣本,采用python進行K-means聚類,結果分為兩類:(1)出行行為變化較大的旅客類別賦值為1;(2)出行行為變化較小的旅客類別賦值為-1。將經過K-means聚類后的動臥旅客數據帶入BP神經網絡進行訓練,設置誤差閾值為0.000 1,通過反向傳播確定權值和偏移量,得到最終的BP神經網絡,利用該神經網絡對所有的樣本數據進行價格敏感度計算,對每位旅客在調價前后出行行為的變化做出評價,給予最終得分,得分分布在[-1,1]范圍內,得分越接近1,表明該旅客在動臥票價開始動態化定價后乘坐高鐵動臥列車頻次、購買高鐵動臥票價金額、提前購買車票時間等出行行為同比變動越大,說明其出行行為對價格敏感度越高。反之,得分越接近-1,說明該旅客對價格敏感度越低。
根據日常工作經驗,當該名旅客得分高于0.9時應歸入價格敏感度高的旅客群體,當得分低于-0.5時應歸入價格敏感度低的旅客群體,當得分介于-0.5與0.9之間時,該名旅客屬于對價格敏感度模糊的群體,因而把所有動臥旅客樣本分為上述3類。此外,由于過程存在隨機性,對所有動臥旅客樣本進行多次計算,取每類群體占比的均值來代表最終分類結果,如表1所示。

表1 動臥旅客價格敏感度最終分類結果
根據表1的結果,高鐵動臥旅客對價格敏感度得分主要集中在小于-0.5和大于0.9兩個區間,合計占全部動臥旅客的84%,其中,價格敏感度高的旅客群體占總體的25%左右,即高鐵動臥列車實行動態價格浮動政策后,約25%經常乘坐高鐵動臥的旅客出行行為發生較大變化,證明了價格因素對這部分旅客群體的出行決策有很大影響。
隨著近年來鐵路事業的快速發展,鐵路票價定價權限和定價機制也逐漸朝著市場化目標接軌。根據客流情況動態調整票價水平,使票價能夠及時、準確反映鐵路旅客運輸市場的供需情況,滿足各層級旅客消費需求,對提高鐵路企業的經營效益具有重要意義。
就本文研究對象高鐵動臥旅客群體而言,高鐵動臥列車擔當局在綜合考慮同區段航空價格、所處客流周期的基礎上實施“一日一價”的動態票價措施,能夠顯著影響25%左右的動臥旅客出行行為,即通過實施靈活浮動的票價政策可以達到“在客流低谷刺激需求,在客流高峰平抑需求”的目標。
如果某類運輸產品所針對的旅客群體中價格敏感度越高,或者某條線上價格敏感度較高的旅客占比越高,則通過價格手段達到“削峰填谷”,提高經營效益的目標越容易實現,且相比其他措施和手段,價格手段更高效。
可以針對性地推出票價在預售期內動態調整的價格措施以滿足購票提前時間變化顯著的那部分旅客群體需求,這同樣可以減少客流波動性,提高列車開行效益。
長期以來,我國鐵路客運票價浮動機制不靈活,不能完全反映供求關系,不利于鐵路充分發揮運力大、占地少、能耗低、污染小、安全性高的競爭優勢。但隨著鐵路改革朝縱深推進,高鐵建設運營規模不斷擴大,相應運輸產品票價也在逐步擴大浮動區間和范圍。使用價格杠桿實現“削峰填谷,穩定客流”,助力增運增收也越來越成為共識和下一步工作的方向。對旅客價格敏感度進行評分計算,并在此基礎上實現旅客群體分類可以廣泛應用于新線開通票價制定,既有線票價浮動測算,豐富常旅客營銷手段,預售期票價折扣實施等方面,不僅有助于科學、合理地制定價格浮動區間與時點,調節票價水平,也有助于更準確地識別旅客群體的差異化需求,提供針對性運輸產品服務;更有助于豐富現有的客運營銷手段和客運產品種類,保障客運提質計劃的順利完成[8]。
