

摘 要:與既有線普通鐵路線相比較,高鐵所吸引的旅客群體主要為高中端旅客,他們在旅行需求和心理存在較大的差異。本文以西成高鐵為例,對旅客進行大數據分析,旨在找出他們之間的關聯度,都有利于西成高鐵對當前的系統與服務進行改進,更好地提升用戶對西成高鐵服務的利用率。
關鍵詞:客運服務;心理需求;質量
一、引言
西成高鐵自2017年12月全面投入運營后,西部地區重慶、成都和西安三個主要城市之間距離被大大縮短,據中國鐵路總公司發布發消息,截至到2018年12月4日18時,西成高鐵客運專線所共開行的高鐵/動車列車達到了4.3萬趟,自該線路開通以來平均每天開行的列車約有117趟;發送的專線沿線旅客超過了1720萬人次,平均每天發送旅客數量達到了4.7萬人次。
二、基于K-means方法的西成高鐵旅客用戶行為與需求挖掘
1.數據獲取與數據處理
本研究于2018年11月和12月期間,收集了西成高鐵在該年的11月1日至11月30日鐵路客戶服務中心系統后臺日志數據,該系統的日志數據詳細記錄了旅客乘坐西成高鐵的出行及獲得相關服務的信息,如旅客證件信息、旅客進出站記錄、購票記錄、改簽及退換票記錄、接入網絡的IP地址及終端信息、乘坐車次、列車發車時間、旅客使用高鐵訂餐相關服務的記錄等。
2.數據分析流程
對西成高鐵旅客行為與需求進行挖掘和分析所采取的方法為大數據分析中常用的K-means算法,在具體執行該算法的過程中,考慮到西成高鐵旅客的用戶對象主要以學生、老人及各行各業的商務人士為主,用戶雖然具有比較大的異質性,但所設置的聚類簇數也不宜過多,否則會導致聚類效果較差。我們根據西成高鐵旅客用戶的大致分類情況,將擬采用的K-means算法所獲得的聚類簇數設置為6個,其具體分析過程包含原始數據獲取、數據篩選、高鐵服務使用類別數量、出行次數比較、使用增值服務的行為比重、使用一般服務的行為比重、數據類型設置、數據過濾、K-means聚類等環節。
3.聚類分析結果
本研究通過K-means聚類分析算法所得出的聚類分析結果如表2所示。由于將K-means聚類簇數設置為6個,我們可以因此獲得六個聚類結果。在這六個類中,聚類3僅包含兩個記錄,且該聚類下的增值服務使用次數、一般服務使用次數、活動次數、活動持續時間、利用西成高鐵服務數量的值均要遠大于其他五個類,說明聚類3所包含的26個記錄存在異常的情況,因此我們不需要對該類的相關信息進行更進一步的分析。
聚類1所包含了記錄數最多,記錄數占所有數據總量的18.57%,該類下聚集了大量用戶,共有8273個用戶,是包含用戶數最多的類該類用戶在數據采集期間在鐵路服務系統中的出行記錄數量平均值為3.025個,在出行過程中所包含的活動行為數量平均有55.764個,在所有類中處于中等水平,說明該類旅客用戶乘坐西成高鐵的行為活動及其使用相關服務的行為比較正常。該類旅客用戶使用西成高鐵一般服務的行為比重相對較低,這些旅客的增值服務使用次數、一般服務使用次數都處于比較中間的水平,說明這類用戶利用西成高鐵服務目的比較統一和集中,主要利用的是西成高鐵的某一個服務,通常主要是購票服務。總體來看,該類旅客用戶對西成高鐵服務的利用處于中等水平,其目的主要以購票為主,利用西高鐵提供的其他增值服務的次數并不高,因此西成高鐵可重點關注這類用戶在出行目的地及其在出行過程中的服務使用記錄,有針對性地為這些旅客推薦一些出行或休閑相關的信息,以使滿足這類旅客用戶的出行需求。
聚類2所包含的記錄數其次多,記錄數占到了所有數據總量的12.42%,該類下包含的用戶數量為4435個,是用戶數量其次多的類。在該類下使用智能設備的用戶數量比較并不算高,只有26%,說明該類用戶大多使用的是桌面端的設備接入到西成高鐵的鐵路服務系統。該類用戶使用西成高鐵的出行次數平均值為2.049次,比聚類1的出行次數相對要少,該類用戶一般服務使用的比重也比較高,達到了58%,該類旅客用戶的增值服務使用行為比重也不算低,達到了24.6%,要高于聚類1,說明該類用戶在使用高鐵一般服務的同時,也會發起比較多的增值服務行為。
聚類4和聚類5所包含的記錄數占所有數據記錄的比重分別為6.63%和4.27%,這兩類用戶屬于兩類行為相反的用戶群。其中,聚類4的用戶屬于以一般服務使用為主要目的,主要利用桌面端設備進行操作,會在鐵路服務系統中留下比較多的服務使用記錄,以獲取精確的服務項目的用戶群,該類用戶進行其他的情況相對較少;聚類5的用戶屬于更愿意利用鐵路服務系統中其他服務的用戶,這類用戶以利用智能設備為主。另外,聚類6的用戶在一般服務行為和增值服務使用行為的頻次上都不算,但其活動記錄的次數卻達到了117.54次,說明這類用戶喜歡比較喜歡漫無目的在鐵路服務系統進行相關無關操作,這類用戶利用西成高鐵出行的需求并不明確,需要為之提供必要的指導。
三、討論
總體來看,本研究運用K-means算法對西成高鐵旅客用戶的出行及其活動行為進行分析,揭示了西成高鐵旅客用戶行為與需求進行了挖掘。通過通過K-means算法進行聚類分析,我們得出了六個類:第1類用戶對西成高鐵增值服務的使用頻次并不高,因此西成高鐵可重點關注這類用戶在出行目的地及其在出行過程中的服務使用記錄,有針對性地為這些旅客推薦一些出行或休閑相關的信息,以使滿足這類旅客用戶的出行需求;第2類旅客用戶增值服務使用行為所占的比重相對較高,其桌面端的用戶占多數,這與本研究之前所得出的結論保持一致。針對這類用戶,西成高鐵在進行高鐵服務精確推送的同時,還可通過鐵種系統服務平臺與短信等渠道為其推薦更多的服務、資源供其選擇;第3類存在異常的情況,故而舍去;第4類和第5類用戶屬于兩類行為相反的用戶群,第4類的用戶屬于以一般服務使用為主要目的,主要利用桌面端設備進行操作,會在鐵路服務系統中留下比較多的服務使用記錄,而第5類的用戶屬于更愿意利用鐵路服務系統中其他服務的用戶,這類用戶以利用智能設備為主;第6類用戶一般服務行為和增值服務使用行為的頻次上都不算,這類用戶利用西成高鐵出行的需求并不明確,需要為之提供必要的指導。
另外,從西成高鐵旅客用戶數據聚類結果揭示的各項服務之間的關聯規則來看,車票查詢和自助售票兩項服務之間的關聯性最強,其次是列車運行和車票查詢兩項服務,再次是自助售票和自助檢票,說明旅客用戶利用西成高鐵出行最基本的幾項服務之間具有比較高的關聯性,并且也是置信度最高的幾項關聯規則。置信度比較高的關聯規則還有便捷通道和托運服務之間關聯規則,說明西成高鐵的許多旅客用戶在選擇通過車站提供的便捷通道進入候車區域后,還會選擇將使用車站提供的托運服務使自己享受到進一步的便捷服務。這些關聯規則的揭示,都有利于西成高鐵對當前的系統與服務進行改進,更好地提升用戶對西成高鐵服務的利用率。
參考文獻:
[1]趙淇.高速鐵路客運服務質量評價體系的研究[D].大連:大連交通大學,2017
[2]王莉莉.鐵路客運服務文化建設評價體系的研究[D].北京驕傲同大學.2018:75-83
[3]曹陽.世界健康調查項目中國預調查的測量方法及質量評估[J].復旦大學,2014(12):63-64
[4]張秀敏.旅客服務心理指標綜合評價方法[J].鐵道運輸與經濟,2015(10):35-39
[5]張秀敏.基于旅客心理需求的鐵路客運服務綜合評價模型研究[J].企業技術開發,2015(10):35-39
作者簡介:
魏寶紅(1979—)女,陜西西安市人,碩士研究生,西安鐵路職業技術學院交通運輸學院講師,研究方向:高鐵客運乘務。