吳濤 申騰飛 莊明軒 閆新男 段莉華



摘要:開放式收費停車場是解決城市道路管理和路邊規范停車的新型手段,停車場的管理運營公司常常面臨停車計時困難和收費率低等問題。為了降低成本和增加營收,運營公司需要對停車用戶分析行為進行建模和分析。本文通過分析開放式收費停車場的停車數量隨時間的變化,發現用戶的停車行為與用戶的通勤時間、日常作息時間和假期之間存在相關性。結合用戶行為的周期性特征,本文提出運營公司可以周期性地管理和維護停車場。基于RFM模型和K-means算法,本文實現對開放式收費停車客戶的準確分類,并挖掘用戶的潛在價值以最大限度地提高收入。
關鍵詞:開放式收費停車場;RFM模型;K-Means聚類
中圖分類號:TP37? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)17-0001-03
開放科學(資源服務)標識碼(OSID):
1 引言
隨著我國經濟水平提高,科技力量不斷增強,計算機性能、網絡技術不斷成熟提高,用戶行為分析[1]技術愈發成熟,傳統的商業模式正在被一個新的營銷模式—“數據化營銷”所替代,尤其是用戶行為分析技術在如今的商業領域的優勢十分明顯。信息化時代來臨使得數據焦點從企業產品轉向用戶群體,用戶行為分析成為公司部門的核心問題。企業借助大數據技術對用戶行為檢測獲取數據,分析比較不同的客戶群體,通過建立合理的客戶價值評估模型[2],對客戶進行分群,分析比較不同客戶群的客戶價值,并制定相應的營銷策略[3],對不同的客戶群提供個性化的客戶服務提高企業受益,減輕企業負擔。用戶行為數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。這個定義包括好幾層含義:數據源必須是真實的、大量的、含噪聲的;發現的是用戶感興趣的知識;發現的知識要可接受、可理解、可運用,企業從中提取輔助商業決策的關鍵性數據能更加準確區分客戶群體,將資源更準確地投入用戶手中。
2 數據來源和預處理
2.1數據來源
本文數據取自某三線城市的開放式收費停車場平臺2020年的用戶數據,數據中存在部分缺失數據、無效數據、重復數據、為了減少數據冗余提高數據準確性,剔除無效數據和非法數據,在數據分析之前先對數據進行簡單的清洗和預處理。
2.2數據預處理
1)屬性規約:基于客戶價值的RFM的模型[4],我們選出停車記錄表中的"car_num" ,"car_no","duration","amout","start_time","end_time","fees_paid","recover_amount"這八個字段。
2)刪除數據集中的重復數據。
3)異常數據的處理:通過計算和觀察發現數據集中存在部分異常數據,比如客戶停車時間和結束停車的時間一致,對于這種類似的數據意義不大因此本文采取刪除該類型的數據。
4)數據轉換:最近的消費間隔 =統計截止時間– 每輛車最近一次的消費時間消費金額 =已付金額("fees_paid")+補繳("recover_amount")消費頻率 =每輛車出現次數的分類匯總。
3 停車用戶行為特征分析
3.1停車數量時間特性分析
選取某三線城市2020年的開放式收費停車場數據。對2020年平均每天的停車數據分析,統計得到以一小時為間隔的停車數量,24小時的停車流量變化情況如圖1所示。
從圖中可以看出,停車場停車數量最少的時刻集中在24:00-05:00,這是因為大部分人都在休息,停車車輛大多是該停車場場附近居民的車輛,停車數量總體較少;在06:30-12:00時段停車數量開始呈現持續上升的趨勢,由于該停車場位于都市的商業圈附近,這段時間正是人們選擇去商場購物的時候,所以這段時間內的停車的數量逐漸增加,說明這群人大部分是來商場工作或者消費的。在12:00-14:00和19:00-20:00這兩個時間段出現了當天的兩個停車高峰,而這兩個時間段正好是一天當中的午餐時間和晚餐時間,人們來商場購物,或者在商場附近就餐;在15:00-17:00這段時間內,人們正處于購物或完成購物準備離開的狀態,停車車輛明顯減少,所以呈現波谷形狀;從20:00-24:00這段時間,停車場停車數量呈現下降趨勢,22:00-24:00停車數量急劇減少,說明該時間段人們完成了購物離開了商場準備回家休息。
選取某三線城市2020年的開放式收費停車場數據,對2020年平均一周的數據進行數據分析,分析工作日和周末之間的停車數量差異,統計以天為間隔的停車數量,如圖2所示。
從圖中可以看出從星期一到星期五的三個指標趨勢大致相同,由于人們的生活方式和通勤時間相對固定,該時段內消費人群規模較小,所以在工作日這段時間停車數量較為穩定,而在周末這兩天,停車車輛明顯要高于工作日,這說明到了周末人們開始選擇放松,出門逛街或者游玩。
選取某三線城市2020年的開放式收費停車場數據,對2020年特殊月份的開放式收費停車場數據進行用戶行為分析,從而找出停車數量在節假日對開放式收費停車場的影響。統計得到以二十四小時為間隔的停車數量,一個月各個時段的停車數量變化情況如圖3所示。
從圖中可以看出十月份的停車數量在十一期間呈現一個高峰,這是因為十一國慶節人們放假休息,所以去往商場進行消費娛樂活動的人數較多。到了7日,由于后一天是工作日,人們開始減少出行,停車數量相對前幾日開始顯著下降。從10月8日到10月31日可以看到停車數量趨于平穩,且帶有較為明顯的周期波動,說明人們已經結束了假期回歸有規律的生活和工作節奏。
選取某三線城市2020年的開放式收費停車場數據,對2020年平均月份開放式收費停車場停車數據進行用戶分析,統計得到以24小時為間隔的停車數量,如圖4所示。
從圖中可以看出停車數量整體呈現有規律的波動,以五天為間隔在星期六達到高峰,星期天的停車數量要略低于星期六的停車數量。由于居民出行具有基本的生活規律,例如工作人員有固定的上下班時間和休息時間大多數會選擇去商場或者出去旅游,從而使停車場的停車數量在時間上呈現一定的規律。
4 用戶聚類
4.1聚類指標選取
經過數據預處理和分析[5],統計得出了客戶的最近一次消費 (Recency)、消費頻率 (Frequency)、消費金額 (Monetary)三個要素。
通過圖5和數據的觀察,發現M和F的值差異較大,但是那些異常值代表著一些重要的客戶,不能消除。于是我們采取對模型打分的方法來消除巨大差異,我們根據實際情況和人為判斷,采取等頻的原則進行打分,如圖6所示。
4.2聚類結果
聚類效果如表格1所示。
通過上述計算后,得到用戶的分類結果。重要保持用戶有21636名,占所有用戶的23.23%,這類用戶在平臺消費時間間隔相距較小,消費頻率次數高、消費的金額大,這類用戶能給企業帶來可觀的利潤收益,重要發展用戶17353名占所有用戶的18.63%,這類用戶在平臺消費時間相距較小,消費的頻率次數、消費的金額也低,推測極有可能是新注冊的用戶,是企業重點關注的對象,重要挽留用戶17049名,占所有用戶的18.31%,這類用戶消費頻率次數和消費金額高,但消費間隔時間較長,企業可以采取優惠方式和短信提醒,挽回用戶,一般用戶共有17276名,占所有用戶的18.55%,這類用戶消費時間間隔短,消費頻率高,但消費金額少,該類用戶可能覺得企業的定價頗高,企業應對這類用戶群體進行調研,發現其中的問題并解決將其轉為重點用戶以及低價值用戶19818名,占所有用戶的21.29%此類用戶在平臺消費間隔時間長,消費頻率次數低、消費金額也少,這類用戶給企業創造的營收微薄,企業不必投入過多的資源在此類用戶身上。分類結果如圖1所示。
4.3聚類特征分析
聚類結果如圖7所示。
A類用戶:這類用戶的消費金額和消費能力大[6],而且來停車頻率高。這類用戶是高價值客戶,是最理想的客戶類型,但是,近期停車時間間隔大,需要用活動或者優惠吸引他們回來。
B類用戶:該類用戶近期間隔小,頻率低,消費也低,可以推斷為新客戶,具有很大潛力,停車場可以與他們多交流和給出額外的優惠,來培養這類用戶的忠誠度。
C類用戶:此類客戶停車頻率高,消費金額較少,而且近期停車事件間隔長,可以看出忠誠度在慢慢降低,開放式收費停車場管理平臺在運營過程中要細心發現這類用戶的特殊情況,分析競爭平臺的營銷方式,采用有效的營銷方式回擊。
D類用戶:此類客戶的消費和停車次數較低,而且近一段時間間隔較大,創造價值有限。
E類用戶:此類客戶的頻率一般但消費較高,并且近期事件間隔比較小,可以推斷他們是屬于近期頻繁來停車,屬于增長性,他們是停車場未來的主力客戶。開放式收費停車場在運營過程中可以相應加大對這類用戶群體的投入,比如以通知、短信、郵件的方式詢問用戶是否滿意開放式收費停車場管理平臺提供的服務等,并給予相關的優惠補貼,提高用戶黏合度。
5 方法評估
本模型采用近期的歷史數據進行建模[7],隨著時間的推移,分析數據的觀測窗口也在變換,因此對于新增的客戶信息,以及未來業務的實際情況,該模型建議一個月運行一次,對新增的客戶信息通過聚類中心進行判斷,同時對本次新增客戶的特征進行分析,如果新增的數據情況與判斷的結果差異過大,需要引起相關部門的重視,查看變化的原因以及確認模型的穩定性,如果模型的穩定性變化較大,需要對模型進行調整和重新訓練。
6 總結
某三線城市處于推進智慧停車場發展的起步時期,在交通信息化的大背景下,如何利用信息化手段提高開放式收費停車場的利用率,減少開放式收費停車場的管理成本成為企業關注的地方。開放式收費停車場的投入使用和發展極大地提高了客戶停車體驗,解決了客戶尋找停車位難、停車距離遠、停車不靈活等問題,在此基礎上,利用數據分析技術挖掘停車客戶的內在的規律和特征,進行有效的車位資源管理和分配,幫助用戶獲得更好的停車體驗成為開放式收費停車場發展方向。
本文首先介紹了某三線城市2020年的開放式收費停車場的原始數據,為了提高數據分析的效率和準確性,對數據進行了預處理和數據清洗。通過時間維度,對特征數據分析,挖掘其中的規律。采用RFM模型[8]和K-means算法對開放式收費停車場用戶進行分類,通過客戶的近期的消費記錄R(Recency)、購買行為購買頻率F(Frequency)、購買金額M(monetary)三個指標來挖掘客戶的潛在價值。
對比本文的實驗結果和實證結果,可以得到以下兩點結論:第一,針對開放式收費停車場停車用戶的停車特征,能夠得出停車用戶行為和時間維度存在關聯性[9],與用戶的作息時間、通勤時間和節假日時間有關系。第二,通過K-means算法和RFM模型將用戶精確分類,分類結果和實證結果較為吻合,為開放式收費停車場提供決策依據。
當然,本文的研究存在一定的局限性:第一,用戶行為分析指標需要更加多元,影響用戶行為的因素很多需要的用戶數據[10]更加精確。第二,由于每一個算法都有自身的局限性,為了更好契合開放式收費停車場用戶群體,實現更加有效的用戶細分,未來可以選擇將密度聚類等方法納入開放式收費停車場用戶分類研究當中。
參考文獻:
[1] 沈佳朋.數據挖掘技術在城市路側停車管理中的應用研究[D].杭州:浙江大學,2020.
[2] 陸建.城市交通系統可持續發展規劃理論與方法[D].南京:東南大學,2003.
[3] 孫展.基于時空量化分析的停車泊位共享配置方法研究[D].北京:北京建筑大學,2018.
[4] 楊琳,寇勇剛,白釗,等.基于改進RFM模型對民航客戶的細分研究[J].數學的實踐與認識,2021,51(1):33-39.
[5] 靖立崢,吳增源.基于改進K-means算法的電子商務客戶細分研究[J].中國計量大學學報,2020,31(4):482-489.
[6] 徐曉敏,谷曉燕.全生命周期客戶價值數據分析挖掘方法[J].北京信息科技大學學報(自然科學版),2020,35(2):6-9,20.
[7] 陳東洋,陳德旺,江世雄,等.基于時段客流特征聚類的地鐵運營時段劃分[J].計算機系統應用,2021,30(3):256-261.
[8] 翁小雄,謝志鵬.基于RFMS的高速公路客戶商業價值挖掘[J].重慶交通大學學報(自然科學版),2021,40(4):62-69.
[9] 武志鵬.路邊停車需求預測與管理對策研究[D].西安:西安電子科技大學,2019.
[10] 肖雪.路外停車需求長短時預測方法研究[D].長春:吉林大學,2020.
【通聯編輯:唐一東】