麥家健


摘要:MaaS(Mobility as a Service,出行即服務)是交通出行發展的趨勢,公交一卡通公司依托自身在交通領域的優勢開始建設MaaS方面的探索。為充分挖掘用戶價值,提供精準服務,本文提出利用平臺數據資源,運用大數據建設用戶畫像的設想,詳細描述了有關技術路線和架構設計,并設計了面向公共出行領域業務用戶標簽體系,描繪了有關應用場景。為MaaS盤活數據資源,提升服務價值提供了新思路。
關鍵字:MaaS;大數據;智慧交通;用戶畫像
一、引言
隨著近年來移動互聯網的發展,在交通出行領域興起了一個新的服務模式MaaS(Mobility as a Service,出行即服務),即由統一的服務提供商整合不同出行方案,為用戶提供一站式出行服務。在當下企業數字化轉型的浪潮中,為了精準識別用戶需求、提供定制化服務、拓展業務范圍,MaaS服務商愈發重視用戶畫像系統的構建,運用大數據技術精確了解用戶,并有針對性地開發產品和服務,提高市場競爭力。
二、Maas出行服務發展概況
(一)Maas的發展起源
一般認為,MaaS(Mobility as a Service,出行即服務)的概念最早由芬蘭智能交通協會主席Sampo Hietanen在2014年的歐盟智能交通系統大會上提出。MaaS參考了云計算的“XX即服務”(IaaS、PaaS、SaaS)理念,強調交通工具的使用而非擁有,通過降低公眾對私家車出行的依賴,達到緩解交通擁堵、降低碳排放等一系列問題。歐美國家隨即開始商業化嘗試,并創建了MaaS平臺,如Whim、Ubigo等[1]。
(二)Maas國內發展
隨著國際MaaS發展熱潮,我國各級政府部門紛紛出臺一系列政策文件,推動MaaS發展。在2019年,黨中央、國務院發布的《交通強國建設綱要》提出“大力發展共享交通,打造基于移動智能終端技術的服務系統,實現出行即服務”的戰略部署[2]。交通運輸部、北京、上海等10余個省市均將MaaS納入有關十四五發展規劃。
在產業落地層面,國內主要有兩種類型MaaS平臺。一是互聯網企業建設運營的MaaS平臺。這類平臺以某家互聯網廠家的服務為核心,整合有關出行服務資源,提出一體化的出行解決方案。例如,高德地圖,其核心服務是基于地圖的信息檢索及出行規劃,是一個優質的出行服務平臺入口。高德地圖通過與其他交通出行服務商合作,為用戶提供出租車/網約車、共享單車/電動車、公共交通、小汽車、飛機、鐵路、貨車、長途客車等一攬子出行服務。滴滴出行以出租車和網約車為核心業務,對外延伸租車、共享單車、客運等一系列出行服務[3]。
二是傳統公交集團/公交一卡通公司通過數字化轉型建設運營的MaaS平臺。廣州市的MaaS平臺是基于“羊城通出行”“如約巴士”“如約的士”等現有出行服務平臺,整合一站式出行服務平臺,從打通市內交通方式和票務系統出發,逐步接入飛機、鐵路、城際、航運等交通方式[4]。
三、面向MaaS的用戶畫像設計與實現
(一)引入用戶畫像的必要性
1.MaaS的發展與制約因素
公交卡一卡通公司基于自身的定位及優勢運營MaaS,其發展通常有以下路徑:一是從傳統交通服務領域延伸至本地市民服務、本地生活服務延伸;二是打通出行鏈,為用戶提供一站式/一票式的MaaS平臺,提供更便捷的服務;三是深耕用戶價值,建設碳普惠等平臺,引導綠色出行理念,提高用戶活躍度。
但在發展的過程中也常常遭遇以下困境:
(1)數據孤島現象。公交卡一卡通公司通常擁有公交地鐵刷卡、班次、站點數據乃至其他出行場景的數據,但這些數據往往存在于孤立的系統中,并未共享與整合。
(2)用戶數據缺乏加工。公交卡一卡通公司通常只是記錄用戶出行消費的原始數據,未加工推導出用戶的出行信息,如用戶的出行習慣、職住關系等,無法定制個性化的出行服務(如定制公交等)。
(3)未能精準識別用戶特征。沒有充分利用系統中留存的用戶數據,無法準確識別用戶所屬群體、消費偏好,影響了業務的多元化拓展。
2.解決思路
當下數字化浪潮席卷世界,各企業紛紛進行數字化轉型,運用云計算、大數據、人工智能手段重構業務,提升組織效能。從數字化的角度審視MaaS的內核,不難得出以下結論:MaaS 實質上是交通領域新型供需關系組織者,其本質是以數字信息為核心生產要素,對各類交通方式進行一體化供需即時組織優化,從而實現交通供需的動態均衡和精準匹配[1]。用戶的“人”數據則處于核心地位。MaaS構建大數據平臺為基礎的用戶畫像體系,深挖用戶價值,成為突破上述發展困境的一個抓手。
3.基于大數據的用戶畫像系統
用戶畫像(persona)這一概念最早出自交互設計/產品設計領域,由交互設計之父 Alan Cooper 提出,他提出用戶畫像是真實用戶的虛擬代表,是基于真實數據的目標用戶模型[5]。顯然,關于用戶的海量數據是構建用戶畫像的基礎,MaaS用戶畫像可以看作交通大數據的具體應用。
(1)數據平臺設計
數據平臺是一種能夠為企業提供數據分析能力,支撐上層數據應用并促進企業數字化轉型的底層基礎設施。它包含數據存儲和數據計算分析等能力,通過匯集各方數據,提供全生命周期的“采集-存儲-分析-管理-應用”軟件支持。經過數十年的發展,數據平臺的架構經歷了數據庫、數據倉庫和數據湖三個階段,并開始出現湖倉一體的融合趨勢[6]。
數據倉庫具有規范性,可集中存儲和計算結構化數據,但成本較高,無法處理半結構化和非結構化數據,擴展性一般且擴展成本高。數據湖具有更大的存儲容量,支持高效訪問多種類型的數據,但不支持事務處理,數據質量難以保障,并且缺乏一致性和隔離性。湖倉一體指的是將數據湖和數據倉庫的優勢融合在一起,形成一體化且開放式的數據處理平臺。通過湖倉一體技術,數據處理平臺可以支持多種數據類型的統一存儲,并實現數據在數據湖和數據倉庫之間的無縫調度和管理,上層可以通過統一接口進行訪問、查詢和分析。總體而言,湖倉一體通過引入數據倉庫治理能力,將高效建庫和靈活建湖兩個優勢融合在一起,提升了數據管理效率和靈活性[6]。
在技術選型方面,本文采用PostgreSQL和Hadoop來支持數據倉庫和數據湖。結構化數據采用PostgreSQL數據庫進行管理,而車輛GPS軌跡和系統日志等半結構化/非結構化數據則存儲在HDFS文件系統中,相當于數據湖。同時,借鑒湖倉一體中的“倉外掛湖”理念,可以通過外部表的方式在PostgreSQL中訪問HDFS中的文件,實現元數據的統一管理。特別地,由于MaaS系統需要存儲和分析大量的空間數據,通過在PostgreSQL中加載PostGIS插件,可以高效地進行空間計算任務。
(2)數據架構
從數據管理的角度看,構建用戶畫像的過程實際上是通過數據建模對原始數據進行ETL(Extract, Transform, Load)處理,進行匯聚、清洗和加工。然后結合機器學習(人工智能)等手段進行標簽提取,最終形成專題的數據集市。通過用戶畫像數據及其上搭建的應用,可以進一步為其他應用提供支持和賦能。
系統架構圖如圖1所示。
數據源層主要包括組織內外部數據,通常由各業務系統提供。內部數據包括公交一卡通系統、金融核心系統、APP及小程序日志、客服系統及自營商城等。外部數據主要是出行服務商提供的數據,通過前置機或數據接口方式提供,包括公交管理平臺、客運系統、航運系統、停車系統等。在數據結構類型方面,客服系統的用戶咨詢投訴記錄、公交平臺提供的GPS軌跡屬于半結構化/非結構化數據。
數據層按照企業級數據倉庫(EDW)的標準劃分為貼源層(ODS)、數據倉庫層和數據集市層。
貼源層(ODS層)實現了數據的初步匯聚和整合,業務系統直接抽取出來的數據先留存在ODS層進行緩存。這些數據從數據結構和數據之間的邏輯關系上都與業務系統基本保持一致。ODS層承擔了一定的數據轉換任務,將原始數據進行初步的清洗,并將其轉換為符合數據倉庫需要的格式。例如日期類型有“YYYY-MM-DD”“MM/DD/YY”等多種格式,經過清洗統一整理為“YYYY-MM-DD”格式。
數據倉庫層的任務是從ODS層通過ETL過程,將數據映射到相應主題域上。數據倉庫的主題域在設計階段通過數據建模確定,一般符合第三范式(Third Normal Form,3rd NF)并保持較粗的顆粒度。根據MaaS業務特性,常設定主題域包括當事人(Involved Party)、事件(Event)、渠道(Channel)、設備(Equipment)、清算(Clearing)、行程(Trip)、場景(Scenario)等。
數據集市與數據倉庫沒有特別明確的界限。一般可以理解為數據集市基于數據倉庫構建,前者可以看作后者的一個子集。數據集市主要面向部門級業務,只面向特定主題。它聚焦于單個業務線,相較于直接訪問復雜數據倉庫可以提高效率。在本文設計中,數據集市的數據是根據業務需求進行加工的,符合維度建模(Dimensional Modeling)規范。用戶畫像數據(用戶標簽體系)可以看作是客戶數據集市的一部分。
應用層是基于數據集市數據構建的360用戶畫像應用系統,用于對MaaS用戶進行精準刻畫,還可以提供可視化分析和交互界面。進一步,根據用戶畫像標簽運用聚類和分群對細分市場進行研究。360用戶畫像應用系統的結果數據可以為產品開發、市場營銷和風險管控等系統提供有力支持。詳見下文。
(3)用戶畫像標簽體系
標簽是對某一種用戶特征的抽象和歸納表示,同時也可以用來表示一類用戶。用戶畫像主要由用戶標簽組成,標簽的構造、分類和體系設計對用戶畫像系統的使用效果具有直接影響。
①標簽分類及標簽化
用戶畫像標簽按照變更頻率一般分為靜態標簽和動態標簽兩類。靜態標簽是指用戶自身的屬性,如性別、年齡、地域、職業等,通常不需要頻繁更新。動態標簽則是指用戶的行為、興趣、互動等實時變化的屬性,如瀏覽記錄、購買行為、評論互動等,需要不斷更新。
用戶畫像標簽按照處理方法一般分為三種類型:統計類標簽、規則類標簽和機器學習挖掘類標簽。其中,統計類標簽是最基礎也最常見的標簽類型。例如,對于某個用戶來說,其性別、年齡、職業、活躍時長、活躍天數、活躍次數等標簽可以從用戶注冊數據、用戶訪問、消費數據中統計得出。統計類標簽構成用戶畫像的基礎。規則類標簽基于用戶行為及業務規則構造。例如,對于MaaS上“低碳出行高頻”用戶這一分類標準的定義可以為“每月公交、地鐵交易合計30筆以上”。機器學習挖掘類標簽通過機器學習方法挖掘產生,用于對用戶的某些屬性或某些行為進行預測判斷。例如,根據一個用戶的出行習慣判斷其對某交通工具的偏好。
本文所采取的分類方式主要從業務出發,結合數據源特性以及業務需求進行設計。
屬性標簽:通過用戶的注冊信息,獲取用戶的基本屬性。可列舉為:用戶性別、年齡層、虛擬卡開戶機構、注冊未使用等等。
行為標簽:通過用戶的使用習慣,獲取用戶的行為模式,標簽用戶的行為偏好。可列舉為:模塊訪問頻率(咨詢模塊、功能模塊)、訪問時長、場景功能交易數據等。特別地,MaaS普遍提供多個出行場景,每個場景都需要根據用戶使用習慣構造標簽進行刻畫。
風險控制標簽:對于存在高危行為的用戶(如惡意欠費),特別開辟風險控制標簽進行管控。
②標簽體系管理
上述標簽分類并不是扁平積累,實踐上會逐層拆分成更細的顆粒度,組織成具備層級結構的標簽體系。優點是方便管理多個標簽,讓散亂的標簽體系化;其次可以直觀反映標簽之間的業務關聯;最后可以為后續應用提供靈活的標簽子集。
根據實際業務需求,劃分場景標簽,如圖2所示。
4.應用示例
MaaS用戶畫像投入使用之后,可以在多個領域發揮作用。
在新產品開發及精準營銷方面,通過上文所述的聚類技術對用戶進行分群,為具有相似出行習慣、興趣愛好和消費能力的用戶設計產品,并定向投放促銷資源。例如,對于工作日經常乘坐公交地鐵且換乘的用戶,運營商可以與出行服務商合作,提供聯乘優惠,并將其定向發放給有“通勤”“公交場景_高頻”“地鐵場景_高頻”標簽的用戶。同時,針對車主(即“路內停車_高頻”或“路外停車_高頻”或“充電樁_高頻”標簽),可以開展汽車后市場業務,并定向發送促銷車輛保養、保險等產品的信息。
在風險管理方面,可以根據用戶的異常行為開發“設備安全風險”“客戶失信風險”“潛在問題客戶”等標簽,并采取相應的措施。對于存在客戶失信風險的用戶,如惡意逃費、非法提現的用戶,平臺會及時將其列入黑名單,并限制其使用各類出行場景服務;對于潛在問題客戶,如投訴后反饋不滿意的用戶,平臺會提供人性化的服務,切實解決用戶的問題,提高用戶滿意度。
在協助公共管理和為政府部門提供政策參考方面,MaaS基本覆蓋了出行領域的所有場景,包括綠色出行(公交、地鐵、共享單車)和自主出行(停車、充電樁),以及部分城際交通(客運、航運)。通過對標簽化及統計的分析,可以全面了解用戶特別是常住人員在各種出行方式上的占比分布和時空變化規律。這些數據可以為政府部門制定專題報告、進行研判,并為公共資源投放、綠色出行優惠及當地文旅推廣提供依據。
四、結束語
通過建設MaaS用戶畫像,可以方便運營商更好地了解平臺(主要是公共交通)用戶的需求、行為和偏好,從而優化公共出行服務,提高用戶體驗和滿意度。從主管部門的角度出發,還可以促進公共交通事業發展。通過分析用戶畫像,可以了解用戶的出行行為和偏好,研判潛在的公共交通需求和市場,為公共交通發展提供參考。這是貫徹交通強國戰略、推進公交發展、推廣綠色出行的有力工具。
參考文獻
[1]周瑜芳.MaaS發展展望與思考[J].人民公交,2022(12):72-77.
[2]中華人民共和國國務院.交通強國建設綱要[Z].2019.
[3]楊君儀.MaaS案例比較研究與旅游出行場景應用構建分析[J]. 綠色·智慧·融合——2021/2022年中國城市交通規劃年會論文集,2022:2852-2866.
[4]董志國.一站式交通出行融合支付MaaS平臺的實踐與思考——以廣州為例[J].交通與港航,2022,9(02):9-14.
[5]Cooper A.Robert Reimann R. Cronin D.About Face 3:The Essentials of Interaction Design [M]. New Jersey: Wiley Publishing Inc,2007:19-22.
[6]CCSA TC601 大數據技術標準推進委員會.湖倉一體技術與產業研究報告,2023.