999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于旅客信任網絡的航線選擇行為預測

2020-07-23 06:27:48馮霞張晨盧敏
現代電子技術 2020年4期

馮霞 張晨 盧敏

摘? 要: 分析理解民航旅客出行特征,對旅客未來潛在出行行為進行預測,是航空公司實施精準營銷的重要支撐。該文以民航領域積累的大規模PNR數據集為基礎,提出一種基于旅客信任網絡的協同過濾航線推薦模型,借鑒社交關系網絡引入旅客信任網絡,對采用協同過濾進行航線推薦的方法進行改進,通過旅客信任網絡中信任的傳遞性以發現相似旅客,從自身偏好和相似旅客偏好兩個方面對旅客出行時對航空公司航線的選擇行為進行刻畫。實驗結果表明,文中算法相較于傳統的基于歷史選擇、基于航線熱度等方法有更高的精準度和召回率。

關鍵詞: 航線推薦; 航線預測; 旅客信任網絡; 精準營銷; 推薦算法; 實驗驗證

中圖分類號: TN911.34?34; TP39? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)04?0078?05

Prediction of route selection behavior based on passenger trust?network

FENG Xia1,2,3, ZHANG Chen1, LU Min1,2,3

(1. College of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China;

2. Information Scientific Research Base, Civil Aviation University of China, Tianjin 300300, China;

3. Key Laboratory of Intelligent Application Technology for Civil Aviation Passenger Services, Tianjin 300300, China)

Abstract: The analyzing and understanding of the travel characteristics of civil aviation passengers and the prediction of their potential travel behaviors in the future are the important supports for? precision marketing implementation of airlines. Based on the large?scale PNR data sets accumulated in the field of civil aviation, a collaborative filtering route recommendation model based on the passenger trust?network is proposed. The social relational network is used to introduce the passenger trust?network to improve the method which adopts collaborative filtering to achieve route recommendation. The similar passengers are found by means of the transitivity of trust in the passenger trust network. The passengers′ choice behavior for airline routes when they plan to travel are described in two aspects of their own preferences and similar passengers′ preferences. The experimental results show that in comparison with the traditional methods based on history selection or route attraction and so on, the algorithm proposed in this paper has higher accuracy and recall rate.

Keywords: air route recommendation; air route prediction; passenger trust network; precision marketing; recommendation algorithm; experiment verification

0? 引? 言

隨著國民收入水平的不斷提高,越來越多的人選擇飛機作為遠距離出行的首選方式,各大電商、航空公司等也適時推出了各種不同類型的在線航空出行服務。如何從大量的在線航空服務中找到滿足自身需求的產品,對于旅客是一個難題;如何更好地理解旅客的出行行為偏好,提供更具有吸引力的服務,對于在線出行服務提供商,更是一個極具挑戰的問題。

與此同時,近年來大規模的旅客出行使得民航業積累了大量的旅客姓名記錄(Passenger Name Record,PNR)數據。對記錄著旅客的出行行為信息的PNR數據進行挖掘分析,可以發現旅客出行的潛在偏好特征,對旅客和在線出行服務提供商有著重要價值。

現階段,國內外對于民航旅客出行行為的研究主要集中在旅客行為細分和旅客價值計算。圍繞旅客行為細分,文獻[1]采用聚類和關聯規則等對中東航空的常旅客數據進行細分,為面向不同組客戶采取不同營銷策略提供決策依據。文獻[2]結合傳統RFM模型,提出一種TCSDG模型描述旅客偏好,從而對旅客進行細分。圍繞旅客價值計算,文獻[3]提出基于客戶的生命周期價值的細分方法,對旅客當前價值及潛在價值進行計算。文獻[4]融合個體屬性與社交關系,提出一種民航旅客價值度量方法,實現旅客價值計算和高價值旅客挖掘。事實上,旅客行為細分及旅客價值的計算只是劃分出不同的旅客群體,并不能精確刻畫每位旅客的行為特征,從而也無法對旅客提供有針對性的個性化服務。

本文重點關注旅客出行時的航空公司航線選擇行為,預測旅客在未來一段時間做出出行選擇時對航空公司航線的選擇行為。其應用價值在于當旅客訪問在線航空服務產品時,可以將旅客感興趣的信息推送在首頁,對航空公司的運營、服務、推薦等帶來輔助決策支持。其本質可以看作是航空電子商務個性化推薦問題。

推薦系統[5]在1997年由Resnick和Varian提出,被廣泛應用到各行業中,推薦對象包括書籍、音像、網頁、文章以及新聞等不同方面,但在民用航空領域的應用還很不成熟。本文借鑒傳統的推薦算法,以旅客出行時選擇航空公司航線的行為為出發點,引入旅客出行信任網絡的概念,從旅客歷史選擇行為及相似旅客出行行為上的相似性兩個維度建模,提出一種基于旅客信任網絡的航空公司航線預測模型 (Traveler Trust Network Collaborative Filtering,TTNCF)。在民航旅客201*—201*兩年真實出行的PNR數據集上的實驗結果表明,本文算法較之傳統的基于熱門航線預測的方法等,具有更高的預測精準度,能提高旅客出行行為的推薦質量,為在線服務系統提供依據。

1? 相關定義

為了方便對問題的理解與表示,給出一些相關定義。

定義1 旅客出行行為。旅客在出行選擇時會在多種方面做出決策,本文對民航旅客PNR數據進行分析,提取旅客ID、航空公司、起飛機場、目的機場,以“起飛機場?目的機場”組合作為旅客航線選擇,從而得到每位旅客出行時對航空公司航線的選擇行為,以此為出發點,對旅客出行選擇進行分析。

定義2? 旅客信任關系。旅客的出行行為信息中隱含著旅客間的多種關系,認為兩名旅客在出行選擇時如果具有相當數量的相同出行選擇,則認為旅客在選擇行為上存在一定的相似信任關系,相同的出行選擇越多,信任關系越明顯。據此構建旅客信任網絡。

定義3? 旅客的選擇矢量相似性。對于旅客眾多的歷史出行選擇,可以得到旅客對航空公司航線的選擇矢量,表示為[(φ1 φ2 … φn)],[φn]表示旅客對某航空公司航線n的選擇次數。通過計算旅客選擇矢量之間的Pearson相關系數和Jaccard系數得到旅客的選擇矢量相似性。

定義4? 旅客對航空公司航線的偏好。對于旅客眾多的歷史出行選擇,表示為[φ=(φ1,φ2,…,φn)],[φn]表示旅客對航空公司航線n的選擇次數。筆者認為,旅客選擇該航空公司航線的次數越多,即[φn(φ1+φ2+… +φn)]越大,則表示對航空公司航線n的偏好越明顯。

2? 基于旅客信任網絡的旅客航線預測算法

2.1? 基于歷史選擇的旅客航線推薦

不同于書籍、電影等商品推薦,民航旅客在做出出行選擇時可能會多次選擇同一航線,即反復選擇同一產品。基于此,可以考慮一種簡單的推薦方法,即直接用其歷史出行選擇作為推薦項推薦給目標用戶。

圖1給出了民航旅客201*年航線選擇次數的分布情況統計結果,橫坐標表示旅客選擇選擇同一航線的次數,縱坐標表示其占比。可以看出,旅客選擇航線頻次的分布屬于典型的長尾性分布,同一旅客選擇同一航線頻次多為1次,重復選擇的僅占少數。

不難推斷,基于旅客歷史選擇的推薦算法有其固有的局限性。對于每位旅客,只考慮歷史選擇時不能產生新的推薦項,不利于覆蓋新的選擇以實現良好的市場營銷。在實際出行中,旅客在做出決策時會受到各種因素的影響。不妨假設,在歷史選擇上具有相似性的旅客在未來選擇上也將具有相似性。為考察相似旅客在未來出行選擇上的相似性,結合傳統協同過濾的方法,提出基于旅客相似性的協同過濾算法。

2.2? 基于旅客矢量相似性的協同過濾算法

基于旅客相似性的協同過濾[6?7]推薦算法,假設相似旅客具有相似出行偏好,找到與目標旅客相似的旅客,并將相似旅客的偏好以一定權重推薦給目標旅客。具體分為兩步:第一步是相似性評估;第二步是旅客未來選擇行為預測。

主要流程如圖2所示。

2.2.1? 旅客相似性的計算

借鑒信息檢索領域[8]文檔相似性的計算方法,將旅客歷史出行數據轉換為旅客?航空公司航線選擇矩陣,根據定義3,計算旅客間的選擇矢量相似性。使旅客u扮演文檔,將“航空公司?起飛機場?降落機場”作為航空公司航線詞對i扮演單詞,旅客u對不同航空公司航線詞對i的選擇次數作為詞頻[γui],得到旅客出行選擇矢量。其中,出行歷史中曾經選擇的航線表示積極的偏好,偏好程度表現為選擇的次數,出行歷史中未選擇過的航線項用零表示,沒有負選擇。

通過計算旅客選擇矢量相似度來代表旅客間的選擇偏好的相似度,計算方法分別為:

[sim(u,v)=Pearson=iγui-γ′uγvi-γ′viγui-γ′u2iγvi-γ′v2] (1)

[sim(u,v)=Jaccard=Nu?NvNu?Nv] (2)

式中:[sim(u,v)]表示旅客u與旅客v選擇矢量之間的相似性,以此表示旅客選擇偏好的相似性;[γui],[γvi]分別表示旅客u和旅客v對航空公司航線i的乘坐次數;[γ′u=1N(u)i∈N(u)γui],表示旅客u出行時航線選擇次數的平均值;[Nu],[Nv]分別表示旅客u和旅客v選擇過的航線集合。

2.2.2? 基于旅客矢量相似性的協同過濾算法

得到旅客間選擇偏好的相似度后,可以由式(3)計算得到旅客v對目標旅客u的影響系數[wuv]:

[wuv=simu,vv∈Susimu,v] (3)

式中,[S(u)]表示目標旅客u的相似旅客集合。

對目標旅客u的所有相似旅客的偏好以其影響系數[wuv]為權重進行加權求和,旅客u對于航空公司航線i的選擇可以量化表示為:

[rui=r′u+v∈Suwuvrvi-r′v=r′u+? ? ? ? ?v∈Susimu,vv∈Susimu,vrvi-r′v] (4)

式中:[rui]表示目標旅客u在未來的出行選擇中對航空公司航線i可能選擇的預測結果;[rvi]表示目標旅客u的相似旅客v對航空公司航線i的乘坐次數。

上述旅客相似性計算中,由于可選的航空公司?航線對很多,而旅客實際的出行選擇非常少,這使得矢量相似度的計算成為高維稀疏向量間的距離計算,難以捕捉旅客出行的真正相似程度。為進一步探究旅客間的相關關系,引入旅客信任網絡,希望通過旅客信任網絡中信任的傳播,以獲得相似旅客。

2.3? 基于旅客信任網絡的旅客航線預測算法

為進一步尋找相似旅客,提出一種基于旅客信任網絡的TTNCF模型,如圖3所示。通過旅客歷史出行記錄構建旅客信任網絡,利用信任網絡中的信任的傳遞關系[9?10]得到旅客間相似性。與基于旅客相似性的協同過濾算法相比,兩個主要步驟保持不變,第一步發現相似旅客,第二步根據相似旅客對航空公司航線選擇的加權總和進行預測。關鍵區別在于相似旅客的識別以及旅客間關系權重的計算。

2.3.1? 構建旅客信任網絡

根據定義2所定義的信任關系構建旅客信任網絡,如圖4所示。使用[G=(V,E,S)]代表旅客信任網絡,其中V為網絡中節點的集合,表示不同的旅客;E為節點間邊的集合,表示旅客間是否存在信任關系;S為邊上的權重,表示由邊連接的兩名旅客之間相同出行選擇的數量,[S∈(1,2,…)]。

2.3.2? 信任網絡中鄰居旅客影響系數計算

在旅客信任網絡中,信任具有傳遞性,假設存在如圖5所示關系,旅客u和旅客v之間存在信任關系,權重為[Tuv],旅客v和旅客x之間存在信任關系,權重為[Tvx],旅客u與旅客x之間沒有顯性的相同出行選擇行為。認為,u和x之間也存在著一定程度上的信任關系。

對于目標旅客u,旅客v與其存在直接的信任關系,稱旅客v為目標旅客u的一階鄰居;旅客x通過旅客v與目標旅客建立了聯系,稱旅客x為目標旅客u的二階鄰居。

在旅客信任網絡的基礎上,基于網絡中信任的傳遞性,計算鄰居旅客對目標旅客的影響系數w。對于目標旅客u,一階鄰居v對目標旅客u的影響系數可表示為:

[wuv=Tuvv∈h(u)Tuv] (5)

二階鄰居x對目標旅客u的影響系數可表示為:

[wux=wuv×wvx=Tuvv∈h(u)Tuv·Tvxx∈h(v)Tvx] (6)

式中:[Tuv],[Tvx]分別表示旅客u,v之間和旅客v,x之間的相同出行選擇次數;[h(u),h(v)]分別表示旅客u和旅客v在旅客信任網絡中的一階鄰居集合。

2.3.3? 基于旅客信任網絡的旅客航線預測算法

在旅客信任網絡中,分別考慮目標旅客的一階鄰居和兩階之內鄰居作為目標旅客的相似旅客集,對相似旅客的出行選擇賦予其對目標旅客的影響系數[w]作為權值,進行加權求和得到目標旅客的選擇偏好。

僅考慮目標旅客一階鄰居時,旅客u對于航空公司航線i的選擇可以量化表示為如下:

[rui=r′u+v∈h(u)(wuv(rvi-r′v))=r′u+? ? ? ?v∈h(u)Tuvv∈h(u)Tuv(rvi-r′v)] (7)

考慮目標旅客兩階之內鄰居時,即同時考慮一階鄰居和二階鄰居,旅客u對于航空公司航線i的選擇可以量化表示為如式(8)所示:

3? 實? 驗

3.1? 實驗數據及預處理

實驗數據集由中國民航信息網絡股份有限公司提供,包含201*—201*年兩年的PNR集。PNR數據中包含旅客編號、航空公司、起飛機場、目的機場、航班號、出發時間、座位號等信息。在實驗中,以前一年的數據作為訓練集,后一年同旅客的出行記錄作為測試集進行驗證。對PNR數據進行分析和整理,包括去除重復記錄,去除無效記錄,去除較低頻次旅客出行記錄。將旅客加密后的身份證號作為旅客的唯一標識,記錄中的航空公司編號、起飛機場三字碼、降落機場三字碼進行拼接得到航空公司航線對,以此作為旅客出行時對航空公司航線的選擇標識。對前一年的數據進行預處理構建旅客關系網絡,數據規模如表1所示。

3.2? 實驗評價指標

本文在最終的預測結果中,列出最可能出行的項目列表作為推薦項,引入準確率、召回率、F1值作為評價指標[11]。

準確率描述推薦列表中旅客真正選擇的航線所占的比例,如下:

[PAll=1KK=1KPu=1KK=1KRu?TuRu] (9)

召回率描述推薦列表中旅客真正選擇的航線占旅客真正選擇記錄的比例,如下:

[RAll=1KK=1KRu=1KK=1KRu?TuTu] (10)

式中:[Ru]表示給目標旅客u的推薦項;[Tu]表示旅客u在測試集上真實的出行記錄。

F1值是綜合準確率和召回率兩個指標的評估指標,用于綜合反映整體的性能,如下:

[F1=2PAllRAllPAll+RAll] (11)

3.3? 實驗基準方法

為了評估基于旅客信任網絡的TTNCF模型的有效性,主要選取以下基準方法進行實驗對比,介紹如下:

1) 依據熱門航線推薦,記作AirlineHot。主要做法是:將航空公司航線對按照熱門程度進行排序,選取Top?N作為下一年的可能出行選擇進行預測。該方法為最常用的航線推薦方式,對所有旅客推薦無差異,不能對旅客產生有針對性的個性化推薦。

2) 基于歷史選擇推薦,記作UserHistory。主要做法是:將旅客過去的歷史出行記錄按出行頻次進行排序,作為未來的可能出行選擇進行預測。各用戶間有了差異,但考慮因素比較單一,不能產生新的推薦項。

3) 基于旅客相似性的協同過濾算法,記作CFPearson和CFJaccard。主要做法是:通過計算旅客選擇矢量之間的Pearson相關系數和Jaccard系數來表示旅客間的相似度。存在旅客選擇矩陣極稀疏,相似度計算困難的問題。

3.4? 實驗結果

該數據集中,旅客出行次數范圍為3~10,平均出行次數為3.7次,故試從預測結果選擇Top5,Top10作為推薦項,各種不同方法的實驗結果對比如表2~表3所示。

由于旅客出行受到多種因素的影響,對未來出行行為的預測及推薦是一項具有挑戰的行為。從實驗結果可以看出,基于旅客信任網絡的推薦辦法相較于傳統的基于歷史記錄及熱門航線的推薦辦法有明顯的優勢,相比于基于旅客矢量相似性的協同過濾算法也有一定的提高。從表2~表3可以看出,考慮目標旅客一階鄰居作為相似旅客TTNCF1的效果要優于考慮目標旅客兩階之內旅客TTNCF2的預測效果。對實驗結果進行進一步的分析,采用基于旅客信任網絡的航線預測辦法中,目標旅客鄰居跳數k的選取對航空公司航線的預測覆蓋率的影響情況如圖6所示。可以看出,當k=1時,即通過尋找信任網絡中一階鄰居節點TTNCF1,可以對66.95%的航空公司航線進行預測;當k=2時,即通過尋找信任網絡中二階內鄰居節點TTNCF2,對航空公司航線的預測覆蓋率可以達到86.78%。

TTNCF2的預測精準度雖然低于TTNCF1的預測精準度,但提高了對航空公司航線的預測覆蓋率,能產生更多的新異性推薦,有利于市場營銷。故TTNCF1和TTNCF2方法有不同的偏重,前者相較于后者有更高的精準度,后者相較于前者有更大的航空公司航線覆蓋率,在考慮不同側重時,可采用不同的預測辦法。

4? 結? 論

本文針對傳統的基于熱門航線對旅客進行航空公司航線推薦辦法的無差異性,提出一種基于旅客信任網絡的航線推薦辦法,對旅客航空公司航線選擇推薦行為取得了一定的效果。但由于民航旅客出行的特殊性,旅客在出行時雖有一定的規律可循,但存在多種不可預知因素的影響,旅客的未來出行存在很大的隨機性。在接下來的研究中將考慮更多的可能影響的因素,對旅客出行行為做出進一步的探究。

注:本文通訊作者為張晨。

參考文獻

[1] MAALOUF L, MANSOUR N. Mining airline data for CRM strategies [C]// WSEAS International Conference on Simulation, Modelling and Optimization. Beijing: WSEAS, 2007: 345?350.

[2] 馮霞,徐冰宇,盧敏.民航旅客訂票行為細分及群體特征分析[J].計算機工程與設計,2015,36(8):2217?2222.

[3] KIM S Y, JUNG T S, SUH E H, et al. Customer segmentation and strategy development based on customer lifetime value: a case study [J]. Expert systems with applications, 2006, 31(1): 101?107.

[4] 丁建立,劉曉慶,王家亮.一種融合個體屬性與社交關系的民航旅客價值度量方法[J].航空學報,2018,39(2):263?274.

[5] RICCI Francesco, ROKACH Lior, SHAPIRA Bracha. Recommender systems handbook [M]. Boston: Springer, 2015: 1?34.

[6] KOREN Yehuda, ROBERT Bell. Advances in collaborative filtering [C]// Recommender Systems Handbook. Boston: Springer, 2015: 77?118.

[7] 榮輝桂,火生旭,胡春華,等.基于用戶相似度的協同過濾推薦算法[J].通信學報,2017,35(2):16?24.

[8] LARSON R R. Introduction to information retrieval [J]. Journal of the American society for information science & technology, 2010, 61(4): 852?853.

[9] MASSA P, AVESANI P. Trust?aware recommender systems [C]// Proceedings of 2007 ACM Conference on Recommender systems. Minneapolis: ACM, 2007: 17?24.

[10] 王興茂,張興明,鄔江興.基于一跳信任模型的協同過濾推薦算法[J].通信學報,2017,36(6):193?200.

[11] 朱郁筱,呂琳媛.推薦系統評價指標綜述[J].電子科技大學學報,2012,41(2):163?175.

主站蜘蛛池模板: 伊人久久大香线蕉成人综合网| 亚洲不卡av中文在线| 成年人福利视频| 青青草原国产免费av观看| 久久国产精品电影| 欧美日韩中文国产va另类| 一区二区三区成人| 国产欧美日韩18| 不卡国产视频第一页| 国产又爽又黄无遮挡免费观看| 精品一区二区三区中文字幕| 日本一区中文字幕最新在线| 中国成人在线视频| 国产十八禁在线观看免费| 67194亚洲无码| 久久人体视频| 2021国产v亚洲v天堂无码| 色噜噜综合网| 欧美性精品| 五月婷婷欧美| 91在线国内在线播放老师| hezyo加勒比一区二区三区| av尤物免费在线观看| 在线视频精品一区| 国产在线欧美| 免费国产黄线在线观看| 99热这里只有精品久久免费| 无码网站免费观看| 粉嫩国产白浆在线观看| 欧美中文字幕在线二区| 国模沟沟一区二区三区| 一级毛片免费观看不卡视频| 99久久精品无码专区免费| 一区二区三区成人| 亚洲制服丝袜第一页| 国产丝袜精品| 九九热精品免费视频| 18禁色诱爆乳网站| 国产日韩欧美中文| 亚洲国产精品日韩欧美一区| 伊人久久大香线蕉综合影视| 国产精品无码翘臀在线看纯欲| 国产精品开放后亚洲| 亚洲性一区| 国产网站免费观看| 国产精品一区二区国产主播| 日本高清有码人妻| 日韩欧美色综合| 国产无人区一区二区三区| 99久久亚洲精品影院| 色综合天天娱乐综合网| 精品久久久久久久久久久| 欧美一级一级做性视频| 67194亚洲无码| 999福利激情视频| 欧洲极品无码一区二区三区| 亚洲Av激情网五月天| 久久9966精品国产免费| 欧美一级夜夜爽| 国产精品亚洲а∨天堂免下载| 亚洲天堂免费观看| 久久精品中文字幕免费| 国产玖玖视频| 国产精品尤物在线| 国产又色又刺激高潮免费看| 国产成人亚洲日韩欧美电影| 91破解版在线亚洲| 四虎成人在线视频| 亚洲精品手机在线| 三级视频中文字幕| 午夜限制老子影院888| 亚洲国产天堂久久综合| 精品成人一区二区三区电影| 激情午夜婷婷| 青青青视频免费一区二区| 中文字幕有乳无码| 中文纯内无码H| 国产无吗一区二区三区在线欢| 久久精品这里只有国产中文精品| 91精品免费高清在线| 国产在线一区视频| 91久久偷偷做嫩草影院|