999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LDA模型的航司投訴文本熱點話題識別

2025-09-08 00:00:00陳林林李曉非
中國管理信息化 2025年15期

doi:10.3969/j.issn.1673-0194.2025.15.073

[中圖分類號]G64;F590 [文獻標識碼]A [文章編號]1673-0194(2025)15-0236-05

0 引言

自2007年開始,中國民航運輸總周轉(zhuǎn)量位居世界第二。截至2023年底,獲得通用航空經(jīng)營許可證的傳統(tǒng)通用航空企業(yè)690家,同比凈增29家;2023年全行業(yè)完成旅客運輸量61957.64萬人次,同比增長 146.1% ;旅客周轉(zhuǎn)量10308.98億人公里,同比增長163.4% 。我國民航業(yè)務規(guī)模已居世界前列,但航空服務質(zhì)量仍有待提升,在2023年SKYTRAX全球航空獎年度榜單中,國內(nèi)航空公司(以下簡稱航司)皆未進入前五,2023年度民航局消費者事務中心受理旅客服務投訴量高達30.27萬件[1]。

旅客投訴是航空服務質(zhì)量的直接體現(xiàn),通過對投訴數(shù)量、種類、內(nèi)容的研究,能夠識別出航空服務的短板,尋找提升服務質(zhì)量的路徑與方法。目前關于航空旅客投訴的研究大多數(shù)為對基本數(shù)據(jù)的分析,缺乏對投訴文本的深層次剖析。例如,楊省貴等人選取中國民用航空局的機場旅客投訴統(tǒng)計數(shù)據(jù),分析了我國民航機場旅客投訴的數(shù)量和內(nèi)容特征[2;呂文暢以近15年民航機場投訴量、旅客吞吐量等基礎數(shù)據(jù)為研究對象,提出了基于ARMA模型的機場投訴量預測方法,并據(jù)此對2023年機場投訴量進行了預測[3]。

因此,本文以黑貓投訴平臺的投訴文本為素材進行量化分析,旨在從消費者角度出發(fā),深入挖掘投訴文本中蘊含的信息,探究旅客投訴原因,并據(jù)此提出改進建議,以期為航司服務質(zhì)量提升策略的制定提供參考。

1 研究設計

采用廣泛應用于投訴文本話題識別的LDA主題挖掘算法[4-5]對國內(nèi)主要航司的旅客投訴文本進行主題挖掘,確定投訴文本的主題分類,獲取該分類下的主題關鍵詞,并基于樸素貝葉斯算法的投訴文本自動分類框架研究,具體的研究設計如圖1所示。

圖1研究設計框架

2 數(shù)據(jù)獲取與預處理

以中國民用航空局《月度航空運輸消費者投訴情況的通報》中涉及的41家航司作為國內(nèi)航司的代表。選取國內(nèi)首個公開性在線投訴平臺一一黑貓投訴,該平臺具有投訴門檻低、投訴信息全公開、投訴記錄可回溯等優(yōu)點,其所公布的數(shù)據(jù)已經(jīng)被大批學者作為素材進行研究[。爬取2024年1月1日至2024年6月30日間黑貓投訴平臺各航司旅客投訴數(shù)據(jù)共計11409條,去除重復、無意義辱罵或發(fā)泄情緒的數(shù)據(jù)后,共計9394條。

黑貓投訴記錄的旅客投訴信息包含“標題”“狀態(tài)”“時間”“字段”“投訴對象”“投訴要求”六個維度,其中,“標題”為旅客投訴的簡要概述,“字段”為旅客投訴的主要內(nèi)容,是對自身投訴行為及投訴原因的具體解釋,具體示例如表1所示,選取“字段”作為本文分析的主要文本數(shù)據(jù)。

運用Python的jieba分詞模塊將爬取的投訴文本進行分詞、過濾,并通過wordcloud進行詞頻統(tǒng)計,以聚合氣泡圖形式進行可視化,其結果如圖2所示,其中,氣泡越大詞頻越高,反之亦然。

表1國內(nèi)航司旅客投訴數(shù)據(jù)示例

圖2關鍵詞氣泡圖

關鍵詞可視化結果表明,旅客對機票改簽及退票的手續(xù)費、航班變動的原因及通知、延誤后航司及平臺處理和客服服務等方面較為重視,尤其體現(xiàn)在退改簽的手續(xù)費及非正常航班處理方面。

3 航司投訴文本的主題挖掘

采用廣泛應用于熱點分析[、主題識別、特征提取[1]等領域的LDA模型進行文本主題挖掘,該模型通過無監(jiān)督機器學習推導分析出文本數(shù)據(jù)中“文檔/詞一主題”的概率分布,分別揭示其“文檔”和“詞”的主題結構,包括主題分布和相互關系。

困惑度(perplexity)是評價LDA主題模型的指標,困惑度越低說明模型越好,借助python的skleam庫對預處理過后的投訴文本進行LDA模型訓練,設置模型先驗參數(shù) α=0.1 , β=0.01 。

不同主題數(shù)目下的困惑度變化情況如圖3所示,結果表明,隨著 k (主題數(shù)目)的增大,困惑度逐漸減小,并且當 k 約等于9時,存在明顯的拐點,故拐點9即為 k 的最佳值[1]。

圖3Perplexity-Topics曲線圖

確定主題數(shù)目后,將主題概率分布最小閾值設置為0.01,以排除冷門主題;將超參數(shù) a 、均設置為自動模式,以便從語料庫中學習先驗知識;將iterations設為100次,確保模型在推斷主題分布時能趨于穩(wěn)定狀態(tài)[12]。模型經(jīng)過訓練后,得到了9個相關性較高的主題,主題分布情況如表2所示。

表2國內(nèi)航司旅客投訴LDA主題分布

同一主題下的詞匯分布相關性較高,說明主題聚類效果較好。旅客投訴最關注的2個主題分別是T1和T9,其中T9主題“一般退改簽政策”約占總數(shù)的1/5,T1主題“航班變動對行程的影響”約占總數(shù)的1/6;T4主題“在線客服售后服務問題”和T7主題“票價變動與消費者權益”占比均超 13% 。

由于所獲得的部分主題的關鍵詞出現(xiàn)重復現(xiàn)象,因此根據(jù)LDAvis可視化氣泡圖(圖4)及各個主題的關鍵詞實際情況,將各主題做合并歸納處理。

圖4LDAvis可視化氣泡圖

圖4中,除Topic5和Topic9有較明顯重疊之外,其他主題無明顯重疊現(xiàn)象,分類效果較好,結合各個主題的高頻關鍵詞實際情況發(fā)現(xiàn),Topic5和Topic9中僅“全額”和“航司”兩個關鍵詞有重疊,其余關鍵詞無較直觀的相關性。回溯其原始數(shù)據(jù)發(fā)現(xiàn),Topic 5中“因病”“證明”“記錄”等皆為旅客因身體原因無法按時登機時退改簽減免手續(xù)費的相關規(guī)定;Topic9中“手續(xù)費”“高額”“不影響二次銷售”等亦可明顯看出是有關退改簽手續(xù)費收費標準,且與Topic6中的“全額”“手續(xù)費”“規(guī)定”等有諸多重疊之處,但Topic6則更側(cè)重于“錯購”的情形,如此,三者均為退改簽的手續(xù)費問題及相關規(guī)定,遂將其合并為“退改簽規(guī)則”主題;Topic1中的“航班取消”“航班延誤”“計劃”“影響行程”等是有關航班變動對旅客后續(xù)行程(“高鐵”“第二程”等)所造成的影響(“損失”“問題”),將其歸納為“航班變動對行程的影響”主題;以此類推,最終將所得的9個主題整理歸納為“航班變動對行程的影響”“民航購票費用與規(guī)定”“民航票務服務問題”“在線客服售后服務問題”“退改簽規(guī)則”“票價變動與消費者權益”以及“行李運輸收費規(guī)則”7個主題,其具體內(nèi)容和文本分布情況如表3所示。

表3國內(nèi)航司旅客投訴主題分類及其分布

“退改簽規(guī)則”占比最高,其主題下文檔數(shù)占據(jù)總文檔數(shù)的 34.09% ;其次是“航班變動對行程的影響”;“票價變動與消費者權益”和“在線客服售后服務問題”兩個主題的文檔數(shù)也相對較高,所占比例分別是 13.01% 和 13.78% ;“民航票務服務問題”和“行李運輸收費規(guī)劃”兩個主題的文檔數(shù)則相對較少,分別占據(jù) 9.32% 和 7.44% ;投訴文檔數(shù)占比最少的主題是“民航購票費用與規(guī)定”,為 5.99% 。

結合各主題內(nèi)容和投訴文本回溯發(fā)現(xiàn)目前航司航空服務存在的不足主要集中在以下幾個方面。

(1)異常航班處理仍存在模糊地帶。由于航班變動造成的影響復雜,現(xiàn)有異常航班處理方案及補償范圍無法完全應對旅客的實際損失。例如,聯(lián)程航班中由第一程航班延誤導致旅客第二程無法按時登機且沒有合適的航班改簽時,退票仍需支付第二程的退票手續(xù)費。

(2)退改手續(xù)費過高。各航司退改手續(xù)費的制定具有較高的自主權,這種“高度自治”的情況使國內(nèi)部分航司的退改手續(xù)費居高不下,如在起飛前27天退票需支付將近 50% 的手續(xù)費。在高鐵、自駕等替代出行方式不斷增多的情況下,高額退改手續(xù)費可能成為航司客戶流失的重要因素。

(3)特殊退改實施缺乏細則。目前航空公司關于“因病退改”“錯購”等特殊退改行為的實施缺乏細則,容易引發(fā)航旅糾紛,如因病退改材料對文件形式、語言表述、醫(yī)院級別等要求標注不清,造成多次返工甚至證明材料無法通過審核。

(4)自理行李箱規(guī)制標注不清、提示性不足。民航局規(guī)定的自理行李體積每件不超過 20cm× 40cm×55cm ,所以普遍認知上可上機的為20寸行季箱( 20cm×40cm×55cm ),部分航司規(guī)定只允許16寸/14寸/20寸( 20cm×30cm×40cm) 的行李箱登機,自理行李特殊規(guī)格標準標識不夠明顯,使旅客產(chǎn)生計劃外的托運費用。

(5)售后客服質(zhì)量有待提升。在售后服務過程中,航司存在電話長時間無人應答、服務態(tài)度欠佳、客戶排隊等候時間過長以及客戶問題未能得到有效解決的狀況,從而對旅客的體驗造成較大的影響。

4航司服務質(zhì)量提升建議

針對航司航空服務存在的不足,結合國內(nèi)部分航空公司先進改革舉措,提出航司服務質(zhì)量提升建議如下。

(1)完善不正常航班處理。航司應及時告知旅客航班狀態(tài),并詳盡解釋其航班變動原因,同時還應擴大補償范圍,將更多的情形納入補償范圍。目前南航、川航等已將機型變動、航班變動導致航程改變、航班經(jīng)停點延誤等因素納入客票免費退改適用范圍[13-14],其先進的做法為其他航司不正常航班處理提供了參考。

(2)制定合理的退改簽收費標準。航司應根據(jù)票價水平、客艙艙型、時間節(jié)點、客戶屬性等,制定合理的機票退改簽收費“階梯費率”,既能維持旅客忠誠度,又能保障航司的盈利水平,從而在旅客保留與利潤增長之間獲得平衡。

(3)完善特殊退改機制。航司可設置“容錯”機制,避免因錯購產(chǎn)生的費用,如購票10分鐘內(nèi)退票/改簽免除手續(xù)費,避免因錯購時間、地點、往返等原因造成的高額手續(xù)費。航司還應簡化病退證明材料,擴大認可醫(yī)院范圍,南航已將認可的醫(yī)療機構范圍擴至衛(wèi)生健康委列明的醫(yī)院及下屬醫(yī)療機構[13],這一舉措為各航司特殊退改機制的實施提供了參考。

(4)加強特殊標準標識的鮮明性。在航班標準與普遍認知不一致時,應更加突出注明該航班的特殊標準,避免因認知不一產(chǎn)生的糾紛,如在購票時突出顯示自理行李規(guī)格、退改簽標準等注意事項,設置合理的閱讀時長,閱讀后方可接轉(zhuǎn)購票付款界面。

(5)提升航司售后客服水平。航司應通過客服人員的教育與培訓,不斷提高其知識能力和服務態(tài)度,使顧客獲得更好的體驗。航司還應加強客服自動化和智能化建設,提升客服響應速度和準確性。

主要參考文獻

[1]中國民用航空局.2023年民航行業(yè)發(fā)展統(tǒng)計公報[EB/OL].(2024-05-31) [2024-12-25]. https://www.caac.gov.cn/XXGK/XXGK/TJSJ/202405/t20240531_224333.html.

[2]楊省貴,楊蒙蒙,徐昶.我國民航機場旅客投訴分析及服務提升[J].重慶交通大學學報(社會科學版),2022,22(5):38-47.

[3]呂文暢.基于ARMA模型的民航機場投訴量預測[J].信息技術與信息化,2023(5):39-42.

[4]許睿,龍丹,劉佳,等.基于LDA 模型的電力投訴文本熱點話題識別[J].云南大學學報(自然科學版),2020,42(增刊2):26-31.

[5]方小飛,黃孝喜,王榮波,等.基于LDA模型的移動投訴文本熱點話題識別[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2017,1(2):19-27.

[6]毛澤強.金融機構海量投訴數(shù)據(jù)分析與應用:基于LDA-TPA模型文本挖掘[J].金融發(fā)展評論,2021(9):81-95.

[7]蔡衛(wèi)星,蒲雨琦,李浩民.顧客至上:消費者在線投訴的基本面預測能力研究[J].管理世界,2024,40(5):139-154.

[8]殷彩明,袁永旭,王漣,等.國內(nèi)社區(qū)養(yǎng)老服務熱點分析:基于LDA模型與生命周期理論[J].醫(yī)學信息學雜志,2024,45(10): 47-52, 97.

[9]任越,李泊泳,譚科銘.基于“主題—工具一效力\"三維框架的我國傳統(tǒng)村落保護政策研究[J/OL].情報科學,1-31[2024-10-24].

[10]范柏乃,盛中華.數(shù)字經(jīng)濟安全的維度識別、特征提取及分層模型:基于LDA主題分析與扎根理論編碼的混合研究[J].浙江大學學報(人文社會科學版),2024,54(2):5-29.

[11]王浩,方俊濤.基于LDA模型對國家海洋博物館游客在線評論的主題分析[J].科技和產(chǎn)業(yè),2024,24(12):224-230.

[12]葉艷,吳鵬,周知,等.基于LDA-BiLSTM模型的在線醫(yī)療服務質(zhì)量識別研究[J].情報理論與實踐,2022,45(8):178-183,168.

[13]中國南方航空.關于調(diào)整南航客票退改規(guī)則的公告[EB/OL].(2023-12-27)[2025-01-13]. https://www.csair.com/cn/about/news/notice/2023/1hil5f18mi7m6.shtml.

主站蜘蛛池模板: 中文字幕一区二区视频| 成人午夜天| 熟妇丰满人妻| 久久国产精品影院| 热九九精品| 国产黑丝视频在线观看| 亚洲伦理一区二区| 婷婷六月综合网| 蜜桃视频一区| 久久久久国产一区二区| 久久伊人色| 欧美精品一区在线看| 亚洲精品无码久久毛片波多野吉| 国产精品原创不卡在线| 香蕉精品在线| 黄色在线网| аv天堂最新中文在线| 91无码视频在线观看| 成年人福利视频| 手机在线看片不卡中文字幕| 中文字幕不卡免费高清视频| 白浆免费视频国产精品视频| 国产在线啪| 亚洲综合色婷婷| 日韩在线观看网站| 97成人在线视频| 日本免费新一区视频| 国产美女精品在线| 欧美成人免费一区在线播放| 无码免费试看| 超碰91免费人妻| 一本大道香蕉中文日本不卡高清二区| 亚洲婷婷丁香| 日韩小视频网站hq| 伊人久久青草青青综合| 婷婷午夜天| 男女性色大片免费网站| 中文国产成人精品久久| 熟女视频91| 日本手机在线视频| 国产成本人片免费a∨短片| 91福利片| 欧美日本中文| 国产菊爆视频在线观看| 99re66精品视频在线观看| 国产丝袜第一页| 亚洲综合欧美在线一区在线播放| 伊人激情久久综合中文字幕| 日韩免费中文字幕| 91久久天天躁狠狠躁夜夜| 在线播放精品一区二区啪视频| www.国产福利| 在线免费看片a| 伊人成人在线视频| 亚洲精品无码AV电影在线播放| 国产成年无码AⅤ片在线| 91区国产福利在线观看午夜| 极品国产在线| 亚洲成av人无码综合在线观看| 操国产美女| 日韩在线第三页| 久久鸭综合久久国产| 成年免费在线观看| 手机在线看片不卡中文字幕| 欧美在线黄| 在线综合亚洲欧美网站| 久久国产高潮流白浆免费观看| 精品91视频| 日韩专区欧美| 毛片卡一卡二| 18禁色诱爆乳网站| 福利视频久久| 亚洲高清资源| 91亚洲精选| 无遮挡国产高潮视频免费观看| 婷婷午夜天| 无码AV日韩一二三区| 三区在线视频| 九九九精品视频| 欧美日韩精品一区二区在线线| 搞黄网站免费观看| 免费一看一级毛片|