999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

研究客戶聲音反映問題溯源分析效率提升的新方法

2021-01-21 09:27:46黎偉健葉天寬胡莉瓊朱凱亮
科技傳播 2020年24期
關鍵詞:數據庫文本分析

黎偉健,葉天寬,彭 濤,胡莉瓊,朱凱亮

1 研究背景

1.1 背景介紹

互聯網的高速發展引領我們進入了一個信息量爆炸性增長的大數據時代,特點是數據量大、速度快、類型多,一些已經較為成熟的數據分析處理技術。運用這些技術對行業數據進行分析,實現海量的數據中,高效篩選和定位關鍵信息,并對此進行深入分析,對提高行業的整體運行效率以及增加行業利潤都起到極大的推動作用。

1.2 提出問題

1)數據源渠道單一。獲取客戶反饋的聲音主要是熱線客服渠道。

2)數據存在滯后性??蛻敉对V由各子公司處理,處理后統一上傳至集團客服系統,客服系統T+1天再傳送至專業公司,因此數據存在滯后性。

3)依靠傳統的分析方法。目前對于客戶投訴的分析依靠傳統人工分析,耗時約7.6分鐘/件投訴。2019年1月—3月日均投訴量8 336件,按照30%對投訴分析有價值的有效單量計算,日均2 501件有效詳單,單憑人工分析需花費19 006分鐘(相當于40個人天工作量),通過逐一查看投訴詳單內容,總結客戶投訴要點。如連續2~3天對于同一問題的客戶投訴量持續較高,才能觸發投訴預警,引起業務側關注并著手解決。

1.3 技術查新

目前在移動通信行業通過客戶評論或投訴分析挖掘客戶關注熱點的應用研究較少,客戶評論或投訴分析較多應用在電商、新聞行業,因此可借鑒其他行業的分析方法開展。

2 設定目標

為滿足實際需要,將目標定為:客戶聲音反映問題溯源分析效率提升至60分鐘/千件。

3 提出方案并確定最佳方案

3.1 提出可行方案

對歷史客戶聲音的內容及分析環節進行梳理,并將解決方法繪制成親和圖,如圖1所示:

方案一:基于正則表達式的分析方法。正則表達式是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、這些特定字符的組合,組成一個“規則字符串”,這個“規則字符串”用來表達對字符串的一種過濾邏輯。該方案通過預先準備好的業務相關關鍵詞清單,利用正則表達式獲取相關客戶聲音信息,并結合業務特點得出原因分析結果。

方案二:基于關鍵詞模型的分析方法。在自然語言處理領域,處理海量的文本文件最關鍵的是要把用戶最關心的問題提取出來。不管是基于文本的推薦還是基于文本的搜索,對于文本關鍵詞的依賴也很大,關鍵詞提取的準確程度直接關系到推薦系統或者搜索系統的最終效果。利用NLP技術構建關鍵詞模型,并根據算法自動提煉出客戶聲音的關鍵詞內容,結合業務特點得出原因分析結果。

3.2 方案評估

從分析效果、維護成本方面進行評估,最終選擇了關鍵詞模型方案。

3.2.1 分析效果

對于兩個方案的分析效果,對離線數據進行模擬實驗。

結果顯示,對同樣的客戶投訴內容,方案二的分析效率更高(見表1)。

3.2.2 開發維護工作量

對于開發維護成本,對兩個方案進行預估。

表1 兩方案的離線模擬實驗

表2 兩方案的成本預估結果

根據成本預估結果(見表2),方案二開發維護工作量較小,對應的人力成本較少。

表3 可行性方案評估

由可行性方案評估表(見表3),客戶聲音分析效率提升的最佳方案是方案二:基于關鍵詞模型的分析方法。

3.3 方案選擇

3.3.1 分析數據源選擇

參評方案:

客戶在使用產品過程中,使用意見可以通過熱線傳統渠道反饋、互聯網渠道反饋,這些客戶聲音是客戶主動參與,內容真實度可靠、留言量大,評論涵蓋面更廣,既有負面批評,也有正面肯定,甚至是改進建議,對提升產品品質和服務質量具有較大參考意義。因此傳統渠道、網絡渠道是客戶聲音反饋的主要渠道,兩者應同時納入分析源考慮范圍。

方案評比:

1)熱線傳統渠道:目前主要為全網投訴工單、在線交互文本、熱線語音(見表4)。

2)創新探索網絡渠道:主要有論壇、應用商城、微博等渠道,這些渠道數據需主動開發網絡檢索代碼獲取所有用戶評論(見表5)。

因此對比之下,傳統熱線渠道選擇全網投訴工單,互聯網渠道的客戶聲音選擇論壇。

3.3.2 數據庫類型選擇

參評方案:

當前數據庫分為關系型數據庫和非關系型數據庫。

方案評比:

表4 傳統熱線渠道

表5 創新互聯網渠道

Microsoft SQL Server數據庫是關系型數據庫,它的二維表結構是非常貼近邏輯世界的一個概念,關系模型相對網狀、層次等其他模型來說更容易理解,通用的SQL語言使得操作關系型數據庫非常方便,同時具備豐富的完整性大大減低了數據冗余和數據不一致的概率,易于維護。因此,選擇Microsoft SQL Server作為數據庫對象(見表6)。

表6 數據庫對比

3.3.3 分析算法選擇

參評方案:

文本分析算法有TextRank、TF-IDF等算法,使用不同方法對最后分析效率有直接的影響,衡量好壞的標準是關鍵詞重復率。為此,利用2種算法分析投訴工單、論壇評論,對比關鍵詞重復率。

方案評比:

分別對兩個算法進行試驗(見表7)。

表7 TextRank與TF-IDF算法對比

3.3.4 輸出形式選擇

參評方案:作為模型輸出結果,關鍵詞的輸出形式對分析原因有重要影響,針對詞云和關鍵詞清單這兩種輸出形式進行對比(見表8)。

方案評比:

1)詞云:“詞云”就是通過形成“關鍵詞云層”,對系列文本中出現頻率較高的“關鍵詞”的視覺上的突出。

2)關鍵詞清單:這是一種將一系列關鍵詞按一定規則排序的詞匯列表,一般以電子表格形式呈現。

表8 詞云與關鍵詞清單對比

3.3.5 確定最佳方案

圖2 文本處理流程

4 實施對策

制定實施對策表,如表9。

表9 制定實施對策表

5 按照對策表實施

5.1 實施一:數據準備

實施項目:通過數據平臺下載客戶投訴詳單、編寫腳本檢索網絡社區用戶評論。

實施情況:

1)投訴詳單獲取。從數據平臺下載1-8月H業務投訴數據,共768 292單。

2)論壇評論檢索。使用Python編寫H業務百度貼吧等網絡檢索腳本,對H產品1-8月客戶評論文本信息進行批量檢索,共獲取1 214 467條評論。

目標確認:

共獲取1 982 759件投訴詳單和網絡社區的評論,達成分目標。

5.2 實施二:搭建數據庫

實施項目:將數據導入數據庫,實現100%入庫。

實施情況:

1)數據入庫。開啟Microsoft SQL Server服務,創建數據庫YEW****_7002,并在數據庫下新建2張表,分別是客戶投訴表HL****XY91_DTL和網絡社區評論表H****XY3_comm,表結構分別如下:為保證分析有效性,篩選有效投訴工單內容(剔除空白值)和網絡社區客戶評論(剔除字符數<15的評論),使用SQL Server數據導入接口將兩張表導入到數據庫中,成功導入行數分別是498 821、912 034。

2)清洗數據。通過Python從SQL Server讀取兩張表文本,使用jieba工具包對中文文本自動切詞,拆分成獨立詞匯,再使用停用詞表進行無效詞過濾,實現文本清洗。

目標確認:對兩張表入庫情況進行統計,情況如表10。

表10 入庫情況統計

本次客戶聲音數據入庫率達100%,達到目標值,對策目標達成。

5.3 實施三:進行數據建模

實施項目:對清洗好的文本數據進行關鍵詞模型訓練,提煉出客戶聲音的關鍵詞。

實施情況:

1)訓練模型。利用Python搭建關鍵詞模型,本次實施采用jieba工具包的TextRank算法,通過詞之間的相鄰關系構建網絡,迭代計算每個節點的rank值,排序rank值得到關鍵詞。

對每一條文本進行上述操作,提取每一條文本的TOP5關鍵詞,直到遍歷全部文本數據,輸出全部關鍵詞,保存為csv文檔。

2)評估模型。檢查每一條文本對應的5個關鍵詞,如果發現關鍵詞不足5個的情況,屬于訓練異?;驑颖疚谋据^短,可判斷為該條文本模型訓練效果不佳。

經統計,本次共訓練1 410 855條文本,其中1 219 259條文本所輸出的關鍵詞大于等于3個。

目標確認:關鍵詞模型有效性為86.4%,對策目標達成。

5.4 實施四:形成輸出

實施項目:使用可視化工具將關鍵詞清單整理成詞云圖,并結合產品現狀分析得出客戶投訴原因。

實施情況:

1)生成詞云圖。使用Python讀取關鍵詞csv文檔,準備好數據源,用詞云工具包整理關鍵詞,并按關鍵詞出現頻次大小輸出凸顯效果不同的詞云效果,生成詞云圖,如圖3所示。

圖3 詞云圖

2)分析客戶關注焦點問題。從詞云圖選取最突出的關鍵詞,結合產品業務特點和現狀,以及實際客戶投訴內容,分析總結出客戶關注焦點問題(見表11)。

表11 客戶關注的焦點問題

目標確認:輸出TOP5客戶熱點問題,達到目標期望,對策目標達成。

6 確認效果

對策實施以后,客戶聲音分析效率平均值為55.2分鐘/千件,達到60分鐘/千件的目標值。

猜你喜歡
數據庫文本分析
隱蔽失效適航要求符合性驗證分析
在808DA上文本顯示的改善
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
數據庫
財經(2017年2期)2017-03-10 14:35:35
電力系統及其自動化發展趨勢分析
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 欧美专区日韩专区| 日韩成人在线一区二区| 国产91麻豆视频| 激情亚洲天堂| 成人国产精品网站在线看| 日本不卡在线视频| 国产黑人在线| 亚洲综合色婷婷| 国产极品美女在线播放| 亚洲成人www| 欧美国产精品不卡在线观看 | 中文字幕乱码二三区免费| 人妻精品久久无码区| 性视频一区| 精品一区二区三区中文字幕| 亚洲国产精品日韩欧美一区| 国产手机在线ΑⅤ片无码观看| 成人亚洲国产| 国产精品成| 伊人AV天堂| 亚洲最大福利视频网| 中国美女**毛片录像在线| 久久精品女人天堂aaa| 亚洲精品在线影院| 精品国产黑色丝袜高跟鞋| 97视频免费在线观看| 精品自窥自偷在线看| 国产成人综合日韩精品无码不卡| 久久大香香蕉国产免费网站| 免费一级毛片不卡在线播放| 亚洲色大成网站www国产| 欧美午夜小视频| 亚洲VA中文字幕| 亚洲一级毛片| 99久久精品无码专区免费| 欧美中文字幕一区| 欧美日韩国产系列在线观看| 91欧美亚洲国产五月天| 亚洲精品高清视频| 无码有码中文字幕| 亚洲国产成人超福利久久精品| www.精品国产| 99热亚洲精品6码| 国产午夜福利亚洲第一| 五月天综合网亚洲综合天堂网| 都市激情亚洲综合久久| 1024国产在线| 中文成人在线视频| AV在线天堂进入| 好吊色国产欧美日韩免费观看| 亚洲天堂色色人体| 国产原创自拍不卡第一页| 亚洲天堂视频网站| 99在线国产| 国产特级毛片aaaaaa| AV老司机AV天堂| 九九九精品成人免费视频7| 91精品国产91久无码网站| 精品伊人久久大香线蕉网站| 五月天福利视频| 午夜小视频在线| 亚洲男人的天堂久久精品| AV无码无在线观看免费| 国产97公开成人免费视频| 午夜无码一区二区三区在线app| 国产亚洲视频播放9000| 91免费国产在线观看尤物| 91小视频版在线观看www| 99视频全部免费| 天堂va亚洲va欧美va国产| 色综合久久88| 强奷白丝美女在线观看| 免费毛片a| 午夜a级毛片| 日韩精品欧美国产在线| 一级毛片高清| 1769国产精品免费视频| 高清免费毛片| 中文字幕有乳无码| 午夜a视频| 91在线国内在线播放老师| 91啦中文字幕|