孟劍萍,沙勇勤
(1.中國電子科技集團公司南京第二十八研究所,江蘇 南京 210007;2.江蘇飛象科技有限公司,江蘇 南通 226000)
3G移動互聯網客戶服務平臺(以下簡稱平臺)將建立一個基于3G移動互聯網的客戶服務體系,平臺通過3G移動互聯網的方式向用戶提供貼心服務,以文字、圖片、演示視頻、對講、在線視頻等服務方式遠程指導、解答、協助解決用戶在使用產品過程中遇到的實際困難和問題。
3G移動互聯網客戶服務平臺具有的四大要素是:知識庫系統、手機客戶端(移動終端應用)、客服客戶端(PC客戶端為主、移動客戶端為輔)、智能調度服務系統。
知識庫系統是平臺的重要組成部分,是客服人員向終端用戶提供產品指導、服務的“力量”源泉。知識庫系統提供從后臺知識點的收集、整理、編輯、批注、審核到前端客服人員的綜合查詢等功能,要求為最終客戶提供精準的“答案”為目標,但因產品的不同需求、不同服務標準而異,故本文略過。
手機客戶端是平臺向用戶提供服務的窗口和工具。用戶通過手機客戶端,可以全天候從平臺獲取強大的、精準的(預過濾的)、條理清晰的、兼有資深專家遠程在線服務的相關產品的知識內容。手機客戶端產品是整個產品體系競爭優勢的不可或缺的重要組成部分,也是展現平臺人性化、智能化、應用級容錯等用戶體驗的最直接產品。
以PC客戶端為主的客服客戶端是平臺后方數以千計的客服人員向手機客戶端提供服務的工具。可分為三種類別:客服交互式客戶端 (包括普通客服和專家客服)、客服管理客戶端、客服會話實時監控客戶端。移動客戶端作為PC客戶端的補充,其需求和功能要求與PC客戶端基本一樣,本文不再贅述。
智能調度服務系統是平臺的核心。該系統依據將要提供服務的產品的市場廣度、用戶使用產品的頻繁程度、難易程度而決定的“在線用戶數”、“并發用戶數”和“系統高可用性”等為主要指標進行設計。
本文中平臺針對“三大運營商”(電信、移動、聯通)的3G手機及其服務為需求藍本而設計,在一定地域內,無須裝備昂貴的小型機或大型機硬件設備,該數據中心可以具有支持百萬級別在線用戶、并發會話用戶上萬級別的設計能力和高可用性。
手機客戶端應符合一般3G移動互聯網應用的特性,操作簡便,能夠方便讓非專業的手機用戶有效使用。可以滿足和具備如下描述功能里的一項或多項,具體的功能應當視實際需求而增減。(1)通過手機注冊、登錄、密碼修改、客戶資料完善功能;(2)類似IM即時通信軟件所提供的基本功能,如:文字聊天、文件、圖片傳送、對講或視頻聊天等;(3)訂閱主題、廣告、應用等服務;(4)留言板和語言信箱服務;(5)訂購收費服務;(6)給客服打分、添加評論;(7)接收服務器推送的廣告、應用、主題訂閱等文字圖片,下載和安裝服務器推送的應用軟件;(8)在線檢測手機的硬件配置、性能、在線故障診斷、并給出修復建議;(9)遠程配置和監控手機終端;(10)歷史聊天記錄查閱、刪除;(11)收費服務訂購、查閱、統計等。
客服客戶端主要功能包括:(1)通過PC或手機登錄客服系統、密碼修改;(2)類似IM即時通信軟件所提供的基本功能,如:文字聊天、文件、圖片傳送、對講或視屏聊天等;(3)具備一個客服同時服務于多個手機客戶端的能力;(4)可以向更高級別的客服提交轉移當前服務的申請;(5)回復留言、語言信箱;(6)客服分組、優先級調度、資料更新等;(管理終端)(7)歷史客服記錄查閱、統計;(管理終端)(8)實時監控,可以以電視墻的展現方式同時監控多個客服終端席位。(監控終端)
(1)為手機客戶端智能分配客服終端;
(2)為客服終端之間提供透明轉接;
(3)容錯和容災設計;
(4)內容過濾和攔截。
(1)收費服務結算;
(2)實時查閱、統計。
(1)海量在線用戶和并發會話;
(2)系統高可用性和應用級容錯設計,當系統中有一臺或多臺服務器、網絡設備出現故障或宕機,如何確保業務 (客服和手機客戶端的會話或其他后臺事務處理)的可持續性、不間斷性;
(3)容災備份和恢復。
2.1.1 系統設計難點分析
與ERP或者MIS系統比較,平臺的業務流程相對比較清晰和簡單。系統設計的難點主要表現在兩個方面:首先,系統必須滿足海量的在線用戶和并發事務需求。其次,系統必須滿足高可用性需求:作為服務型平臺,系統必須每年365天,每周7天×24小時運營。不僅如此,系統需要具備一定的業務容錯性,不論何時何地,即使某個數據中心出現網絡故障、一臺或多臺服務器故障,用戶都可以接入并得到響應和服務。
要解決好以上兩個問題,就必須認真考慮系統架構、通信協議和數據庫的設計。
不同地域的前置服務器采用分布式設計策略,可按地區和數據中心進行劃分,解決部分在線用戶和并發事務問題。
部署在數據中心的應用服務器池和數據庫采用集中式設計策略,不僅要解決數據(庫)的管理問題,在數據庫設計上也要考慮響應時間和數據存儲方式的問題。內存數據庫、共享內存、數據按地域存儲等設計是系統架構設計時必須考慮的技術要素。
同時,不同地域的前置服務器和應用服務器池、數據庫服務器之間的通信、后臺服務進程、線程都要以“容錯”為設計的基本理念,以此為基礎,才能有效地解決好海量在線和并發用戶、響應時間、系統高可用性的問題。在該系統的設計中,將“容錯”理念有效地融入了高可用性網絡設計、軟件架構設計、數據庫設計方方面面。
2.1.2 平臺的基本架構
平臺的基本架構設計如圖1所示。整個平臺分為“遠程”、“數據中心”和“客服中心”三大“區域”。根據需要,三大“區域”可以分布在不同或相同的地理位置。
(1)遠程
為了服務不同地域的手機用戶,在不同的地域(如城市)部署一臺或多臺“前置服務器”,為手機終端提供登錄、會話請求服務。
“前置服務器”將手機終端的會話轉發給 “數據中心”的“應用服務器池”中的某臺特定的、正在活動的“應用服務器”;“前置服務器”上預存“應用服務器池”列表且可動態更新“池”中各個服務器的工作狀態(活動或故障)。
同一地點的“前置服務器”視用戶數可以合并和拆分。不僅如此,如果某一臺或多臺“前置服務器”故障或網絡中斷,手機客戶端將會自動尋找并請求同一地域的其他“前置服務器”服務,也可以請求其他地域的“前置服務器”提供服務。
(2)數據中心

圖1 基本架構設計圖
數據中心按建設規模和服務地域來規劃和設計“應用服務器池”和“數據庫服務器”的容量。一個數據中心應該能夠支持多個不同地域或地區的海量手機終端的并發訪問。考慮到我國幅員遼闊,可以根據人口密度配置3~4個大型數據中心。
與“前置服務器”可動態配對的“應用服務器”根據“智能調度服務進程”的指令配對(或重新配對)客服席位和轉發來自于手機“前置服務器”和客服“前置服務器”的會話。如果“應用服務器池”中的某臺或多臺服務器故障,原本與之通信的所有“前置服務器”都將會自動尋找和請求池里其他的服務器繼續提供服務。
會話的內容通過“內容審核服務”進程過濾和攔截。
“智能調度服務”進程根據配對規則和優先服務級別為手機終端和客服終端提供配對和重新配對會話。
“寫數據庫服務”進程將交互會話的所有內容和日志依據寫策略實時或者異步存放到數據庫。
“讀數據庫服務”進程讀取數據庫中的信息到內存數據庫中或發給特定的服務進程。
“會話監控服務”進程將監控所有交互會話,并把會話內容轉發給“實時監控終端”。
“內存數據庫管理”進程管理內存數據庫(或共享內存區),并負責信息的讀入和清理(移出)。
文件FTP服務器池提供超出一定大小的文件和應用的下載服務。
知識庫系統為客服人員提供手機終端提出的問題的解答、應用下載地址等服務,主要的使用者是客服人員。
以上列出了數據中心服務器上運行的主要后臺進程和服務,此外還有諸如“Keep live”(保持客戶端和服務器連接)、“Server heartbeat agent”(檢測服務器是否活動)、“訂閱廣播”等進程或服務。
(3)客服中心
客服中心主要由“普通客服席”、“專家客服席”、“客服管理席”和“客服監控席”組成。不同的席位對應不同的終端應用。
平臺的基本架構可以向如下兩個方向進行擴展應用:(1)結合“云計算”技術,為手機終端提供文件的轉儲和多臺移動終端之間文件同步服務;(2)結合“容災備份和恢復”技術,形成跨地域(省、市)的“大”數據中心。
(1)分布和集中的合理結合
在平臺運行一定時間后,依據不同地域的手機終端的數量、在線用戶數量、并發會話數量、平均使用頻繁度等實際統計數據,可以動態分配和重新部署不同地域的“前置服務器”和與之配對的數據中心的 “應用服務器池”、“數據庫服務器”的配比和數量,以期最大限度地發揮系統中每個服務器的能力,調配資源,環保節能。
(2)應用級容錯設計、數據庫容災設計
如果一臺或多臺“前置服務器”故障,手機終端將會自動選擇本地或異地的其他“前置服務器”繼續會話。如果一臺或多臺“應用服務器”故障,“前置服務器”將會自動選擇其他服務器(包括異地或第二數據中心的應用服務器池)繼續會話。如果某臺“數據庫服務器”故障,數據庫池里的其他數據庫服務器將會無縫、實時地接管服務,最大限度地降低數據庫宕機導致業務中斷的幾率。
在極端情況下,如火災、地震等,部署在異地或其他地域的數據中心可以無縫接管當前的會話和服務。
(3)高伸縮性、高擴展性、高可用性設計
本文所述的設計特色使系統具備了非常高的伸縮性和擴展性,基于應用級容錯的設計方法和容災設計同時確保了系統的高可用性。
本平臺基于分布式、實時系統、應用級容錯設計,具有支持特大在線用戶和并發用戶的能力,兼具管理、實時監控、智能調度、基于規則過濾等綜合特點,不僅適用于聚合海量用戶的三大運營商的產品客服體系建設,也可以推廣到其他大型或巨型用戶的行業或應用,比如,3G移動互聯網社交網絡、“云計算”服務平臺、廣告和應用推送服務平臺、飛機票、火車票售賣等客服系統的設計和建設,具有廣闊的應用前景。