劉沛強(qiáng)
(1.華為技術(shù)有限公司,廣東 廣州 510627;2.廣州夢(mèng)海信息技術(shù)有限公司,廣東 廣州 510665)
近十年來(lái),隨著各種開(kāi)源項(xiàng)目的蓬勃發(fā)展,IT業(yè)界出現(xiàn)了越來(lái)越多成熟可用的開(kāi)源軟件。而互聯(lián)網(wǎng)廠商,特別是電商井噴式地發(fā)展,普遍要求高可用、高并發(fā)、大容量的系統(tǒng)架構(gòu)。互聯(lián)網(wǎng)廠商與開(kāi)源項(xiàng)目的結(jié)合日益加深,谷歌和亞馬遜等巨頭甚至自研開(kāi)源軟件以支撐業(yè)務(wù)的發(fā)展。一系列互聯(lián)網(wǎng)龍頭企業(yè)的成功,為上述系統(tǒng)架構(gòu)的推廣提供了最好的范例。與互聯(lián)網(wǎng)企業(yè)不斷進(jìn)行技術(shù)創(chuàng)新和顛覆相反,移動(dòng)運(yùn)營(yíng)商由于轉(zhuǎn)型較慢,系統(tǒng)架構(gòu)相對(duì)保守,但運(yùn)營(yíng)商也存在系統(tǒng)架構(gòu)更新?lián)Q代的迫切需求。一方面,由于用戶(hù)需求從語(yǔ)音、短信逐漸過(guò)渡到面向網(wǎng)際互聯(lián)協(xié)議(IP)的長(zhǎng)期演進(jìn)語(yǔ)音承載(Voice over Long-Term Evolution,VoLTE)、規(guī)模化的物聯(lián)網(wǎng)(Internet of Things,IoT)、低時(shí)延的車(chē)聯(lián)網(wǎng)、VR 等業(yè)務(wù),需要支持網(wǎng)絡(luò)切片;另一方面,需要降低運(yùn)營(yíng)成本,特別是需要降低服務(wù)器成本和日常運(yùn)維的成本,高昂的成本嚴(yán)重影響了運(yùn)營(yíng)商的利潤(rùn)。因此,互聯(lián)網(wǎng)企業(yè)催化成熟的眾多開(kāi)源軟件,為移動(dòng)運(yùn)營(yíng)商的系統(tǒng)架構(gòu)提供了很好的范例。
目前中國(guó)移動(dòng)集團(tuán)公司客戶(hù)關(guān)系管理(Customer Relationship Management,CRM)采用的是集團(tuán)公司CRM+省公司CRM 的二級(jí)架構(gòu)[1],各省份的CRM系統(tǒng)獨(dú)立進(jìn)行建設(shè),它們由不同的廠家進(jìn)行研發(fā),只要滿(mǎn)足與集團(tuán)公司的接口協(xié)議即可,但各廠家采用的是不同的系統(tǒng)架構(gòu)。由于運(yùn)營(yíng)商對(duì)系統(tǒng)架構(gòu)的高可用和高并發(fā)有極高的要求、對(duì)接的子系統(tǒng)繁多、數(shù)據(jù)量龐大而復(fù)雜,因此普遍采用相對(duì)保守的技術(shù)架構(gòu),對(duì)開(kāi)源軟件持審慎的態(tài)度。總的來(lái)說(shuō),目前移動(dòng)運(yùn)營(yíng)商的CRM 架構(gòu)有以下特點(diǎn):
單體式服務(wù)的優(yōu)點(diǎn)在于編譯、發(fā)布方便,結(jié)構(gòu)簡(jiǎn)單清晰,只需要訪問(wèn)單臺(tái)的數(shù)據(jù)庫(kù),因此容易進(jìn)行網(wǎng)絡(luò)規(guī)劃,數(shù)據(jù)備份恢復(fù)也相對(duì)容易。但模塊之間耦合度很高,擴(kuò)容比較麻煩,并且數(shù)據(jù)庫(kù)訪問(wèn)壓力較大,因而對(duì)系統(tǒng)穩(wěn)定性要求極高,服務(wù)器一般采用小型機(jī)。分布式服務(wù)克服了單體服務(wù)的上述缺點(diǎn),由于關(guān)鍵的模塊分開(kāi)部署,分擔(dān)了系統(tǒng)的壓力,服務(wù)器可以采用小型機(jī)或X86 結(jié)構(gòu)的PC server。
單體服務(wù)的系統(tǒng)結(jié)構(gòu),在存儲(chǔ)方面通常采用集中式的存儲(chǔ),主要采用Oracle 數(shù)據(jù)庫(kù)和易安信(EMC)公司的存儲(chǔ)服務(wù)器,以滿(mǎn)足超大規(guī)模的存儲(chǔ)容量和超高的處理速度。同時(shí),采用光纖通道與服務(wù)器進(jìn)行傳輸,以滿(mǎn)足大容量的數(shù)據(jù)交換的要求。也有的省份采用分布式存儲(chǔ)結(jié)構(gòu),即將不同功能模塊的數(shù)據(jù)分開(kāi)存儲(chǔ),以減輕數(shù)據(jù)庫(kù)壓力。
CRM 的某些業(yè)務(wù)需要進(jìn)行跨地市交互,例如省內(nèi)家庭網(wǎng)、異地補(bǔ)卡等業(yè)務(wù)。有的省份數(shù)據(jù)量不大,可以使用同一個(gè)實(shí)例進(jìn)行處理,能確保在一個(gè)事務(wù)中進(jìn)行提交。而有的省份數(shù)據(jù)量非常大,不同的地市的服務(wù)和數(shù)據(jù)分布在不同的實(shí)例上,需要進(jìn)行跨區(qū)服務(wù)調(diào)用進(jìn)行業(yè)務(wù)處理。這種架構(gòu)一般采用異步方式處理跨地市業(yè)務(wù),因此需要一定的糾錯(cuò)機(jī)制,例如業(yè)務(wù)回退或者數(shù)據(jù)一致性稽核,來(lái)保證不同地市的數(shù)據(jù)一致性。此外,不同省份的地市之間,只能使用跨區(qū)接口進(jìn)行業(yè)務(wù)交互。
目前集團(tuán)CRM 與省CRM 之間采用一級(jí)BOSS規(guī)范進(jìn)行交互。集團(tuán)公司對(duì)省公司的主套餐和重點(diǎn)業(yè)務(wù)有統(tǒng)一的規(guī)范和要求,集團(tuán)CRM 通過(guò)一級(jí)BOSS 協(xié)議對(duì)省CRM 進(jìn)行驗(yàn)收和常規(guī)考核,如4G/5G 主套餐、WLAN、夢(mèng)網(wǎng)業(yè)務(wù)、家庭寬帶等業(yè)務(wù)。
在互聯(lián)網(wǎng)時(shí)代,移動(dòng)運(yùn)營(yíng)商除了傳統(tǒng)的營(yíng)業(yè)廳、電子渠道、網(wǎng)站、移動(dòng)商城等渠道之外,還需要通過(guò)互聯(lián)網(wǎng)廠商進(jìn)行引流。能力開(kāi)放平臺(tái)[2]為移動(dòng)運(yùn)營(yíng)商提供核心業(yè)務(wù)能力輸出,支撐移動(dòng)運(yùn)營(yíng)商與外部合作伙伴進(jìn)行增值業(yè)務(wù)合作,通過(guò)提供統(tǒng)一、安全的輸出接口,實(shí)現(xiàn)“對(duì)外能力開(kāi)放,對(duì)內(nèi)服務(wù)集成”,助力CRM 系統(tǒng)在互聯(lián)網(wǎng)領(lǐng)域進(jìn)行業(yè)務(wù)拓展。
這幾年來(lái),各省份的移動(dòng)運(yùn)營(yíng)商的架構(gòu)升級(jí)持續(xù)進(jìn)行中:海南移動(dòng)向“云+平臺(tái)+應(yīng)用”的互聯(lián)網(wǎng)架構(gòu)轉(zhuǎn)型[3];山東移動(dòng)使用華為產(chǎn)品成功完成了CRM 核心系統(tǒng)的軟硬件替換升級(jí),引入面向服務(wù)的架構(gòu)(Service-Oriented Architecture,SOA)、云計(jì)算、大數(shù)據(jù)等新架構(gòu)建設(shè)了全新的CRM 系統(tǒng);2020 年12 月,青海移動(dòng)省級(jí)CRM/BOSS 系統(tǒng)華南節(jié)點(diǎn)割接上線……總的來(lái)說(shuō),移動(dòng)運(yùn)營(yíng)商架構(gòu)演進(jìn)體現(xiàn)出以下特點(diǎn)和趨勢(shì)。
隨著國(guó)內(nèi)云化建設(shè)進(jìn)程的加快,越來(lái)越多的硬件和軟件部署到云端。中國(guó)移動(dòng)正在啟動(dòng)全球最大規(guī)模的網(wǎng)絡(luò)云化變革,并計(jì)劃在2025 年達(dá)到100&的云化。作為5G 網(wǎng)絡(luò)的運(yùn)營(yíng)支撐系統(tǒng),CRM 必然深受影響[4]。新一代的CRM 架構(gòu),總體思路是云化部署,包括硬件系統(tǒng)的云化和分布式的應(yīng)用架構(gòu)[5]。云化有以下3 個(gè)優(yōu)勢(shì)。
(1)可以根據(jù)業(yè)務(wù)發(fā)展需要進(jìn)行快速、彈性部署[6]。由于對(duì)業(yè)務(wù)增長(zhǎng)難以準(zhǔn)確預(yù)估,通過(guò)云化,可以對(duì)資源進(jìn)行集約化管理,方便快速地進(jìn)行資源調(diào)配,做到即開(kāi)即用。
(2)管理簡(jiǎn)單。CRM 業(yè)務(wù)需要維護(hù)人員每日巡檢軟硬件設(shè)施以保證7×24 小時(shí)不間斷服務(wù),這對(duì)運(yùn)營(yíng)商來(lái)說(shuō)是一筆很大的成本,而使用云服務(wù)器可以大幅度降低運(yùn)維成本。
(3)價(jià)格相對(duì)低廉。云服務(wù)器可以使用X86服務(wù)器承載基礎(chǔ)應(yīng)用,通過(guò)云平臺(tái)的自動(dòng)化安裝部署,極大的節(jié)省搭建基礎(chǔ)網(wǎng)絡(luò)設(shè)施的成本。
移動(dòng)運(yùn)營(yíng)商CRM 系統(tǒng)建設(shè),走了一條各地市分別建設(shè)到全省規(guī)劃建設(shè)的道路。各省根據(jù)自身業(yè)務(wù)發(fā)展的規(guī)律自行獨(dú)立建設(shè),開(kāi)展了許多具有當(dāng)?shù)靥厣臉I(yè)務(wù)。然而,這也導(dǎo)致各省的CRM 系統(tǒng)不僅在系統(tǒng)架構(gòu)方面設(shè)計(jì)迥異,而且在業(yè)務(wù)規(guī)劃上也千差萬(wàn)別。這就使得同一個(gè)相似的業(yè)務(wù),各省的業(yè)務(wù)流程和功能各不相同,甚至在業(yè)務(wù)功能上相去甚遠(yuǎn),因此在集團(tuán)頂層上難以進(jìn)行統(tǒng)一。這樣,在硬件設(shè)施云化的基礎(chǔ)上,CRM 系統(tǒng)進(jìn)行區(qū)域集中化建設(shè)的統(tǒng)一規(guī)劃就成為一個(gè)趨勢(shì):地域相近的若干個(gè)省份,集中共建一套CRM 系統(tǒng),如圖1 所示。目前有的省份正在進(jìn)行區(qū)域集中建設(shè)。例如,西部某省份在全球第二的業(yè)務(wù)支撐系統(tǒng)(Business Support System,BSS)廠商亞信的幫助下,正在開(kāi)展CRM 集中化項(xiàng)目;吉林移動(dòng)在國(guó)內(nèi)知名CRM 廠商思特奇的支持下,也于2021 年3 月上線了全網(wǎng)集中化項(xiàng)目。

圖1 CRM 區(qū)域集中化云
區(qū)域集中化建設(shè)需要有一個(gè)統(tǒng)一的基礎(chǔ)平臺(tái)對(duì)各省的用戶(hù)和業(yè)務(wù)進(jìn)行統(tǒng)一地集中管理。如圖2 所示,系統(tǒng)架構(gòu)可以采用1 個(gè)基礎(chǔ)平臺(tái)+N個(gè)省份的定制模塊的方式,硬件設(shè)施的云化為統(tǒng)一的基礎(chǔ)平臺(tái)提供了保證。在此基礎(chǔ)上,允許區(qū)域內(nèi)各省對(duì)服務(wù)接口進(jìn)行定制化,可以?xún)?yōu)先調(diào)用定制接口。如果不存在定制,則使用公共的服務(wù)。這樣既能最大程度的減少基礎(chǔ)平臺(tái)和服務(wù)的重復(fù)開(kāi)發(fā)和運(yùn)維,又能保留各省份業(yè)務(wù)的特色。

圖2 一種統(tǒng)一集成平臺(tái)的區(qū)域集中化CRM 系統(tǒng)
區(qū)域化統(tǒng)一運(yùn)營(yíng),需要將不同省份的用戶(hù)數(shù)據(jù)云化存放,在統(tǒng)一的系統(tǒng)架構(gòu)下對(duì)不同的省份進(jìn)行數(shù)據(jù)隔離,這就要使用到多租戶(hù)模式,將每個(gè)省作為一個(gè)租戶(hù)。多租戶(hù)隔離模式主要有以下3 種。
(1)每個(gè)租戶(hù)獨(dú)立創(chuàng)建數(shù)據(jù)庫(kù),這種模式安全性最好,隔離級(jí)別也最高。其優(yōu)點(diǎn)是每個(gè)租戶(hù)都可以使用不同的擴(kuò)展方案以滿(mǎn)足不同省份的獨(dú)特需求,如果系統(tǒng)出現(xiàn)的故障只影響一個(gè)省,恢復(fù)也相對(duì)容易;缺點(diǎn)是采購(gòu)和維護(hù)成本比較高,一旦修改公共部分的數(shù)據(jù)和結(jié)構(gòu)就要把所有數(shù)據(jù)庫(kù)都修改 一次。
(2)所有租戶(hù)共享數(shù)據(jù)庫(kù),但每個(gè)租戶(hù)使用不同的schema。它也可以為租戶(hù)采用個(gè)性化的擴(kuò)展方案,租戶(hù)數(shù)據(jù)也能實(shí)現(xiàn)一定程度的隔離。因?yàn)闀?huì)涉及到其他租戶(hù)的數(shù)據(jù),所以數(shù)據(jù)恢復(fù)比較麻煩。這是一種平衡型的模式。
(3)所有租戶(hù)共享數(shù)據(jù)庫(kù),共享 Schema 和數(shù)據(jù)表,僅在每一個(gè)表中增加租戶(hù)標(biāo)識(shí)以區(qū)分不同省份的數(shù)據(jù)。這是共享程度最高的模式,數(shù)據(jù)并不進(jìn)行物理隔離,僅在邏輯上區(qū)分。該模式的配置成本最低,每個(gè)數(shù)據(jù)庫(kù)的租戶(hù)數(shù)量最多;缺點(diǎn)是數(shù)據(jù)安全性和隔離性最差,數(shù)據(jù)的備份和恢復(fù)最麻煩,每個(gè)表都需要針對(duì)不同租戶(hù)進(jìn)行不同處理。
上述3 種方案,除了考慮隔離性和成本外,還需要對(duì)其他因素進(jìn)行綜合考慮,例如各租戶(hù)數(shù)據(jù)量大小是否合適,如果單個(gè)租戶(hù)的數(shù)據(jù)量已經(jīng)非常巨大,則傾向于隔離;反之,如果單個(gè)租戶(hù)數(shù)據(jù)量不大但租戶(hù)數(shù)量比較多,則傾向于共享。
隨著用戶(hù)量的劇增,移動(dòng)運(yùn)營(yíng)商的CRM 承受的壓力越來(lái)越大,傳統(tǒng)的單體式服務(wù)已經(jīng)越來(lái)越難以滿(mǎn)足高并發(fā)訪問(wèn)的要求,繼續(xù)橫向擴(kuò)展也難以為繼。有的省份甚至已經(jīng)考慮從熱點(diǎn)城市、繁忙時(shí)段和服務(wù)接口等幾個(gè)維度對(duì)用戶(hù)訪問(wèn)進(jìn)行“限流”,即按照一定比例隨機(jī)性的限制訪問(wèn)。而微服務(wù)架構(gòu)在誕生之初就攜帶著擴(kuò)展成本低、高可靠性、高并發(fā)性的基因,因而在互聯(lián)網(wǎng)廠商中早已得到普遍的應(yīng)用。在CRM 系統(tǒng)中引入微服務(wù)架構(gòu),不僅能以較小的成本在X86 架構(gòu)的PC Server 中進(jìn)行部署,而且便于橫向擴(kuò)展,對(duì)熱點(diǎn)服務(wù)部署多套,由負(fù)載均衡器對(duì)請(qǐng)求進(jìn)行動(dòng)態(tài)分配。由于每個(gè)服務(wù)都存在若干個(gè)“無(wú)狀態(tài)”的實(shí)例,如果個(gè)別服務(wù)器出現(xiàn)擁塞甚至故障,用戶(hù)請(qǐng)求就會(huì)被動(dòng)態(tài)分配到其他服務(wù)器,并且對(duì)用戶(hù)無(wú)感知,這樣就兼顧了服務(wù)的低成本和高可用性,同時(shí)還有利于去IOE(IBM 小型機(jī)、Oracle 數(shù)據(jù)庫(kù)、EMC 存儲(chǔ)設(shè)備)。
在微服務(wù)架構(gòu)中,各服務(wù)之間的調(diào)用非常繁雜,一旦出現(xiàn)問(wèn)題就需要根據(jù)服務(wù)日志一層一層的定位。解決問(wèn)題的辦法,是將這個(gè)請(qǐng)求經(jīng)過(guò)的每一個(gè)節(jié)點(diǎn)都記錄下來(lái),形成一個(gè)完整的鏈條,這就是服務(wù)調(diào)用鏈,如圖3 所示。顯然,通過(guò)服務(wù)調(diào)用鏈技術(shù),可以快速定位問(wèn)題,全盤(pán)理解和監(jiān)控整個(gè)系統(tǒng)。

圖3 微服務(wù)調(diào)用鏈
服務(wù)調(diào)用鏈還可以用來(lái)分析用戶(hù)行為。在大數(shù)據(jù)時(shí)代,用戶(hù)數(shù)據(jù)越來(lái)越受到重視。與業(yè)務(wù)日志只能在用戶(hù)結(jié)果層面呈現(xiàn)用戶(hù)需求不同的是,服務(wù)調(diào)用鏈技術(shù)不僅可以看到用戶(hù)提交的操作,還可以從用戶(hù)點(diǎn)擊瀏覽器的行為過(guò)程為用戶(hù)進(jìn)行精準(zhǔn)畫(huà)像,以便更加有針對(duì)性地對(duì)用戶(hù)開(kāi)展?fàn)I銷(xiāo)活動(dòng)。
由于容器化部署具有持續(xù)集成部署、跨云平臺(tái)支持、環(huán)境標(biāo)準(zhǔn)化、隔離性和安全性等優(yōu)點(diǎn),目前已經(jīng)得到廣泛的應(yīng)用。將CRM 程序運(yùn)行在容器內(nèi)部,顯著的好處就是互相隔離、互不影響,并且可以快速部署多套鏡像而不需要考慮基礎(chǔ)環(huán)境的差異。這種優(yōu)點(diǎn)顯而易見(jiàn),由于服務(wù)器內(nèi)可以部署多個(gè)容器,每個(gè)容器內(nèi)運(yùn)行著一套獨(dú)立完整的程序,一個(gè)容器內(nèi)的服務(wù)出現(xiàn)故障,并不影響其他容器內(nèi)程序的運(yùn)行。目前最為廣泛流行的容器是Docker 和CoreOS Rocket,常用的容器編排工具有Kubernetes、Docker Swarm 等。
由于復(fù)雜的數(shù)據(jù)關(guān)系和龐雜的功能,中國(guó)移動(dòng)各省CRM 架構(gòu)改造進(jìn)展緩慢[7]。但是,隨著互聯(lián)網(wǎng)許多先進(jìn)技術(shù)的出現(xiàn),多種成熟的技術(shù)正在往傳統(tǒng)的CRM 領(lǐng)域進(jìn)行滲透,并深刻影響著下一代CRM 系統(tǒng)的發(fā)展。特別是硬件系統(tǒng)云化、多租戶(hù)、微服務(wù)、服務(wù)調(diào)用鏈等技術(shù)在CRM 系統(tǒng)的應(yīng)用,不但能顯著降低后者的建設(shè)和運(yùn)營(yíng)成本,并且能提升后者高并發(fā)、高可靠性和高可用性的能力,助力運(yùn)營(yíng)商進(jìn)行數(shù)字化轉(zhuǎn)型。
目前,各地的5G 網(wǎng)絡(luò)正在大規(guī)模進(jìn)行建設(shè),移動(dòng)運(yùn)營(yíng)商需要對(duì)CRM 系統(tǒng)進(jìn)行升級(jí)改造,提升用戶(hù)的使用體驗(yàn),占據(jù)更大的市場(chǎng)份額。