雷蕾+熊偉
【摘要】目前,商業(yè)智能系統(tǒng)作為電信行業(yè)主要的客戶行為數(shù)據(jù)分析平臺(tái),在新業(yè)務(wù)模式下已不能滿足挖掘客戶需求以支撐一線營(yíng)銷的需要。通過(guò)討論大數(shù)據(jù)時(shí)代的數(shù)據(jù)特點(diǎn),分別從數(shù)據(jù)采集及處理、數(shù)據(jù)調(diào)度及存儲(chǔ)、數(shù)據(jù)分析及應(yīng)用三方面總結(jié)出各項(xiàng)數(shù)據(jù)管理的應(yīng)對(duì)策略,為系統(tǒng)優(yōu)化提供了參考。
【關(guān)鍵詞】大數(shù)據(jù)商業(yè)智能數(shù)據(jù)管理
中圖分類號(hào):TP311.5文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1006-1010(2014)-09-0069-03
1 背景及研究現(xiàn)狀分析
移動(dòng)互聯(lián)網(wǎng)時(shí)代,新型應(yīng)用不斷涌現(xiàn),客戶行為習(xí)慣也隨之改變,電信運(yùn)營(yíng)商從以語(yǔ)音收入為主的業(yè)務(wù)模式,進(jìn)入到了語(yǔ)音和流量雙經(jīng)營(yíng)的業(yè)務(wù)模式。在此背景下,IT支撐每天面對(duì)數(shù)以PB級(jí)的海量數(shù)據(jù)[1],數(shù)據(jù)前所未有的生成速度和數(shù)量帶來(lái)了“數(shù)據(jù)雪崩”(Data Avalanche)和“數(shù)據(jù)洪流”(Data Deluge)[2-3]。如何從中挖掘有價(jià)值的商業(yè)信息,適應(yīng)“數(shù)據(jù)經(jīng)濟(jì)”(Data Economy)和“數(shù)據(jù)科學(xué)”(Data Science)[4-5]的大數(shù)據(jù)時(shí)代,這是客戶挽留營(yíng)銷和收入增長(zhǎng)的重要環(huán)節(jié)。
根據(jù)電信運(yùn)營(yíng)商現(xiàn)有的IT系統(tǒng)架構(gòu),管理及分析客戶業(yè)務(wù)數(shù)據(jù)主要由基于企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)的商業(yè)智能(Business Intelligence)系統(tǒng)完成。目前,面對(duì)業(yè)務(wù)部門的需求,該系統(tǒng)存在以下問題:
(1)分析數(shù)據(jù)缺失:客戶移動(dòng)互聯(lián)網(wǎng)行為數(shù)據(jù)采集不完整,無(wú)法還原客戶應(yīng)用場(chǎng)景。
(2)數(shù)據(jù)量劇增帶來(lái)存儲(chǔ)和處理性能的壓力:一個(gè)省的用戶流量數(shù)據(jù)每日可達(dá)150億條,約是傳統(tǒng)語(yǔ)音計(jì)費(fèi)數(shù)據(jù)的15倍。生產(chǎn)系統(tǒng)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)時(shí),ETL調(diào)度性能及數(shù)據(jù)倉(cāng)庫(kù)的擴(kuò)容速度不滿足需求。
(3)大量非結(jié)構(gòu)化數(shù)據(jù)無(wú)法用傳統(tǒng)的建模方法分析:采集到的URL串等客戶行為數(shù)據(jù),無(wú)法直接反映客戶行為特征,必須經(jīng)過(guò)處理和轉(zhuǎn)換才能獲得有用的建模信息。
2 大數(shù)據(jù)時(shí)代各項(xiàng)應(yīng)對(duì)策略
通過(guò)上述分析,可以看出在大數(shù)據(jù)時(shí)代,商業(yè)智能系統(tǒng)面臨的是從數(shù)據(jù)采集處理、調(diào)度存儲(chǔ)到分析的一系列問題,本文從完善數(shù)據(jù)源開始,探討一套完整的數(shù)據(jù)管理策略。
2.1數(shù)據(jù)采集及處理
商業(yè)智能系統(tǒng)并不產(chǎn)生實(shí)際的生產(chǎn)數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)都是從其他網(wǎng)絡(luò)、計(jì)費(fèi)、客服等生產(chǎn)系統(tǒng)獲取的,按照既定的接口通過(guò)ETL調(diào)度定期更新及完善數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)。大數(shù)據(jù)時(shí)代,2G、3G、4G、WLAN四網(wǎng)并行,除了保證2G、3G及4G網(wǎng)絡(luò)GPRS話單、WLAN流量話單、客戶位置信息、終端信息的采集外,為了精準(zhǔn)分析客戶的行為信息,還需新增兩類數(shù)據(jù)的采集,如表1所示:
表1兩類客戶行為數(shù)據(jù)基本信息
客戶行為數(shù)據(jù) 主要處理技術(shù) 數(shù)據(jù)來(lái)源
上網(wǎng)內(nèi)容 文本挖掘、爬蟲技術(shù) GGSN(Gateway GSN,網(wǎng)關(guān)GSN)等網(wǎng)關(guān)日志采集
客戶端應(yīng)用 DPI解析
(1)上網(wǎng)內(nèi)容
指采集用戶使用HTTP協(xié)議的上網(wǎng)行為日志,通過(guò)文本挖掘、爬蟲技術(shù)對(duì)URL進(jìn)行分析,獲取用戶的上網(wǎng)內(nèi)容。一個(gè)省每日從網(wǎng)絡(luò)側(cè)獲取的非結(jié)構(gòu)化的URL在50億條左右,約占1TB存儲(chǔ),其中隱含著具有商業(yè)價(jià)值的用戶偏好信息。對(duì)于一線市場(chǎng)營(yíng)銷人員,需要的是每個(gè)客戶的特征標(biāo)簽,比如,某用戶的特征標(biāo)簽是喜歡上網(wǎng)閱讀,閱讀內(nèi)容為言情小說(shuō),這樣就可以向這位用戶推薦一些手機(jī)閱讀的產(chǎn)品。因此,需要將這些非結(jié)構(gòu)化的URL記錄轉(zhuǎn)化為用戶上網(wǎng)內(nèi)容偏好標(biāo)簽,主要有以下兩種方式:
1)上網(wǎng)搜索關(guān)鍵字提取:針對(duì)搜索產(chǎn)生的URL,解析其中關(guān)鍵詞獲取標(biāo)簽信息。
2)網(wǎng)頁(yè)內(nèi)容提取:
◆建立以URL為主鍵的“網(wǎng)頁(yè)信息分類庫(kù)”,該信息庫(kù)對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行分類,并給每條URL打上分類標(biāo)簽;
◆將清洗過(guò)濾后的用戶URL記錄和“網(wǎng)頁(yè)信息分類庫(kù)”匹配,按照一定的規(guī)則(如訪問次數(shù)最多的類型)給客戶打上分類標(biāo)簽;
◆如果庫(kù)中沒有相應(yīng)的URL信息,則需要通過(guò)爬蟲及文本挖掘完善“網(wǎng)頁(yè)信息分類庫(kù)”。
(2)客戶端應(yīng)用
即識(shí)別出用戶客戶端的應(yīng)用,如QQ音樂、百度搜索等應(yīng)用。目前主要依靠在GGSN(Gateway GSN,網(wǎng)關(guān)GSN)上部署DPI(Deep Packet Inspection,深度包檢測(cè))硬件設(shè)備來(lái)實(shí)現(xiàn)。DPI技術(shù)通過(guò)對(duì)應(yīng)用流中的數(shù)據(jù)報(bào)文內(nèi)容進(jìn)行探測(cè),例如對(duì)數(shù)據(jù)報(bào)文中特定比特串進(jìn)行檢測(cè),從而確定數(shù)據(jù)報(bào)文真正的應(yīng)用類型[6]。在目前的實(shí)際應(yīng)用中,通過(guò)解析識(shí)別出來(lái)的應(yīng)用已達(dá)到 1 400種以上,基本覆蓋當(dāng)前熱門應(yīng)用。
2.2數(shù)據(jù)調(diào)度及存儲(chǔ)
其他系統(tǒng)采集處理后的數(shù)據(jù),通過(guò)ETL調(diào)度到商業(yè)智能系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行存儲(chǔ),為下一步數(shù)據(jù)分析做準(zhǔn)備。為了減輕大數(shù)據(jù)量帶來(lái)的數(shù)據(jù)倉(cāng)庫(kù)調(diào)度和存儲(chǔ)壓力,對(duì)原有系統(tǒng)架構(gòu)進(jìn)行變更,引入云平臺(tái)完成數(shù)據(jù)入庫(kù)前的預(yù)處理工作,同時(shí)提升ETL調(diào)度性能。數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)轉(zhuǎn)變?nèi)鐖D1所示:
圖1數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)轉(zhuǎn)變
下面說(shuō)明引入云平臺(tái)的作用及帶來(lái)的兩項(xiàng)提升:
(1)完成數(shù)據(jù)入庫(kù)前的預(yù)處理:減少入庫(kù)的數(shù)據(jù)量;減少入庫(kù)時(shí)數(shù)據(jù)處理操作。
表2是用戶上網(wǎng)日志在云平臺(tái)上處理前后數(shù)據(jù)量的比對(duì),基于28臺(tái)刀片服務(wù)器(BL465G7:AMD O6134*2,32GB內(nèi)存,2*300GB硬盤;D2200:300G*6)構(gòu)建的Hadoop分布式系統(tǒng)。
表2上網(wǎng)日志經(jīng)云平臺(tái)處理前后數(shù)據(jù)量比對(duì)
字段 存儲(chǔ)空間
處理前:59個(gè)字段 處理前:1TB
處理后:16個(gè)字段 處理后:600GB
可見數(shù)據(jù)量縮小了約40%,減少了入庫(kù)數(shù)據(jù)量及處理操作,降低了ETL調(diào)度及數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)壓力。
(2)完成數(shù)據(jù)文件調(diào)度到數(shù)據(jù)倉(cāng)庫(kù)的處理:提升ETL調(diào)度能力。
以應(yīng)用DPI解析結(jié)果入庫(kù)為例,采用8臺(tái)刀片服務(wù)器(BL465G7:AMD O6134*2,32GB內(nèi)存,2*300GB硬盤;D2200:300G*6)構(gòu)建的Hadoop分布式系統(tǒng)后,系統(tǒng)前后調(diào)度性能的比對(duì)如表3所示:
表3DPI解析結(jié)果調(diào)度性能提升
數(shù)據(jù)量 ETL調(diào)度時(shí)間
入倉(cāng)庫(kù)前:80億條 采用傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)ETL調(diào)度方式:8小時(shí)
入倉(cāng)庫(kù)后:6億條 引入云平臺(tái)后:1.5小時(shí)
可見其性能提升了5倍多,并在調(diào)度過(guò)程中完成數(shù)據(jù)的合并轉(zhuǎn)換工作。
2.3數(shù)據(jù)分析及應(yīng)用
經(jīng)過(guò)上述流程,電信行業(yè)大數(shù)據(jù)時(shí)代主要新增的兩類客戶行為數(shù)據(jù):客戶上網(wǎng)內(nèi)容和客戶端應(yīng)用,已經(jīng)轉(zhuǎn)化為數(shù)據(jù)模型的輸入變量,借助數(shù)據(jù)模型完成數(shù)據(jù)分析工作。從上網(wǎng)日志中提取轉(zhuǎn)換后的變量包括:上網(wǎng)內(nèi)容一級(jí)分類(閱讀、游戲、音樂等)、上網(wǎng)內(nèi)容二級(jí)分類(以閱讀為例:社科科普、名著傳記、科幻小說(shuō)等)、上網(wǎng)搜索關(guān)鍵詞等;從客戶端應(yīng)用解析轉(zhuǎn)換后的變量主要是具體應(yīng)用及應(yīng)用分類。
數(shù)據(jù)模型可利用客戶的這些上網(wǎng)行為特征,分析出營(yíng)銷挽留活動(dòng)的目標(biāo)客戶,現(xiàn)在熱點(diǎn)數(shù)據(jù)模型的種類如表4所示:
表4數(shù)據(jù)模型分類及應(yīng)用場(chǎng)景
數(shù)據(jù)模型分類 應(yīng)用場(chǎng)景
套餐營(yíng)銷類 識(shí)別目標(biāo)客戶,推薦優(yōu)惠的流量資費(fèi)套餐
終端營(yíng)銷類 識(shí)別潛在購(gòu)機(jī)客戶,推薦符合需求的智能終端機(jī)
業(yè)務(wù)營(yíng)銷類 針對(duì)不同類型的客戶,推薦感興趣的業(yè)務(wù)應(yīng)用
網(wǎng)絡(luò)分流類 引導(dǎo)客戶從2G網(wǎng)絡(luò)分流到3G、4G及WLAN網(wǎng)絡(luò),使網(wǎng)絡(luò)資源負(fù)載均衡
3 總結(jié)
綜上所述,首先通過(guò)文本挖掘、爬蟲、DPI解析技術(shù)處理從網(wǎng)絡(luò)側(cè)采集到的客戶上網(wǎng)行為數(shù)據(jù);再通過(guò)搭建云平臺(tái)提升ETL調(diào)度性能,減少數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)壓力;最后,將標(biāo)簽式的客戶行為特征變量,通過(guò)數(shù)據(jù)模型轉(zhuǎn)化為可被一線營(yíng)銷人員采用的信息。
目前,本文所述的這套大數(shù)據(jù)管理策略已在個(gè)別分公司試用,雖然還處在嘗試階段,但是效果已逐步被認(rèn)可。根據(jù)當(dāng)前在建設(shè)中遇到的困難來(lái)看,網(wǎng)頁(yè)日志解析的全面性以及DPI對(duì)新應(yīng)用解析的研發(fā)速度有待提高。另外,云平臺(tái)部署的成本投入也是個(gè)需要探討的問題,目前是通過(guò)購(gòu)買新的刀片機(jī)來(lái)實(shí)現(xiàn)的,背離了云平臺(tái)采用廉價(jià)、閑置的X86 PC設(shè)備構(gòu)建的初衷。
參考文獻(xiàn):
[1] 童曉渝,張?jiān)朴?房秉毅,等. 大數(shù)據(jù)時(shí)代電信運(yùn)營(yíng)商的機(jī)遇[J]. 信息通信技術(shù), 2013(1): 5-9.
[2] Clifford Lynch. Big data: How do your data grow[J]. Nature, 2008(455): 28-29.
[3]The Economist. The data deluge[EB/OL]. [2012-12-10]. http://www.economist.com/node/15579717.
[4] Mitch Waldrop. Big data: Wikiomics[J]. Nature, 2008(455): 22-25.
[5] Mike Loukides. What is data science[EB/OL]. [2012-12-01]. http://radar.oreilly.com/2010/06/what-is-data-science.html.
[6] 呂錦揚(yáng). DPI技術(shù)在移動(dòng)數(shù)據(jù)網(wǎng)絡(luò)分析的應(yīng)用[J]. 電信技術(shù), 2013(6): 72-75.★
作者簡(jiǎn)介
雷蕾:碩士畢業(yè)于西安交通大學(xué)軟件工程專業(yè),現(xiàn)任職于中國(guó)移動(dòng)(深圳)有限公司,從事業(yè)務(wù)支撐系統(tǒng)測(cè)評(píng)工作,研究方向?yàn)锽I系統(tǒng)架構(gòu)及數(shù)據(jù)挖掘技術(shù)應(yīng)用。
熊偉:碩士畢業(yè)于天津科技大學(xué),現(xiàn)任職于中國(guó)移動(dòng)(深圳)有限公司,從事業(yè)務(wù)支撐系統(tǒng)測(cè)評(píng)工作,研究方向?yàn)檐浖_發(fā)和測(cè)試各類應(yīng)用技術(shù)。
endprint
【摘要】目前,商業(yè)智能系統(tǒng)作為電信行業(yè)主要的客戶行為數(shù)據(jù)分析平臺(tái),在新業(yè)務(wù)模式下已不能滿足挖掘客戶需求以支撐一線營(yíng)銷的需要。通過(guò)討論大數(shù)據(jù)時(shí)代的數(shù)據(jù)特點(diǎn),分別從數(shù)據(jù)采集及處理、數(shù)據(jù)調(diào)度及存儲(chǔ)、數(shù)據(jù)分析及應(yīng)用三方面總結(jié)出各項(xiàng)數(shù)據(jù)管理的應(yīng)對(duì)策略,為系統(tǒng)優(yōu)化提供了參考。
【關(guān)鍵詞】大數(shù)據(jù)商業(yè)智能數(shù)據(jù)管理
中圖分類號(hào):TP311.5文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1006-1010(2014)-09-0069-03
1 背景及研究現(xiàn)狀分析
移動(dòng)互聯(lián)網(wǎng)時(shí)代,新型應(yīng)用不斷涌現(xiàn),客戶行為習(xí)慣也隨之改變,電信運(yùn)營(yíng)商從以語(yǔ)音收入為主的業(yè)務(wù)模式,進(jìn)入到了語(yǔ)音和流量雙經(jīng)營(yíng)的業(yè)務(wù)模式。在此背景下,IT支撐每天面對(duì)數(shù)以PB級(jí)的海量數(shù)據(jù)[1],數(shù)據(jù)前所未有的生成速度和數(shù)量帶來(lái)了“數(shù)據(jù)雪崩”(Data Avalanche)和“數(shù)據(jù)洪流”(Data Deluge)[2-3]。如何從中挖掘有價(jià)值的商業(yè)信息,適應(yīng)“數(shù)據(jù)經(jīng)濟(jì)”(Data Economy)和“數(shù)據(jù)科學(xué)”(Data Science)[4-5]的大數(shù)據(jù)時(shí)代,這是客戶挽留營(yíng)銷和收入增長(zhǎng)的重要環(huán)節(jié)。
根據(jù)電信運(yùn)營(yíng)商現(xiàn)有的IT系統(tǒng)架構(gòu),管理及分析客戶業(yè)務(wù)數(shù)據(jù)主要由基于企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)的商業(yè)智能(Business Intelligence)系統(tǒng)完成。目前,面對(duì)業(yè)務(wù)部門的需求,該系統(tǒng)存在以下問題:
(1)分析數(shù)據(jù)缺失:客戶移動(dòng)互聯(lián)網(wǎng)行為數(shù)據(jù)采集不完整,無(wú)法還原客戶應(yīng)用場(chǎng)景。
(2)數(shù)據(jù)量劇增帶來(lái)存儲(chǔ)和處理性能的壓力:一個(gè)省的用戶流量數(shù)據(jù)每日可達(dá)150億條,約是傳統(tǒng)語(yǔ)音計(jì)費(fèi)數(shù)據(jù)的15倍。生產(chǎn)系統(tǒng)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)時(shí),ETL調(diào)度性能及數(shù)據(jù)倉(cāng)庫(kù)的擴(kuò)容速度不滿足需求。
(3)大量非結(jié)構(gòu)化數(shù)據(jù)無(wú)法用傳統(tǒng)的建模方法分析:采集到的URL串等客戶行為數(shù)據(jù),無(wú)法直接反映客戶行為特征,必須經(jīng)過(guò)處理和轉(zhuǎn)換才能獲得有用的建模信息。
2 大數(shù)據(jù)時(shí)代各項(xiàng)應(yīng)對(duì)策略
通過(guò)上述分析,可以看出在大數(shù)據(jù)時(shí)代,商業(yè)智能系統(tǒng)面臨的是從數(shù)據(jù)采集處理、調(diào)度存儲(chǔ)到分析的一系列問題,本文從完善數(shù)據(jù)源開始,探討一套完整的數(shù)據(jù)管理策略。
2.1數(shù)據(jù)采集及處理
商業(yè)智能系統(tǒng)并不產(chǎn)生實(shí)際的生產(chǎn)數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)都是從其他網(wǎng)絡(luò)、計(jì)費(fèi)、客服等生產(chǎn)系統(tǒng)獲取的,按照既定的接口通過(guò)ETL調(diào)度定期更新及完善數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)。大數(shù)據(jù)時(shí)代,2G、3G、4G、WLAN四網(wǎng)并行,除了保證2G、3G及4G網(wǎng)絡(luò)GPRS話單、WLAN流量話單、客戶位置信息、終端信息的采集外,為了精準(zhǔn)分析客戶的行為信息,還需新增兩類數(shù)據(jù)的采集,如表1所示:
表1兩類客戶行為數(shù)據(jù)基本信息
客戶行為數(shù)據(jù) 主要處理技術(shù) 數(shù)據(jù)來(lái)源
上網(wǎng)內(nèi)容 文本挖掘、爬蟲技術(shù) GGSN(Gateway GSN,網(wǎng)關(guān)GSN)等網(wǎng)關(guān)日志采集
客戶端應(yīng)用 DPI解析
(1)上網(wǎng)內(nèi)容
指采集用戶使用HTTP協(xié)議的上網(wǎng)行為日志,通過(guò)文本挖掘、爬蟲技術(shù)對(duì)URL進(jìn)行分析,獲取用戶的上網(wǎng)內(nèi)容。一個(gè)省每日從網(wǎng)絡(luò)側(cè)獲取的非結(jié)構(gòu)化的URL在50億條左右,約占1TB存儲(chǔ),其中隱含著具有商業(yè)價(jià)值的用戶偏好信息。對(duì)于一線市場(chǎng)營(yíng)銷人員,需要的是每個(gè)客戶的特征標(biāo)簽,比如,某用戶的特征標(biāo)簽是喜歡上網(wǎng)閱讀,閱讀內(nèi)容為言情小說(shuō),這樣就可以向這位用戶推薦一些手機(jī)閱讀的產(chǎn)品。因此,需要將這些非結(jié)構(gòu)化的URL記錄轉(zhuǎn)化為用戶上網(wǎng)內(nèi)容偏好標(biāo)簽,主要有以下兩種方式:
1)上網(wǎng)搜索關(guān)鍵字提取:針對(duì)搜索產(chǎn)生的URL,解析其中關(guān)鍵詞獲取標(biāo)簽信息。
2)網(wǎng)頁(yè)內(nèi)容提取:
◆建立以URL為主鍵的“網(wǎng)頁(yè)信息分類庫(kù)”,該信息庫(kù)對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行分類,并給每條URL打上分類標(biāo)簽;
◆將清洗過(guò)濾后的用戶URL記錄和“網(wǎng)頁(yè)信息分類庫(kù)”匹配,按照一定的規(guī)則(如訪問次數(shù)最多的類型)給客戶打上分類標(biāo)簽;
◆如果庫(kù)中沒有相應(yīng)的URL信息,則需要通過(guò)爬蟲及文本挖掘完善“網(wǎng)頁(yè)信息分類庫(kù)”。
(2)客戶端應(yīng)用
即識(shí)別出用戶客戶端的應(yīng)用,如QQ音樂、百度搜索等應(yīng)用。目前主要依靠在GGSN(Gateway GSN,網(wǎng)關(guān)GSN)上部署DPI(Deep Packet Inspection,深度包檢測(cè))硬件設(shè)備來(lái)實(shí)現(xiàn)。DPI技術(shù)通過(guò)對(duì)應(yīng)用流中的數(shù)據(jù)報(bào)文內(nèi)容進(jìn)行探測(cè),例如對(duì)數(shù)據(jù)報(bào)文中特定比特串進(jìn)行檢測(cè),從而確定數(shù)據(jù)報(bào)文真正的應(yīng)用類型[6]。在目前的實(shí)際應(yīng)用中,通過(guò)解析識(shí)別出來(lái)的應(yīng)用已達(dá)到 1 400種以上,基本覆蓋當(dāng)前熱門應(yīng)用。
2.2數(shù)據(jù)調(diào)度及存儲(chǔ)
其他系統(tǒng)采集處理后的數(shù)據(jù),通過(guò)ETL調(diào)度到商業(yè)智能系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行存儲(chǔ),為下一步數(shù)據(jù)分析做準(zhǔn)備。為了減輕大數(shù)據(jù)量帶來(lái)的數(shù)據(jù)倉(cāng)庫(kù)調(diào)度和存儲(chǔ)壓力,對(duì)原有系統(tǒng)架構(gòu)進(jìn)行變更,引入云平臺(tái)完成數(shù)據(jù)入庫(kù)前的預(yù)處理工作,同時(shí)提升ETL調(diào)度性能。數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)轉(zhuǎn)變?nèi)鐖D1所示:
圖1數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)轉(zhuǎn)變
下面說(shuō)明引入云平臺(tái)的作用及帶來(lái)的兩項(xiàng)提升:
(1)完成數(shù)據(jù)入庫(kù)前的預(yù)處理:減少入庫(kù)的數(shù)據(jù)量;減少入庫(kù)時(shí)數(shù)據(jù)處理操作。
表2是用戶上網(wǎng)日志在云平臺(tái)上處理前后數(shù)據(jù)量的比對(duì),基于28臺(tái)刀片服務(wù)器(BL465G7:AMD O6134*2,32GB內(nèi)存,2*300GB硬盤;D2200:300G*6)構(gòu)建的Hadoop分布式系統(tǒng)。
表2上網(wǎng)日志經(jīng)云平臺(tái)處理前后數(shù)據(jù)量比對(duì)
字段 存儲(chǔ)空間
處理前:59個(gè)字段 處理前:1TB
處理后:16個(gè)字段 處理后:600GB
可見數(shù)據(jù)量縮小了約40%,減少了入庫(kù)數(shù)據(jù)量及處理操作,降低了ETL調(diào)度及數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)壓力。
(2)完成數(shù)據(jù)文件調(diào)度到數(shù)據(jù)倉(cāng)庫(kù)的處理:提升ETL調(diào)度能力。
以應(yīng)用DPI解析結(jié)果入庫(kù)為例,采用8臺(tái)刀片服務(wù)器(BL465G7:AMD O6134*2,32GB內(nèi)存,2*300GB硬盤;D2200:300G*6)構(gòu)建的Hadoop分布式系統(tǒng)后,系統(tǒng)前后調(diào)度性能的比對(duì)如表3所示:
表3DPI解析結(jié)果調(diào)度性能提升
數(shù)據(jù)量 ETL調(diào)度時(shí)間
入倉(cāng)庫(kù)前:80億條 采用傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)ETL調(diào)度方式:8小時(shí)
入倉(cāng)庫(kù)后:6億條 引入云平臺(tái)后:1.5小時(shí)
可見其性能提升了5倍多,并在調(diào)度過(guò)程中完成數(shù)據(jù)的合并轉(zhuǎn)換工作。
2.3數(shù)據(jù)分析及應(yīng)用
經(jīng)過(guò)上述流程,電信行業(yè)大數(shù)據(jù)時(shí)代主要新增的兩類客戶行為數(shù)據(jù):客戶上網(wǎng)內(nèi)容和客戶端應(yīng)用,已經(jīng)轉(zhuǎn)化為數(shù)據(jù)模型的輸入變量,借助數(shù)據(jù)模型完成數(shù)據(jù)分析工作。從上網(wǎng)日志中提取轉(zhuǎn)換后的變量包括:上網(wǎng)內(nèi)容一級(jí)分類(閱讀、游戲、音樂等)、上網(wǎng)內(nèi)容二級(jí)分類(以閱讀為例:社科科普、名著傳記、科幻小說(shuō)等)、上網(wǎng)搜索關(guān)鍵詞等;從客戶端應(yīng)用解析轉(zhuǎn)換后的變量主要是具體應(yīng)用及應(yīng)用分類。
數(shù)據(jù)模型可利用客戶的這些上網(wǎng)行為特征,分析出營(yíng)銷挽留活動(dòng)的目標(biāo)客戶,現(xiàn)在熱點(diǎn)數(shù)據(jù)模型的種類如表4所示:
表4數(shù)據(jù)模型分類及應(yīng)用場(chǎng)景
數(shù)據(jù)模型分類 應(yīng)用場(chǎng)景
套餐營(yíng)銷類 識(shí)別目標(biāo)客戶,推薦優(yōu)惠的流量資費(fèi)套餐
終端營(yíng)銷類 識(shí)別潛在購(gòu)機(jī)客戶,推薦符合需求的智能終端機(jī)
業(yè)務(wù)營(yíng)銷類 針對(duì)不同類型的客戶,推薦感興趣的業(yè)務(wù)應(yīng)用
網(wǎng)絡(luò)分流類 引導(dǎo)客戶從2G網(wǎng)絡(luò)分流到3G、4G及WLAN網(wǎng)絡(luò),使網(wǎng)絡(luò)資源負(fù)載均衡
3 總結(jié)
綜上所述,首先通過(guò)文本挖掘、爬蟲、DPI解析技術(shù)處理從網(wǎng)絡(luò)側(cè)采集到的客戶上網(wǎng)行為數(shù)據(jù);再通過(guò)搭建云平臺(tái)提升ETL調(diào)度性能,減少數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)壓力;最后,將標(biāo)簽式的客戶行為特征變量,通過(guò)數(shù)據(jù)模型轉(zhuǎn)化為可被一線營(yíng)銷人員采用的信息。
目前,本文所述的這套大數(shù)據(jù)管理策略已在個(gè)別分公司試用,雖然還處在嘗試階段,但是效果已逐步被認(rèn)可。根據(jù)當(dāng)前在建設(shè)中遇到的困難來(lái)看,網(wǎng)頁(yè)日志解析的全面性以及DPI對(duì)新應(yīng)用解析的研發(fā)速度有待提高。另外,云平臺(tái)部署的成本投入也是個(gè)需要探討的問題,目前是通過(guò)購(gòu)買新的刀片機(jī)來(lái)實(shí)現(xiàn)的,背離了云平臺(tái)采用廉價(jià)、閑置的X86 PC設(shè)備構(gòu)建的初衷。
參考文獻(xiàn):
[1] 童曉渝,張?jiān)朴?房秉毅,等. 大數(shù)據(jù)時(shí)代電信運(yùn)營(yíng)商的機(jī)遇[J]. 信息通信技術(shù), 2013(1): 5-9.
[2] Clifford Lynch. Big data: How do your data grow[J]. Nature, 2008(455): 28-29.
[3]The Economist. The data deluge[EB/OL]. [2012-12-10]. http://www.economist.com/node/15579717.
[4] Mitch Waldrop. Big data: Wikiomics[J]. Nature, 2008(455): 22-25.
[5] Mike Loukides. What is data science[EB/OL]. [2012-12-01]. http://radar.oreilly.com/2010/06/what-is-data-science.html.
[6] 呂錦揚(yáng). DPI技術(shù)在移動(dòng)數(shù)據(jù)網(wǎng)絡(luò)分析的應(yīng)用[J]. 電信技術(shù), 2013(6): 72-75.★
作者簡(jiǎn)介
雷蕾:碩士畢業(yè)于西安交通大學(xué)軟件工程專業(yè),現(xiàn)任職于中國(guó)移動(dòng)(深圳)有限公司,從事業(yè)務(wù)支撐系統(tǒng)測(cè)評(píng)工作,研究方向?yàn)锽I系統(tǒng)架構(gòu)及數(shù)據(jù)挖掘技術(shù)應(yīng)用。
熊偉:碩士畢業(yè)于天津科技大學(xué),現(xiàn)任職于中國(guó)移動(dòng)(深圳)有限公司,從事業(yè)務(wù)支撐系統(tǒng)測(cè)評(píng)工作,研究方向?yàn)檐浖_發(fā)和測(cè)試各類應(yīng)用技術(shù)。
endprint
【摘要】目前,商業(yè)智能系統(tǒng)作為電信行業(yè)主要的客戶行為數(shù)據(jù)分析平臺(tái),在新業(yè)務(wù)模式下已不能滿足挖掘客戶需求以支撐一線營(yíng)銷的需要。通過(guò)討論大數(shù)據(jù)時(shí)代的數(shù)據(jù)特點(diǎn),分別從數(shù)據(jù)采集及處理、數(shù)據(jù)調(diào)度及存儲(chǔ)、數(shù)據(jù)分析及應(yīng)用三方面總結(jié)出各項(xiàng)數(shù)據(jù)管理的應(yīng)對(duì)策略,為系統(tǒng)優(yōu)化提供了參考。
【關(guān)鍵詞】大數(shù)據(jù)商業(yè)智能數(shù)據(jù)管理
中圖分類號(hào):TP311.5文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1006-1010(2014)-09-0069-03
1 背景及研究現(xiàn)狀分析
移動(dòng)互聯(lián)網(wǎng)時(shí)代,新型應(yīng)用不斷涌現(xiàn),客戶行為習(xí)慣也隨之改變,電信運(yùn)營(yíng)商從以語(yǔ)音收入為主的業(yè)務(wù)模式,進(jìn)入到了語(yǔ)音和流量雙經(jīng)營(yíng)的業(yè)務(wù)模式。在此背景下,IT支撐每天面對(duì)數(shù)以PB級(jí)的海量數(shù)據(jù)[1],數(shù)據(jù)前所未有的生成速度和數(shù)量帶來(lái)了“數(shù)據(jù)雪崩”(Data Avalanche)和“數(shù)據(jù)洪流”(Data Deluge)[2-3]。如何從中挖掘有價(jià)值的商業(yè)信息,適應(yīng)“數(shù)據(jù)經(jīng)濟(jì)”(Data Economy)和“數(shù)據(jù)科學(xué)”(Data Science)[4-5]的大數(shù)據(jù)時(shí)代,這是客戶挽留營(yíng)銷和收入增長(zhǎng)的重要環(huán)節(jié)。
根據(jù)電信運(yùn)營(yíng)商現(xiàn)有的IT系統(tǒng)架構(gòu),管理及分析客戶業(yè)務(wù)數(shù)據(jù)主要由基于企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)的商業(yè)智能(Business Intelligence)系統(tǒng)完成。目前,面對(duì)業(yè)務(wù)部門的需求,該系統(tǒng)存在以下問題:
(1)分析數(shù)據(jù)缺失:客戶移動(dòng)互聯(lián)網(wǎng)行為數(shù)據(jù)采集不完整,無(wú)法還原客戶應(yīng)用場(chǎng)景。
(2)數(shù)據(jù)量劇增帶來(lái)存儲(chǔ)和處理性能的壓力:一個(gè)省的用戶流量數(shù)據(jù)每日可達(dá)150億條,約是傳統(tǒng)語(yǔ)音計(jì)費(fèi)數(shù)據(jù)的15倍。生產(chǎn)系統(tǒng)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)時(shí),ETL調(diào)度性能及數(shù)據(jù)倉(cāng)庫(kù)的擴(kuò)容速度不滿足需求。
(3)大量非結(jié)構(gòu)化數(shù)據(jù)無(wú)法用傳統(tǒng)的建模方法分析:采集到的URL串等客戶行為數(shù)據(jù),無(wú)法直接反映客戶行為特征,必須經(jīng)過(guò)處理和轉(zhuǎn)換才能獲得有用的建模信息。
2 大數(shù)據(jù)時(shí)代各項(xiàng)應(yīng)對(duì)策略
通過(guò)上述分析,可以看出在大數(shù)據(jù)時(shí)代,商業(yè)智能系統(tǒng)面臨的是從數(shù)據(jù)采集處理、調(diào)度存儲(chǔ)到分析的一系列問題,本文從完善數(shù)據(jù)源開始,探討一套完整的數(shù)據(jù)管理策略。
2.1數(shù)據(jù)采集及處理
商業(yè)智能系統(tǒng)并不產(chǎn)生實(shí)際的生產(chǎn)數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)都是從其他網(wǎng)絡(luò)、計(jì)費(fèi)、客服等生產(chǎn)系統(tǒng)獲取的,按照既定的接口通過(guò)ETL調(diào)度定期更新及完善數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)。大數(shù)據(jù)時(shí)代,2G、3G、4G、WLAN四網(wǎng)并行,除了保證2G、3G及4G網(wǎng)絡(luò)GPRS話單、WLAN流量話單、客戶位置信息、終端信息的采集外,為了精準(zhǔn)分析客戶的行為信息,還需新增兩類數(shù)據(jù)的采集,如表1所示:
表1兩類客戶行為數(shù)據(jù)基本信息
客戶行為數(shù)據(jù) 主要處理技術(shù) 數(shù)據(jù)來(lái)源
上網(wǎng)內(nèi)容 文本挖掘、爬蟲技術(shù) GGSN(Gateway GSN,網(wǎng)關(guān)GSN)等網(wǎng)關(guān)日志采集
客戶端應(yīng)用 DPI解析
(1)上網(wǎng)內(nèi)容
指采集用戶使用HTTP協(xié)議的上網(wǎng)行為日志,通過(guò)文本挖掘、爬蟲技術(shù)對(duì)URL進(jìn)行分析,獲取用戶的上網(wǎng)內(nèi)容。一個(gè)省每日從網(wǎng)絡(luò)側(cè)獲取的非結(jié)構(gòu)化的URL在50億條左右,約占1TB存儲(chǔ),其中隱含著具有商業(yè)價(jià)值的用戶偏好信息。對(duì)于一線市場(chǎng)營(yíng)銷人員,需要的是每個(gè)客戶的特征標(biāo)簽,比如,某用戶的特征標(biāo)簽是喜歡上網(wǎng)閱讀,閱讀內(nèi)容為言情小說(shuō),這樣就可以向這位用戶推薦一些手機(jī)閱讀的產(chǎn)品。因此,需要將這些非結(jié)構(gòu)化的URL記錄轉(zhuǎn)化為用戶上網(wǎng)內(nèi)容偏好標(biāo)簽,主要有以下兩種方式:
1)上網(wǎng)搜索關(guān)鍵字提取:針對(duì)搜索產(chǎn)生的URL,解析其中關(guān)鍵詞獲取標(biāo)簽信息。
2)網(wǎng)頁(yè)內(nèi)容提取:
◆建立以URL為主鍵的“網(wǎng)頁(yè)信息分類庫(kù)”,該信息庫(kù)對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行分類,并給每條URL打上分類標(biāo)簽;
◆將清洗過(guò)濾后的用戶URL記錄和“網(wǎng)頁(yè)信息分類庫(kù)”匹配,按照一定的規(guī)則(如訪問次數(shù)最多的類型)給客戶打上分類標(biāo)簽;
◆如果庫(kù)中沒有相應(yīng)的URL信息,則需要通過(guò)爬蟲及文本挖掘完善“網(wǎng)頁(yè)信息分類庫(kù)”。
(2)客戶端應(yīng)用
即識(shí)別出用戶客戶端的應(yīng)用,如QQ音樂、百度搜索等應(yīng)用。目前主要依靠在GGSN(Gateway GSN,網(wǎng)關(guān)GSN)上部署DPI(Deep Packet Inspection,深度包檢測(cè))硬件設(shè)備來(lái)實(shí)現(xiàn)。DPI技術(shù)通過(guò)對(duì)應(yīng)用流中的數(shù)據(jù)報(bào)文內(nèi)容進(jìn)行探測(cè),例如對(duì)數(shù)據(jù)報(bào)文中特定比特串進(jìn)行檢測(cè),從而確定數(shù)據(jù)報(bào)文真正的應(yīng)用類型[6]。在目前的實(shí)際應(yīng)用中,通過(guò)解析識(shí)別出來(lái)的應(yīng)用已達(dá)到 1 400種以上,基本覆蓋當(dāng)前熱門應(yīng)用。
2.2數(shù)據(jù)調(diào)度及存儲(chǔ)
其他系統(tǒng)采集處理后的數(shù)據(jù),通過(guò)ETL調(diào)度到商業(yè)智能系統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行存儲(chǔ),為下一步數(shù)據(jù)分析做準(zhǔn)備。為了減輕大數(shù)據(jù)量帶來(lái)的數(shù)據(jù)倉(cāng)庫(kù)調(diào)度和存儲(chǔ)壓力,對(duì)原有系統(tǒng)架構(gòu)進(jìn)行變更,引入云平臺(tái)完成數(shù)據(jù)入庫(kù)前的預(yù)處理工作,同時(shí)提升ETL調(diào)度性能。數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)轉(zhuǎn)變?nèi)鐖D1所示:
圖1數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)轉(zhuǎn)變
下面說(shuō)明引入云平臺(tái)的作用及帶來(lái)的兩項(xiàng)提升:
(1)完成數(shù)據(jù)入庫(kù)前的預(yù)處理:減少入庫(kù)的數(shù)據(jù)量;減少入庫(kù)時(shí)數(shù)據(jù)處理操作。
表2是用戶上網(wǎng)日志在云平臺(tái)上處理前后數(shù)據(jù)量的比對(duì),基于28臺(tái)刀片服務(wù)器(BL465G7:AMD O6134*2,32GB內(nèi)存,2*300GB硬盤;D2200:300G*6)構(gòu)建的Hadoop分布式系統(tǒng)。
表2上網(wǎng)日志經(jīng)云平臺(tái)處理前后數(shù)據(jù)量比對(duì)
字段 存儲(chǔ)空間
處理前:59個(gè)字段 處理前:1TB
處理后:16個(gè)字段 處理后:600GB
可見數(shù)據(jù)量縮小了約40%,減少了入庫(kù)數(shù)據(jù)量及處理操作,降低了ETL調(diào)度及數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)壓力。
(2)完成數(shù)據(jù)文件調(diào)度到數(shù)據(jù)倉(cāng)庫(kù)的處理:提升ETL調(diào)度能力。
以應(yīng)用DPI解析結(jié)果入庫(kù)為例,采用8臺(tái)刀片服務(wù)器(BL465G7:AMD O6134*2,32GB內(nèi)存,2*300GB硬盤;D2200:300G*6)構(gòu)建的Hadoop分布式系統(tǒng)后,系統(tǒng)前后調(diào)度性能的比對(duì)如表3所示:
表3DPI解析結(jié)果調(diào)度性能提升
數(shù)據(jù)量 ETL調(diào)度時(shí)間
入倉(cāng)庫(kù)前:80億條 采用傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)ETL調(diào)度方式:8小時(shí)
入倉(cāng)庫(kù)后:6億條 引入云平臺(tái)后:1.5小時(shí)
可見其性能提升了5倍多,并在調(diào)度過(guò)程中完成數(shù)據(jù)的合并轉(zhuǎn)換工作。
2.3數(shù)據(jù)分析及應(yīng)用
經(jīng)過(guò)上述流程,電信行業(yè)大數(shù)據(jù)時(shí)代主要新增的兩類客戶行為數(shù)據(jù):客戶上網(wǎng)內(nèi)容和客戶端應(yīng)用,已經(jīng)轉(zhuǎn)化為數(shù)據(jù)模型的輸入變量,借助數(shù)據(jù)模型完成數(shù)據(jù)分析工作。從上網(wǎng)日志中提取轉(zhuǎn)換后的變量包括:上網(wǎng)內(nèi)容一級(jí)分類(閱讀、游戲、音樂等)、上網(wǎng)內(nèi)容二級(jí)分類(以閱讀為例:社科科普、名著傳記、科幻小說(shuō)等)、上網(wǎng)搜索關(guān)鍵詞等;從客戶端應(yīng)用解析轉(zhuǎn)換后的變量主要是具體應(yīng)用及應(yīng)用分類。
數(shù)據(jù)模型可利用客戶的這些上網(wǎng)行為特征,分析出營(yíng)銷挽留活動(dòng)的目標(biāo)客戶,現(xiàn)在熱點(diǎn)數(shù)據(jù)模型的種類如表4所示:
表4數(shù)據(jù)模型分類及應(yīng)用場(chǎng)景
數(shù)據(jù)模型分類 應(yīng)用場(chǎng)景
套餐營(yíng)銷類 識(shí)別目標(biāo)客戶,推薦優(yōu)惠的流量資費(fèi)套餐
終端營(yíng)銷類 識(shí)別潛在購(gòu)機(jī)客戶,推薦符合需求的智能終端機(jī)
業(yè)務(wù)營(yíng)銷類 針對(duì)不同類型的客戶,推薦感興趣的業(yè)務(wù)應(yīng)用
網(wǎng)絡(luò)分流類 引導(dǎo)客戶從2G網(wǎng)絡(luò)分流到3G、4G及WLAN網(wǎng)絡(luò),使網(wǎng)絡(luò)資源負(fù)載均衡
3 總結(jié)
綜上所述,首先通過(guò)文本挖掘、爬蟲、DPI解析技術(shù)處理從網(wǎng)絡(luò)側(cè)采集到的客戶上網(wǎng)行為數(shù)據(jù);再通過(guò)搭建云平臺(tái)提升ETL調(diào)度性能,減少數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)壓力;最后,將標(biāo)簽式的客戶行為特征變量,通過(guò)數(shù)據(jù)模型轉(zhuǎn)化為可被一線營(yíng)銷人員采用的信息。
目前,本文所述的這套大數(shù)據(jù)管理策略已在個(gè)別分公司試用,雖然還處在嘗試階段,但是效果已逐步被認(rèn)可。根據(jù)當(dāng)前在建設(shè)中遇到的困難來(lái)看,網(wǎng)頁(yè)日志解析的全面性以及DPI對(duì)新應(yīng)用解析的研發(fā)速度有待提高。另外,云平臺(tái)部署的成本投入也是個(gè)需要探討的問題,目前是通過(guò)購(gòu)買新的刀片機(jī)來(lái)實(shí)現(xiàn)的,背離了云平臺(tái)采用廉價(jià)、閑置的X86 PC設(shè)備構(gòu)建的初衷。
參考文獻(xiàn):
[1] 童曉渝,張?jiān)朴?房秉毅,等. 大數(shù)據(jù)時(shí)代電信運(yùn)營(yíng)商的機(jī)遇[J]. 信息通信技術(shù), 2013(1): 5-9.
[2] Clifford Lynch. Big data: How do your data grow[J]. Nature, 2008(455): 28-29.
[3]The Economist. The data deluge[EB/OL]. [2012-12-10]. http://www.economist.com/node/15579717.
[4] Mitch Waldrop. Big data: Wikiomics[J]. Nature, 2008(455): 22-25.
[5] Mike Loukides. What is data science[EB/OL]. [2012-12-01]. http://radar.oreilly.com/2010/06/what-is-data-science.html.
[6] 呂錦揚(yáng). DPI技術(shù)在移動(dòng)數(shù)據(jù)網(wǎng)絡(luò)分析的應(yīng)用[J]. 電信技術(shù), 2013(6): 72-75.★
作者簡(jiǎn)介
雷蕾:碩士畢業(yè)于西安交通大學(xué)軟件工程專業(yè),現(xiàn)任職于中國(guó)移動(dòng)(深圳)有限公司,從事業(yè)務(wù)支撐系統(tǒng)測(cè)評(píng)工作,研究方向?yàn)锽I系統(tǒng)架構(gòu)及數(shù)據(jù)挖掘技術(shù)應(yīng)用。
熊偉:碩士畢業(yè)于天津科技大學(xué),現(xiàn)任職于中國(guó)移動(dòng)(深圳)有限公司,從事業(yè)務(wù)支撐系統(tǒng)測(cè)評(píng)工作,研究方向?yàn)檐浖_發(fā)和測(cè)試各類應(yīng)用技術(shù)。
endprint