陳沖 陶慧青 張鋒 王偉 李俊徽
摘要:針對互聯(lián)網(wǎng)氣象服務(wù)手段與產(chǎn)品千篇一律現(xiàn)狀,提出了基于CRAP架構(gòu)的系統(tǒng)設(shè)計,將信息采集、云庫集成、分析系統(tǒng)與主動推送融合為一體提升氣象服務(wù)能力,系統(tǒng)依托天氣羅盤及智慧氣象等浙江省氣象局的服務(wù)平臺和出口積累的用戶行為數(shù)據(jù),挖掘用戶訪問量、訪問偏好和訪問時長等信息,結(jié)合用戶畫像分析方案得出規(guī)律性特征,指導(dǎo)氣象服務(wù)信息技術(shù)開發(fā)策略和氣象服務(wù)產(chǎn)品研發(fā),最終實現(xiàn)氣象服務(wù)產(chǎn)品個性化無感推送。經(jīng)實驗和應(yīng)用表明,利用基于用戶畫像的氣象服務(wù)系統(tǒng)較好地提升了用戶體驗,為互聯(lián)網(wǎng)式的氣象服務(wù)向智能化、智慧化氣象服務(wù)發(fā)展提供了參考。
關(guān)鍵詞:用戶畫像;氣象服務(wù);CR AP;個性化;無感推送;智能
中圖分類號:P409;TP399文獻標(biāo)志碼:A文章編號:1008-1739(2021)23-61-5

0引言
隨著互聯(lián)網(wǎng)氣象服務(wù)發(fā)展,氣象產(chǎn)品趨同態(tài)勢嚴(yán)重[1-3],用戶體驗感下滑,氣象服務(wù)與用戶需求不一致導(dǎo)致矛盾進一步加劇,如何掌握用戶對氣象信息的個性化需求成為公眾氣象服務(wù)的一大痛點[4-8]。
本文提出了基于CRAP架構(gòu)(Collection信息采集+RDS云庫集成+Analysis分析系統(tǒng)+Push-Service主動推送服務(wù)),對浙江氣象服務(wù)出口采集氣象用戶行為信息進行分析,完成靶向氣象服務(wù)產(chǎn)品自動化加工,最終再次通過服務(wù)出口實現(xiàn)個性化主動智能推送服務(wù)的方案。解決了分眾場景不同用戶對氣象服務(wù)產(chǎn)品的具體需求,實現(xiàn)氣象服務(wù)由用戶主動獲取氣象信息變?yōu)楦兄脩粜枨螅悄芡扑蛡€性化氣象信息,有效提升了用戶的體驗感。
1系統(tǒng)設(shè)計
1.1用戶行為采集系統(tǒng)
用戶行為采集系統(tǒng)即CRAP架構(gòu)中的Collection,本文針對天氣羅盤、智慧氣象[9]等浙江省氣象局服務(wù)平臺和出口的大量用戶日常使用偏好等基礎(chǔ)數(shù)據(jù)[10-13],對其進行了分布式標(biāo)準(zhǔn)化分析、處理并存放于數(shù)據(jù)存儲中心統(tǒng)一管理,形成用戶畫像基礎(chǔ)數(shù)據(jù)庫。
數(shù)據(jù)采集方式主要是頁面標(biāo)簽法[14-16],將定制化的JavaScript等代碼植入服務(wù)平臺,當(dāng)用戶對平臺頁面中的標(biāo)簽進行操作時,觸發(fā)采集機制,該辦法盡可能滿足了當(dāng)前平臺的服務(wù)模式,能夠在不影響用戶體驗的前提下較全面地采集用戶體驗的行為數(shù)據(jù)。對上述平臺的各大功能子模塊植入埋點,部分埋點位置如圖1~圖3所示。

當(dāng)用戶訪問平臺或者各模塊時,觸發(fā)當(dāng)前監(jiān)測事件,采集數(shù)據(jù)的腳本代碼才會被觸發(fā),從而采集用戶行為數(shù)據(jù)。埋點技術(shù)有2個比較明顯的優(yōu)勢:每一個用戶的操作行為都是被單獨監(jiān)測采集的,在一個頁面文件中可能會存在多個函數(shù)被植入多段代碼,這樣可以保證監(jiān)測的每一個用戶的交互行為事件是獨立并且完整的;其次是每一個頁面都是獨立的,因此采集到的數(shù)據(jù)沒有重復(fù)性減少冗余,利于后期CRAP架構(gòu)中RDS云庫上的存儲。因此,本文在進行埋點之前先整理并設(shè)計好需要采集的數(shù)據(jù)類型,具體植入采集數(shù)據(jù)的位置等。部分信息采集字段如表1所示。
信息采集表的字段將為RDS建表字段設(shè)立奠定基礎(chǔ),而RDS用戶行為記錄表則作為用戶推送服務(wù)產(chǎn)品研發(fā)的基礎(chǔ)依據(jù),主要對用戶行為數(shù)據(jù)記錄統(tǒng)計,有助于確定用戶使用習(xí)慣、當(dāng)前狀態(tài)等信息,便于根據(jù)實際情況進行智能定制產(chǎn)品,也有助于后續(xù)改進或者優(yōu)化相應(yīng)的推送服務(wù)產(chǎn)品。
采集數(shù)據(jù)儲存于RDS阿里云庫與OSS對象存儲,由結(jié)構(gòu)化的數(shù)據(jù)庫表以及JSON、txt等數(shù)據(jù)類型組成,RDS記錄表如圖4所示。基于阿里云的存儲方案,使得系統(tǒng)支持高并發(fā)讀寫,性能優(yōu)良。同時,接口服務(wù)使用的是阿里云企業(yè)級分布式應(yīng)用(EDAS),具備高效、可靠、易拓展等巨大優(yōu)勢[17-23]。

1.2用戶行為采集系統(tǒng)
用戶行為分析系統(tǒng)即CRAP架構(gòu)中的Analysis分析系統(tǒng),該系統(tǒng)主要針對存儲于RDS與OSS的用戶行為信息進行進一步分析與研究,從數(shù)據(jù)中了解用戶在氣象應(yīng)用時的瀏覽方式,訪問的氣象要素與行為習(xí)慣等信息自動研制定制化氣象服務(wù)產(chǎn)品,具體定制產(chǎn)品對應(yīng)方案如表2所示,并以API形式提供中間件,該分析方案的主服務(wù)部署于阿里云上自建的推送服務(wù)集群中,以較高性能與可靠性來獲取詳細的用戶行為信息及分析結(jié)果,用戶的行為分析系統(tǒng)整體架構(gòu)如圖5所示。
該系統(tǒng)的個性化推送產(chǎn)品所使用數(shù)據(jù)源眾多,因此該系統(tǒng)針對浙江省氣象局氣象實況、預(yù)報等數(shù)據(jù)特征,研發(fā)了針對性較高的解析與加工程序,同時將其解析中間件存儲于阿里云OSS,Hbase,Redis等供后期調(diào)用。對于數(shù)據(jù)庫中的數(shù)據(jù),為了保證訪問程序性能與服務(wù)器性能,采用將數(shù)據(jù)存儲為JSON、XML等格式作為二次交換文件使用,用戶行為分析系統(tǒng)可視化流程如圖6所示。

用戶行為分析系統(tǒng)包含用戶訪問氣象要素分析、用戶訪問氣象頻道分析、用戶訪問時間、位置分析及其他功能使用率分析等。目前用戶行為分析系統(tǒng)智能分析的氣象服務(wù)產(chǎn)品方向達13個,含上下班天氣、氣象類指數(shù)、交通氣象安全、短臨天氣、環(huán)境、臺風(fēng)以及觀潮等。
1.3個性化氣象服務(wù)無感推送系統(tǒng)


2應(yīng)用情況
基于用戶畫像的氣象服務(wù)系統(tǒng)于2020年11月正式應(yīng)用于浙江省氣象服務(wù)中心開發(fā)的《智慧氣象》App、《天氣羅盤》App等服務(wù)出口,自該系統(tǒng)應(yīng)用起至2021年6月,《智慧氣象》App用戶累計活躍數(shù)達130萬,月均活躍數(shù)達20萬,相較于之前有了明顯提升,同時,基于《天氣羅盤》App的主動推送服務(wù)達到近30萬次。系統(tǒng)推送效果如圖8所示。

根據(jù)浙江氣象服務(wù)出口用戶活躍度數(shù)據(jù)庫查詢,集成了用戶畫像氣象服務(wù)系統(tǒng)的《智慧氣象》App、《天氣羅盤》App等服務(wù)出口,自2020年11月至今,用戶活躍度總體穩(wěn)步提升,用戶活躍度如圖9所示,因此,該系統(tǒng)有效提升了用戶的體驗感,得到了良好的服務(wù)回饋。


3結(jié)束語
實踐證明,基于用戶畫像的氣象服務(wù)系統(tǒng)較好地解決了分眾場景不同用戶對氣象服務(wù)產(chǎn)品的具體需求,實質(zhì)上是將氣象服務(wù)由用戶主動獲取氣象信息變?yōu)榱烁兄脩粜枨螅賹⒂脩羲铓庀蠓?wù)產(chǎn)品推送給用戶。一方面,該系統(tǒng)讓用戶無需再通過互聯(lián)網(wǎng)檢索其所需常規(guī)氣象信息;另一方面,系統(tǒng)提供的氣象信息正對性更強,用戶個性化服務(wù)特征更為顯著。為進一步加強應(yīng)用效果,下一步可以擴大收集范圍接入第三方的用戶行為數(shù)據(jù),同時不斷完善CRAP技術(shù)架構(gòu),開展大量的訓(xùn)練,改進應(yīng)用功能和服務(wù)體驗。
參考文獻
[1] COFINO A S,GUTIéRREZ J M,JAKUBIAK B, et al. Implementation of Data Mining Techniques for Meteorological Applications[M].Realizing Teracomputing,2003.
[2]方學(xué)鋒.試析互聯(lián)網(wǎng)與氣象服務(wù)的融合與發(fā)展[J].科學(xué)與財富,2017(33):137.
[3]華巖.山東氣象局氣象服務(wù)產(chǎn)業(yè)發(fā)展戰(zhàn)略研究[D].濟南:山東大學(xué),2006.
[4] WU X,CA O Y,GAO G,et al. Relationship Among Public Cognition, Perceived Value, and Meteorological Service Satisfaction[J].TropicalConservation Science,2019,12(5): 1-5.
[5] NIE, FengYing. A Value-oriented Model of Big Data-driven Knowledge Management and Collaborative Services: Ameteorological Service Case[C]//International Conference on Information Management. Chengdu:IEEE, 2017:511-516.
[6]廖賢達,姚學(xué)民,黃學(xué)忠.行業(yè)氣象服務(wù)要點探討[J].氣象研究與應(yīng)用,2008,29(4):86-89.
[7] BRUNO L,TORDK.Calculating Workplace Wbgt from Meteorological Data: A Tool for Climate Change Assessment[J].Ind Health,2012,50(4):267-278.
[8]徐鵬,張瑋,沈文穎.全媒體時代公眾氣象服務(wù)發(fā)展淺析[J].科技傳播,2017,9(8):87-88.
[9]馬琰鋼,沈萍月,鄧闖.基于ArcGIS Mobile的“智慧氣象”數(shù)據(jù)服務(wù)技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用, 2015(9):62.
[10]李建,張鋒,陳沖,等基于AI智能語音交互氣象服務(wù)的研究與應(yīng)用[J].計算機技術(shù)與發(fā)展,2020,30(12):197-202.
[11]尚燕敏,曹亞男,韓毅,等.基于主題和大眾影響的用戶動態(tài)行為傾向預(yù)測[J].計算機學(xué)報,2018,41(7):1431-1447.
[12]廖祥文,鄭候東,劉盛華,等.基于用戶行為的情感影響力和易感性學(xué)習(xí)[J].計算機學(xué)報,2017,40(4):955-969.
[13]孟祥武,李瑞昌,張玉潔,等.基于用戶軌跡數(shù)據(jù)的移動推薦系統(tǒng)研究[J].軟件學(xué)報,2018,29(10):3111-3133.
[14]宋杰,王大玲,鮑玉斌,等.基于頁面Block的Web檔案采集和存儲[J].軟件學(xué)報,2008(2):275-290.
[15]王雅坤.電商網(wǎng)站用戶行為實時監(jiān)控系統(tǒng)的設(shè)計與實現(xiàn)[D].北京:北京交通大學(xué),2016.
[16]李冰.基于Android日志的APP用戶行為分析研究與實現(xiàn)[D].北京:北京郵電大學(xué),2018.
[17]陳金光.基于阿里云的Kubernetes容器云平臺的設(shè)計與實現(xiàn)[D].杭州:浙江大學(xué),2018.
[18]楊挺,王萌,張亞健,等.云計算數(shù)據(jù)中心HDFS差異性存儲節(jié)能優(yōu)化算法[J].計算機學(xué)報,2019,42(4):721-735.
[19]黃華,彭蓉,馮在文.基于行為的大規(guī)模云工作流模型庫高效檢索方法研究[J].計算機學(xué)報,2018,41(6):1018-1034.
[20]牛祿青.阿里云:創(chuàng)新云計算[J].新經(jīng)濟導(dǎo)刊,2013(3): 66-68.
[21]駱小龍,虞開森,余金銘,等.基于阿里云的臺風(fēng)路徑實時發(fā)布系統(tǒng)研究[J].計算機時代,2015(2):15-18.
[22]蘇鵬,劉甚靈,張春元.多云存儲網(wǎng)關(guān)設(shè)計和實現(xiàn)[J].計算機研究與發(fā)展,2015,52(S2):43-48.
[23]翁湦元,單杏花,閻志遠,等.基于Kubernetes的容器云平臺設(shè)計與實踐[J].鐵路計算機應(yīng)用,2019,28(12):49-53.