999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于標簽分類的數據協同技術研究

2020-05-09 09:58:01邱瑞汪寧朱振華
科技創新與品牌 2020年2期

邱瑞 汪寧 朱振華

摘 ? 要:通過對標簽體系分類方法和標簽數據共享技術路線的研究,利用基礎屬性、統計分析、模型算法及大數據分析等技術,將描述研究對象的標簽數據進行提取和分類,實現了對標簽資源的分類,建立統一標簽資源目錄體系。在數據協同過程中,系統中心節點獲取各子節點查詢請求,并統一調配計算資源,最后將匯總結果返回到請求方節點,從而實現節點間的標簽數據共享,有效的推動業務數據跨地區、跨部門的共享,促進了業務模型向智能化發展。

關鍵詞:標簽;標簽目錄;數據協同

1 引言

標簽反映人或物的社會屬性、行為屬性等屬性特征。近年來,在公共安全等領域,專家用標簽進行畫像和特征分析,建立相關的應用系統,幫助用戶進行工作模式的改進和工作效率的提高。

在標簽數據分類的過程中,由于不同的分類方式產生的標簽定義也不一致,有可能造成在使用過程中導致數據難以共享、標簽易誤解等問題,造成對研究對象的錯誤預警。

在標簽資源服務系統中,對各子節點間獲取統一標簽資源目錄體系,通過分布式調度架構將查詢請求經中心節點發送至各子節點,中心節點統一協調各子節點的調配資源,將標簽查詢結果匯總后返回到請求方節點,從而實現了不同子節點間的標簽數據共享。

本文將利用屬性標注、模型算法、文本挖掘等技術,研究標簽數據的分類技術,同時研究基于標簽資源目錄的協同共享技術,實現標簽數據的協同共享。

2 標簽治理和分類

2.1 數據治理

標簽數據治理是對匯集的原始數據進行標準化、規范化的處理過程,主要包括數據匯集、數據治理、數據建庫等工作。通過對數據進行一系列的治理,形成結構化、規范化的資源庫,為標簽分類和生產提供數據基礎。

首先,通過數據采集系統采集多源異構數據,如金融數據等相關數據。之后,針對不同的數據采取數據去重、數據融合、字段標準等規范化操作。最后,構建基于標簽領域相關的資源庫,實現對各級業務數據統一規范化的管理,針對各個數據進行主題分類、標準化和規范化存儲。

2.2 數據分類

標簽分類體系的建設過程就是對數據不斷提煉和價值迭代的過程,通過構建標簽分類體系,讓數據價值清晰化、規范化,通過標簽表達數據潛在的意義、滿足當前業務的分析工作。標簽分類主要從屬性抽取、特征提煉、規律刻畫等幾個方面考慮,標簽按照數據生成的維度可以分為屬性標簽、統計標簽和算法標簽。

(1) 屬性標簽包括研究對象的所有原生屬性和派生屬性,主要為人的年齡、性別、學歷、身份信息等基礎屬性信息,基礎屬性的標簽往往和個人信息有關。

(2) 統計標簽是基于過往特定時間段內的行為、日志數據而計算出的描述個體或群體的規律性標簽,這類標簽隨著統計周期而發生變化,更新頻率較大、周期較短、標簽變化性較大。

(3) 算法標簽是根據過去特定段時間的行為狀態,預測事物未發生、或將來即將發生的行為,這種標簽是基于普通標簽、統計標簽數據,通過使用特定算法、挖掘技術計算出來的,給出預測對象的行為相符合的標簽。

3 標簽建設路線

標簽開發流程分為特征提取、標簽加工、標簽管理、標簽應用四大部分。首先,特征提取主要從基礎特征、人員特征、行為特征、社會屬性等維度來提取特征,形成基礎化標簽;在標簽加工過程中,對已經提取的基礎化標簽數據進行規則清洗、加工、建模,再經由對標簽進行ETL開發,從而得到體系化、規范化的標簽,并進入標簽市場,為下一步標簽應用做準備。

我們可以將標簽構建過程分為三個階段。第一階段是基礎標簽的建設,此階段將通過對數據資源按照一定的規則進行加工得到基礎化的標簽,用來刻畫實體的基礎特征,主要由數據治理人員參與并完成。伴隨基礎標簽的體系建立標簽構建將進入第二階段,業務人員根據行業分析經驗將對基礎標簽進行組合,從而得到符合行業的業務標簽。第三階段為數據分析人員對業務標簽進行分析,并經過對事件進行分析、研判、建模,構建符合的算法標簽,以滿足預測預警的需求。經過三大階段對標簽的構建過程,將構建符合行業規范的數據資源目錄體系,從而實現對標簽數據的分類。

4 數據協同技術的研究

標簽資源服務系統面向各級子節點開放,建設了標準化、規范化的標簽資源服務目錄,實現標簽統一發布、各級子節點共享,能夠有效支撐各級子節點業務需求,為用戶提供便捷的操作方式,減少標簽生成復雜過程。

文中數據協同技術采用的是“一主多從”架構。中心節點為主節點,統一對資源目錄進行建設、上線、下線等管理操作。各級子節點為平級子節點,共享中心節點所發布的資源目錄。各級子節點通過“申請審批”等流程,當子節點A啟動節點間標簽組合查詢時,即開始占用其請求的子節點的標簽資源,中心節點統一調配資源并在中心節點進行計算,將標簽組合查詢結果匯總后返到查詢子節點A,減少了資源的浪費,同時實現了節點間的標簽數據協同共享。

5 結束語

本文研究實現了標簽治理、分類目的,解決了如何從海量數據中發現各種數據關系與關聯規則,挖掘數據的價值問題,形成了語義化的描述。建立統一標簽資源目錄體系,通過分布式調度系統將查詢請求發送至各子節點,最后中心節點將匯總結果返回到請求方節點,從而實現了不同節點間的標簽數據共享。下一步將繼續優化算法模型,在預測類標簽生成的準確性方面進行重點研究。

參考文獻

[1]張大偉. 公安數據標簽化建設應用研究[J].警察技術,2017,(6):37-41.

[2]席巖, 張乃光, 王磊, et al. 基于大數據的用戶畫像方法研究綜述[J]. 廣播電視信息, 2017(10):39-43.

[3]王慶, 趙發珍. 基于"用戶畫像"的圖書館資源推薦模式設計與分析[J]. 現代情報, 2018(3):105-109,137

[4]丁偉,王題,劉新海等.基于大數據技術的手機用戶畫像與征信研究[J].郵電設計技術,2016(3):64-69.

責編/李曼

主站蜘蛛池模板: 成AV人片一区二区三区久久| 国产成人精品一区二区三区| 亚洲高清无在码在线无弹窗| 亚洲精品777| 国产香蕉国产精品偷在线观看| 国产美女在线观看| 91青青视频| 久久综合九色综合97网| 日韩精品一区二区三区大桥未久 | 99久久精品免费看国产电影| 欧美爱爱网| 欧美精品成人| 色妞www精品视频一级下载| 蜜芽国产尤物av尤物在线看| 在线精品欧美日韩| 欧美日本不卡| 日本一区中文字幕最新在线| 国产网友愉拍精品视频| 亚洲美女操| 99资源在线| 欧美 国产 人人视频| 亚洲国产系列| 97av视频在线观看| 欧美精品在线观看视频| 欧美区国产区| 亚洲bt欧美bt精品| 福利在线一区| 国产精品视频导航| 97无码免费人妻超级碰碰碰| 久久精品一品道久久精品| 婷婷色一区二区三区| 国产欧美日韩综合一区在线播放| 色偷偷一区| 亚洲一级毛片在线观| 青青热久免费精品视频6| 特级毛片8级毛片免费观看| 亚洲精品日产AⅤ| 中国一级毛片免费观看| 日韩美毛片| 亚洲天堂免费在线视频| 亚洲国产精品无码久久一线| 国产另类乱子伦精品免费女| 亚洲欧美日韩精品专区| 亚洲人成亚洲精品| 夜夜操狠狠操| 黑人巨大精品欧美一区二区区| 国产亚洲视频中文字幕视频 | 亚洲第一网站男人都懂| 亚洲色精品国产一区二区三区| 欧美一区精品| 欧美日韩精品一区二区在线线| 色一情一乱一伦一区二区三区小说| 老色鬼欧美精品| 激情综合婷婷丁香五月尤物 | 亚洲欧美成aⅴ人在线观看| 成人字幕网视频在线观看| 亚洲国产第一区二区香蕉| 国产精品免费久久久久影院无码| 欧美亚洲一二三区| 91小视频在线| 亚洲品质国产精品无码| 欧美一级一级做性视频| 日韩天堂在线观看| 亚洲不卡影院| 国产成人综合亚洲欧美在| 欧美翘臀一区二区三区| 亚洲国产一区在线观看| 人人澡人人爽欧美一区| 国产三级国产精品国产普男人| 欧美区一区| 四虎在线高清无码| 亚洲天堂视频网站| 国产精品男人的天堂| 亚洲视频黄| 成人在线天堂| 人妻少妇乱子伦精品无码专区毛片| 亚洲av无码人妻| 久久天天躁狠狠躁夜夜躁| 在线色国产| 日本一区二区不卡视频| 久久亚洲国产视频| 欧美三级不卡在线观看视频|