999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于標簽分類的數據協同技術研究

2020-05-09 09:58:01邱瑞汪寧朱振華
科技創新與品牌 2020年2期

邱瑞 汪寧 朱振華

摘 ? 要:通過對標簽體系分類方法和標簽數據共享技術路線的研究,利用基礎屬性、統計分析、模型算法及大數據分析等技術,將描述研究對象的標簽數據進行提取和分類,實現了對標簽資源的分類,建立統一標簽資源目錄體系。在數據協同過程中,系統中心節點獲取各子節點查詢請求,并統一調配計算資源,最后將匯總結果返回到請求方節點,從而實現節點間的標簽數據共享,有效的推動業務數據跨地區、跨部門的共享,促進了業務模型向智能化發展。

關鍵詞:標簽;標簽目錄;數據協同

1 引言

標簽反映人或物的社會屬性、行為屬性等屬性特征。近年來,在公共安全等領域,專家用標簽進行畫像和特征分析,建立相關的應用系統,幫助用戶進行工作模式的改進和工作效率的提高。

在標簽數據分類的過程中,由于不同的分類方式產生的標簽定義也不一致,有可能造成在使用過程中導致數據難以共享、標簽易誤解等問題,造成對研究對象的錯誤預警。

在標簽資源服務系統中,對各子節點間獲取統一標簽資源目錄體系,通過分布式調度架構將查詢請求經中心節點發送至各子節點,中心節點統一協調各子節點的調配資源,將標簽查詢結果匯總后返回到請求方節點,從而實現了不同子節點間的標簽數據共享。

本文將利用屬性標注、模型算法、文本挖掘等技術,研究標簽數據的分類技術,同時研究基于標簽資源目錄的協同共享技術,實現標簽數據的協同共享。

2 標簽治理和分類

2.1 數據治理

標簽數據治理是對匯集的原始數據進行標準化、規范化的處理過程,主要包括數據匯集、數據治理、數據建庫等工作。通過對數據進行一系列的治理,形成結構化、規范化的資源庫,為標簽分類和生產提供數據基礎。

首先,通過數據采集系統采集多源異構數據,如金融數據等相關數據。之后,針對不同的數據采取數據去重、數據融合、字段標準等規范化操作。最后,構建基于標簽領域相關的資源庫,實現對各級業務數據統一規范化的管理,針對各個數據進行主題分類、標準化和規范化存儲。

2.2 數據分類

標簽分類體系的建設過程就是對數據不斷提煉和價值迭代的過程,通過構建標簽分類體系,讓數據價值清晰化、規范化,通過標簽表達數據潛在的意義、滿足當前業務的分析工作。標簽分類主要從屬性抽取、特征提煉、規律刻畫等幾個方面考慮,標簽按照數據生成的維度可以分為屬性標簽、統計標簽和算法標簽。

(1) 屬性標簽包括研究對象的所有原生屬性和派生屬性,主要為人的年齡、性別、學歷、身份信息等基礎屬性信息,基礎屬性的標簽往往和個人信息有關。

(2) 統計標簽是基于過往特定時間段內的行為、日志數據而計算出的描述個體或群體的規律性標簽,這類標簽隨著統計周期而發生變化,更新頻率較大、周期較短、標簽變化性較大。

(3) 算法標簽是根據過去特定段時間的行為狀態,預測事物未發生、或將來即將發生的行為,這種標簽是基于普通標簽、統計標簽數據,通過使用特定算法、挖掘技術計算出來的,給出預測對象的行為相符合的標簽。

3 標簽建設路線

標簽開發流程分為特征提取、標簽加工、標簽管理、標簽應用四大部分。首先,特征提取主要從基礎特征、人員特征、行為特征、社會屬性等維度來提取特征,形成基礎化標簽;在標簽加工過程中,對已經提取的基礎化標簽數據進行規則清洗、加工、建模,再經由對標簽進行ETL開發,從而得到體系化、規范化的標簽,并進入標簽市場,為下一步標簽應用做準備。

我們可以將標簽構建過程分為三個階段。第一階段是基礎標簽的建設,此階段將通過對數據資源按照一定的規則進行加工得到基礎化的標簽,用來刻畫實體的基礎特征,主要由數據治理人員參與并完成。伴隨基礎標簽的體系建立標簽構建將進入第二階段,業務人員根據行業分析經驗將對基礎標簽進行組合,從而得到符合行業的業務標簽。第三階段為數據分析人員對業務標簽進行分析,并經過對事件進行分析、研判、建模,構建符合的算法標簽,以滿足預測預警的需求。經過三大階段對標簽的構建過程,將構建符合行業規范的數據資源目錄體系,從而實現對標簽數據的分類。

4 數據協同技術的研究

標簽資源服務系統面向各級子節點開放,建設了標準化、規范化的標簽資源服務目錄,實現標簽統一發布、各級子節點共享,能夠有效支撐各級子節點業務需求,為用戶提供便捷的操作方式,減少標簽生成復雜過程。

文中數據協同技術采用的是“一主多從”架構。中心節點為主節點,統一對資源目錄進行建設、上線、下線等管理操作。各級子節點為平級子節點,共享中心節點所發布的資源目錄。各級子節點通過“申請審批”等流程,當子節點A啟動節點間標簽組合查詢時,即開始占用其請求的子節點的標簽資源,中心節點統一調配資源并在中心節點進行計算,將標簽組合查詢結果匯總后返到查詢子節點A,減少了資源的浪費,同時實現了節點間的標簽數據協同共享。

5 結束語

本文研究實現了標簽治理、分類目的,解決了如何從海量數據中發現各種數據關系與關聯規則,挖掘數據的價值問題,形成了語義化的描述。建立統一標簽資源目錄體系,通過分布式調度系統將查詢請求發送至各子節點,最后中心節點將匯總結果返回到請求方節點,從而實現了不同節點間的標簽數據共享。下一步將繼續優化算法模型,在預測類標簽生成的準確性方面進行重點研究。

參考文獻

[1]張大偉. 公安數據標簽化建設應用研究[J].警察技術,2017,(6):37-41.

[2]席巖, 張乃光, 王磊, et al. 基于大數據的用戶畫像方法研究綜述[J]. 廣播電視信息, 2017(10):39-43.

[3]王慶, 趙發珍. 基于"用戶畫像"的圖書館資源推薦模式設計與分析[J]. 現代情報, 2018(3):105-109,137

[4]丁偉,王題,劉新海等.基于大數據技術的手機用戶畫像與征信研究[J].郵電設計技術,2016(3):64-69.

責編/李曼

主站蜘蛛池模板: 国产一级毛片网站| 国产国语一级毛片| 国产av色站网站| 无码 在线 在线| 国产玖玖玖精品视频| 久久毛片网| 欧美视频免费一区二区三区| www.av男人.com| 爽爽影院十八禁在线观看| 久久国产高潮流白浆免费观看| 免费看av在线网站网址| 亚洲狼网站狼狼鲁亚洲下载| 欧美一区二区三区不卡免费| 91视频首页| 亚洲va在线∨a天堂va欧美va| 久久黄色毛片| 视频二区亚洲精品| 欧美国产日韩在线播放| 亚洲综合国产一区二区三区| 亚洲天堂在线免费| 伊人精品成人久久综合| 4虎影视国产在线观看精品| 狠狠色丁香婷婷| 91亚洲视频下载| 成人第一页| 欧美精品一二三区| 国产精品99久久久| 亚洲综合色婷婷中文字幕| 午夜啪啪网| 亚洲中文在线视频| av尤物免费在线观看| 久久美女精品| 无码国产偷倩在线播放老年人| 亚洲AⅤ综合在线欧美一区| 人妻中文字幕无码久久一区| 91区国产福利在线观看午夜| 日韩AV无码免费一二三区| 国产精品理论片| 久精品色妇丰满人妻| 露脸真实国语乱在线观看| 日韩在线第三页| 国产在线自乱拍播放| 亚洲人成网站日本片| 国产无码精品在线播放| 四虎影视永久在线精品| 自偷自拍三级全三级视频 | 日韩欧美网址| 91精选国产大片| 99人妻碰碰碰久久久久禁片| 欧美天堂在线| 日本AⅤ精品一区二区三区日| 无码中文字幕乱码免费2| 亚洲欧美成人在线视频| 999福利激情视频| 国产小视频网站| 国产伦片中文免费观看| 中文字幕伦视频| 日本精品影院| 国产免费人成视频网| 国产精品成人免费视频99| 国产亚洲精久久久久久无码AV| 99在线视频精品| 自拍中文字幕| 好紧好深好大乳无码中文字幕| 国产麻豆福利av在线播放| 99精品这里只有精品高清视频| 蜜臀av性久久久久蜜臀aⅴ麻豆| 久久无码高潮喷水| 日韩视频免费| 国产在线视频二区| 女人一级毛片| 亚洲日韩高清无码| 国产情精品嫩草影院88av| 女人一级毛片| 亚洲大尺度在线| 国产亚洲视频播放9000| 色婷婷在线影院| 日韩AV手机在线观看蜜芽| 国产高清在线丝袜精品一区| 伊人天堂网| 伊人久综合| 亚洲视频免费在线|