999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于模式注入的數(shù)據(jù)生成方法

2018-02-25 02:39:06易忱
電子技術(shù)與軟件工程 2018年7期
關(guān)鍵詞:數(shù)據(jù)挖掘

易忱

摘要 對(duì)于規(guī)律未知數(shù)據(jù),利用數(shù)據(jù)挖掘算法對(duì)已擁有的少量真實(shí)數(shù)據(jù)進(jìn)行模式探索,采用模式注入的方法,將探索得到的數(shù)據(jù)模式以一定的規(guī)范語言描述出來,按數(shù)據(jù)模式產(chǎn)生的數(shù)據(jù)約束關(guān)系轉(zhuǎn)換為SDDL規(guī)范化語言,生成需要的數(shù)據(jù),為設(shè)備性能評(píng)估提供數(shù)據(jù)支持。工程實(shí)例說明了模式注入數(shù)據(jù)生成方法的正確性和可行性。

【關(guān)鍵詞】模式注入 數(shù)據(jù)挖掘 數(shù)據(jù)生成

很多設(shè)備的狀態(tài)監(jiān)控和性能評(píng)估,通常采用大數(shù)據(jù)和人工智能的方法,分析挖掘數(shù)據(jù)規(guī)律,對(duì)設(shè)備系統(tǒng)性能進(jìn)行科學(xué)、準(zhǔn)確的評(píng)價(jià)。但很多工況數(shù)據(jù)缺失,體量達(dá)不到大數(shù)據(jù)規(guī)模,大多是低價(jià)值密度的數(shù)據(jù),原因主要有:

1)歷史數(shù)據(jù)積累少;

2)樣本少;

3)安全保密控制;

4)數(shù)據(jù)無法利用。

為了解決這一矛盾,根據(jù)數(shù)據(jù)特性和應(yīng)用目的的不同,結(jié)合工程實(shí)踐經(jīng)驗(yàn),嘗試從數(shù)據(jù)的特性入手,研究模式注入或特性繼承的數(shù)據(jù)挖掘方法,為性能評(píng)估提供數(shù)據(jù)支持。

1 模式注入方法研究

在具體應(yīng)用中,普遍面對(duì)的是根據(jù)已有知識(shí),無法判斷數(shù)據(jù)對(duì)研究的意義,更不能明確數(shù)據(jù)蘊(yùn)含知識(shí)的數(shù)據(jù)集,我們將這類數(shù)據(jù)稱之為規(guī)律未知數(shù)據(jù)。通過少量歷史數(shù)據(jù),采用模式注入方法,生成這類數(shù)據(jù)。

模式注入的數(shù)據(jù)生成基本思想是化規(guī)律未知為己知,然后通過規(guī)律己知數(shù)據(jù)類似的方式生成數(shù)據(jù)。在操作步驟上,首先利用數(shù)據(jù)挖掘算法對(duì)已擁有的少量真實(shí)數(shù)據(jù)進(jìn)行模式探索,然后將探索得到的數(shù)據(jù)模式以一定的規(guī)范語言描述出來,如PMML (Predictive ModelMarkup Language);然后將數(shù)據(jù)模式產(chǎn)生的數(shù)據(jù)約束關(guān)系轉(zhuǎn)換為數(shù)據(jù)生成工具的規(guī)范化語言描述, 如SDDL (Synthetic Data DefinitionLanguage),供數(shù)據(jù)生成工具使用。

PMML是由數(shù)據(jù)挖掘協(xié)會(huì)(The DataMining Group,DMG)組織開發(fā)的,主要目的是形成一種通用標(biāo)準(zhǔn),允許應(yīng)用程序和聯(lián)機(jī)分析處理( OLAP)工具能從數(shù)據(jù)挖掘系統(tǒng)獲得模型,而不用獨(dú)自開發(fā)數(shù)據(jù)挖掘模塊,為模型的跨平臺(tái)、跨系統(tǒng)共享提供一種快速且簡單的方式。同時(shí),PMML還提供靈活的機(jī)制支持多個(gè)預(yù)言模型的選擇和平衡,非常適合于全部學(xué)習(xí),部分學(xué)習(xí),分布式學(xué)習(xí)等多種應(yīng)用場(chǎng)景。PMML基于XML格式,目前己發(fā)展到4 2版本,包括標(biāo)題( header)、數(shù)據(jù)字典(data dictionary)、數(shù)據(jù)流(dataflow)、挖掘模式(mining schema)、數(shù)據(jù)轉(zhuǎn)換( transformations)、預(yù)測(cè)模型、模型組合定義( ensembles of models)、異常處理規(guī)則(rules for exception handling)等內(nèi)容。數(shù)據(jù)生成主要用到兩個(gè)重要組成其一是數(shù)據(jù)字典,遵循一個(gè)或多個(gè)挖掘模型,包括name(描述數(shù)據(jù)集字段名),Optype(字段可操作類型),dataType attributes(重用W3C XML schemaatomic types中的名稱和語法)等元素,描述字段類型、操作方式、數(shù)據(jù)范圍等內(nèi)容,不依賴于具體的挖掘模型其二是挖掘模式( Miningschema),儲(chǔ)存字段的值分布規(guī)律等特殊信息,根據(jù)具體挖掘模型的不同存在區(qū)別。目前PMML標(biāo)準(zhǔn)支持決策樹、關(guān)聯(lián)規(guī)則、聚集、回歸、nalve貝葉斯、神經(jīng)網(wǎng)絡(luò)、規(guī)則集、序列、文本模型、支持向量機(jī)等挖掘模型。一個(gè)精簡了部分內(nèi)容及格式后的決策樹挖掘模式如圖2的XML所示。

通過模式探索獲得PMML描述的數(shù)據(jù)模式后,經(jīng)過描述轉(zhuǎn)換形成能夠?yàn)閿?shù)據(jù)生成工具直接使用的SDDL文檔。SDDL同樣基于XML文檔格式,能夠表達(dá)出最大/最小約束、分布約束、公式約束、字典約束、查詢數(shù)據(jù)約束、迭代/重復(fù)約束等。這些約束間還能夠通過組合形成比較復(fù)雜的約束,如迭代/重復(fù)約束可以和其它約束組合。圖3的XML為這種約束的一個(gè)典型的示例。

數(shù)據(jù)生成工具按照SDDL表達(dá)的約束條件實(shí)現(xiàn)大量數(shù)據(jù)的生成。

2 工程實(shí)例

某設(shè)備管理綜合信息系統(tǒng)是一個(gè)涉及業(yè)務(wù)廣,功能十分復(fù)雜的大型信息系統(tǒng)。系統(tǒng)不僅管理設(shè)備終端自動(dòng)采集數(shù)據(jù)、業(yè)務(wù)流轉(zhuǎn)數(shù)據(jù),還需要通過對(duì)這些數(shù)據(jù)的分析,為業(yè)務(wù)機(jī)關(guān)提供決策支持。在系統(tǒng)正式上線前,必須利用盡量真實(shí)的數(shù)據(jù)對(duì)系統(tǒng)進(jìn)行充分的測(cè)試。在該系統(tǒng)中采用模式注入的數(shù)據(jù)生成方法進(jìn)行了工程實(shí)踐,取得了很好的應(yīng)用效果。

主要步驟如下:

2.1 數(shù)據(jù)定義分析

根據(jù)數(shù)據(jù)模型分析該系統(tǒng)數(shù)據(jù)定義,確定數(shù)據(jù)生成的表范圍。按照壽命周期等客觀屬性,該系統(tǒng)的數(shù)據(jù)表大致可分為基礎(chǔ)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、自動(dòng)采集數(shù)據(jù)等大類。其中基礎(chǔ)數(shù)據(jù)主要包括單位、設(shè)備、器材等目錄代碼及一系列的枚舉型應(yīng)用字典,業(yè)務(wù)數(shù)據(jù)主要包括各類計(jì)劃、業(yè)務(wù)流轉(zhuǎn)過程數(shù)據(jù)等,自動(dòng)采集數(shù)據(jù)主要包括設(shè)備、器材自動(dòng)化測(cè)試、環(huán)境監(jiān)控等終端采集的數(shù)據(jù)。該系統(tǒng)數(shù)據(jù)劃分及部分表示例如圖4所示。

2.2 準(zhǔn)備真實(shí)歷史數(shù)據(jù)

將能夠得到的真實(shí)數(shù)據(jù)經(jīng)預(yù)處理后加載到對(duì)應(yīng)的數(shù)據(jù)表中,作為必要的基礎(chǔ)。基礎(chǔ)數(shù)據(jù)變化慢,壽命周期長,有少量的真實(shí)數(shù)據(jù);業(yè)務(wù)流程數(shù)據(jù)變化快,歷史積累多,有較多真實(shí)數(shù)據(jù);自動(dòng)采集數(shù)據(jù)同具體對(duì)象相關(guān),重點(diǎn)設(shè)備及配備量大的設(shè)備數(shù)據(jù)多,一般設(shè)備及配備量小的數(shù)據(jù)少。

2.3 確定數(shù)據(jù)生成策略

具體分析數(shù)據(jù)表,在總體上確定各表數(shù)據(jù)生成的順序(被引用父表必須在子表數(shù)據(jù)生成之前生成),確定單表數(shù)據(jù)生成方式,并通過規(guī)范化語言描述,供數(shù)據(jù)生成工具使用。

2.4 按策略描述生成數(shù)據(jù)

數(shù)據(jù)生成工具按照規(guī)范化語言描述策略生成數(shù)據(jù)。規(guī)律未知數(shù)據(jù)的代表如部分設(shè)備的測(cè)試數(shù)據(jù)。

2.5 效果分析

某型設(shè)備組成件的測(cè)試數(shù)據(jù)歷史積累少,難以支撐系統(tǒng)分析測(cè)試要求,我們采用了模式注入的方法進(jìn)行數(shù)據(jù)生成。該關(guān)鍵件測(cè)試數(shù)據(jù)分為4組22個(gè),其中第一組為Po,第二組為P10~P16,第三組為P20—P26,第四組為P30-P36,表示例如表1所示。

原始數(shù)據(jù)僅有168條,經(jīng)過特性繼承的方法生成得到798條。原始數(shù)據(jù)和生成數(shù)據(jù)在分類及統(tǒng)計(jì)特性上具有很好的相似性,如圖5所示。

由對(duì)比分析可見,通過上述方法生成的設(shè)備數(shù)據(jù)同真實(shí)數(shù)據(jù)具有很大的統(tǒng)計(jì)相似性,為某設(shè)備管理綜合信息系統(tǒng)的用戶試用和質(zhì)量評(píng)測(cè)提供了很大幫助。

3 結(jié)論

本文理論方法和工程實(shí)踐都表明,模式注入的數(shù)據(jù)生成方法,是正確的和可行的。通過數(shù)據(jù)生成能夠較好的解決設(shè)備使用與保障研究中數(shù)據(jù)缺少的問題,在一定的場(chǎng)景下具備替換真實(shí)數(shù)據(jù)的能力。

參考文獻(xiàn)

[1]J. White,“American Data Set GenerationProgram: Creat ion,

Applications, andSignicance” [D]. ComputerScience andComputer Engineering Dept., Univ. ofArkansas.2005.

[2]黎方正,羅大庸,謝東.一種海量數(shù)據(jù)生成方法[J]小型微型計(jì)算機(jī)系統(tǒng),2009 (12): 2420-2423.

[3]魏偉杰,張斌,王波等,一種用于數(shù)據(jù)挖掘算法的數(shù)據(jù)生成方法[J],東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2008 (03): 328-331.

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
主站蜘蛛池模板: 日本在线视频免费| 91在线视频福利| 婷婷成人综合| 国产美女无遮挡免费视频| 亚洲福利一区二区三区| 国产福利拍拍拍| 亚洲精品成人福利在线电影| 国产成人艳妇AA视频在线| 欧美五月婷婷| 呦女精品网站| 永久免费无码成人网站| 91在线激情在线观看| 婷婷亚洲视频| 色综合中文字幕| 免费a级毛片视频| 日韩成人午夜| 国产内射一区亚洲| 热99精品视频| 中文字幕在线免费看| 伊人久久综在合线亚洲2019| 玩两个丰满老熟女久久网| 国产AV毛片| 久久国产亚洲欧美日韩精品| 国内老司机精品视频在线播出| 国产精品女在线观看| 99热6这里只有精品| 亚洲欧美自拍中文| 亚洲va精品中文字幕| 亚洲AV色香蕉一区二区| 国产精品视频久| 人妻精品久久无码区| 99久久99这里只有免费的精品| 成人午夜福利视频| 国产日本欧美亚洲精品视| 日韩区欧美国产区在线观看| 久久综合干| 免费亚洲成人| 亚洲第一极品精品无码| 日韩小视频在线播放| 噜噜噜久久| 精品黑人一区二区三区| 四虎永久免费地址在线网站| 亚洲视频色图| 国产丝袜无码一区二区视频| 日韩在线视频网站| 日韩A级毛片一区二区三区| 好吊日免费视频| 精品国产福利在线| AV无码国产在线看岛国岛| 无码精品国产dvd在线观看9久 | 国产精品浪潮Av| 日韩不卡免费视频| 又大又硬又爽免费视频| 一级毛片在线播放免费观看 | 亚洲精品久综合蜜| 无遮挡一级毛片呦女视频| 国产亚洲欧美日韩在线观看一区二区| 喷潮白浆直流在线播放| 伊人激情综合网| 97狠狠操| 欧美国产精品不卡在线观看| 日韩高清一区 | 精品亚洲国产成人AV| 女人18毛片一级毛片在线| 91网址在线播放| 亚洲成人福利网站| 动漫精品啪啪一区二区三区| 91欧美亚洲国产五月天| 天堂成人在线| 666精品国产精品亚洲| 亚洲国产成熟视频在线多多| 丁香婷婷激情网| 日韩乱码免费一区二区三区| 91在线视频福利| 少妇精品久久久一区二区三区| 狠狠干欧美| 久久青草精品一区二区三区| 亚洲中文久久精品无玛| 婷婷色狠狠干| 久久精品无码专区免费| 亚洲第一国产综合| 在线观看国产小视频|