999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向大數(shù)據(jù)的規(guī)則引擎驅(qū)動下信息分類方法

2021-11-17 08:37:22邵英儉
計算機仿真 2021年5期
關(guān)鍵詞:引擎規(guī)則分類

倪 海,邵英儉

(1. 北華大學(xué)大數(shù)據(jù)與智慧校園管理中心,吉林 吉林 132013;2. 北華大學(xué),吉林 吉林 132013)

1 引言

信息時代快速發(fā)展的背景下,互聯(lián)網(wǎng)技術(shù)也隨之成為獲取大數(shù)據(jù)信息的重要手段,其從原來單一化趨勢逐漸朝著集成化和大數(shù)據(jù)化的方向發(fā)展[1]。在大數(shù)據(jù)中,將信息主要分為同步信息和異步信息兩種,在異步信息中,需要將不同時間段的信息進行分類[2-3]。規(guī)則引擎是一種高效的決策工具,它能夠從成千上萬異步信息中進行快速、準確的反復(fù)判決,并且負責從異步信息的微觀層面上對信息進行邏輯和現(xiàn)實的分離。

文獻[4]提出基于快速隱層優(yōu)化的大數(shù)據(jù)分類方法,根據(jù)多個隱層網(wǎng)絡(luò)同時訓(xùn)練優(yōu)化隱層節(jié)點個數(shù),采用分布式方法通過計算實現(xiàn)信息分類。該方法穩(wěn)定性較強,但分類準確度有待提高,并且不能對不同信息類型進行有效劃分。文獻[5]提出基于多智能體策略的數(shù)據(jù)分類方法,將多智能體技術(shù)應(yīng)用到網(wǎng)絡(luò)進化中,根據(jù)克隆選擇算法模擬網(wǎng)絡(luò)模型,通過增加抗體間的競爭提高網(wǎng)絡(luò)分析能力。該方法成本消耗較低,但由于人工神經(jīng)大數(shù)據(jù)在整個訓(xùn)練過程中,速度較慢,容易陷入局部最優(yōu)的情況,從而嚴重影響了分類準確度和效率。

針對上述方法存在的問題,提出面向大數(shù)據(jù)的規(guī)則引擎驅(qū)動下信息分類方法。大數(shù)據(jù)信息分類問題屬于一個非線性問題,而支持向量機能夠得到大數(shù)據(jù)信息分類問題的全局最優(yōu)解,在非線性問題中具有顯著的優(yōu)勢,目前已經(jīng)在大數(shù)據(jù)信息分類方面取到了廣泛地應(yīng)用。粒子群優(yōu)化算法是一種全局優(yōu)化算法,它具有簡單易實現(xiàn)的優(yōu)點,已經(jīng)被廣泛的應(yīng)用到分類識別等領(lǐng)域。根據(jù)規(guī)則引擎技術(shù),結(jié)合支持向量機、粒子群算法與數(shù)據(jù)概化理論,完成大數(shù)據(jù)信息分類,并通過仿真驗證了所提方法的有效性。

2 基于規(guī)則引擎的大數(shù)據(jù)信息分類方法

2.1 規(guī)則引擎在大數(shù)據(jù)信息分類中的應(yīng)用

規(guī)則引擎在大數(shù)據(jù)信息分類處理技術(shù)的主要目標是:根據(jù)相關(guān)的大數(shù)據(jù)信息,建立相應(yīng)的分類處理規(guī)則,實現(xiàn)大數(shù)據(jù)信息規(guī)則管理流程的自動化[6];應(yīng)用規(guī)則引擎技術(shù),構(gòu)建信息分類處理技術(shù)平臺,使工作人員能夠隨時進行信息規(guī)則的制定和管理;充分應(yīng)用成熟的引擎部件,減少信息處理過程中的編程代碼的使用頻率;在一定程度上減少編程的工作量,提高大數(shù)據(jù)信息分類的效率。

在規(guī)則庫中包含所有針對大數(shù)據(jù)信息所建立的生成式規(guī)則,該規(guī)則根據(jù)信息所對應(yīng)的參數(shù)進行描述,并且各個參數(shù)之間具有一定的邏輯性,以xml的格式進行存儲,其分類處理工作具體流程如下:

1)利用規(guī)則引擎中的接口函數(shù),構(gòu)建規(guī)則引擎對象。

2)利用規(guī)則定制模塊,將規(guī)則集中的大數(shù)據(jù)信息傳送到規(guī)則引擎中。

3)開啟引擎,將信息輸入到支持向量機中,采用粒子群算法選取最優(yōu)的支持向量機參數(shù)。

4)得出信息的分類處理結(jié)果,并將其傳入到數(shù)據(jù)庫中進行保存[7]。

2.2 獲取大數(shù)據(jù)信息特征

通過對規(guī)則引擎下的大數(shù)據(jù)信息進行分析,構(gòu)建大數(shù)據(jù)信息集模型,獲取大數(shù)據(jù)信息特征,具體過程如下:

為了能夠?qū)崿F(xiàn)對大數(shù)據(jù)信息的分類,需要建立大數(shù)據(jù)信息集模型,以此來得到大數(shù)據(jù)信息特征。假設(shè),大數(shù)據(jù)信息序列為s1(t),s2(t),…,sp(t),其能夠?qū)?jié)點能量預(yù)測進行基本描述[8],利用下式給出節(jié)點能量信息的狀態(tài)空間

S={k,n}

(1)

式中,0≤k≤K,0≤n≤N,k,n分別表示節(jié)點能量信息的橫縱坐標,根據(jù)多路由探測,將大數(shù)據(jù)信息進行發(fā)送,得到大數(shù)據(jù)局部信息的量化噪聲,其表達式為

mi(k)=S+qi(k)

(2)

式中,qi(k)表示信息量化噪聲。

大數(shù)據(jù)信息量化噪聲是一種高斯白噪聲,為了方便分析,在設(shè)定大數(shù)據(jù)信息量化的過程中,需要保證沒有外界噪聲的加入。即要將節(jié)點信息序列Pn(t)和大數(shù)據(jù)信息序列Sn(t)相結(jié)合進行卷積計算,得到兩者之間的卷積結(jié)果,構(gòu)建大數(shù)據(jù)信息集模型為

E{w(k)}=Bi(k)×mi(k)

(3)

式中,Bi(k)為卷積計算得到的數(shù)值。以式(3)為基礎(chǔ),得出大數(shù)據(jù)信息特征表達式

(4)

2.3 異步信息特征分類方法

采用核函數(shù)將大數(shù)據(jù)信息特征原始分類問題轉(zhuǎn)換到高維空間中,從而進行線性可分問題分析,并建立分類超平面[9]。

假設(shè),用xi∈Rn表示訓(xùn)練樣本向量,其所對應(yīng)的期望輸出用yi∈{+1,-1}來表示,l代表訓(xùn)練樣本的數(shù)量,d代表大數(shù)據(jù)信息的維數(shù)。利用下式給出,支持向量機所要解決的原始優(yōu)化問題

(5)

式中,C表示懲罰因子;ξi表示大數(shù)據(jù)信息松弛變量。則原始優(yōu)化問題相應(yīng)的決策函數(shù)為

(6)

采用不同的核函數(shù),可以建立不一樣的支持向量機分類器,現(xiàn)階段經(jīng)常使用的核函數(shù)主要是徑向基函數(shù)(RBF),因為其只需要確定一個參數(shù),并且具有和其它函數(shù)一樣的全局性能,所以采用RBF作為支持向量機的核函數(shù)[10],利用下式給出其表達式

(7)

式中,σ表示核函數(shù)寬度參數(shù)。

當采用RBF作為支持向量機的核函數(shù)時,需要對兩個參數(shù)進行優(yōu)化,這兩個參數(shù)分別是xi和xj,xi和xj對支持向量機的分類性能會造成一定的影響。在支持向量機訓(xùn)練的過程中,對這兩個參數(shù)進行合理的選取非常重要,采用粒子群優(yōu)化算法找出最優(yōu)的支持向量機參數(shù),以此獲取最佳分類器[11]。

假設(shè),搜索空間是由m個粒子構(gòu)成的一個粒子種群,每一個單獨的粒子都會被看成是這個D維空間中的一個點。其狀態(tài)根據(jù)它的更新位置和速度進行描述

(8)

式中,ω表示慣性權(quán)重值,其計算公式如式(9)所示。隨著迭代次數(shù)的不斷增加,利用式(9)從起始值開始進行線性遞減;c1和c2表示為正整數(shù)的學(xué)習(xí)因子;rand代表處于0到1之間的隨機數(shù)。

(9)

采用粒子群算法對支持向量機參數(shù)進行優(yōu)化,具體步驟如下

1)設(shè)定支持向量機參數(shù)的整個搜索范圍和粒子群種群中所有粒子的搜索范圍和最大速度。

2)初始化粒子群。隨機生成xi和xj這兩個參數(shù),將它們當成種群中每個粒子的起始位置,并隨機設(shè)定每個粒子的起始速度。

3)求出各個粒子的適應(yīng)度,得到每個粒子的全局位置,對該參數(shù)進行優(yōu)化的主要目的是提高對大數(shù)據(jù)信息分類的正確率,將大數(shù)據(jù)信息分類正確率作為適應(yīng)度函數(shù)

(10)

式中,yt和y分別表示大數(shù)據(jù)信息初步分類的樣本數(shù)量和總數(shù)。

4)根據(jù)式(9)得到各個粒子的慣性權(quán)重值,并通過式(8)得到所有粒子更新后的速度和位置,獲取全局最優(yōu)位置。

5)判斷是否滿足最大的迭代次數(shù),當它滿足時,停止搜索;不滿足則轉(zhuǎn)到(4),繼續(xù)搜索[12]。

根據(jù)支持向量機參數(shù)選取結(jié)果實現(xiàn)信息的初步分類。

2.4 信息屬性最優(yōu)分類

在信息分類的過程中,需要使大數(shù)據(jù)中的眾多數(shù)據(jù)以最簡單的形式呈現(xiàn)出其最重要的屬性信息,將其從較低概念層抽象到較高概念層的方法稱之為數(shù)據(jù)概化理論。通過數(shù)據(jù)概化理論能夠?qū)崿F(xiàn)對信息屬性的進一步分類。通常情況下,可以將信息劃分成數(shù)據(jù)立方體,把屬性不同的信息進行分類是面向?qū)傩詺w納中較為重要的手段之一,針對不同的信息屬性,將每個不同的信息分配到任意分類中相對容易,但在實際分類過程中,經(jīng)常會出現(xiàn)部分信息屬性模糊的問題。對于未知的信息屬性進行分類,可以利用高聚類、低耦合的原理對信息屬性進行最優(yōu)分類,具體分類過程如下。

信息屬性分類從本質(zhì)上來說是對多維的信息數(shù)據(jù)樣本進行分類,將數(shù)據(jù)樣本值分成k組,將n描述為取出樣本的次數(shù)。通過列舉不同劃分結(jié)果,選擇出其中特征最為明顯的部分,用來作為判定的分類結(jié)果,根據(jù)這一原則進行最優(yōu)分類。

假設(shè)有序樣本為X1,X2,X3…,Xi,其中Xi=(X1,X2,X3,Xm),那么假設(shè)其中某一類的樣本數(shù)據(jù)為{Xj,Xj+1,Xi},則該類的平均向量可以表示為

(11)

將數(shù)據(jù)樣本劃分為q個種類,那么種類劃分的第一個種類就是(Xq1,Xq1+1,Xq2-1),以此類推第二個為{Xq2,Xq2+1,Xq3-1},以此類推,當樣本確定取樣數(shù)值后,那么取值向量之間的總距離平方和是一個定值,那么根據(jù)上述分析,就可以通過遞推的形式實現(xiàn)對規(guī)則引擎驅(qū)動下的信息屬性進行分類。

3 實驗與仿真證明

為了驗證所提出面向大數(shù)據(jù)的規(guī)則引擎驅(qū)動下信息分類方法的綜合有效性,需要進行實驗。實驗用Matlab軟件進行數(shù)據(jù)處理,并在NS-2平臺上進行方法模擬。隨機采用基于快速隱層優(yōu)化的大數(shù)據(jù)分類方法(方法1)和基于多智能體策略的數(shù)據(jù)分類方法(方法2)與所提方法進行對比實驗,實驗結(jié)果如下所示。

將平均誤分率(%)作為對比指標,對不同方法進行對比,結(jié)果如圖1所示。

圖1 不同方法的平均誤分率對比結(jié)果

分析圖1可知,樣本量不同的條件下,不同方法平均誤分率都有不同程度的變化。通過圖1進行對比可知,方法1和方法2的平均誤分率較高,而所提方法的平均誤分率低于文獻對比方法,因此證明,所提方法提高了大數(shù)據(jù)信息分類的準確率。

進行分類耗時(s)對比實驗,實驗結(jié)果如圖2所示。

圖2 不同方法分類消耗對比實驗

分析圖2可知,隨著樣本量的不斷增加,不同方法的分類耗時均呈現(xiàn)出持續(xù)增長的趨勢。但是所提方法的分類耗時最低,說明所提方法的分類效率最高,可以實現(xiàn)對信息的快速分類,具有一定的實用價值。

進行分類效果對比實驗,本次實驗隨機抽取多個信息數(shù)據(jù),將這些信息數(shù)據(jù)分成3個信息集,分別為信息集1、信息集2和信息集3。其中,信息集1中包含8個信息素、信息集2中包含14個信息素,信息集3中包含10個信息素,分別采用所提方法和方法1、方法2對數(shù)據(jù)集進行分類實驗,圖3為信息素原始分布狀態(tài),圖4為經(jīng)過不同方法分類后的分布結(jié)果。

圖3 信息素原始分布狀態(tài)

圖4 不同方法分類效果對比實驗

分析圖4中的信息劃分結(jié)果可知,采用所提方法能夠有效劃分出不同信息集中的信息素,并將它們劃分至各自的數(shù)據(jù)集中,而方法1和方法2雖然可以將一部分信息進行劃分,但是劃分結(jié)果中部分信息素仍然不能劃分至相應(yīng)的數(shù)據(jù)集中,說明所提方法能夠有效劃分不同類型的信息,劃分效果較好。

根據(jù)上述實驗可以看出所提方法在分類結(jié)果準確性、分類效率和分類效果方面均明顯優(yōu)于方法1和方法2,經(jīng)過上述分析,可以驗證面向大數(shù)據(jù)的規(guī)則引擎驅(qū)動下信息分類方法的有效性,證明其具備極強的信息分類能力。

4 結(jié)束語

針對以往大數(shù)據(jù)信息分類中存在的分類偏差較大、分類效率不高和分類效果不佳的問題,提出一種面向大數(shù)據(jù)的規(guī)則引擎驅(qū)動下信息分類方法。該方法通過求解各個粒子的適應(yīng)度,得到了每個粒子的全局位置,同時,對該參數(shù)進行優(yōu)化提高了對大數(shù)據(jù)信息分類的準確率。并根據(jù)數(shù)據(jù)概化理論對初步分類結(jié)果進行進一步的分類,實現(xiàn)信息屬性的最優(yōu)分類。實驗結(jié)果表明,所提方法平均誤分率較低、分類完成時間較短、能夠?qū)⒉煌愋偷男畔⑦M行劃分,分類效果較佳。未來階段將針對文章的不足之處加以改正,為異步融合算法的應(yīng)用與發(fā)展提供理論依據(jù)和參考。

猜你喜歡
引擎規(guī)則分類
撐竿跳規(guī)則的制定
數(shù)獨的規(guī)則和演變
分類算一算
分類討論求坐標
數(shù)據(jù)分析中的分類討論
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
藍谷: “涉藍”新引擎
商周刊(2017年22期)2017-11-09 05:08:31
教你一招:數(shù)的分類
TPP反腐敗規(guī)則對我國的啟示
無形的引擎
河南電力(2015年5期)2015-06-08 06:01:46
主站蜘蛛池模板: 8090成人午夜精品| 玖玖精品在线| 米奇精品一区二区三区| 亚洲网综合| 色噜噜久久| 久久黄色一级片| 亚洲AV色香蕉一区二区| 亚洲日本www| 18黑白丝水手服自慰喷水网站| 亚洲首页在线观看| 日本精品αv中文字幕| 免费A级毛片无码免费视频| 毛片免费在线视频| AV无码无在线观看免费| 在线精品自拍| 国产精品免费电影| 婷婷色中文| 亚洲一区二区成人| 日本手机在线视频| 人妻出轨无码中文一区二区| 午夜影院a级片| 亚洲视频在线网| 国产精品久久久精品三级| 一级毛片在线直接观看| 免费女人18毛片a级毛片视频| 中国精品久久| 欧美人在线一区二区三区| 99激情网| 伊人色在线视频| 亚洲国产欧美中日韩成人综合视频| 欧美日韩专区| 999在线免费视频| 国产精品亚洲一区二区三区z| 香蕉久久国产超碰青草| 沈阳少妇高潮在线| 中文一区二区视频| 亚洲第一黄片大全| 国产精品视频999| 国产精品毛片在线直播完整版| 亚洲香蕉久久| 波多野结衣一区二区三区四区视频 | 大陆国产精品视频| 久久黄色免费电影| 亚洲天堂伊人| 亚洲福利网址| 亚欧美国产综合| 欧美在线视频a| 成人欧美在线观看| 欧美激情伊人| 又黄又湿又爽的视频| 九色视频在线免费观看| 91无码人妻精品一区二区蜜桃| 久久大香伊蕉在人线观看热2| 国产综合亚洲欧洲区精品无码| 日本免费福利视频| 国产原创演绎剧情有字幕的| 美女国产在线| www亚洲精品| 欧美午夜在线播放| 国产丝袜无码一区二区视频| 毛片免费试看| 日韩国产亚洲一区二区在线观看| 国产成人精品亚洲77美色| 久久精品电影| 熟女视频91| 亚洲区第一页| 在线国产毛片| 华人在线亚洲欧美精品| 精品国产成人a在线观看| 影音先锋亚洲无码| 自拍偷拍欧美| 54pao国产成人免费视频| 成人精品视频一区二区在线| 久久久亚洲色| 99久久国产综合精品2020| 91麻豆国产在线| 久久夜色精品| 亚洲综合经典在线一区二区| 青青草原偷拍视频| 波多野结衣第一页| 欲色天天综合网| av午夜福利一片免费看|