999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

擬單層覆蓋粗糙集中近似集的增量更新算法

2022-06-16 05:24:48吳正江張亞寧梅秋雨
計算機工程 2022年6期

吳正江,張亞寧,張 真,梅秋雨,楊 天

(河南理工大學計算機科學與技術學院,河南焦作 454003)

0 概述

經典的粗糙集[1]在沒有任何先驗知識的情況下,通過上下近似集表示某個確定的概念,能夠處理具有不確定性、不一致性等特點的數據集。粗糙集理論廣泛應用于數據挖掘[2]、推薦系統[3]、工業控制系統[4-5]等領域。

信息系統可能伴有部分缺失值或集值。研究人員提出了容差關系[6]、非對稱相似關系[7]、限制性容差關系[8]、最大相容類[9]等二元關系代替不可區分關系,使得泛化的粗糙集模型能夠處理集值信息系統。文獻[10-11]提出擬單層覆蓋粗糙集界于一般覆蓋與劃分之間,是一個特殊的鄰域系統。近似質量是衡量一個模型的標準,文獻[12]將擬單層覆蓋粗糙集應用于集值信息系統中,并在真實數據集上進行實驗,證明了該模型在近似質量和計算效率方面均優于容差關系、非對稱相似關系、限制性容差關系以及最大相容類,但是該模型無法應用于動態集值信息系統。

隨著時間的推移,信息系統也會持續不斷地發生變化。求解近似集的效率將直接影響規則提取和屬性約簡的效率。當信息系統發生改變時,快速獲取更新系統中的近似集成為亟待解決的難題。

增量學習是指充分利用已知的信息并且避免從頭開始計算,從而達到提升計算效率的目的。將增量學習靈活運用于動態信息系統中近似集的求解可以顯著提升其計算效率。信息系統結構的動態變化方式有屬性集的變化[13-15]、屬性值的變化[16-17]以及對象集的變化。關于對象集發生變化的情況,文獻[18]基于模糊優勢鄰域粗糙集提出動態區間值有序數據的增量特征選擇方法。根據云平臺下的并行模型MapReduce,文獻[19]提出經典粗糙集的并行增量算法,用于更新大規模數據的近似集。當對象批量發生變化時,文獻[20]提出一種鄰域決策粗糙集模型的增量式更新算法。針對混合型信息系統,文獻[21]提出基于鄰域決策粗糙集矩陣方法的增量式更新算法。文獻[22]提出鄰域多粒度粗糙集模型的矩陣化方法并設計了相應的增量更新方法,用于更新正域、負域及其邊界域。文獻[23]研究了優勢粗糙集模型中動態有序數據的增量屬性約簡方法。

本文提出擬單層覆蓋粗糙集中近似集的增量更新算法。當一個對象集添加至原始系統時或一個對象集從原始系統移除時,通過分析擬單層覆蓋集中信息單元的變化情況,根據信息單元的變化對各近似集可靠單元和爭議單元的相關可靠單元集的影響,設計相應的更新算法。在此基礎上,通過計算更新系統中各近似集的最終結果,從而提高近似集的計算效率。

1 基本概念

集值信息系統S=(U,A,V,f)是一個四元組。其中:U是一個非空有限的對象集,稱為論域;A是有限的屬性集;V為屬性的值域且是從U×A到V的集值映射。

定義1令S=(U,A,V,f)為集值信息系統,其中A=(a1,a2,…,an)。對象x∈U的信息解釋是一個集值向量。表達式=,其中f(x,ai)是集合。

定義2令S=(U,A,V,f)為集值信息系統。是S上的一個信息單元,且x∈Cellx,。如果中的任意值均為單值,則該信息單元被稱為可靠單元。如果中存在集值,則該信息單元被稱為爭議單元。Cellc的相關可靠單元集記為RS(Cellc),其中RS(Cellc)=(Cellr∈RC|?ai∈A,x∈Cellx,y∈Celly,f(x,ai)?f(y,ai))。

可靠單元和爭議單元分別記為Cellr和Cellc,并且所有可靠元和爭議元的集合分別記為RC 和CC。

定理1令S=(U,A,V,f)為集值信息系統。RC和CC 分別包含S中所有的可靠單元和爭議單元。對應任意X?U,S上X的DA0 和DE0 近似集如下:

2 近似集的增量更新

當論域發生變化時,擬單層覆蓋粗糙集中的近似集也會發生變化。傳統的靜態方法將從頭開始計算近似集,會浪費大量的時間。本文提出當對象集變化時擬單層覆蓋粗糙集的增量更新方法,充分利用已知的計算結果,達到提高計算效率的目的。

2.1 對象增加時近似集動態更新

2.2 對象移除時近似集動態更新

3 本文算法

本文設計增量更新算法,算法1 為靜態算法,算法2 和算法3 分別為對象集增加時和減少時的增量更新算法。

3.1 靜態算法

在定義2 和定理1 的理論基礎上,本文設計相應的靜態算法。

3.2 對象集添加時近似集的增量更新算法

當原始系統中添加一個對象集時,根據2.1 節提出的方法設計相應的增量更新算法。

3.3 對象集移除時近似集的增量更新算法

當原始系統中移除一個對象集時,根據2.2 節提出的方法設計相應的增量更新算法。

本文通過對比靜態算法和兩個增量算法的時間復雜度可知,無論對象集被添加還是被移除,增量算法的時間復雜度總低于靜態算法的時間復雜度。

4 實驗結果與分析

本文通過在真實數據集上的一系列實驗驗證增量算法的有效性。在計算結果保持一致的前提下,本文計算擬單層覆蓋粗糙集中近似集所消耗的時間,對比靜態算法和增量算法的效率。

本文實驗分為對象添加和對象移除兩種情況。這兩種情況下的對比實驗均在UCI 數據集上進行。數據集的具體描述如表1 所示。

表1 數據集描述Table 1 Data sets description

本文對數據集進行預處理形成對應的集值信息系統,分別計算每個屬性的最小值、最大值、平均數和中位數,將其從小到大排列產生3 個間隔。如果該列的某個屬性值位于第1 個間隔,則該屬性值對應于單值記錄。如果其位于第3 個間隔,則該屬性值對應于與前者不同的單值記錄,否則該值對應于前兩者組成的集值記錄。

實驗環境的操作系統為Windows 10,CPU 為Intel?CoreTMi7-9750H,內存為16 GB。本文使用Java 編程語言在IDEA 平臺上實現靜態和增量算法,其中Java 虛擬機版本為JVM 1.8。

當對象集發生變化時,本文在保持原始數據集包含對象數不變的前提下,依次增加發生變化(被添加到原始系統或從原始系統中移除)的對象數,對比靜態算法和增量算法的計算時間,以驗證增量理論和對應算法的有效性。

對于一個對象集被添加至原始集值信息系統的情況,本文對數據集進行如下處理:1)取出前50%的對象作為原始數據;2)將后50%的對象平均劃分為10 份;3)依次將10%,20%,…,100%添加至原始數據。針對算法1 和算法2,本文使用以上產生的10 組添加對象數不同的數據進行實驗。在不同的數據集上,當對象增加時算法1 和算法2 計算時間的對比如圖1 所示。

圖1 當對象增加時算法1 和算法2 的計算時間對比Fig.1 Computation time comparison of algorithm 1 and algorithm 2 when objects are added

從圖1 可以看出,隨著添加至原始數據集中對象數目的增加,算法1 和算法2 的計算時間都呈增加趨勢,但算法1 對應曲線的斜率更大,并且計算時間比算法2 多。因此,算法1 的效率低于算法2。當數據集中包含對象增加時,信息單元(可靠單元和爭議單元)的數目也會隨之增加。根據算法1 和算法2 的時間復雜度可知,2 個算法隨著對象集的增加所需的計算時間也會增加,即圖1 的結果也與時間復雜度的分析保持一致。

當對象添加率為10%、50%和100%時,靜態算法1和增量算法2 計算近似集所需運行時間的比值如表2 所示。從表2 可以看出,隨著對象添加率的增加,算法1 和算法運行時間的比值越來越小。在Sensorless 數據集上,當對象添加率達到100%時,算法1 的執行時間為4.155 s,而算法2 僅需0.224 s,前者仍是后者的18 倍。

表2 算法1 與算法2 運行時間的比值Table 2 Running time ratio of algorithm 1 and algorithm 2

對于一個對象集從原始集值信息系統中移除的情況,本文對數據集進行如下處理:1)將完整的數據集作為原始數據;2)將后50%的對象平均劃分為10 份;3)依次將10%,20%,…,100%從原始數據中移除。針對算法1 和算法3,本文使用以上產生的10 組移除對象數中不同的數據進行實驗。在不同的數據集上,當對象移除率增加時算法1 和算法3 的計算時間對比如圖2 所示。從圖2 可以看出,隨著移除對象的增加,算法1 呈下降趨勢,而算法3 呈上升趨勢,但是算法3 的曲線總在算法1 對應曲線的下方。因此,當論域中部分對象集移除時算法3 的效率更高。

圖2 當對象移除時算法1 和算法3 的計算時間對比Fig.2 Computation time comparison of algorithm 1 and algorithm 3 when objects are removed

當對象移除率為10%、50%和100%時,靜態算法1和增量算法3 計算所需運行時間的比值如表3 所示。

表3 算法1與算法3運行時間的比值Table 3 Running time ratio of algorithm 1 and algorithm 3

從表3可以看出,當對象移除率增加時,靜態算法1和增量算法3 計算所需運行時間的比值越來越小。在Sensorless 數據集上,當對象移除率達到100%時,算法1 的執行時間為2.489 s,而算法3 僅需0.221 s,前者是后者的11.26 倍。

表4 在不同對象移除率下的結果Table 4 Result of under different object removal ratio

表4 在不同對象移除率下的結果Table 4 Result of under different object removal ratio

5 結束語

因集值信息系統中的對象集隨時間的推移而增加或移除,導致擬單層覆蓋粗糙集中的近似集發生變化。本文結合增量學習與擬單層覆蓋粗糙集,提出近似集的增量更新算法。通過設計信息單元、可靠單元和爭議單元的更新方法,以達到提高計算效率的目的。構建與更新算法相對應的增量算法,并分析其時間復雜度。在UCI 數據集上進行實驗,結果表明,當對象集發生變化時,本文算法相較于靜態算法的近似集計算效率高。下一步將擬單層覆蓋粗糙集增量更新算法與大數據框架相結合,并對本文增量更新算法的并行化問題進行研究,使其能夠實時處理海量數據。

主站蜘蛛池模板: 高清无码一本到东京热| 99这里只有精品在线| 久久精品波多野结衣| 亚洲第一精品福利| 欧洲成人免费视频| 日韩资源站| 91精品啪在线观看国产91九色| 亚洲日本韩在线观看| 国产福利2021最新在线观看| 亚洲一级色| 视频一本大道香蕉久在线播放| 国产免费黄| 久久香蕉国产线看精品| 91区国产福利在线观看午夜| 国产精品免费福利久久播放 | 亚洲欧美激情小说另类| 成人亚洲天堂| 国产97视频在线| 午夜欧美理论2019理论| 18黑白丝水手服自慰喷水网站| 97青青青国产在线播放| 丝袜美女被出水视频一区| 大陆精大陆国产国语精品1024| 欧美伦理一区| 成人日韩精品| 亚洲色欲色欲www网| 亚洲欧美在线综合图区| 女人天堂av免费| 欧洲av毛片| 99国产精品一区二区| 欧美 亚洲 日韩 国产| 国产 日韩 欧美 第二页| 国产啪在线91| 国产精品片在线观看手机版 | 亚洲精品波多野结衣| 无码精品国产dvd在线观看9久 | 四虎精品国产AV二区| 成人免费午夜视频| 91精品啪在线观看国产60岁| 色网站免费在线观看| 极品性荡少妇一区二区色欲| 在线a视频免费观看| 亚洲国产成人无码AV在线影院L | 666精品国产精品亚洲| 久久综合伊人77777| 国产又爽又黄无遮挡免费观看 | 国模视频一区二区| 国产女人在线视频| 国产午夜精品一区二区三| 毛片在线播放a| 国产91精品调教在线播放| 久久亚洲国产最新网站| 欧美劲爆第一页| 91小视频在线| 亚洲精品va| 高清不卡毛片| 2020国产精品视频| 综合久久五月天| 深夜福利视频一区二区| 欧美日韩免费| 亚洲不卡无码av中文字幕| a毛片在线| 国产91熟女高潮一区二区| 99热国产在线精品99| 国产精品欧美亚洲韩国日本不卡| jizz在线免费播放| 国产高清免费午夜在线视频| 亚洲精品777| 久久午夜夜伦鲁鲁片无码免费| 欧美一级黄片一区2区| 911亚洲精品| 亚洲一级毛片在线观| 国产精品自拍合集| 国内老司机精品视频在线播出| 综合色亚洲| 在线不卡免费视频| 99手机在线视频| 操美女免费网站| 欧美日韩另类国产| 97青草最新免费精品视频| 国产成人乱无码视频| 国产欧美精品一区aⅴ影院|