999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于核值的粗糙集填補方法

2014-07-24 15:51:36席寧
新媒體研究 2014年8期

摘 要 利用粗糙集的知識來進行缺失數(shù)據(jù)填補的方法很多,但很多都沒有考慮到?jīng)Q策規(guī)則。文章利用核值的重要性,通過構造可辨識矩陣,使得填補的數(shù)據(jù)更好的遵循決策規(guī)則,消除噪音數(shù)據(jù)。

關鍵詞 核值;極大完備子系統(tǒng);可辨識矩陣

中圖分類號:TP311 文獻標識碼:A 文章編號:1671-7597(2014)08-0061-01

1 粗糙集相關知識

在現(xiàn)今社會中,各個行業(yè)都會用數(shù)據(jù)庫來保存大量的歷史數(shù)據(jù)。然而,這些數(shù)據(jù)總會在不經(jīng)意間有所缺失,可能是環(huán)境因素,也可能是人為缺失。缺失的數(shù)據(jù)都蘊含著大量寶貴有用的信息,與企業(yè)經(jīng)營成果息息相關,因此很多企業(yè)都采用數(shù)據(jù)挖掘等技術,從缺失的數(shù)據(jù)中挖掘出有價值的信息。

粗糙集理論是繼概率論,模糊集,證據(jù)理論之后的又一個處理不確定性的數(shù)學工具,其作為一種較新的軟計算方法,其被有效的運用到數(shù)據(jù)預處理中,為不完備信息的填補開辟了另一條途徑。

在基于粗糙集的屬性約簡過程中,核值才是最有用的數(shù)據(jù)。本文提出了一種基于核值的重要性的填補方法,較好的保持信息表的決策規(guī)則。

該算法主要涉及到極大完備子系統(tǒng)和可辨識矩陣等粗糙集知識,相關的定義如下。

定理1 任一信息系統(tǒng)=,若增加一條對象,構成一個新的信息系統(tǒng)=<,,,>,其中,則的核值必是的核值。

推論 不完備信息系統(tǒng)S=,=是其極大完備子系統(tǒng),則的核值必是S的核值。

2 基于核值的ROUSTIDA算法描述

2.1 算法描述

由上述推論可以表明將不完備信息系統(tǒng)S分離成其極大完備子系統(tǒng)和待補系統(tǒng),而的核值必是S的核值,這說明在的核值的基礎上引進不可分辨關系不影響S的核值。

該算法是以可辨識矩陣為基礎,基本流程如下。

輸入:不完備信息系統(tǒng);

輸出:完備信息系統(tǒng);其中,前者是條件屬性集,后者為決策屬性集;

第一步 核值化:

將分離成它的極大完備子系統(tǒng)和待補系統(tǒng)。將看作是一個獨立系統(tǒng),建立它的核值體系,然后再將非核值的數(shù)據(jù)改為“*”,這樣就會得到一個新的系統(tǒng),將組合成一個新的信息系統(tǒng)=<,,,>.

第二步 求矩陣,,;r=0;

第三步

1)針對所有,求得,;

2)生成

(1) 對于所有,有=,;

(2) 對于所有,對做循環(huán);

①若=0,=*;

②否則若,則

(1)若,則;

(2)若,則;

(3)否則;

③若某一對象與多個對象存在不可分辨關系,則將此對象的缺失屬性值用其余對象的此屬性的均值填補;

第四步 決策表中對象獨立性的判斷:

1)對上述;若=0,則如存在,使=時,都有,將=*轉步驟3,否則轉2;若有(),將()整行刪去;否則轉2;

2)若=轉步驟5;否則,計算,,,,轉到第三步;

第五步 如果有遺失值,可用其他算法處理;

第六步 結束。

2.2 算法分析

算法主要解決使ROUSTIDA算法失效的不完備數(shù)據(jù)。可以通過以下圖表來說明問題。包括原始的不完備信息表,經(jīng)過步驟一得出的基于核值的不完備信息系統(tǒng),以及最終得到的完備信息表。

表1 原始表

U a1 a2 a3 a4

1 0 1 0 1

2 * 2 1 0

3 * 0 0 0

4 0 * 1 0

5 1 0 1 2

表2 基于核值的不完備信息表

U a1 a2 a3 a4

1 0 1 0 1

2 * 2 1 0

3 * 0 0 0

4 0 1 1 1

5 1 0 1 2

表3 結果表

U a1 a2 a3 a4

1 0 1 0 1

2 0 2 1 0

3 0 0 0 0

4 0 1 1 0

5 1 0 0 2

與原ROUSTIDA算法比較,該算法能使更多的缺失項得到科學的填補,且該算法在缺失項填補過程中,基于可辨識矩陣,以核值為比較對象,這樣填補可保留更多的核值,從而使填補的值與決策規(guī)則更為貼近。同時第四步對決策表中對象獨立性的判斷,使該算法避免了應用其他方法可能導致的決策規(guī)則矛盾的問題。

但該算法也存在一定的缺點:1)計算較為復雜,比原ROUSTIDA算法計算繁瑣;2)該算法僅對缺損數(shù)據(jù)較少時適用,若缺損較多,則對于初始計算極大完備子系統(tǒng)時存在的困難較大,甚至可能無法操作。

3 結論

一般的填補數(shù)據(jù)方法有時容易引起信息表內容的沖突,本算法是基于核值的基礎上進行缺失數(shù)據(jù)填補的,能夠保持更多的核值,并且更好的避免了信息表的沖突,又較好的反映了信息表所蘊含的決策規(guī)則。

參考文獻

[1]Pawlak Z. Rough Sets and Fuzzy Sets. Fuzzy Sets and Systems, 1985(17):99-102.

[2]Krysikiewicz M. Rough Set Approach to Incomplete Information System. Information Sciences, 1998(112):39-49.

[3]王國胤.Rough集理論與知識獲取[M].西安:西安交通大學出版社,2005.

[4]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學出版社,2006.

[5]曾黃麟.粗糙集理論及其應用[M].重慶:重慶大學出版社,1996.

作者簡介

席寧(1977-),女,漢族,遼寧錦州人,副教授,碩士,主要從事計算機網(wǎng)絡,數(shù)據(jù)挖掘,計算機應用設計。

摘 要 利用粗糙集的知識來進行缺失數(shù)據(jù)填補的方法很多,但很多都沒有考慮到?jīng)Q策規(guī)則。文章利用核值的重要性,通過構造可辨識矩陣,使得填補的數(shù)據(jù)更好的遵循決策規(guī)則,消除噪音數(shù)據(jù)。

關鍵詞 核值;極大完備子系統(tǒng);可辨識矩陣

中圖分類號:TP311 文獻標識碼:A 文章編號:1671-7597(2014)08-0061-01

1 粗糙集相關知識

在現(xiàn)今社會中,各個行業(yè)都會用數(shù)據(jù)庫來保存大量的歷史數(shù)據(jù)。然而,這些數(shù)據(jù)總會在不經(jīng)意間有所缺失,可能是環(huán)境因素,也可能是人為缺失。缺失的數(shù)據(jù)都蘊含著大量寶貴有用的信息,與企業(yè)經(jīng)營成果息息相關,因此很多企業(yè)都采用數(shù)據(jù)挖掘等技術,從缺失的數(shù)據(jù)中挖掘出有價值的信息。

粗糙集理論是繼概率論,模糊集,證據(jù)理論之后的又一個處理不確定性的數(shù)學工具,其作為一種較新的軟計算方法,其被有效的運用到數(shù)據(jù)預處理中,為不完備信息的填補開辟了另一條途徑。

在基于粗糙集的屬性約簡過程中,核值才是最有用的數(shù)據(jù)。本文提出了一種基于核值的重要性的填補方法,較好的保持信息表的決策規(guī)則。

該算法主要涉及到極大完備子系統(tǒng)和可辨識矩陣等粗糙集知識,相關的定義如下。

定理1 任一信息系統(tǒng)=,若增加一條對象,構成一個新的信息系統(tǒng)=<,,,>,其中,則的核值必是的核值。

推論 不完備信息系統(tǒng)S=,=是其極大完備子系統(tǒng),則的核值必是S的核值。

2 基于核值的ROUSTIDA算法描述

2.1 算法描述

由上述推論可以表明將不完備信息系統(tǒng)S分離成其極大完備子系統(tǒng)和待補系統(tǒng),而的核值必是S的核值,這說明在的核值的基礎上引進不可分辨關系不影響S的核值。

該算法是以可辨識矩陣為基礎,基本流程如下。

輸入:不完備信息系統(tǒng);

輸出:完備信息系統(tǒng);其中,前者是條件屬性集,后者為決策屬性集;

第一步 核值化:

將分離成它的極大完備子系統(tǒng)和待補系統(tǒng)。將看作是一個獨立系統(tǒng),建立它的核值體系,然后再將非核值的數(shù)據(jù)改為“*”,這樣就會得到一個新的系統(tǒng),將組合成一個新的信息系統(tǒng)=<,,,>.

第二步 求矩陣,,;r=0;

第三步

1)針對所有,求得,;

2)生成

(1) 對于所有,有=,;

(2) 對于所有,對做循環(huán);

①若=0,=*;

②否則若,則

(1)若,則;

(2)若,則;

(3)否則;

③若某一對象與多個對象存在不可分辨關系,則將此對象的缺失屬性值用其余對象的此屬性的均值填補;

第四步 決策表中對象獨立性的判斷:

1)對上述;若=0,則如存在,使=時,都有,將=*轉步驟3,否則轉2;若有(),將()整行刪去;否則轉2;

2)若=轉步驟5;否則,計算,,,,轉到第三步;

第五步 如果有遺失值,可用其他算法處理;

第六步 結束。

2.2 算法分析

算法主要解決使ROUSTIDA算法失效的不完備數(shù)據(jù)。可以通過以下圖表來說明問題。包括原始的不完備信息表,經(jīng)過步驟一得出的基于核值的不完備信息系統(tǒng),以及最終得到的完備信息表。

表1 原始表

U a1 a2 a3 a4

1 0 1 0 1

2 * 2 1 0

3 * 0 0 0

4 0 * 1 0

5 1 0 1 2

表2 基于核值的不完備信息表

U a1 a2 a3 a4

1 0 1 0 1

2 * 2 1 0

3 * 0 0 0

4 0 1 1 1

5 1 0 1 2

表3 結果表

U a1 a2 a3 a4

1 0 1 0 1

2 0 2 1 0

3 0 0 0 0

4 0 1 1 0

5 1 0 0 2

與原ROUSTIDA算法比較,該算法能使更多的缺失項得到科學的填補,且該算法在缺失項填補過程中,基于可辨識矩陣,以核值為比較對象,這樣填補可保留更多的核值,從而使填補的值與決策規(guī)則更為貼近。同時第四步對決策表中對象獨立性的判斷,使該算法避免了應用其他方法可能導致的決策規(guī)則矛盾的問題。

但該算法也存在一定的缺點:1)計算較為復雜,比原ROUSTIDA算法計算繁瑣;2)該算法僅對缺損數(shù)據(jù)較少時適用,若缺損較多,則對于初始計算極大完備子系統(tǒng)時存在的困難較大,甚至可能無法操作。

3 結論

一般的填補數(shù)據(jù)方法有時容易引起信息表內容的沖突,本算法是基于核值的基礎上進行缺失數(shù)據(jù)填補的,能夠保持更多的核值,并且更好的避免了信息表的沖突,又較好的反映了信息表所蘊含的決策規(guī)則。

參考文獻

[1]Pawlak Z. Rough Sets and Fuzzy Sets. Fuzzy Sets and Systems, 1985(17):99-102.

[2]Krysikiewicz M. Rough Set Approach to Incomplete Information System. Information Sciences, 1998(112):39-49.

[3]王國胤.Rough集理論與知識獲取[M].西安:西安交通大學出版社,2005.

[4]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學出版社,2006.

[5]曾黃麟.粗糙集理論及其應用[M].重慶:重慶大學出版社,1996.

作者簡介

席寧(1977-),女,漢族,遼寧錦州人,副教授,碩士,主要從事計算機網(wǎng)絡,數(shù)據(jù)挖掘,計算機應用設計。

摘 要 利用粗糙集的知識來進行缺失數(shù)據(jù)填補的方法很多,但很多都沒有考慮到?jīng)Q策規(guī)則。文章利用核值的重要性,通過構造可辨識矩陣,使得填補的數(shù)據(jù)更好的遵循決策規(guī)則,消除噪音數(shù)據(jù)。

關鍵詞 核值;極大完備子系統(tǒng);可辨識矩陣

中圖分類號:TP311 文獻標識碼:A 文章編號:1671-7597(2014)08-0061-01

1 粗糙集相關知識

在現(xiàn)今社會中,各個行業(yè)都會用數(shù)據(jù)庫來保存大量的歷史數(shù)據(jù)。然而,這些數(shù)據(jù)總會在不經(jīng)意間有所缺失,可能是環(huán)境因素,也可能是人為缺失。缺失的數(shù)據(jù)都蘊含著大量寶貴有用的信息,與企業(yè)經(jīng)營成果息息相關,因此很多企業(yè)都采用數(shù)據(jù)挖掘等技術,從缺失的數(shù)據(jù)中挖掘出有價值的信息。

粗糙集理論是繼概率論,模糊集,證據(jù)理論之后的又一個處理不確定性的數(shù)學工具,其作為一種較新的軟計算方法,其被有效的運用到數(shù)據(jù)預處理中,為不完備信息的填補開辟了另一條途徑。

在基于粗糙集的屬性約簡過程中,核值才是最有用的數(shù)據(jù)。本文提出了一種基于核值的重要性的填補方法,較好的保持信息表的決策規(guī)則。

該算法主要涉及到極大完備子系統(tǒng)和可辨識矩陣等粗糙集知識,相關的定義如下。

定理1 任一信息系統(tǒng)=,若增加一條對象,構成一個新的信息系統(tǒng)=<,,,>,其中,則的核值必是的核值。

推論 不完備信息系統(tǒng)S=,=是其極大完備子系統(tǒng),則的核值必是S的核值。

2 基于核值的ROUSTIDA算法描述

2.1 算法描述

由上述推論可以表明將不完備信息系統(tǒng)S分離成其極大完備子系統(tǒng)和待補系統(tǒng),而的核值必是S的核值,這說明在的核值的基礎上引進不可分辨關系不影響S的核值。

該算法是以可辨識矩陣為基礎,基本流程如下。

輸入:不完備信息系統(tǒng);

輸出:完備信息系統(tǒng);其中,前者是條件屬性集,后者為決策屬性集;

第一步 核值化:

將分離成它的極大完備子系統(tǒng)和待補系統(tǒng)。將看作是一個獨立系統(tǒng),建立它的核值體系,然后再將非核值的數(shù)據(jù)改為“*”,這樣就會得到一個新的系統(tǒng),將組合成一個新的信息系統(tǒng)=<,,,>.

第二步 求矩陣,,;r=0;

第三步

1)針對所有,求得,;

2)生成

(1) 對于所有,有=,;

(2) 對于所有,對做循環(huán);

①若=0,=*;

②否則若,則

(1)若,則;

(2)若,則;

(3)否則;

③若某一對象與多個對象存在不可分辨關系,則將此對象的缺失屬性值用其余對象的此屬性的均值填補;

第四步 決策表中對象獨立性的判斷:

1)對上述;若=0,則如存在,使=時,都有,將=*轉步驟3,否則轉2;若有(),將()整行刪去;否則轉2;

2)若=轉步驟5;否則,計算,,,,轉到第三步;

第五步 如果有遺失值,可用其他算法處理;

第六步 結束。

2.2 算法分析

算法主要解決使ROUSTIDA算法失效的不完備數(shù)據(jù)。可以通過以下圖表來說明問題。包括原始的不完備信息表,經(jīng)過步驟一得出的基于核值的不完備信息系統(tǒng),以及最終得到的完備信息表。

表1 原始表

U a1 a2 a3 a4

1 0 1 0 1

2 * 2 1 0

3 * 0 0 0

4 0 * 1 0

5 1 0 1 2

表2 基于核值的不完備信息表

U a1 a2 a3 a4

1 0 1 0 1

2 * 2 1 0

3 * 0 0 0

4 0 1 1 1

5 1 0 1 2

表3 結果表

U a1 a2 a3 a4

1 0 1 0 1

2 0 2 1 0

3 0 0 0 0

4 0 1 1 0

5 1 0 0 2

與原ROUSTIDA算法比較,該算法能使更多的缺失項得到科學的填補,且該算法在缺失項填補過程中,基于可辨識矩陣,以核值為比較對象,這樣填補可保留更多的核值,從而使填補的值與決策規(guī)則更為貼近。同時第四步對決策表中對象獨立性的判斷,使該算法避免了應用其他方法可能導致的決策規(guī)則矛盾的問題。

但該算法也存在一定的缺點:1)計算較為復雜,比原ROUSTIDA算法計算繁瑣;2)該算法僅對缺損數(shù)據(jù)較少時適用,若缺損較多,則對于初始計算極大完備子系統(tǒng)時存在的困難較大,甚至可能無法操作。

3 結論

一般的填補數(shù)據(jù)方法有時容易引起信息表內容的沖突,本算法是基于核值的基礎上進行缺失數(shù)據(jù)填補的,能夠保持更多的核值,并且更好的避免了信息表的沖突,又較好的反映了信息表所蘊含的決策規(guī)則。

參考文獻

[1]Pawlak Z. Rough Sets and Fuzzy Sets. Fuzzy Sets and Systems, 1985(17):99-102.

[2]Krysikiewicz M. Rough Set Approach to Incomplete Information System. Information Sciences, 1998(112):39-49.

[3]王國胤.Rough集理論與知識獲取[M].西安:西安交通大學出版社,2005.

[4]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學出版社,2006.

[5]曾黃麟.粗糙集理論及其應用[M].重慶:重慶大學出版社,1996.

作者簡介

席寧(1977-),女,漢族,遼寧錦州人,副教授,碩士,主要從事計算機網(wǎng)絡,數(shù)據(jù)挖掘,計算機應用設計。

主站蜘蛛池模板: 日韩福利视频导航| 亚洲国产亚洲综合在线尤物| 国产成人1024精品| 97se亚洲综合在线天天| 欧美中文字幕第一页线路一| 毛片免费在线视频| 免费无遮挡AV| 日韩精品毛片| 国产毛片不卡| 亚洲综合一区国产精品| 国产AV无码专区亚洲精品网站| 一级毛片在线播放| 秋霞一区二区三区| 99热这里都是国产精品| аv天堂最新中文在线| 美女无遮挡免费视频网站| 欧美日韩国产在线播放| 操国产美女| 国产成人综合网| 欧美日本在线播放| 国国产a国产片免费麻豆| 国产亚洲日韩av在线| 国产乱视频网站| 欧美人与牲动交a欧美精品| 免费国产在线精品一区| 在线观看国产网址你懂的| 日韩av无码精品专区| 亚洲午夜综合网| 久久婷婷五月综合色一区二区| 国产精品视频导航| 999福利激情视频| 成人一级免费视频| 欧美色综合久久| 干中文字幕| 18禁黄无遮挡网站| 国产粉嫩粉嫩的18在线播放91| 亚洲欧美国产五月天综合| 国产精品手机在线观看你懂的| 亚洲精品久综合蜜| 免费一级毛片不卡在线播放| 欧美在线网| 国产精品偷伦视频免费观看国产| 欧美色视频在线| 中文字幕人妻无码系列第三区| 亚洲无码91视频| 最新亚洲av女人的天堂| 国产91线观看| 2021亚洲精品不卡a| 男女男免费视频网站国产| 91久久夜色精品| 91九色视频网| 免费亚洲成人| 国产欧美精品专区一区二区| 国产日韩欧美中文| 日韩毛片免费| 亚洲资源站av无码网址| 中文字幕欧美日韩| 人妻丰满熟妇啪啪| 少妇极品熟妇人妻专区视频| 国产精品不卡永久免费| 国产无人区一区二区三区| 无码精油按摩潮喷在线播放| 毛片手机在线看| 中文字幕在线看| 伊人激情久久综合中文字幕| 国产黄色免费看| 青草视频免费在线观看| 五月婷婷中文字幕| 国产区免费精品视频| 夜夜操天天摸| 亚洲综合色区在线播放2019 | 日韩欧美一区在线观看| 九九热视频精品在线| 亚洲日韩高清无码| 97超碰精品成人国产| 国产激情国语对白普通话| 国产SUV精品一区二区6| 国产高清不卡视频| 97在线国产视频| 国产福利一区视频| 福利姬国产精品一区在线| 99视频在线免费|