999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多屬性綜合評價的食品安全標準引用網絡重要節點發現方法

2022-05-07 07:07:52郝志剛
計算機應用 2022年4期

郝志剛,秦 麗,2*

(1.華中農業大學信息學院,武漢 430070;2.湖北省農業大數據工程技術研究中心(華中農業大學),武漢 430070)

0 引言

食品安全國家標準的起草和實施是我國食品安全體系建設中重要的一環。隨著食品行業的發展以及食品安全體系建設的不斷完善,現有的食品標準數量已經達到上千個。普通民眾很難對這些食品標準有一個清晰的認識,而且由于我國食品安全標準體系仍不完善,各標準之間不協調統一,這導致標準的審查和執行上也存在問題,特別是標準更新周期的不一致,有些標準更新周期長,標準的版本較早;有些標準更新周期短,存在多個標準。食品生產企業和食品質檢部門如果對這些標準的認識不統一,將會導致同時執行多個標準,對我國的食品生產和檢測造成嚴重影響,進一步危害我國的食品安全體系建設。而造成這一結果的原因主要是食品安全標準數量較多,種類繁雜,標準之間存在著較多的引用關系,對食品標準的修訂帶來很大難處,尤其是那些占據著核心地位的食品標準,對這些標準的修訂“牽一發而動全身”。對食品生產企業來說,準確把握眾多標準中的核心標準對指導食品生產是很有必要的。為了找出這些隱藏在所有食品安全標準中的“核心標準”,需要利用食品安全標準引用網絡來從眾多的食品安全國家標準中找到對食品安全檢驗、檢測影響較大的關鍵標準,因此本文提出了一種基于多屬性綜合評價的食品安全標準引用網絡重要節點的發現方法。

網絡模型是對現實世界中事物以及事物之間的關系的抽象,網絡中的節點和邊分別表示事物和關系,通過分析網絡,可以得到很多有用的信息來進行下一步研究。其中,最具代表性的工作就是社交網絡分析。而食品安全標準引用網絡雖然節點只有一千多個,但節點間的引用關系比較復雜,因此社交網絡節點的分析方法也可以應用到食品標準引用網絡中。基于這一想法,本文使用社交網絡中評價節點重要性的一些指標,如度中心性(Degree Centrality,DC)、緊密度中心性(Closeness Centrality,CC)、介數中心性(Betweenness Centrality,BC)等,并結合PageRank(PR)頁面重要性算法來對標準節點的重要性進行綜合評價,以此來判斷哪些食品安全標準屬于“核心標準”。

1 相關工作

近年來,社交網絡的研究領域越來越廣泛。在這些研究中,對網絡節點重要性進行排序是一項重要工作。基于此,誕生了一些經典的排序方法,如度中心性、半局部中心性、緊密度中心 性、Katz中心性、介數中心性、PageRank等其他算法。鄭文萍等提出了節點中心性度量指標LNC(Local Neighbor Centrality)識別網絡中的關鍵節點;羅浩等提出了采用信息融合的IOMEC(In-degree Out-degree Multiplex Evidential Centrality)節點重要性度量方法;杜航原等提出利用節點的內聚度和分離度計算節點重要性;馬媛媛等提出KI(K-shell Intimacy)算法計算節點的親密度從而對節點重要性進行排序;邵豪等提出H 算法識別動態網絡中的重要節點;尹榮榮等融合了結構洞與K核指標來對網絡節點重要度進行評估;梁耀洲等通過排名聚合的方法來挖掘社交網絡中的關鍵用戶。隨著社交網絡相關研究的成功,研究人員將目光轉向了其他領域內的復雜網絡研究,并將社交網絡研究中的一些成果直接應用到其他網絡中,如物流配送節點重要性、公路網絡節點重要性等,且取得了不錯的研究成果。

2 重要性評價指標

2.1 度中心性

節點度數是節點周圍的鄰居節點數目,在有向圖中包括出度(指向其他節點的邊的數目)和入度(進入該節點的邊的數目),是評價一個節點重要性最為直觀的指標。節點度數越大表明與之直接相連的節點也越多,該節點重要性程度也就越高。而度中心性(DC)則是根據網絡中節點總數對節點的度進行標準化。假設在網絡

G

中共有

N

個節點,其中,節點

x

共有

k

個節點與之直接相連,則記該節點度數為

deg

(

x

)=

k

,對應的度中心性計算為式(1):

但是,這一指標只能表明節點在局部小范圍內的重要程度,沒有考慮節點在網絡中所處的位置信息。因此,需結合其他評判標準來綜合考慮節點的重要程度。

2.2 緊密度中心性

節點緊密度表示節點與網絡中所有節點的緊密程度,即節點到其他節點的距離總和越小,緊密度越高。而緊密度中心性(CC)則是利用節點總數對節點緊密度進行標準化。假定節點

x

和節點

y

之間的距離用

d

(

x

y

)來表示,則

x

的緊密度中心性計算如式(2):

2.3 介數中心性

節點的介數用來反映節點在網絡中所處位置的重要程度,途經某節點的最短路徑越多,該節點的介數越大。同樣,介數中心性(BC)則是利用節點數目對其進行標準化。假定節點

x

和節點

y

之間的最短路徑數為

σ

(

x

y

),其中通過節點

i

的數目為

σ

(

x

y

|

i

),則節點

i

的介數中心性計算如式(3):

2.4 PageRank

PageRank(PR)算法是Google 應用在搜索引擎中來判斷Web 頁面重要度的一種算法。一個頁面的重要程度由指向該頁面的其他頁面數目以及頁面相應的重要程度決定。將其應用到網絡中,則表明一個節點的重要程度由相鄰節點數目和節點對應的重要程度決定,通過多次迭代,最終確定每一個節點的重要程度。對于一個節點

v

其PR 值計算如式(4):

3 食品標準引用網絡構建

食品安全標準引用網絡的構建主要由兩部分工作組成:一個是節點的抽取,另一個是節點間關系的抽取。

3.1 節點抽取

食品安全標準引用網絡的節點名稱由食品標準的標準編號表示,該編號是獨一無二的,因此每個節點都代表一種食品安全標準,節點抽取本質上就是對每個食品安全標準的編號進行抽取。而食品安全標準的編號組成是有規律的,比如:1)每種標準編號以“GB”開頭,表示國標;2)“GB”之后是每種標準對應的特殊數字串;3)最后是每種標準的發布時間。根據這些信息,可以通過正則式將其提取出來。

3.2 關系抽取

食品安全標準之間的引用關系隱含在標準文檔的內容中,經過數據處理后的文本和表格信息作為關系抽取的原始數據,使用一些簡單的自然語言處理技術就可以將食品標準引用關系抽取出來。

本文采用了基于規則的模式匹配方法。因為要抽取的關系比較簡單,在文檔中表述標準之間的引用關系時會寫明在哪一方面參考了其他標準,比如,在《GB2717―2018 食品安全國家標準醬油》中在引用其他標準時,相應的描述文本為“污染物限量應符合GB2762 的規定”“真菌毒素限量應符合GB2761 的規定”“致病菌限量應符合GB29921 的規定”等。而類似“污染物限量”“真菌毒素限量”等關鍵詞在其他標準中的描述也大致相同。因此,只需要預先定義關鍵詞庫并輔以一些匹配規則即可進行標準引用關系抽取。

在本文的前期工作中,經過節點和關系抽取后,共得到1 239 個節點和2 593 條邊,借助可視化軟件將其繪制為如圖1 所示的引用關系網絡。

圖1 食品安全標準引用關系網絡Fig.1 Food safety standard reference network

圖1 中,不同的節點標簽顯示的文字大小會根據節點的度數大小而改變,節點的度數越大,標簽文字越大。

4 節點重要性分析

對食品安全標準引用網絡中的節點依據節點的度、度中心性、緊密度中心性、介數中心性分別進行計算,并利用PageRank 算法對每個節點的重要程度進行評價,以下是一些節點的計算結果。

4.1 節點的度

從圖1 中可以粗略地看出大部分節點的度數比較小,有少部分節點度數較大,此外,還列出了排名前十的節點相關信息(表1)。在表1 中,度數排名靠前的節點如GB5009.12、GB/T14454、GB/T6682―2008、GB/T11538―2006、GB/T11540、GB/T14455 等節點度數在100 以上的食品安全標準,在圖1 中展示較為清晰。而這些節點的出度全為0,說明這些節點的度數全部來源于節點入度,也表明了這些標準被其他標準引用較多,從側面證明了這些食品安全標準的重要程度。

表1 食品標準引用網絡節點度數(Top10)Tab 1 Degrees of food standard reference network nodes(Top10)

4.2 度中心性

DC 是對節點度數進行標準化,經過標準化后的度中心性值可以反映某一節點的鄰居節點數目在總節點中的占比情況。表2 列出了食品標準引用網絡節點的前十位。

表2 食品標準引用網絡節點的DC值(Top10)Tab 2 DC values of food standards reference network nodes(Top10)

從表2 中可以看出,排名前四的節點GB5009.12、GB/T14454、GB/T6682―2008 和GB/T11538―2006 的引用標準數量達到了所有標準的10%以上,遠超過其他的標準,表明這幾個標準在所有標準中占據著重要地位。

4.3 緊密度中心性

節點的緊密度反映了節點在整個網絡中所處的“中心程度”。經過計算,本文列出了一些節點的CC 值(表3),這些節點之間的CC 值差異不大且數值較小,而從圖1 中也可以看出該引用網絡中仍然存在著不少的孤立節點,這表明整個網絡連通度較低,并沒有一個節點能夠輻射整個網絡,少部分節點只能影響局部的一些節點。

表3 食品標準引用網絡節點的CC值(Top10)Tab 3 CC values of food standard reference network nodes(Top10)

4.4 介數中心性

節點的BC 反映了節點在網絡中所處位置的重要程度,節點的BC 值越高,表明該節點處在越多的“關鍵路徑”上,該節點在網絡中的地位越高。表4 只列出了5 個節點的相應數據,這是因為其他節點的介數中心性值為零。而且5 個節點的介數中心值也較小,這也從側面反映出整個標準引用網絡的連通程度較低,相應的關鍵路徑數目也較少。

表4 食品標準引用網絡節點的BC值(Top5)Tab 4 BC values of food standards reference network nodes(Top5)

4.5 PageRank重要度

PR 算法是谷歌用來對網頁進行重要度排序的一種算法,其核心思想是:一個網頁的重要程度由這個網頁所指向的目標網頁以及指向本網頁的其他網頁的重要程度所共同決定。這個算法可以應用到網絡中節點重要度分析,即網絡中的每個節點重要度由該節點相連的節點重要度所決定。表5 列出了食品標準引用網絡中一些重要度排名靠前的節點數據。從表5 中可以看出,有許多DC 排名靠前的節點,如GB5009.12,GB14454,GB/T6682―2008,GB/T11538―2006等,也出現在表2 中,且排名靠前。這表明在該網絡中節點的DC 值對使用PR 算法計算的節點重要度也有重要影響。

表5 食品標準引用網絡節點的PR重要度(Top10)Tab 5 PR importance of food standard reference network nodes(Top10)

4.6 對比分析

為了對標準引用網絡的這幾個指標從整體上進行分析,本文統計了每種指標相應數值下對應的節點數量,并繪制成圖2。從圖2 中可以看到,節點的度中心性圖像分布、介數中心性圖像分布和PageRank 重要度圖像分布都呈現一種下降趨勢,表明在該引用網絡中,大部分節點的重要程度較低,相應的指標值也較小。而緊密度中心性圖像分布卻呈現兩極分化的情況,整個網絡中的節點分為了兩部分:1)節點的緊密度值較小,代表了網絡中那些離散的節點;2)節點的緊密度值較大,代表了網絡中那些局部中心點。同時這兩部分節點各自的緊密度值差距不大,整體的緊密度值也較小,反映出整個引用網絡的連通度不高。此外,度中心性圖像分布與PR 重要度圖像分布大致相同,表明在該網絡中節點的PR 值計算中,節點的度起著重要的作用。

圖2 各指標下節點的數量分布Fig.2 Number distribution of nodes under each index

4.7 綜合評價

前文給出了評價節點重要性的多個衡量指標,并對每種指標進行了簡要的分析,但是僅僅依賴某一指標來判斷節點的重要程度存在很大的片面性。因此,要依據這幾個指標對節點進行一個綜合性的評價,并將評價較高的節點作為標準引用網絡中的重要節點,該節點所代表的標準作為重要標準。為了得到每個節點的重要性綜合值,首先要確定每種指標的計算權重。

4.7.1 指標權重

對于指標權重的確定可以使用常用的主成分分析法和層次分析法(Analytic Hierarchy Process,AHP)。主成分分析法是在指標數量較多時通過數學變化將指標進行線性組合并選擇其中信息量占比大的幾個相關性較小的指標作為主成分,并確定主成分的計算權重,在盡可能不影響客觀評價的基礎上減少工作量;而層次分析法主要依據實驗人員的經驗來判斷指標之間的重要程度,通過構建判斷矩陣來確定各指標權重,不對指標進行篩選,對實驗人員的經驗依賴更強。在后續的節點綜合重要性評價中共用到了四個指標,分別為度中心性(DC)、緊密度中心性(CC)、介數中心性(BC)、PageRank(PR)算法。對于這四個指標權重的確定,由于不需要使用主成分分析法來篩選主要指標,同時對于指標之間重要性的判斷,實驗者的經驗要更為重要一些,因此采用了更為適合的層次分析法。利用層次分析法確定各指標權重步驟如下:

1)對于指標

m

與指標

m

(

i

j

∈{DC,CC,BC,PR}),使用(0,1,2)三標度法進行兩兩比較,建立如下比較矩陣

B

其中:

在比較矩陣

B

中,

m

m

m

m

m

m

的比較值都為2,表明在4 個指標中,節點的度中心性(DC)是最重要的。主要是因為在食品安全標準引用網絡中,節點之間的關系種類比較單一,DC 能夠很好地體現出一個標準的重要程度,度越大代表該標準被其他標準引用的次數越多,同時也由于節點關系類型比較單一(只涉及引用關系)且網絡中存在著很多的離散節點,而節點的CC 和BC 的計算與整個網絡的結構緊密相連,大量離散節點的存在導致整個網絡的連通度較低,使得節點的這兩個指標計算結果很小,在引用網絡中的影響程度較低。從圖2 中可以看到,節點的DC 與節點的PR 值圖像中的節點分布大致相同,表明這兩個指標之間是有一定聯系的,節點的PR 值由節點的相鄰節點的PR 值不斷進行迭代相加計算得出。在該引用網絡中,由于只有局部中心點即度數較大的節點周圍有其他節點的存在,而每個節點的PR 值主要通過相鄰節點的PR 值相加得出,該節點的度數越大意味著通過相加計算得到的節點PR 值就越大,從這一層面來說,節點的PR 值在一定程度上反映了節點的度數;但如果這些局部中心點的相鄰節點不再和其他節點相連,也會導致局部中心點的重要度有所下降,這種情況在引用網絡中是較為常見的。因此相較于度中心性,節點的PR 值的重要程度要弱一些,但是要比節點的緊密度中心性和介數中心性更重要。因此,本文將

m

m

m

m

的比較值設為2。而

m

m

的比較值為2,表明節點的CC 要比節點的BC 重要。從圖2 中各指標下節點數量分布來看,幾乎所有節點的BC 值為零,而CC 值不為零的節點數量占據了一半以上,表明在該網絡中節點的

m

要比

m

更重要些。2)通過變換將比較矩陣

B

轉換為判斷矩陣

C

并證明滿足一致性,最后來確定各指標的相應權重

w

。具體步驟如下:①按照極差法構造判斷矩陣

C

表6 平均隨機一致性指標Tab 6 Average random consistency index

經過一致性檢驗后,最終得到各指標的權重

w

=0.490 8,

w

=0.152 7,

w

=0.083 5,

w

=0.272 9。將利用這些權重來計算每個節點的綜合指標重要性。

4.7.2 節點綜合指標重要性計算

本文采用的是基于逼近理想解排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)的多屬性決策方法。具體計算步驟如下:

利用前文計算得到的各節點對應的指標值以及使用AHP 確定的各指標權重,采用TOPSIS 計算后的

D

D

以及

Z

如表7 所示。

表7 標準引用網絡節點綜合重要性(Top10)Tab 7 Comprehensive importance of standard reference network nodes(Top10)

從表7 可以看出,最后經過綜合評價后得到的排名前十的節點與之前單一屬性評價時有了很大變化,其中只有GB5009.3、GB2763 和GB/T14455 在之前排名信息中出現過,而其余節點則是未曾出現過的新節點。這一情況表明,節點的度在綜合評價中雖然占據較大權重,但不再是節點重要性的決定性因素,節點其他屬性也起到了綜合性評價作用。

5 算法評價

在節點的單一屬性指標中,節點的度對節點的重要性起著重要作用,而經過綜合評價后可以看到新的重要性排名與節點的度指標排名有些不同,為了驗證哪種評價方式在引用網絡中更為合理,本文從原始網絡中分別刪除兩份排名表中的節點,通過比較刪除節點后的網絡連通性來判斷節點的重要程度,因為節點集在網絡中的重要性等價于在該網絡中將節點集刪除后對網絡的破壞性,該評價方法的研究的是節點集刪除前后圖的連通狀況的變化情況,連通性越差說明節點集對網絡越重要。

表8 中展示了原始網絡以及刪除相應節點后的網絡信息。從表8 可以看到,由于G2 和G3 中刪除了相應節點后節點數目有所下降,但兩者差距不大,G2 只少一個節點,但G2比G3 邊的數目卻少了將近700 條,只留下G1 原始圖邊數的52%,而G3 是77.7%,從這一點上來說,應該是G2 的連通性要更差一些。

表8 網絡結構對比Tab 8 Comparison of network structure

為了對G2 和G3 有一個直觀的認識,本文使用Gephi 繪圖工具繪制出了這兩個引用網絡的圖,如圖3 所示。從圖3可以看到,相較于原始網絡G1(圖1),G2 中少了很多大字體的標簽節點,說明度很大的節點去掉了,而G3 與G1 的圖標簽節點效果差距不大,但是并不能因此而斷定G2 的連通性要比G3 的連通性更差,因為整個網絡的連通性并不是完全由網絡中邊的數量決定的。對網絡中的節點進行社區劃分,通過社區分類可以很好地判斷整個引用網絡的連通性。本文采用的社區劃分算法是Louvain 算法,基本思想是:

圖3 G2與G3引用網絡對比Fig.3 G2 and G3 reference network comparison

1)將每個節點看作獨立社區,并計算當前的模塊度

Q

;2)隨機選擇一個節點加入其鄰近社區并計算對應

Q

值,選擇令

Q

值增加值最大的社區加入;3)將新的社區看作一個節點,重復上述步驟直到所有社區

Q

值不再變化。該算法進行社區劃分時,由于要判斷一個節點加入鄰近社區的

Q

值,所以對于那些離散的節點是不進行社區劃分的,因為它們沒有鄰近社區。因此,可以通過判斷網絡經過Louvain 算法社區劃分后。得到的社區數量、社區內節點的數量以及未參與劃分的節點數量來綜合判斷網絡的連通性。網絡的連通性越高,則劃分后的社區數量越少,社區內節點數量越多,且未參與劃分的節點數量越少。本文對G1、G2、G3 進行社區劃分后的結果如表9 所示。

表9 網絡社區劃分結果Tab 9 Results of network community division

從表9 中可以看出,刪除原始網絡G1 中那些度數較大的節點后,整個網絡G2 的連通性下降,導致離散節點增多,未參與劃分的節點數量也隨之增加,所以得到的社區數量也由66 個下降成3 個,最大社區內的節點數量只有原始網絡劃分后的最大社區節點數量的24.3%;但G3 的連通性相較于G2 要更差,整個網絡中參與社區劃分的節點數為0,表明這些節點之間離散程度更高,即使有一些度數較大的節點存在,但是由于缺少了一些關鍵節點導致它們之間無法連通,在計算模塊度

Q

時不能使得

Q

值增加,無法加入任何一個社區。上述實驗結果表明,使用TOPSIS 算法找出的節點要比單獨使用節點的度這一單一指標效果要好,將該方法應用在食品安全標準網絡中判斷節點的重要性是有效的。

6 結語

為了找出食品安全國家標準中那些“重要標準”,本文挖掘了所有標準之間的相互引用關系,構建了食品標準引用網絡,并分析這個復雜網絡中每個節點在網絡中的重要程度。本文使用的衡量指標有:節點度數、節點緊密度、節點介數以及PageRank 重要度。由于單一指標的計算不能全面地衡量節點的重要性,所以本文采用了一種節點重要性綜合性評價方法,即先使用層次分析法計算各個指標參與評價的權重,再基于TOPSIS 的多屬性決策方法重新計算節點重要性。

相較于僅通過度來計算節點重要性,本文方法在節點重要性判斷上有了一些不一樣的結果。為了比較兩種結果的有效性,本文通過在網絡結構中刪除重要節點的方法來比較刪除重要節點后網絡結構的連通性,連通性的判斷則是通過使用Louvain 算法對標準引用網絡進行節點社區發現,網絡中如果未參與社區劃分的節點數量越多,該網絡的連通性越差。實驗結果證明,基于多屬性的綜合評價方法發現的重要節點被刪除后,不能劃入社區的節點為1 239 個,即沒有任何節點被劃入社區,而基于度的評價方法發現的重要節點被刪除后,不能劃入社區的節點為1 039 個,共發現了3 個社區,最大的社區有120 個節點,所以基于多屬性的綜合評價方法發現的節點在網絡中更為重要。

本文的實驗結果證明了多屬性綜合評價方法在復雜網絡重要節點發現上是有效的;但在利用層次分析法計算多指標權重時,需要對比較矩陣中各指標之間的重要性關系進行人工定義,而定義的準確性依賴于操作人員的經驗。為了進一步降低多屬性評價方法對人的經驗依賴,在未來的工作中,將考慮加入對歷史評價數據的學習,以此來實現多指標比較矩陣的自動生成,增強多屬性綜合評價方法的智能性。

主站蜘蛛池模板: 欧美天天干| 青青青国产视频手机| 高清无码一本到东京热| 国产正在播放| 日韩黄色精品| 色网站免费在线观看| 亚洲色图欧美在线| 中文字幕亚洲另类天堂| 亚洲美女一区二区三区| 日本午夜精品一本在线观看| www.日韩三级| 欧洲成人在线观看| 国产福利小视频在线播放观看| 国产精品999在线| 永久免费无码日韩视频| 尤物成AV人片在线观看| 国产情侣一区二区三区| 伊人无码视屏| 毛片网站在线看| 国内丰满少妇猛烈精品播| 国产日本欧美亚洲精品视| 欧美有码在线观看| 呦女亚洲一区精品| 亚洲精品午夜天堂网页| 高清色本在线www| 91成人免费观看| 91热爆在线| 欧美特黄一免在线观看| 97在线公开视频| 亚洲有无码中文网| 亚洲成人免费在线| 中文字幕免费在线视频| 亚洲中文字幕日产无码2021| 激情六月丁香婷婷| 久久综合亚洲色一区二区三区| 欧美a在线视频| 欧美在线中文字幕| 91无码国产视频| 精品少妇人妻av无码久久| 国产成人无码播放| 91色综合综合热五月激情| 国产综合另类小说色区色噜噜| 91网红精品在线观看| 国产一二三区在线| 亚洲无码精品在线播放| a级高清毛片| 亚洲天堂网2014| 福利国产微拍广场一区视频在线| 久久人午夜亚洲精品无码区| 欧美午夜网| 亚洲伊人久久精品影院| 午夜视频免费一区二区在线看| 免费欧美一级| 国产一国产一有一级毛片视频| 波多野结衣第一页| 高清精品美女在线播放| 国产AV毛片| 波多野结衣一区二区三区88| 在线观看无码av五月花| 国产区免费| 再看日本中文字幕在线观看| 亚洲天堂精品视频| 欧美在线黄| 亚国产欧美在线人成| 欧美精品成人一区二区视频一| 91小视频版在线观看www| a级毛片免费看| 欧美第九页| 高清色本在线www| 国产小视频免费观看| 中文字幕无码中文字幕有码在线| 成人免费网站久久久| 99人妻碰碰碰久久久久禁片| 成人福利免费在线观看| 亚洲国产欧美自拍| 国产一区二区三区精品欧美日韩| 伊人久久精品亚洲午夜| 亚洲视频在线青青| 亚洲天堂视频网| 国产网站黄| 成人在线不卡视频| 国产网站黄|