衛博雅, 壽業航, 蔣雯
(西北工業大學電子信息學院, 710072, 西安)
信息融合最早稱為數據融合,是一個對從單個和多個信息源獲取的數據和信息進行關聯、相關和綜合,以獲得精確的位置和身份估計,以及對態勢和威脅及其重要程度進行全面及時評估的信息處理過程。該技術起源于20世紀70年代,并在90年代迅速發展起來,廣泛應用于各個領域。然而,目前該技術仍然存在精確度不高、融合效率低等問題,需要進一步研究處理。信息融合通常采用融合算子對數據進行相關融合。而決策問題的多種多樣促使人們提出了大量的融合方法,這些方法試圖為不同的決策問題提供相應的解決方案。
融合算子是信息融合領域一種十分有用的工具,它可以提供更多功能的數據融合過程。例如,Yager于1988年首先提出了有序加權平均(ordered weighted averaging operator,OWA)算子[1]。這種有序加權方法可以有效消除一些不合理的信息融合情況。此后,該算子的衍生算子被大量提出,如被誘導的OWA算子(IOWA)[2]、不確定OWA算子(UOWA)[3]、廣義OWA算子(GOWA)[4]等。此后,Yager從數據本身的關系入手,進一步提出了冪均(power average aggregation operator,P-A)算子[5],該算子包含了一個支持度函數,為了反映融合過程中數據間相互支持的原則,冪均算子引入了一種新的支持度函數。
自OWA算子首次出現以來,專家學者們對其權重的獲取進行了大量的研究。O’Hangan在1988年提出了獲得權重的關鍵方法之一——最大熵方法[6],該方法將OWA算子權重問題定義為約束的非線性優化模型,并以orness的預定度作為目標函數,得到的權重被稱為最大熵權重。之后Fullér和Majlender采用拉格朗日乘子法[7]對O’Hangan[6]的問題進行了分析。然而,如何確定權重迄今仍是一個有待討論的問題[8]。
不僅如此,Yager于2001還首次提出了冪均算子[5]。不同于OWA算子,在該算子中數據的權重是由其他數據給它的支持度決定的。冪均算子廣泛應用于信息融合[9]、環境評估[10]和多屬性決策[11-12]等領域。近年來,學者們對P-A算子進行了深入研究,衍生出許多不同的算子來更好地處理不確定信息。例如,直覺模糊冪集合算子(IFPA)[12]、有序加權幾何冪均算子(POWGA)和有序加權調和冪均算子(POWHA)[13]。然而,這些基于冪均算子的融合方法過于復雜,在實際應用中無法做到簡單有效。為了更方便地解決實際問題,本文基于冪均算子,充分考慮了數據間的相互關系提出了一種新的可視化加權平均信息融合方法,該方法通過數據之間的相互支持度來衡量數據的權重關系,并利用該方法獲得的權重對原始數據進行加權融合,以針對不同問題作出相應決策。
冪均算子首先由著名學者Yager于2001年提出[5]。該算子包含了一個支持度函數,此函數使數據在融合過程中應該相互支持。
定義1設(a1,a2,…,an)為傳感器輸出的一組原始信息數據,則冪均算子F的定義如下
(1)
式中
(2)
T(ai)為其他數據對ai的所有支持度之和;S(ai,aj)為對ai的支持度。S(ai,aj)滿足以下3個性質:
(1)S(ai,aj)∈[0,1];
(2)S(ai,aj)=S(aj,ai);
(3)如果|ai-aj|<|ax-ay|,那么S(ai-aj)≥S(ax-ay)。
根據定義可以看出,冪均算子是一個非線性加權平均算子,數據的排列順序并不影響最終結果值。如果兩個數據越相似,二者的支持度就越大。當S(ai,aj)=0時,冪均算子將退化為算數平均算子。
可見圖(Visibility Graph,VG)方法是由Lacasa等人于2008年首次提出[14],該方法可以將一個時間序列轉換成一幅可視圖。在圖中,每個節點和序列數值一一對應,圖中節點間的連接反映了數據之間的可見性。可視圖的定義如下。
定義2設坐標上的兩個數據(i,ai)和(j,aj)之間具有可見性,那么對于任意一個在二者間的數值(k,ak)滿足
(3)
定義3設(a1,a2,…,an)為傳感器輸出的一組原始信息數據,將其按照數值大小進行降序排序,得到O={o1,o2,…,on},稱其為原始序列對應的有序序列。
定義4設兩個排好序的坐標值分別是(i,oi)和(j,oj),如果二者間的任意一個變量(k,ok)滿足
(4)
那么稱坐標點(i,oi)和(j,oj)具有可見性。
定義5設O={o1,o2,…,on}是一個有序序列,那么n元函數F(融合值)可定義為
(5)
式中
(6)
在復雜網絡中,度是指在無向圖中每個節點連邊的條數。在一個網絡拓撲結構中,節點的度可以代表該點的重要程度。各個的節點度的散布情況就是度的分布。由于度的分布可以反映節點的重要性,一個節點的度越多,那么它受其他節點的支持程度就越大,因此可以通過節點間的距離來定義節點間的支持度,即S(oi,oj)。
定義6設d為2個節點之間的距離,則二者的支持度可以表示為
(7)
式中:n為任意一個正整數。
定義7oi的支持度總和可以表示為
(8)
在可視圖中,數據的順序決定了節點與節點之間是否具有可見性。如果兩個節點存在可見性,就將二者連接起來。在網絡中,如果一個節點與其它節點的連線越多,該節點受其他節點的支持度就越大,對融合結果的影響也越大。
設多源傳感器輸出一組數據,這8個數值分別是45、85、50、70、55、40、70、75。現在要通過這些信息對傳感器做一簡單評估。
首先,要對其數據進行將序排序,得到一組有序序列含有8個數值,即O={85,75,70,70,55,50,45,40}。將該序列轉化成條形圖,并將可視頂點連接起來,構成一副可視圖。圖1十分清晰地展現了條形頂點間的關系,通過該圖可以很容易獲得每個頂點的支持度總和。例如數值85,和它有連接關系的3個數值分別是75,75,和70。選取n=2,根據式(8),可得到第一個點85的支持度總和T(o1)為
(9)
同理,可以得到其他節點的總支持度。之后,根據式(5)可以得到最終的融合結果
F(85,75,70,70,55,50,45,40)=61.774 4
(10)

(a)有序序列的可視圖

(b)與圖1a對應的網絡結構圖1 輸出數據的可視圖及網絡結構
可持續發展和環境保護要求具備綠色產品、綠色流程和廢物管理等策略。綠色清潔流程與綠色產品的設計及選擇會涉及一系列待處理的與環境、經濟和技術相關的數據,因此在不確定性環境下,采用綜合技術去處理這些因素是十分必要的。
可視冪均融合方法將用于近海岸生產水管理分析。同時,用最大熵OWA算子[8]和OVGWA算子[15]進行計算,并通過融合結果對3種方法子的優劣性進行分析。在第一階段,用最佳可行性技術(Best Available Technologies,BAT)對生產水的處理進行評估。本文只考慮第一階段的評估問題。由于難以理解這些數據的內在關系,因此處理離散的定量、定性輸入數據是十分困難的。這就導致人們往往無法做出正確合理的決策,而本文的可視冪均融合方法則可以有效解決這個難題。
在綠色和清潔工藝的設計和選擇中,評估不同的選擇。每種選擇都會導致不同的結果。在第一階段的評估中,文獻[16]對14種不同的BAT選擇的18種技術指標分別進行單獨評估,得到離散量化、定性輸入數據作為本算例的原始數據(如文獻[16]表4所示)。這14種水處理方式分別是:①物理分離技術包括浮選、噴射、合并;②增強分離技術由水力旋流器、PECT-F型設備、離心機完成;③拋光技術包括MPPE塑膠、吸附、C-Tour技術、薄膜、蒸汽剝離、生物、生產水再注射、井下分離。

圖3 3種方法的融合值比較
本文方法選取支持度參數n=1,計算此種情況下對決策結果的影響。以浮選技術的各種指標為例,根據文獻[16]中的表4可得,18個原始數據值{a1,a2,…,a18}為{0.03、0.10、0.15,0.30、0.20、0.60、0.00、0.00、0.20、0.00、0.00、0.80、0.85、1.00、0.40、0.10、0.20、0.30},將其排序便可得到原始數據的有序序列,即{o1,o2,…,o18}。然后,畫出n=1時這些數據的相應的可視圖,如圖2所示。根據式(8)可求得每種技術所獲取的支持度總和。以此類推,最終根據式(5)即可得到最終融合結果為0.291 5。同理可得其他13種選擇的相應融合結果,分別是0.329 4、0.335 2、0.409 8、0.409 0、0.387 7、0.526 2、0.512 2、0.575 6、0.602 5、0.515 2、0.511 8、0.643 3、0.657 2。
本文針對不同類別的處理技術(物理和增強分離、拋光技術)都進行了分析與計算,結果分析與比較如表1所示。為了便于觀察比較,本文將不同方法得到的融合結果繪制成折線圖,如圖3所示。

(a)對應指標的可視圖

(b)與圖2a對應的網絡結構圖2 物理分離技術的可視圖及網絡結構
總的來說,不同融合方法得到的融合曲線變化趨勢大體一致。對OWA算子融合方法來說,α值會對結果產生重要影響。不同的α值會導致不同的融合結果。由于α的選取受主觀因素的影響非常大,因此選取合適的α值是十分困難的。本例中,選取α=0.1,0.5和0.9進行融合計算。對于同樣用到可視化方法的OVGWA算子融合方法來說,結果是符合實際的,但該方法并沒有充分利用數據關系的緊密度。本文方法的變化曲線和OVGWA算子融合方法曲線很接近,這說明了本文方法的合理性。然而,本文認為在網絡中衡量節點間的支持度大小時,節點的遠近直接影響到它們之間的依賴關系。因此,在設計方法時,考慮節點間距離是十分必要的。OVGWA算子融合方法認為網絡中不同距離的節點支持度是一樣的,這顯然是不合理的。
根據對不同技術融合值的最大最優選擇原則,從表1可以看出,本文方法認為融合值為0.657 2的井下分離技術是最理想的選擇,而在實際的評估中,這種選擇被證實確實是最好的。因此,本文方法具有很強的可操作性和有效性。由于本文方法具有無序性,因此無論原始數據順序如何改變,結果始終是一樣的,這很好地減少了原始數據在融合過程中的信息損失。從圖3可以看出,本文方法產生的曲線和OWA算子融合方法中α=0.5的曲線最接近(α=0.5是OWA算子融合方法中包含主觀因素最少的選擇)。造成二者差異的主要原因是數據之間的支持度和權重的不同。通過與不同融合方法進行比較,這個例子證明了本文方法的可行性和有效性。

表1 3種方法的融合值比較
針對傳統融合方法存在的種種問題,本文從網絡的角度出發,提出了一種有序可視的信息融合方法。首先,將一組數據按照降序順序排列;然后,將這組數據轉換成一個有序可視圖,并將頂點具有可見性的條形連接起來,映射到網絡中,根據節點間的距離,就可以算出具有可見性的節點之間的相互支持度;最后根據支持度的不同,對所有實驗數據進行加權融合,得到最終結果。近海岸生產水管理的實驗結果也說明了新方法的合理性和有效性。
本文提出的可視化加權平均信息融合方法有3個優點:首先,它充分考慮了一組數列的序信息;其次,從網絡拓撲圖的角度出發,用數據間的距離來衡量彼此間的關系是十分有趣和新奇的;最后,由于它的可操作性和有效性,未來它將應用于諸如數據挖掘,智能決策以及信息融合等更多領域。
參考文獻:
[1]YAGER R R. On ordered weighted averaging aggregation operators in multi-criteria decision making [J]. Readings in Fuzzy Sets for Intelligent Systems, 1993, 18(1): 80-87.
[2]王曉, 劉兮, 陳華友, 等. 基于IOWA算子的區間組合預測方法 [J]. 武漢理工大學學報(信息與管理工程版), 2010, 32(2): 221-225.
WANG Xiao, LIU Xi, CHEN Huayou, et al. An interval combination forecasting method based on IOWA operators [J]. Journal of Wuhan University of Technology (Information and Management Engineering), 2010, 32(2): 221-225.
[3]XU Z S, DA Q L. The uncertain OWA operator [J]. International Journal of Intelligent Systems, 2002, 17(6): 569-575.
[4]YAGER R R. Generalized OWA aggregation operators [J]. Fuzzy Optimization & Decision Making, 2004, 3(1): 93-107.
[5]YAGER R R. The power average operator [J]. IEEE Transactions on Systems Man & Cybernetics, 2001, 31(6): 724-731.
[6]O’HAGAN M. Aggregating template or rule antecedents in real-time expert systems with fuzzy set logic [C]∥Conference Record of Asilomar Conference on Circuits, Systems & Computers. San Jose, CA, USA: Maple Press, 1988: 681-689.
[7]FULLéR R, MAJLENDER P. An analytic approach for obtaining maximal entropy OWA operator weights [J]. Fuzzy Sets & Systems, 2001, 124(1): 53-57.
[8]江立輝, 陳華友, 丁芳清, 等. 基于IGOWLA算子的最優組合預測模型及應用 [J]. 統計與決策, 2015, 2015(4): 82-85.
JIANG Lihui, CHEN Huayou, DING Fangqing, et al. Optimal combination forecasting model based on IGOWLA operator and its application [J]. Statistics and Decision, 2015, 2015(4): 82-85.
[9]鄧勇, 施文康. 基于冪均融合算子的模糊傳感器數據融合 [J]. 上海交通大學學報, 2003, 37(8): 1279-1281.
DENG Yong, SHI Wenkang. Fuzzy sensor data fusion based on power average operator [J]. Journal of Shanghai Jiaotong University, 2003, 37(8): 1279-1281.
[10] CAO L, LI M, SADIQ R, et al. Developing environmental indices using fuzzy numbers power average (FN-PA) operator [J]. International Journal of System Assurance Engineering & Management, 2014, 6(2): 1-11.
[11] 熊升華. 幾類廣義交互冪均和冪幾何聚合算子及其應用研究 [D]. 成都: 西南交通大學, 2017: 97-118.
[12] 常娟, 杜迎雪, 劉衛鋒. 直覺正態模糊數冪均算子及其決策應用 [J]. 模糊系統與數學, 2017, 31(5): 101-110.
CHANG Juan, DU Yingxue, LIU Weifeng. The power-mean operator of intuitionistic normal fuzzy numbers and its decision applications [J]. Fuzzy Systems and Mathematics, 2017, 31(5): 101-110.
[13] 周禮剛. 幾類廣義信息集成算子及其在多屬性決策中的應用 [D]. 合肥: 安徽大學, 2013: 23-36.
[14] LACASA L, LUQUE B, BALLESTEROS F. From time series to complex networks: the visibility graph [J]. Proceedings of the National Academy of Sciences of the United States of America, 2008, 105(13): 4972-4977.
[15] WANG H, MO H, SADIQ R, et al. Ordered visibility graph weighted averaging aggregation operator: a methodology based on network analysis [J]. Computers & Industrial Engineering, 2015, 88: 181-190.
[16] SADIQ R, KHAN F I, VEITCH B. Evaluating offshore technologies for produced water management using GreenPro-I: a risk-based life cycle analysis for green and clean process selection and design [J]. Computers & Chemical Engineering, 2005, 29(5): 1023-1039.