任紅梅,王 緌
(四川大學 工商管理學院,成都 610064)
結構方程模型(SEM)方法是在20世紀70年代中期由瑞典統計學家Karl G.Joreskog提出的,受到了管理學界、心理學界等社會科學研究人員的青睞。這主要是因為它具有不同于一般統計分析方法的優點:(1)可以同時處理多個因變量;(2)允許自變量和因變量含有測量誤差;(3)可以同時估計因子結構和因子關系;(4)允許更大的測量模型;(5)能夠估計整個模型的擬合程度[1][2]。
結構方程現已在我國各個領域得到了廣泛的應用,然而數據的輸入都是采用確定的形式,從數據的來源看,結構方程的大多數數據是調查數據,通過設置問卷的方法獲取。然而,這一過程中,存在著大量的不確定性因素。首先,備選答案之間存在中間過渡性,就具有模糊性;其次,在人類的感覺、判斷、經驗和情緒起重要作用的領域,本身存在大量的模糊性因素。考慮到大量的實際決策系統中,有時所獲取參數信息不完全或者所獲取信息的不可量化,Liu給出了模糊集的相關理論;文獻[3]則研究了具有模糊參數的規劃問題,并通過利用模糊集理論知識,給出了相應的算法。
不同模糊數據的可信性直接影響到結構方程模型結果的真實性,所以,將模糊變量引到結構方程模型,將一些邊界不清,不易定量的因素轉化了某種量化的表達形式,可以提決策的科學性與正確性。從結構方程數據獲取的方式而言,選擇模糊結構方程方法對模型中潛變量之間、潛變量與顯變量之間的關系系數進行估計是一條可行也是一條較好的途徑。本文擬采用模糊模擬[3]的算法,求解模糊PLS-結構方程迭代模型。該算法既保持了原結構方程的精華,同時又有許多良好的優化性能。
結構方程模型主要通過引入潛在變量來研究抽象變量之間的因果結構關系,由測量模型和結構模型兩部分組成。PLS作為一種求結構解結構方程的“軟模型”,可以明確求出潛變量估計值[4],以及用PLS求解時不需要預先假設總體數據某種分布等。本文以2個潛變量的模糊PLS-結構方程進行研究并給出具體的求解過程。模型結構如圖1。

圖1 模糊結構方程模型
模糊PLS的結構方程模型由源結構關系和隱性結構關系組成。
源結構關系由兩部分組成。
1.1.1 外部關系

其中:π1h0,π2k0為截距值;π1h,π2k為載荷系數;v1h,v2k為誤差(殘差)。
滿足條件假設:(1)期望關系

(2)非相關性

1.1.2 內部關系

滿足條件假設:E(η|ξ)=β0+β1ξ;r(ε,η)=0
隱結構關系包括因果預測關系和權重關系,為偏最小二乘法分析所特有的。
1.2.1 因果預測關系
由(2)和(3)可得:
其中:截距為 μ2k=π2k0+π2kβ0
殘差為 v2k=π2kε+v2k
滿足條件假設:r(v2k,ξ)=0
1.2.2 權重關系
權重關系分為反映型和構成型兩種模型,在圖1中,潛變量η屬于反映型,潛變量ξ屬于構成型,其權重關系分別為:

設ξ為模糊變量,它的隸屬函數是μ,如果u和 r是實數,那么一個模糊事件{ξ≤r}的可能性被描述為Pos{ξ≤r},模糊事件{ξ≤r}的可信為 Cr{ξ≤r}Pos{ξ≤r}+1-Pos{ξ≤r}),在此基礎上,Liu給出了模糊變量期望值的定義。
定義1 設ξ為模糊變量,則稱

為模糊變量的期望值(為了避免出現∞-∞情形,要求上式兩個積分到少有一個有限)。
那么,假設 f∶Rn→R 是一個實值函數,ξ=(ξ1,ξ2,…,ξn)是可能性空間(Θ,p(Θ),Pos)上的模糊向量,則 f(ξ)也是一個模糊變量,它的期望值定義為

其中:L=Cr{f(ξ)≥r}為模型事件 f(ξ)發生的可信性,可以由下式估計得到:

對帶有不確定數的數學模型,要進行計算,首先得轉化化確定性問題的求解。從模糊數的特點不難判斷,模糊PLS-結構方程模型的解不是唯一的,而是存在無數個,根據模糊數的性質,模糊數取不同值的隸屬度一般不同,因此,由模型PLS結構方程得出的估計值和回歸系數取不同解的可能性也一般不同。為了在目標值和可能度之間達到某種均衡或折中,我們引入模糊期望的概念,利用模糊模擬的原理,把不確定的數確定化,求解以上模型。由擴張原理知,由于所求的PLS 估計值 ω1h,ω2k,LXn,LYn都為的函數,記為 f,故都為模糊變量。
以兩個潛變量的模糊PLS-結構方程的迭代模型為例,說明求解過程。該求解過程包括兩大部分,一是運用模糊模擬的主程序;二是求解確定PLS-結構方程模型的迭代函數f,作為代求期望的模糊向量,向量中的各個元素的期望值即為待求的原結構方程的估計值。
2.2.1 模糊模擬
(1)置向量 e=0。
(2)分別從 Θ 中均勻產生 θk,使得 Pos(θk)≥ε,令 vk=Pos(θk);k=1,2,…,N。 其中 ε 是個充分小的數。
(3)置向量 a=f(ξ(θ1))∧…∧f(ξ(θN)),向量 b=f(ξ(θ1))∨…∨f(ξ(θN))。
(4)從[ai,bi]中均勻產生 ri,構成向量 r。
(5)如果 ri≥0,那么 ei←ei+Cr{f(ξ)i≥ri}。
(6)如果 ri<0,那么 ei←ei-Cr{f(ξ)i≤ri}。
(7)重復步驟(4)至步驟(6)共 N 次。
(8)E[f(ξ)i]=ai∨0+b∧0+ei(bi-ai)/N
2.2.2 確定PLS-結構方程模型的迭代原理
由模糊區間隨機產生的數構成確定的輸入數據。求解步驟如下:

這里f1,f2是標準化算子。 同理可得f2
重復以上步驟直到|ω(n)-ω(n+1)|<10-5。
(2)由(1)步得出的潛變量估計值 LXn,LYn后,由以下幾個方程估計出測量模型與結構模型系數

(3)將所求結果賦給函數f
選取學生能力與成績的一組小樣本數據,對以上模糊PLS-結構方程模型進行測試。其中潛變量ξ為學習能力,η為學習成績,其估計值分別為LX,LY。x1為IQ表現,x2為高中時綜合成績,x3為去年學習動機得分,y1為必修課平均績點,y2為選修課平均績點。由于IQ表現的程度之間本身就具有過渡性,且目前較真實的IQ測量需在失重的狀態下進行才比較有效。根據相關資料和專家意見,對原始數據中x1進行模糊化 x1,為形如=(a1,a2,a3)的三角模糊數,見表 1。

表1 模糊處理后的數據

表2 潛變量ξ與η的估計值LX與LY

表3 回歸系數與擬合效果
在matlab7.0下,運用以上模糊PLS-結構方程模型實現程序,循環2000次,同時為了區別本文模型與傳統確定的PLS-結果方程模型,將對比結果列入表2、表3。
從表3可知,當用確定PLS-結構求解時,由于忽略了大量模糊因素的存在,其結果與經過模糊化的PLS-結構方程有一定差別。當模糊數的置信水平取為1時,所有的模糊數都變成確定數—模糊數的主值,相當于應用確定PLS-結構方程模型。把IQ表現變量定義為三角模糊數時,與實際相吻合,得出IQ表現與學習能力的關系系數變小。
對回歸方程進行顯著性檢驗,確定PLS-結構方程模型R2=0.5692(越接近1越好),擬合效果不是很好。如果此時我們把得出回歸系數解釋模型,必定不合理。相反,從模糊PLS-結構模型得出的結果可以看出,R2=0.6703>0.5692,F=40.715>>F0.05(1,13)=4.67,因此,由x~1,x2,x3反映的 ξ與由 y1,y2反映的η之間線性關系顯著存在;且在一定程度上優化了傳統的確定PLS-結構方程模型。
本文系統研究了含有兩個潛變量的模糊PLS-結構方程模型的求解方法,給出了具體的求解步驟,并通過算例驗證了模型有效性。由于目前結構方程的應用尚未直接引入模糊變量,對所有不確定變量的處理方式大多采用先確定化的方法,這種方式對以問卷獲取輸入數據為主要途徑的結構方程模型而言是一個很大的弊端,將影響模型最終的解釋能力。所以,本文的模糊PLS-結構方程模型方法為優化結構方程提供了一個有現實意義的數學工具;同時本文模糊模擬算法對含有兩個潛變量的模糊PLS-結構方程具有普遍的適用性。考慮到實際中多個潛變量的情形,可結合該思想,對模型進行改進。
[1]侯杰泰,溫忠麟,成子娟.結構方程模型及其應用[M].北京:教育科學出版社,2004.
[2]林盛,劉金蘭,韓文秀.基于PLS-結構方程的顧客滿意度評價方法[J].系統工程學報,2005,20(6).
[3]劉寶碇,趙瑞清,王綱.不確定規劃及應用[M].北京:清華大學出版社,2003.
[4]寧祿喬,劉金蘭.兩個潛變量的PLS算法模擬數據分析[J].統計與決策,2007.(8).