向燕飛
(廣東東軟學院 廣東省佛山市 528225)
每個人是社會的組成部分,個人信用是社會信用的基礎。如果個人發生個人失信行為,容易引起集體失信。近年來,信用問題已成為社會關注的一個重要問題。如何建設個人信用評價體系,特別針對作為未來社會的棟梁的高校學生,是本文研究的工作。通過建立高校學生個人信用評價體系,引導和督促學生重視個人信用記錄、改善個人信用行為,是本文研究的意義所在。
關于個人信用評估的研究較多,如李嫻[1]基于GCV 準則和Newton-Raphson 算法的正則化參數快速選擇方法,利用最小二乘支持向量機中建立個人信用風險預測模型;劉太安[2]在銀行個人信用特征數據基礎上,將LSVM 算法應用于個人信用評估中;魏志靜[3]在對信用數據進行多種數據操作的基礎上,其中,數據處理操作包括數據預處理、指標優化、格式轉換、歸一化等,利用網格搜索和交互檢驗選擇最佳核函數與核參數,同時使用SVM-KNN 方法進行分類預測并應用于個人信用評估中;張瀾覺[4]在P2P 信貸個人信用評價中引入BP 神經網絡,利用附加動量法和彈性梯度下降法調整權值,提出了一個適用于P2P 信貸個人信用評價模型;肖文兵等[5]運用網格5-折交叉確認來尋找不同核函數的最優參數,以此建立了一個基于支持向量機的個人信用評估預測方法;史小伍[6]運用組合代價敏感支持向量機模型,結合統計分析和神經網絡技術構建模型個人信用評價方法。
雖然個人信用評估研究較多,但針對高校學生群體的研究較少,且各類方法各有其優缺點。為了解決高校學生群體的信用評估問題,本文采用最小二乘支持向量機算法(簡稱LSSVM)進行信用評估,同時采用微粒群算法(簡稱PSO)優選LSSVM 算法參數。
由于PSO 算法是一種利用群體智能的隨機全局優化方法,它易實現、全局搜索能力較強,但線性遞減的慣性權重進化策略使算法存在初期局部搜索能力較弱、易錯過全局最優值及算法后期全局搜索能力較弱、易陷入局部極值等問題。因此,本文在普通PSO算法基礎上,定義了一種動態自適應的慣性權重方程,建立了一種自適應PSO 算法,利用自適應PSO 算法優選LSSVM 參數,克服了LSSVM 算法參數敏感性問題,提高了算法的全局搜索能力,并根據高校學生信用評估指標建立了自適應參數的LSSVM 信用評估模型,為高校學生信用評估提供了一種新的方法。
LSSVM 算法是SVM 算法的一種改進算法,改進之處在于:將結構風險最小化式中容許誤差由一次方變為平方,其不等式約束條件變為等式約束條件,從而將求解凸二次規劃問題轉化為求解線性方程組問題。

圖1:個人信用評估流程
LSSVM 法通過引入對偶理論建立Lagrange 方程求解優化問題[7-10]:
上式中αi為Lagrange 乘子,C 為正則化參數,按優化條件可解得權向量w 的表達式,并利用核函數K(xk, xl)替換,將優化問題轉化為求解線性方程組問題,并通過最小二乘法求解線性方程組,避免了SVM 算法中求解凸二次規劃問題,提高了求解問題的速度和收斂精度,LSSVM 客戶核函數一般選擇徑向基函數,即,其δ 為核參數。
通過以上分析,LSSVM 算法受核參數δ 及正則化參數C 影響較大,存在參數敏感性問題 。因此本文擬采用PSO 算法優選LSSVM 算法參數。
由于PSO 算法具有較好的全局搜索能力,但其慣性權重的線性遞減策略過于簡單,無法滿足實際問題的需要,同時它也無法協調好算法局部搜索能力與全局搜索能力之間的關系,因此,本文定義了一種動態自適應的慣性權重方程,建立了一種自適應微粒群算法APSO,可根據實際問題動態改變PSO 算法的全局搜索能力。

表1:信用評估結果對比表
在PSO 算法中,其慣性權重主要起到調節粒子局部搜索能力與全局搜索能力的作用,如果慣性權重較大則表示有較好的全局搜索能力,或者則具有較好的局部收斂能力。可將慣性權重方程定義為:

在式(2)中,wmax、wmin分別表示慣性權重的最大和最小值,t 表示迭代次數,N 表示最大迭代代數。該式表示每慣性權重隨迭代代數線性減少,同一迭代代數下粒子之間的慣性權重是相同的。但在實際問題中,每一迭代代數下每個粒子所需要的全局搜索能力并不相同,所以必須根據粒子自身的性質來動態改其慣性權重值,從而將該粒子的全局搜索能力與局部搜索能力的有效地結合起來。
因此本文定義了一種自適應微粒群算法APSO,其自適應慣性權重進化方程定義為:

在式(3)中,本文定義了一個函數Rij,表示信息自適應函數,其具體形式如式(4)所示。式(1+di)/(1+dmax)將慣性權重與微粒隸屬于全局最優位置的距離聯系起來,越靠近全局最優粒子,慣性權重應越小,局部收斂能力應越好。di表示該微粒與全局最優粒子之間的距離,dmax表示該代微粒中離全局最優粒子最遠的距離,分子分母都加1 是為了避免分母為零。式(fi-fmin+1)/(fmax-fmin+1)將慣性權重與微粒的適應值聯系起來,適應值越小,慣性權重應越小,局部收斂能力應越好。fi表示該微粒的適應值,fmin表示該代微粒中的最小適應值,fmax表示該代微粒中的最大適應值。通過APSO 算法慣性權重的動態自適應過程,從而影響該算法的全局搜索能力。
本文通過建立高校學生信用評估指標,根據歷史信用數據構建學習樣本,利用本文提出的自適應PSO 算法優選LSSVM 參數,同時構建LSSVM 評估模型進行個人信用評估,其構建流程如圖1 所示。
本文根據高校學生個人信用特點,所建立的高校學生信用評估指標包括:
(1)個人基本信息:包含學生年齡,性別及生源地等;
(2)學校基本信息:包含學校類型(985 學校、211 學校及其他大學),學生所學專業情況等;
(3)學生在校表現:包括學生學科成績、學科排名、借還圖書、獲獎情況、人際交往等;
(4)學生經濟情況:主要指學生經濟來源,包括父母供給、助學貸款、兼職收入、獎學金、研究經費等;
(5)學生日常表現:包含考試作弊、誠實守信等方面;
(6)信用卡情況:包含信用卡張數、刷卡金額及還款情況等。
本文利用學校助學貸款個人數據,構建個人信用特征數據的學習樣本進行驗證,同時將本文算法與KNN 算法,LSSVM 算法預測結果進行對比,對比結果如表1 所示。
通過評估結果對比,表明了本文所提出來的自適應參數的LSSVM 高校學生信用評估系統是合理有效性的,為高校學生信用評估提供了一種新的方法。
本文針對LSSVM 算法參數敏感性問題,在PSO 算法基礎上,定義了一種動態自適應的慣性權重方程,建立了一種自適應PSO算法,利用自適應PSO 算法優選LSSVM 參數,克服了LSSVM 法對其參數的敏感性問題,提高了算法的全局搜索能力;并根據高校學生信用評估指標建立了自適應參數的LSSVM 信用評估模型,為高校學生信用評估提供了一種新的方法。