程美英,錢 乾,倪志偉,朱旭輝
(1.湖州師范學(xué)院經(jīng)濟管理學(xué)院,浙江湖州 313000;2.浙江省教育信息化評價與應(yīng)用研究中心,浙江湖州 313000;3.湖州師范學(xué)院教師教育學(xué)院,浙江湖州 313000;4.合肥工業(yè)大學(xué)管理學(xué)院,合肥 230009)
(?通信作者電子郵箱02550@zjhu.edu.cn)
自組織遷移算法(Self-Organized Migrating Algorithm,SOMA)[1]是一種新型基于群體的智能優(yōu)化算法,自2004 年提出至今已得到廣泛研究,現(xiàn)有成果主要集中于兩方面:1)改進SOMA,彌補易陷入局部最優(yōu)、收斂速度慢、求解精度低等缺陷。文獻[2]引入機會策略產(chǎn)生擾動向量,提供比基本SOMA更多的位置選擇來增強個體尋優(yōu)能力;文獻[3]在SOMA 中引入自適應(yīng)參數(shù)控制、領(lǐng)導(dǎo)個體選擇及給最優(yōu)個體建立外部檔案等策略提高種群多樣性;文獻[4]在每次迭代過程中按照與領(lǐng)導(dǎo)者的歐氏距離均勻選擇粒子進行移動,提高SOMA 收斂速度和精度等。2)將SOMA 應(yīng)用于解決實際優(yōu)化問題。文獻[5]在可重構(gòu)制造業(yè)中引入SOMA 最小化機器模塊變化;文獻[6]將SOMA 用于機器人躲避動態(tài)障礙物并抓取移動目標(biāo);文獻[7]引入SOMA解決多層次圖像閾值分割問題等。
基于群體的智能優(yōu)化算法通過個體之間的協(xié)作能“涌現(xiàn)”出智能行為,實則具有隱含并行性,而這種并行性表現(xiàn)在兩方面:一是算法的內(nèi)在并行,即本身適合大規(guī)模并行;二是算法的內(nèi)涵并行性,群體智能算法采用種群的方式組織搜索,因而可以搜索解空間內(nèi)的多個區(qū)域,并相互交流信息,具備很強的多任務(wù)優(yōu)化能力(多任務(wù)優(yōu)化指在某一時刻同時處理多個不同的優(yōu)化問題[8])。基于群體智能算法的多任務(wù)優(yōu)化[9]概念開創(chuàng)了將具有“隱”并行性的進化算法應(yīng)用于多任務(wù)處理的新局面。文獻[9]首次探索多因子遺傳機制,提出多任務(wù)處理多因子進化算法(MultiFactorial Evolution Algorithm,MFEA),在多層次多任務(wù)優(yōu)化[10]、多目標(biāo)多任務(wù)優(yōu)化[11]等領(lǐng)域中均得到較好應(yīng)用;文獻[12]在MFEA 基礎(chǔ)上,引入擬牛頓迭代、重新初始化部分適應(yīng)值較差解、自適應(yīng)選擇策略,提高MFEA 求解多任務(wù)性能;文獻[13]通過實驗證明MFEA 可保持種群的動態(tài)多樣性,但MFEA 的本質(zhì)在于有效信息傳遞;文獻[14]以數(shù)據(jù)驅(qū)動獲取任務(wù)之間的相關(guān)信息,自適應(yīng)實現(xiàn)任務(wù)之間的信息傳遞;文獻[15]基于閉式解自動降噪編碼器顯示實現(xiàn)多任務(wù)之間映射;文獻[16-17]首次將自然界生物種群中的協(xié)同進化機制與粒子群算法相結(jié)合,子種群間按一定概率或連續(xù)停滯若干代后交互信息,實現(xiàn)多任務(wù)優(yōu)化;文獻[18]引入等級因子、標(biāo)量因子和技能因子構(gòu)造多任務(wù)環(huán)境,每次讓最合適的粒子求解最合適的任務(wù)。
現(xiàn)有SOMA 關(guān)注點主要集中在單個任務(wù)優(yōu)化上,在多任務(wù)優(yōu)化領(lǐng)域研究甚少,且現(xiàn)有關(guān)于在多任務(wù)優(yōu)化領(lǐng)域如何避免無關(guān)信息共享造成“負(fù)遷移”現(xiàn)象的研究成果并不多。基于上述問題,本文的主要工作為:通過有效探索SOMA 的“隱并行性”,共享和協(xié)調(diào)種群中有效信息,實現(xiàn)多任務(wù)優(yōu)化,然后引入信息篩選機制有效遏制多任務(wù)負(fù)遷移消極影響,提出信息篩選多任務(wù)優(yōu)化自組織遷移算法(SOMA for Multi-task optimization with Information Filtering,SOMAMIF)。仿真實驗以一組函數(shù)優(yōu)化問題和一組離散優(yōu)化問題為例驗證了SOMAMIF的有效性。
SOMA 的社會生物學(xué)基礎(chǔ)是社會環(huán)境下群體的自組織行為,如一群動物在尋找食物時,若某一個體率先發(fā)現(xiàn)食物,則成為群體領(lǐng)先者,其他個體通過改變自身運動方向遷移至領(lǐng)先者附近,在搜索過程中某個體若比先前領(lǐng)先者更為成功,則它成為群體中新的領(lǐng)先者,其他個體再次改變運動方向遷移至該新領(lǐng)先者所在位置,直至達到或接近全部最優(yōu)解。SOMA基本步驟如下:
步驟1 初始化種群中個體位置和所有參數(shù)。
步驟2 計算所有個體適應(yīng)值。
步驟3 比較得出當(dāng)前領(lǐng)先者位置。
步驟4 按式(1)得出參數(shù)PRTVector。
步驟5 按式(2)更新個體位置。
步驟6 判斷是否滿足循環(huán)結(jié)束條件,若不滿足,轉(zhuǎn)步驟2。
步驟7 輸出全局最優(yōu)解。
PRTVector依賴于PRT:若隨機 數(shù)rand小 于PRT,則PRTVector取值1,否則為0,如式(1)所示。

為形象描述多任務(wù)環(huán)境中的信息遷移模式,這里僅以同時求解極小函數(shù)優(yōu)化問題f1和f2為例,如圖1 所示。假設(shè)f2全局極值點位于B點,在AB區(qū)域,函數(shù)f1和f2的單調(diào)趨勢相反,當(dāng)f1傳遞信息給f2,必會使得f2偏離極值點(信息負(fù)遷移);而在BC區(qū)域,當(dāng)f1傳遞信息給f2,必會加速f2收斂至極值解(信息正遷移)。若能利用BC區(qū)域的有效信息,將任務(wù)f1和f2綁定同時求解,必能同時加速f1和f2的收斂速度并提高二者的求解質(zhì)量。

圖1 多任務(wù)信息遷移Fig.1 Multi-task information transfer
多任務(wù)環(huán)境中不同任務(wù)一般處于不同的維度,構(gòu)建統(tǒng)一多任務(wù)搜索空間,使得不同維度的任務(wù)仍然可以傳遞有效信息。假設(shè)需要同時處理K個任務(wù)T1,T2,…,TK,任務(wù)Ta(a=1,2,…,K)的搜索空間和維數(shù)分別設(shè)為ψa和da,令多任務(wù)統(tǒng)一搜索空間Ψ=ψ1∪ψ2,…,∪ψK,維 數(shù)D=max{d1,d2,…,dK},對Ta解碼時,只需取D的前da維。
在多任務(wù)環(huán)境中,無關(guān)的信息共享可能傷害多任務(wù)處理性能,即出現(xiàn)信息“負(fù)遷移”[8],進而抑制干擾多任務(wù)優(yōu)化性能,這是目前尚未完全解決的難題之一,本文引入信息篩選機制有效遏制“負(fù)遷移”消極影響。
假設(shè)需要同時處理K個任務(wù),則隨機產(chǎn)生K個SOMA 子種群,子種群Pa(a∈{1,2,…,K})用于處理任務(wù)Ta。各子種群在執(zhí)行基本SOMA 的同時,實施如下的信息篩選和遷移過程,具體步驟如下:
步驟1 信息交互愿望(需求)。當(dāng)任務(wù)Ta連續(xù)若干代停滯進化時,子種群Pa產(chǎn)生信息交互需求,即達到信息交互節(jié)點γ。
步驟2 信息獲取來源。自然界中的物種并非彼此孤立,生活在同一環(huán)境中的物種/種群通過交互信息達到共同進化。當(dāng)任務(wù)Ta產(chǎn)生信息交互需求時,其他K-1個任務(wù)(或子種群)成為任務(wù)Ta獲取信息的主要來源,即:(T1,T2,…,TK) →Ta。
步驟3 信息篩選。選擇所有信息來源中對自己有用的信息,過濾無用信息,可在一定程度上保證信息的正向遷移。這里根據(jù)同時處理的任務(wù)個數(shù)選擇不同的信息遷移來源:
a)當(dāng)K=2 時。若任務(wù)T1停滯進化,將任務(wù)T2中個體適應(yīng)值快速排序,取排名前30%的個體位置作為信息遷移來源。
b)當(dāng)K>2 時。采用基于概率的信息選擇模式,隨機產(chǎn)生[0,1]的隨機數(shù)rand,當(dāng)rand≤時,選擇任務(wù)T1作為信息遷移源,若Ta連續(xù)在λ代內(nèi)不能改變進化停滯現(xiàn)象(即信息負(fù)遷移),則繼續(xù)按概率從剩余K-2 個任務(wù)中選擇信息遷移來源,如圖2所示。

圖2 多任務(wù)信息來源選擇示意圖Fig.2 Schematic diagram of multi-task information source selection
步驟4 信息遷移。假設(shè)t時刻,任務(wù)Ta停滯進化產(chǎn)生信息交互愿望,選中任務(wù)Tk作為信息遷移來源。按式(3)將任務(wù)Tk所在種群個體位置與任務(wù)Ta種群中的所有個體位置進行交叉。信息遷移不是單純的信息增加,而是遷移信息后,種群結(jié)構(gòu)的重新調(diào)整。

多任務(wù)SOMAMIF偽代碼如下:
1) 隨機產(chǎn)生K個子種群Pa(a∈{1,2,…,K})用于同時處理K個極小優(yōu)化問題。
2) 初始化子種群Pa(t=0)(a∈{1,2,…,K})中個體位置和參數(shù)。
3) 計算種群Pa(t=0)領(lǐng)先者fbesta(t=0)。
4) while(未滿足循環(huán)結(jié)束條件)
5)t=t+1;
6) for(對任意子種群Pa)
7) for(對任意個體i,i∈Pa)
8) 按式(1)~(2)更新個體i位置;
9) 計算個體i適應(yīng)值;
10) end for
11) 比較得出子種群Pa當(dāng)前領(lǐng)先者
13)counta=counta+1
14) end if
15) if(counta==γ)
16) 子種群Pa產(chǎn)生信息交互需求;
17) 按圖2選擇信息來源;
18) 按式(3)實施信息遷移,并評價個體適應(yīng)值;
19)counta=0
20) end if
21) 比較子種群Pa全局極值解;
22)end for
23)end while
24)輸出K個任務(wù)全局最優(yōu)解。
這里僅以同時處理2 個任務(wù)(即K=2)為例。設(shè)子種群P1和P2規(guī)模分別為m,最大迭代次數(shù)為Maxiter,任務(wù)T1維數(shù)為d1,任務(wù)T2維數(shù)為d2,假設(shè)d1>d2,則多任務(wù)搜索空間維數(shù)為D=max{d1,d2}=d1,當(dāng)計算任務(wù)T2適應(yīng)值 時,取d1中 的前d2維。
2.3.1 時間復(fù)雜度分析
SOMAMIF 同時優(yōu)化2 個任務(wù)的時間復(fù)雜度等于求解任務(wù)T1時間復(fù)雜度Q1和T2時間復(fù)雜度Q2之和。其中:
1)優(yōu)化任務(wù)T1時間復(fù)雜度Q1分析。
a)子種群P1運行時間復(fù)雜度包括:初始化子種群P1中m個個體位置時間復(fù)雜度為O(m·d1);初始化參數(shù)s、PRT時間復(fù)雜度為O(1);計算個體適應(yīng)值時間復(fù)雜度為O(m·d1);比較得出當(dāng)前領(lǐng)導(dǎo)者位置時間復(fù)雜度為O(m);計算參數(shù)PRTVector時間復(fù)雜度為O(1);更新個體遷移后位置時間復(fù)雜度為O(m·d1);更新子種群P1領(lǐng)先者位置時間復(fù)雜度為O(d1)。經(jīng)過Maxiter次迭代后得=O(Maxiter·m·d1)。
b)子種群P1篩選信息、P2向P1遷移信息復(fù)雜度包括:假設(shè)在整個算法Maxiter次迭代過程中,子種群P2向P1傳遞了θ1次信息,每次產(chǎn)生信息交互需求時,將子種群P2個體適應(yīng)值進行快速排序時間復(fù)雜度為O(mlogm),每次信息遷移產(chǎn)生新位置的時間復(fù)雜度為O(m·d1),計算新位置適應(yīng)值時間復(fù)雜度為O(m·d1),比較得出新領(lǐng)導(dǎo)者位置時間復(fù)雜度總時間為O(m),總體復(fù)雜度為O(θ1·m·d1);其他操作時間復(fù)雜度常數(shù)次O(1)。綜合分析,得=O(θ1·m·d1),則Q1==O(Maxiter·m·d1)+O(θ1·m·d1)。
2)優(yōu)化任務(wù)T2時間復(fù)雜度Q2分析。
優(yōu)化任務(wù)T2的過程與T1相似,也包括兩部分:
a)子種群P2運行時間復(fù)雜度包括:初始化子種群P2中m個個體位置時間復(fù)雜度為O(m·d1);初始化參數(shù)s、PRT時間復(fù)雜度為O(1);計算個體適應(yīng)值時間復(fù)雜度為O(m·d2);比較得出當(dāng)前領(lǐng)導(dǎo)者位置時間復(fù)雜度為O(m);計算參數(shù)PRTVector時間復(fù)雜度為O(1);更新個體位置時間復(fù)雜度為O(m·d1);更新子種群P2領(lǐng)先者位置時間復(fù)雜度為O(d2)。綜合上述分析,因d1>d2,經(jīng)過Maxiter次迭代后得Q12=O(Maxiter·m·d1)。
b)子種群P2篩選信息、P1向P2遷移信息復(fù)雜度包括:假設(shè)在整個算法Maxiter次迭代過程中,子種群P1向P2傳遞了θ2次信息,每次產(chǎn)生信息交互需求時,將子種群P1個體適應(yīng)值進行快速排序時間復(fù)雜度為O(mlogm),每次信息遷移產(chǎn)生新位置的時間復(fù)雜度為O(m·d1),計算新位置適應(yīng)值時間復(fù)雜度為O(m·d2),比較得出新領(lǐng)導(dǎo)者位置時間復(fù)雜度總時間為O(m),總體復(fù)雜度為O(θ1·m·d1);其他操作時間復(fù)雜度常數(shù)次O(1)。綜合分析,得=O(θ2·m·d1)。則Q2==O(Maxiter·m·d1)+O(θ2·m·d1)。
因θ1<Maxiter,θ2<Maxiter,綜 合1)和2),得 出SOMAMIF 求解兩個不同優(yōu)化任務(wù)的時間復(fù)雜度如式(4)所示:

2.3.2 空間復(fù)雜度分析
1)任務(wù)T1所需存儲空間包括如下兩部分:
a)子種群P1所需存儲空間:存儲子種群P1中m個個體位置所需空間為m·d1;存儲P1領(lǐng)先者位置所需空間為d1。
b)子種群P1篩選、遷移信息所需存儲空間:存儲新位置所需存儲空間為m·d1。
2)任務(wù)T2所需存儲空間包括如下兩部分:
a)子種群P2所需存儲空間:存儲子種群P2中m個個體位置所需空間為m·d1;存儲P2領(lǐng)先者位置所需空間為d2。
b)子種群P2篩選、遷移信息所需存儲空間:存儲新位置所需存儲空間為m·d1。
因d1>d2,綜合1)和2),得出SOMAMIF 求解兩個不同優(yōu)化任務(wù)的空間復(fù)雜度如式(5)所示:

由式(4)~(5)可知:本文多任務(wù)SOMAMIF 求解兩個不同任務(wù)的時間和空間復(fù)雜度均為多項式。
將本文算法與文獻[16]算法、文獻[18]算法進行對比分析,設(shè)置相同迭代次數(shù)Maxiter、種群規(guī)模m、最大搜索空間維數(shù)d1。文獻[16]的協(xié)同多任務(wù)粒子群優(yōu)化(MultiTasking Coevolutionary Particle Swarm Optimization,MT-CPSO)算法同時處理兩個不同任務(wù)時間和空間復(fù)雜度分別為O(Maxiter·m·d1)、O(m·d1)。
當(dāng)種群規(guī)模m小于等于函數(shù)維數(shù)d1,即m≤d1時,文獻[18]的信息交互多任務(wù)粒子群優(yōu)化(Information Exchange Particle Swarm Optimization for Multitasking,IEPSOM)算法同時求解兩個不同任務(wù)的時間和空間復(fù)雜度分別為O(Maxiter·m·d1)和O(m·d1);當(dāng)m>d1時,文獻[18]算法同時求解兩個不同任務(wù)的時間和空間復(fù)雜度分別為O(Maxiter·m2)和O(m2)。
綜合上述對比分析可知,本文多任務(wù)SOMAMIF的時間復(fù)雜度和空間復(fù)雜度與MT-CPSO算法、IEPSOM算法相當(dāng)。
本節(jié)以8 個經(jīng)典benchmark 函數(shù)優(yōu)化問題為例,如式(6)~(13),按函數(shù)和維數(shù)構(gòu)造不同多任務(wù)組合,在同一時刻處理3 個優(yōu)化問題,以驗證SOMAMIF 求解多任務(wù)性能。為強調(diào)SOMAMIF多任務(wù)環(huán)境中信息篩選機制的優(yōu)異性能,這里采用消融法比較信息篩選前后算法性能差異,若信息篩選前后涉及到相同的參數(shù),則設(shè)為一致。

為方便描述,將上述8 個函數(shù)名稱進行簡寫,并給出函數(shù)全局最優(yōu)值,如表1所示。

表1 函數(shù)簡稱及最優(yōu)值Tab.1 Function abbreviation and optimal value
當(dāng)SOMA 中未引入信息篩選機制處理50 維Sphere 函數(shù)優(yōu)化問題時,將其標(biāo)簽設(shè)為50S;若采用多任務(wù)SOMAMIF 同時處理50 維Sphere function、50 維Ackley function、50 維Rastrigin function,則將其標(biāo)簽設(shè)為(50S,50A,50R),依此類推,將上述8個函數(shù)分成如下6個多任務(wù)組:
F1={50S,50A,50R,(50S,50A,50R)}
F2={50S,50G,50Q,(50S,50Q,50G)}
F3={50SD,50SS,50Z,(50SD,50SS,50Z)}
F4={100S,100A,100R,(100S,100A,100R)}
F5={(100S,100G,100Q,(100S,100G,100Q)}
F6={(100SD,100SS,100Z,(100SD,100SS,100Z)}
F1、F2、F3、F4、F5、F6分別用于比較在SOMA 中引入信息篩選機制前后,50S、50A、50R、50G、50Q、50SD、50SS、50Z、100S、100A、100R、100G、100Q、100SD、100SS、100Z的求解性能。
算法參數(shù)設(shè)置如下:多任務(wù)組合F1、F2、F4、F5搜索空間設(shè)為[-30,30],F(xiàn)3、F6搜索空間均設(shè)為[-10,10],子種群規(guī)模為50,迭代次數(shù)為500,步長step=0.08。同時,多任務(wù)SOMAMIF中的信息遷移節(jié)點γ=10。多任務(wù)組合F1、F2、F3、F4、F5、F6單獨運行30次求平均值實驗結(jié)果如表2所示。

表2 引入信息篩選機制前后本文算法求解多任務(wù)高維函數(shù)優(yōu)化問題的實驗結(jié)果Tab.2 Experimental results of proposed algorithm solving multi-task high-dimensional function optimization problems before and after introducing information filtering mechanism
當(dāng)SOMA 中未引入信息篩選機制求解50 維函數(shù),如50S、50A、50R、50G、50Q、50SD、50SS、50Z時,最優(yōu)適應(yīng)值分別為0.101 681、0.208 711、5.755 48、0.108 872、1、1.6E-11、0.000 708 014、66.539 5,平均適 應(yīng)值分別為1.837 051、1.275 379、54.948 31、0.247 349、11.5、44.9、0.166 966、96.012 77,而引入信息篩選機制的多任務(wù)SOMAMIF 求解任務(wù)(50S,50A,50R)、(50S,50Q,50G)、(50SD,50SS,50Z)組合時,50S、50A、50R、50Q、50G、50SD、50SS、50Z最優(yōu)適應(yīng)值均達到了全局極值解0,平均適應(yīng)值也遠遠優(yōu)于未引入信息篩選機制的SOMA。當(dāng)上述8 個函數(shù)維數(shù)上升到100 維時,多任務(wù)SOMAMIF 所得結(jié)果也明顯優(yōu)于SOMA,這說明本文提出的多任務(wù)算法通過子種群之間的信息篩選和遷移能顯著提高解的質(zhì)量。
表3 將本文多任務(wù)SOMAMIF 運行結(jié)果與文獻[16]的多任務(wù)MT-CPSO 算法、文獻[18]的多任務(wù)IEPSOM 算法進行對比,本文算法和MT-CPSO算法、IEPSOM算法在求解上述50維和100 維函數(shù)時,實驗結(jié)果基本相當(dāng),但本文算法在求解100R、100SS、100Z時性能優(yōu)于MT-CPSO 算法,且除了求解50SD、100SD這兩個函數(shù)時稍劣于IEPSOM 算法外,本文算法求解其他函數(shù)結(jié)果均優(yōu)于IEPSOM 算法。這些結(jié)果在SOMAMIF 和MT-CPSO 算法、SOMAMIF 和IEPSOM 算法威 爾克森符號秩檢驗結(jié)果中得到了進一步證實(設(shè)置信度水平為0.05),結(jié)果如表4所示。

表3 不同算法求解多任務(wù)高維函數(shù)優(yōu)化問題的平均適應(yīng)值對比Tab.3 Average fitness comparison of different algorithms in solving multi-task high-dimensional function optimization problems

表4 不同算法求解多任務(wù)高維函數(shù)優(yōu)化問題威爾克森符號秩檢驗結(jié)果Tab.4 Wilcoxon signed-rank test results of different algorithms in solving multi-task high-dimensional function optimization problems
圖3 進一步給出信息篩選前后,高維函數(shù)50S、50A、50R、50Q、50G、50SD、50Z、100S、100A、100R、100G、100Z單獨運行30 次的平均收斂曲線。由圖3 可知,當(dāng)SOMA 中未引入信息篩選機制時,上述50維或100維函數(shù)收斂速度緩慢,均停滯在局部極值解附近,而SOMAMIF能明顯同時加速多個任務(wù)的收斂,使其快速收斂至全局最優(yōu)解。

圖3 信息篩選前后高維函數(shù)平均收斂曲線圖Fig.3 Average convergence curves for high-dimensional functions before and afterinformation filtering
2020 年一場突發(fā)疫情席卷全球,不可避免地對中國乃至世界經(jīng)濟造成較大沖擊,企業(yè)穩(wěn)崗壓力增大,一些企業(yè)裁員數(shù)上升,勞動力市場需求“縮水”,失業(yè)人員增加。2020 屆全國普通高校畢業(yè)生874 萬,比上一年增加了40 萬人,增量、增幅均為近年之最,這讓原本嚴(yán)峻的就業(yè)形勢雪上加霜。盡管地方政府出臺了一系列措施,積極鼓勵大學(xué)生返鄉(xiāng)創(chuàng)業(yè)就業(yè),但收效甚微。有效識別制約大學(xué)生返鄉(xiāng)關(guān)鍵因素,可為地方政府鼓勵和引導(dǎo)大學(xué)生返鄉(xiāng)就業(yè)政策制定、調(diào)整提供科學(xué)參考依據(jù)。因影響大學(xué)生返鄉(xiāng)因素眾多,并可能存在多重共線性,冗余因素的存在不僅導(dǎo)致計算效率低下,還在一定程度上干擾辨識過程。
大學(xué)生返鄉(xiāng)關(guān)鍵制約因素挖掘過程實質(zhì)上是一個特征選擇過程,屬于典型的二元離散優(yōu)化問題。本節(jié)以SOMAMIF為搜索策略,將種群中粒子位置通過Sigmoid 函數(shù)轉(zhuǎn)換成1 或0,1或0分別表示該因素是或否被選擇為返鄉(xiāng)關(guān)鍵制約因素,分形維數(shù)作為子集評估度量準(zhǔn)則,同時提取戶籍所在地分別為縣及以下和三線以上城市的大學(xué)生返鄉(xiāng)關(guān)鍵制約因素。
目前計算數(shù)據(jù)集分形維數(shù)的方法較多,這里采用盒計數(shù)法。假設(shè)數(shù)據(jù)集指標(biāo)個數(shù)為L,數(shù)據(jù)點落在邊長為r的L維格子中,其關(guān)聯(lián)分形維數(shù)如式(14)所示:

其中:s(r)=Cr,w為落入第w個格子的數(shù)據(jù)點數(shù);r為格子半徑,[r1,r2]為數(shù)據(jù)集無標(biāo)度空間。數(shù)據(jù)集中數(shù)據(jù)點每維采用十進制實數(shù)表示,根據(jù)點坐標(biāo)值和盒子半徑統(tǒng)計該半徑下每個盒子中落入點數(shù)的平方和,根據(jù)不同半徑r得到一系列不同點對(lnr,lns(r)),擬合后所得直線斜率,即為關(guān)聯(lián)分形維數(shù)。
3.2.1 數(shù)據(jù)集描述及數(shù)據(jù)預(yù)處理
仿真實驗以高校學(xué)生為研究對象,將受訪學(xué)生分成兩組:
①戶籍所在地為縣及以下高校學(xué)生;
②戶籍所在地為三線及以上城市高校學(xué)生。
涉及到的返鄉(xiāng)因素共14 個,分別為:1)所在大學(xué)類型;2)學(xué)歷;3)家庭情況;4)學(xué)習(xí)成績;5)當(dāng)前就業(yè)形勢;6)自身求職競爭力;7)父母是否支持返鄉(xiāng);8)家鄉(xiāng)薪資待遇;9)家鄉(xiāng)生活成本;10)回鄉(xiāng)就業(yè)優(yōu)惠政策;11)家鄉(xiāng)生活節(jié)奏工作壓力;12)對家鄉(xiāng)未來發(fā)展環(huán)境滿意度;13)對家鄉(xiāng)基礎(chǔ)設(shè)施滿意度;14)對家鄉(xiāng)居住環(huán)境滿意度。返鄉(xiāng)意愿有兩種:愿意返鄉(xiāng)就業(yè)/不愿意返鄉(xiāng)就業(yè)。
構(gòu)建基于SOMAMIF的多任務(wù)組:
1)任務(wù)T1:挖掘戶籍所在地為縣及以下高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素。
2)任務(wù)T2:挖掘戶籍所在地為三線及以上城市高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素;
其中任務(wù)T1實例數(shù)為383,任務(wù)T2實例數(shù)為43。
3.2.2 多任務(wù)高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素提取結(jié)果分析
按式(14)分別計算任務(wù)T1和T2原始數(shù)據(jù)集分形維數(shù)為2.713 13、4.185 62,然后向上取整得任務(wù)T1返鄉(xiāng)關(guān)鍵制約因素個數(shù)為3(即,任務(wù)T2返鄉(xiāng)關(guān)鍵制約因素個數(shù)為5(即。
將子種群規(guī)模設(shè)為50,迭代次數(shù)為20,信息遷移節(jié)點γ=3。采用本文多任務(wù)SOMAMIF結(jié)合分形維數(shù)同時求解任務(wù)T1和T2后,得到戶籍所在地為縣及以下高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素為:父母是否支持返鄉(xiāng)、家鄉(xiāng)薪資待遇和家鄉(xiāng)居住環(huán)境滿意度;戶籍所在地為三線及以上城市高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素為:父母是否支持返鄉(xiāng)、家鄉(xiāng)薪資待遇、家鄉(xiāng)生活成本、家鄉(xiāng)生活節(jié)奏工作壓力、對家鄉(xiāng)基礎(chǔ)設(shè)施滿意度,約簡率分別為78.57%和64.29%。
進一步采用支持向量機(Support Vector Machine,SVM)計算得出返鄉(xiāng)關(guān)鍵制約因素提取前后數(shù)據(jù)集的平均分類準(zhǔn)確率,任務(wù)T1和T2原始數(shù)據(jù)集的平均分類準(zhǔn)確率分別為72.913 65%和82.226 18%,最優(yōu)返鄉(xiāng)關(guān)鍵制約因素平均分類準(zhǔn)確率分別為73.262 31%和82.824 75%,平均分類準(zhǔn)確率分別提高了0.348 66個百分點和0.598 57個百分點。
圖4 和圖5 分別給出了引入信息篩選機制前后算法單獨運行30 次時,不同戶籍高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素的平均分類準(zhǔn)確率收斂曲線。

圖4 信息篩選前后任務(wù)T1平均收斂曲線Fig.4 Average convergence curves for task T1 before and after information filtering

圖5 信息篩選前后任務(wù)T2平均收斂曲線Fig.5 Average convergence curves for task T2 before and after information filtering
由圖4~5 可知,多任務(wù)(T1,T2)的收斂速度明顯優(yōu)于T1和T2,能顯著縮短返鄉(xiāng)關(guān)鍵制約因素的提取時間。
表5 進一步給出了不同戶籍高校學(xué)生返鄉(xiāng)關(guān)鍵制約因素提取前后威爾克森符號秩檢驗結(jié)果,設(shè)置信度水平為0.05,由表5可知,T1和(T1,T2)、T2和(T2,T1)的差距顯著。

表5 返鄉(xiāng)關(guān)鍵制約因素提取前后威爾克森符號秩檢驗結(jié)果Tab.5 Wilcoxon signed-rank test results before and after key home returning constraints extraction
本文通過挖掘自組織遷移算法的“隱并行性”,在基本SOMA 中基于信息遷移機制在同一時間內(nèi)有效求解多個不同優(yōu)化問題,并引入基于概率的信息選擇方法,在一定程度上保證了信息的正向遷移,能顯著提高多任務(wù)的求解質(zhì)量并加速各優(yōu)化問題的收斂,為多任務(wù)優(yōu)化提供了一種新穎的高性能計算模型。本文從全新視角研究SOMA,既拓寬了SOMA 的知識內(nèi)涵,也為后續(xù)研究推廣到其他群智能算法實現(xiàn)多任務(wù)處理,奠定了理論和實驗基礎(chǔ)。