楊志飛,閆光輝,羅 浩,常文文
(蘭州交通大學 電子與信息工程學院,蘭州 730070)
隨著研究生的不斷擴招,研究生規模不斷擴大,研究生管理數據也日趨龐大,這些數據看似毫無關聯.在大數據時代,找到它們之間有效的關聯,分析其關聯關系,有利于發現其相互作用[1].同時隨著智能產業的興起,導致了工程系統社會化、社會系統工程化、簡單系統復雜化的新趨勢,研究生教育也得到了很好地發展[2].目前,我國的研究生教育已經成為培養高層次人才、支撐自主創新的戰略性力量,也是推進創新型國家的構建和“中國夢”實現的主導力量[3],因而需要優化課程教學管理,不斷推動教學改革與創新[4].研究生教學管理主要為學術型研究生和專業型研究生[5].課程體系是專業培養的重要內容,是實現人才培養的最主要途徑和最重要的基礎,是實現人才培養方案的依托.2019年3月,教育部發布教研廳[2019]1號文件《教育部辦公廳關于進一步規范和加強研究生培養管理的通知》明確要求,要堅持“服務需求,提高質量”的研究生教育發展主線,優化和完善方案設置.構建多元化的研究生課程體系勢在必行[2],分析課程間的關系有利于構建優質的課程體系,有利于解決研究生學習的多樣性問題.復雜網絡是根據數學方法、圖論等發展起來的定量分析方法,是研究復雜系統的新視角.復雜網絡目前已經應用在自然科學與社會科學研究的各個方面,比如疾病傳播、氣象動力學、歷史演化等.在教育方面,復雜網絡也有了一定的應用,通過分數將課程關聯,分析本科專業核心課程[6];挖掘課程內知識點,構建網絡模型,優化教學過程[7-8].本文將復雜網絡作為研究生課程群體系的建模原理,以研究生培養計劃為基礎,將其定義為選課關系,對研究生課程進行建模和分析,探索研究生課程間的關聯關系,同時借助網絡分析可視化工具,直觀地展示各專業培養方案中課程之間的結構以及關聯關系.最后,以蘭州交通大學電子與信息工程學院研究生培養方案中的課程為例,并將課程作為一個向量,通過每門課程中的學生集合建立課程之間的關聯,計算其相關關系,將課程間的復雜關系通過網絡圖的方式呈現;將學生集合作為課程的重要屬性之一并融合兩種網絡結構分析課程重要性.
采用復雜網絡技術對研究生選課關系的課程群建模,從而可以利用復雜網絡中的社團劃分、重要節點排序對課程群進行分析,同時將復雜網絡技術應用于研究生課程群的建設,其建模過程可以定義為Stu-Course-CN,其建模流程如下:
1)根據研究生培養方案建立每學期的課程群ΩC={c1,…,ci,…,cM},其中的ci表示第i門課程.
2)根據研究生的培養計劃建立每門課的選課學生集合ΩSi={fi(ci)},其中:ΩS={s1,s2,…,sN}為選課的學生集合;{fi(ci)}為第i門課程的學生集合.
3)剔除學生集為空的課程,將非空學生集的課程定義為選課課程群=ΩC\{ci|ΩSi=?};然后,計算選課課程群中課程之間的學生集的交集,Numij=|ΩSi∩ΩSj|為第i,j 2門課程之間的共有學生數.
4)根據復雜網絡鄰接矩陣原理,建立基于Numij的網絡關系,其鄰接矩陣為

定義該網絡為選課課程群網絡.
為了分析選課課程群的內在關系,對課程群網絡結構進行社團分析.課程群網絡結構的社團研究可以揭示錯綜復雜的課程群網絡如何由相對獨立又相互交錯的社團構成.根據社團內的節點之間連接非常緊密而社團間的連接卻相對稀疏的現象,分析課程群的社團結構,對了解課程群網絡結構和分析網絡特性具有極為重要的意義,并且可以進一步幫助發現課程之間的聚類關系,為課程群建設、排課安排等提供一定的應用價值.
課程群網絡的社團分析算法分為3個階段,這3個階段重復迭代,定義為stepA算法[9-10].假設課程群網絡為由N門課程組成的N個節點的加權網絡,同時采用網絡模塊度的度量準則模塊度增益ΔQ.定義社團B的模塊化增益為

第1階段,完成初步社團劃分,計算步驟如下:
1)為每個節點分配一個社團,此時社團數等于節點數.
2)對每個節點i,考慮其鄰居節點j,將節點i從其社團移除,并將其放置在j的社團中.
3)計算每個社團的模塊化增益ΔQ.若ΔQ≥0,則保留i在j社團中,完成一次社團節點的移動;若ΔQ<0,則i恢復到原來的社團中,節點社團移動失敗.
4)遍歷所有的節點.
5)當模塊化增益不再有正值時,第1階段完成.
第2階段,完成新網絡構建,計算步驟如下:
1)將第1階段形成的社團視為節點;
3)生成新網絡;
4)對新網絡采用第1階段步驟對其進行迭代計算.
第3階段,判斷模塊化增益是否為最大值,若不是最大值繼續第1階段和第2階段,否則結束社團劃分.
stepA算法計算示意圖如圖1所示.首先,通過計算模塊度增益及對其的優化過程形成新社團;其次,根據社團劃分建立新網絡.重復這2個階段直到模塊化增益達到最大值.

圖1 選課網絡社團分析步驟Fig.1 Analysis steps of course selection network community
在選課課程群網絡中,有必要對該網絡中的課程進行重要性分析,發現和挖掘選課關系下課程的重要性,為下一步的課程建設做支持.在復雜網絡中,刻畫節點重要程度的一個指標就是節點中心化,用于定量表示網絡中一些節點比其他節點更重要或處于更中心的位置,該指標用于確定網絡中個體所處位置與其在群體中的影響之間的關系,已廣泛應用于保障體系[11]、燃氣管網[12]、傳輸效率[13]和個人績效[14]等方面.節點重要性的度量方法主要有節點度、特征向量和接近度等,但這些指標僅考慮網絡中節點的結構關系.在選課關系網絡中,在兼顧課程群網絡節點的結構關系的同時引入課程屬性(尤其是課程的選課人數),以便對課程重要性進行多屬性[15-16]分析.
1)網絡結構的局部信息處理.在基于選課關系的課程群網絡結構中,雖然度指標能直接反映一個節點對網絡中其他節點的直接影響力,但擁有大量連接的鄰居節點可能有更大的影響力,也就是在選課課程群網絡結構中節點的重要性不僅與自身的信息有關,而且與該節點的鄰居節點的度也存在一定關聯,即該節點的度及其鄰居節點的度越大,節點越重要,可以采用一個多級鄰居信息指標以及其鄰居之間的緊密程度對網絡中的節點重要性進行度量,將其定義為基于鄰居信息與集聚系數的節點重要性評價方法(P(i))[17].

其中:fi為節點vi自身的度與其所有鄰居vu度之和,即fi=k(i)+k(u),k(u)表示節點vu的度,Γ(i)表示當前節點vi的鄰居節點集合;cci為節點vi的集聚系數;G為整個網絡節點集.
2)網絡結構的全局信息處理.基于網絡全局屬性的節點重要性度量主要考慮網絡全局信息,特征向量指標不僅考慮全局網絡信息,同時考慮了鄰居節點的重要性程度.特征向量指標強調節點之間的相互影響,節點的重要性不僅與其連接的邊數有關,而且和連接節點的重要性成線性關系,設網絡具有N個節點,A表示網絡的鄰接矩陣,λ1,λ2,…,λN表示A的N個特征值.設λ為矩陣A的最大特征值,有

其中:aij為A中元素;ei為節點i的重要性度量值;ej為節點i鄰居節點的重要性度量值.則節點i的特征向量指標可以定義為

3)網絡節點選課人數屬性處理.根據Stu-Course-CN建模流程,計算每門課的學生人數si,形成課程人數集合s={s1,…,si,…,sN}.人數是選課的最重要的屬性,對其歸一化處理,歸一化公式為

因選課中最大人數不等于最小人數,所以s′i∈(0,1).
在選課的課程網絡中,需要充分考慮網絡的局部信息和全局信息,同時融合選課人數信息,為此定義課程重要性指標為

采用蘭州交通大學電信學院研究生連續3年的選課情況作為分析對象.本文以2018年第2學期研究生的選課情況為例,實際開課共33門,研究生182名,3個專業方向(信息與通信工程、計算機科學與技術、電子科學工程).為了便于分析,對課程進行編號處理,定義如下:1代表功率電子學;2代表大規模集成電路CAD;3代表可信計算與信息安全;4代表基于FPGA的數字系統設計;5代表現代半導體物理與器件;6代表應用統計學;7代表機器學習;8代表模糊數學及應用;9代表深度學習;10代表最優化方法及應用;11代表DSP技術及開發;12代表通信網協議分析與管理;13代表通信系統仿真技術;14代表軟件無線電技術;15代表數字圖像處理;16代表語音信號處理;17代表信號檢測與估值;18代表應用密碼學;19代表無線通信技術與應用;20代表軌道交通通信技術;21代表無線通信網絡規劃與優化;22代表軟件體系結構;23代表智能計算;24代表數據挖掘;25代表現代數據庫技術;26代表網絡安全技術;27代表神經網絡理論與應用;28代表統計決策與模式識別;29代表分布式系統;30代表高級計算機圖形學;31代表智能鐵路運輸系統(ITS-R);32代表科技英語寫作(信息類);33代表虛擬現實技術及應用.根據式(1)獲得課程之間的鄰接矩陣(見表1),采用Stu-Course-CN構建學生培養計劃下的課程之間的復雜網絡,網絡如圖2所示,該網絡共33個節點,468條邊.從圖2的選課關系網絡中可以發現:該網絡為稠密網絡,大部分課程之間具有較為稠密的連接,僅個別課程連接比較稀疏.從該網絡中無法直接獲得課程的專業方向以及課程的重要性,為此需要對該網絡進行社團和重要性分析.

圖2 選課關系的課程復雜網絡Fig.2 Course complex network of course selection relationship
為了挖掘網絡結構中隱藏的信息,對該33門課的選課關系課程群網絡采用stepA算法進行社團分析,結果如圖3所示,最終模塊度ΔQ收斂于0.171,社團劃分為三類,分別為:電子科學方向,包括1,2,4,5,15,25等6個節點;計算機方向,包括3,6,7,10,18,22,23,24,26,29,32等11個節點;信息與通信方向,包括8,9,11,12,13,14,16,17,19,20,21,27,28,30,31,33等16個節點.與培養方案進行比較,社團劃分與培養方案課程劃分一致.圖4為培養方案的課程關系,在培養方案中,15(數字圖像處理)、25(現代數據庫技術)和32(科技英語寫作(信息類))3門課為3個培養方向的共有課程,但15(數字圖像處理)內容偏重信息與通信方向,25(現代數據庫技術)內容偏重計算機方向;18(應用密碼學)、24(數據挖掘)、26(網絡安全技術)、27(神經網絡理論與應用)和30(高級計算機圖形學)是計算機方向和信息與通信方向的共有課程,但18(應用密碼學)內容偏重于信息與通信方向,24(數據挖掘)、26(網絡安全技術)、27(神經網絡理論與應用)和30(高級計算機圖形學)4門課程內容偏重于計算機方向.從圖3的選課網絡社團劃分可以看出:15(數字圖像處理)、25(現代數據庫技術)在分類中屬于電子科學方向,說明這兩門課程主要選擇的學生為電子科學方向學生,可能同這學期電子科學方向開課的課程數少有一定的關系;30(高級計算機圖形學)屬于信息與通信方向分類,說明該課程主要由信息與通信方向的學生進行選課.從上述分析中可以得出:基于學生選課關系網絡的社團劃分和培養方案是一致的,說明該方法在選課網絡中是可行的.同時從社團劃分中也可以看出個別課程的主要選課學生的學科方向,對后期的培養方案修訂具有一定的意義.

圖3 課程群的社團劃分Fig.3 Community division of curriculum group

圖4 培養方案課程關系Fig.4 Relationship between training program
為了進一步挖掘課程的有效信息,采用式(7)對選課關系課程群的課程重要性進行分析,其結果如圖5所示,圖中列出了選課人數屬性下的課程重要性分析、網絡結構特征的課程重要性分析以及二者融合的重要性分析.從圖5中可以看出:絕大多數的課程在這3種分析下重要性具有一致性,但機器學習、數字圖像處理、軌道交通通信技術、數據挖掘、現代數據庫技術、分布式系統以及科技英語寫作(信息類)等7門課程值得注意,從這7門課程可以看出,這7門選課人數都很多,在網絡結構影響下其重要性雖沒有變化,但對其重要性幅值帶來了一定的約束,重要性值更加合理;同時有個別課程二者的重要性不同,如模糊數學與應用,雖然其選課人數少于應用統計學,但其融合后的重要性大于應用統計學,說明網絡結構關系提升了其重要性;另外,還有分布式系統、應用密碼學和現代數據庫技術,這些課程的網絡結構直接影響了融合后的重要性分析,使得選課人數多的分布式系統的重要性低于應用密碼學和現代數據庫技術.從整體上而言,基于選課關系網絡課程的重要性能夠反應學生的喜好,通過網絡關系可以反應選課關系對課程重要性的影響.

圖5 課程重要性分析Fig.5 Curriculum importance analysis
本文首先對研究生課程群的選課關系進行了分析,建立了選課關系下的課程群復雜網絡模型,隨后分析了在選課關系下的課程群社團結構,并和培養方案進行了比較,結果表明:該社團結構同培養方案是一致的,同時也挖掘出個別課程主要為某一個學科方向的學生選擇,為培養方案的修訂提供了一定的依據.接著,采用網絡結構指標、選課人數屬性以及二則的融合對選課關系下的課程重要性進行了分析,從分析結果可以看出學生選課的興趣傾向于該門課程在學生中的影響力,這對課程評價有一定的參照價值,同時也有利于研究課程的合理性安排.總之,通過復雜網絡對研究生課程進行建模不僅能分析課程在課程體系中的重要性,同時為后續的課程管理與學生興趣相結合提供依據.