劉小琴,騫憲忠,羅艷虹,張巖波
(山西醫科大學,山西 太原 030001)
近年來隨著我國高等教育的發展,許多高等院校紛紛提出自己的定位類型,一些未提出定位類型的高校也已經認識到大學類型定位的重要性。大學定位的必要性在于:學校自身發展的需要、高等教育管理體制改革的需要、高校辦學特色的需要以及解決高等教育發展中問題的需要[1]。廣東管理科學院《中國大學評價》課題組武書連2002年按照科研規模將我國大學的類型定位劃分為4種類型:研究型、研究教學型、教學研究型、教學型[2]。
文章通過采用層次聚類分析方法,對我國17所醫科大學進行層次聚類分析,以求證明層次聚類分析方法在高等學校定位中的可行性和簡便性,以期能在高校類型定位時提供決策支持。
文章以17所醫科大學為樣本。選取有關分析指標:博導數、研究生本科生比例、博士點一級學科數量、碩士點一級學科數量、國家級重點學科數量、國家級教學團隊數量、教育部創新團隊數量、國家級精品課程數量、國家級特色專業數量、國家級重點實驗室數量、國家級教學名師數量、近三年國家級自然科學基金項目數量。首先選取各個大學官網上(截止2012年12月25日)的數據作為實證分析的基本資料,另外在國家自然科學基金委員會的官方網站上查閱了17所醫科大學在2010-2012年三年國家級自然科學基金項目數量。
缺失數據是指在數據收集過程中,未能收集到某些指標或變量的全部觀察值,從而導致數據集中存在變量缺失的一種現象[3]。聚類分析需要完整的數據集,因此缺失數據的處理方法就成為數據分析過程中所必須考慮的操作環節之一。
數據缺失機制包括完全隨機缺失(Missing CompletelyRandom簡稱MCAR)、隨機缺失(Missing at Random)、非隨機缺失三類MNAR(Missing Not At Random)。SPSS軟件估計缺失值方法有四種:逐列(Listwise)處理、配對(Pairwise)處理、回歸(Regression)估計及期望最大(Expectation Maximization、EM)估計[3]。經Little's MCAR檢驗,其卡方統計量為28.610,P值為0.590>0.05,得該樣本數據缺失機制為完全隨機缺失,可采用均值替換法。
*通訊作者
層次聚類分析方法的層次含義是:開始時每個樣品各看成一類,將距離最近的兩類合并:重新計算新類與其他類的距離,再將距離最近的兩類合并;再計算新類與其他類的距離……,這樣一步一步地進行下去,每一步減少一類,直至所有的樣品都合并成一類為止[3]。
SPSS軟件中層次聚類分析方法有7種[4]:(1)類間平均(Between-groups linkage):傾向合并偏差較小的類;(2)類內平均法:(With-groups linkage)傾向合并偏差較小的類;(3)最鄰近距離法(Nearest Neighbor):適用于非常離散的資料;(4)最鄰近距離法(Nearest Neighbor)(5)中間距離法(Clustering):為前兩種方法的折中;(6)中心法(Centroid clustering):分類效果較差,但穩健,對異常值不敏感:(7)離差平方和法(Ward’s method)傾向得到各類樣品數目接近的分類結果,分類效果好但對異常值敏感。通過對比7種方法的聚類結果與17所醫科大學自己定位的符合程度,文章采用離差平方和法。離差平方和法的聚類分析結果與17所醫科大學自己類型定位結果符合程度最大。
由聚類分析樹狀圖可以看出:自己定位相同的學校間距離較小,也就是說相似性較大,在一定程度上聚集在一起,可以合并為一類;自己定位不同的學校的間距相對較大。
7種方法得出的結果對比學校自己定位的類型,可以看出大部分學校自己定位比較符合聚類分析的
結果。離差平方和法17所學校的聚類分析結果分為3類是:“A醫科大學”、“O醫科大學”、“E醫科大學”、“D醫科大學”、“C醫科大學”、與“Q醫科大學”、為一類,相對應的類型為教學型;“F醫科大學”、“P醫科大學”、“K醫科大學”、“I醫科大學”、與“B醫科大學”、為一類,相對應的類型為教學研究型;“J醫科大學”、“N醫科大學”、“G醫科大學”、“L醫科大學”、“M醫科大學”與“H醫科大學”為一類,相對應類型的為研究教學型。

附圖 層次聚類離差平方和法聚類結果樹狀圖
不符合聚類分析結果的學校為“F醫科大學”和“B醫科大學”。“F醫科大學”自己定位為“教學型”,層次聚類分析結果為“教學研究型”?!癇醫科大學”自己定位為“研究教型”,層次聚類分析結果為“教學研究型”。
聚類分析結果與學校自己定位的類型不完全符合原因可能有以下幾個方面:各高校官網最新數據更新時間不一樣;資料收集不完全,有缺失數據;缺失數據的填補結果與真實數據相差較大;部分變量由于數據缺失嚴重被刪除,可能會影響分析結果;有些學校自己類型定位也存在問題等。
做聚類分析時變量的選擇并非越多越好,應結合專業知識盡可能地刪去對分類不起作用的變量,因為無分類作用變量的存在有時會嚴重地引起不正確的分類。SPSS中聚類分析的方法有7種,具體用哪種方法需要多次嘗試并結合研究目的而定。統計學的分類結果并不是最終結論,各高校還需結合自身實際情況來進行最后的正確定位。
[1]王德蕆.大學定位的幾個問題[J].成都中醫藥大學學報:教育科學版,2005(1).5-8.
[2]武書連.再探大學定位[J].中國高等教育評估,2002(4).
[3]宇傳華.SPSS與統計分析[M].北京:電子工業出版社,2007.333.
[4]張文彤.SPSS11統計分析高級教程[M].北京:北京希望電子出版社,2002.321.