張 興
《美國新聞與世界報道》(U.S.News&WorldReport)1948年由《美國新聞》《世界報道》《美國周刊》三種雜志合并而成,目前為僅次于《時代》和《新聞周刊》的第三大新聞雜志。1983年,該雜志第一次推出針對美國本科院校的最好大學排名,獲得了很好的市場反響。從那以后,該雜志發(fā)布了一系列排行榜。最好研究生院、最好高中、最好醫(yī)院、汽車排行榜等不斷被推出,排名范圍從教育領域擴大到日常生活領域。目前,各種類型的排行榜已經成為該雜志的特色內容。
在這些排名中,1983年發(fā)布的“美國本科院校最好大學排名”(以下簡稱“美新大學排名”)歷史最長、影響最廣。它被認為是大學排名領域的分水嶺,也是大學排名史上的里程碑,對全球各國大學排名產生了巨大影響[1]。另外,該排名的排名方法已經發(fā)展成為一套完整的排名體系,注重主觀指標與客觀指標的結合,具有一定的研究和借鑒意義[2]。
美新大學排名對它所評估的學院和大學進行了分類,同時,它還包括性價比最高大學排名、本科教學最佳大學排名、次優(yōu)學生可選擇的頂尖大學排名、傳統(tǒng)黑人大學排名等具有明確方向的排名信息,可以滿足不同客戶個性化的需求[3]。國內文獻較多關注該排名的優(yōu)點,對該排名的不足討論較少,且多為理論分析,缺乏證據支持;國外文獻以批評為主,且多為實證分析。任何一個排名都不是完美的,本研究將分別從指標體系、數據計算以及動機和結果層面梳理美國最好大學排名存在的問題,以更客觀、更全面地評價大學排名。
美新大學排名通常于每年8月發(fā)布,該排名誕生之初并不具備完整的評估指標體系,最初三期以大學校長的主觀調查為依據,并不包括客觀評估指標。直至1988年,才正式推出兼具主觀評價和客觀指標的評估指標體系。從1998年開始,排名評估指標體系的一級指標相對固定,二級指標或計算方法不斷調整。本研究以最新的2019年指標體系為例進行分析,如表1所示。

表1 2019年美新大學排名評估指標體系
學術聲譽指標在所有指標中占20%權重,對于不同類型的高校有不同的二級指標。高中輔導員評價得分在2011年首次被引入評價指標體系,用于評價全國性大學、全國性文理學院的學術聲譽。根據2019年的指標體系,在全國性大學、全國性文理學院的學術聲譽調查中,相同類型高校的校長、教務長、招生院長(或同等職務)等學術同行評價和高中輔導員評價分別占15%和5%的權重,地區(qū)性大學和地區(qū)性學院的學術聲譽則只包括學術同行評估得分。
研究者對該指標的批評集中在學術聲譽不能客觀反映各高校的教學質量。結構方程模型評估的結果發(fā)現(xiàn),同行評估聲譽在很大程度上受已發(fā)布的大學排名的影響,與組織質量和績效的變化無關[4]。也有研究發(fā)現(xiàn),相對于畢業(yè)生的表現(xiàn)而言,一所高校的聲譽實際上與政府人均教師經費支出相關性更大[5]。換句話說,該排名的目的是幫助學生選擇學校和判斷學校的教學質量,但事實上,該排名中使用的聲譽指標無法實現(xiàn)上述目標。
教學成效是2019年新增的一級指標,用以衡量高校教育成果,包含社會流動性、畢業(yè)率和保留率、畢業(yè)率表現(xiàn)3個二級指標,社會流動性為新增,故現(xiàn)有文獻主要關注后兩個指標。研究者普遍認為,學術領導者應該支持提高學生的保留率和畢業(yè)成績,故畢業(yè)率和保留率相關指標本身有意義。高保留率和較好的畢業(yè)成績不僅可以通過提高學生的教育經歷和經濟支持來實現(xiàn),還可以通過降低學生的學業(yè)要求來實現(xiàn),但是排名數據只關注了保留率和畢業(yè)成績的最終結果,而沒有關注實現(xiàn)的方法[6]。
教師資源指標包括班級規(guī)模、教師薪資水平、有本學科最高學位的全職教師的比例、師生比和全職教師占比5個二級指標,研究者批評較多的是教師薪資水平指標。
在微觀層面,阿斯丁(Astin)的實證研究發(fā)現(xiàn),教師薪酬指標更多地反映教師的科研活動,該指標甚至與學生的科研學習呈負相關[7]。在宏觀層面,埃倫伯格(Ehrenberg)指出該排名使用的教師平均薪資指標沒有考慮由于教師的專業(yè)領域和年齡分布不同產生的平均工資差異[6]。在另一篇文章中他指出,教師工資指標可能促使大學持續(xù)增加教師工資,這可能是過去20年中私立研究型大學相對于公立研究型大學教師工資上漲的部分原因[8]。
學生的選拔性指標包含學生入學考試成績和原高中班級前10%新生比例2個二級指標,它們均受到了諸多批評。
入學考試成績對低收入和少數群體不公平。許多機構早在20世紀90年代早期就對這一指標不再作強制要求,另外,排名中強調的標準化測試成績可能對低收入和代表性不足的少數群體學生申請者不公平,各高校也希望在更廣泛的范圍內評判入學申請者,并鼓勵高中學生花時間準備測試之外的其他活動[8]。同樣,這些戰(zhàn)略性招生政策可能會傷害低收入申請者,他們在標準化考試中得分相對較低,并且經濟條件通常不允許他們提前招生[9]。標準化測試不能代表學生的整體質量,只根據排名作出的錄取決定沒有關注學生的整體素質[10],比如領導力這樣難以量化但已經被證明與學校成功有關的質量因素就沒有被考慮到[11]。
學生選拔性中包含的第二個指標是進入高中排名前10%的學生的比例,這一標準對那些在競爭激烈學校就讀的學生不利[6]。此外,除了少數地區(qū),許多高中不再對學生進行排名。根據2005年調查數據,康奈爾大學的新生中排名前10%的一年級新生占80%,但35%的康奈爾大學新生所在的高中沒有進行排名[8]。
財務資源指標衡量生均經費資源,占10%權重。生均經費資源是一項典型的高校投入指標,相關研究認為,投入指標對學生學習產生的作用是高等教育中最大的謎團之一。特倫齊尼(Terenzini)和帕斯卡雷拉(Pascarella)在控制了學生進入學校時的特征、能力、背景等因素之后發(fā)現(xiàn),學生的成長與這些投入指標之間沒有關系[12]。瑞恩(Ryan)的研究報告也指出,教學、學術支持和學生服務支出對于學生學習和發(fā)展密切相關的學生參與度沒有顯著影響[13]。除此之外,給學生帶來的經濟壓力是該指標的另一個問題。高校為了排名更靠前,不敢輕易降低每名學生的支出增長率,這不利于本科學費的減少。簡而言之,該排名鼓勵高校花更多錢,這對低收入家庭的學生不利[6]。
校友捐贈指標指校友的平均捐贈率,占5%權重。校友捐贈率是一項容易被操控的指標,越來越多的大學為了提高排名而操縱此項數據[14]。例如,南加利福尼亞大學沒有26%校友的聯(lián)系信息,因此便沒有將這部分計入報告的校友捐贈率。該校捐贈主管稱,學校的目標是提高捐贈率,而不是捐贈總額。研究者認為,為了提高排名而向每位校友索要1美元以提高捐贈率的做法是沒有意義的。
美新大學排名的指標體系始終在不斷變化和完善。自發(fā)布排名以來,指標系統(tǒng)出現(xiàn)了許多重要的轉折點。盡管如此,該排名仍然存在數據不準確、指標不全面、指標體系頻繁改變和權重任意分配等問題。
由于美新大學排名的公式是公開的,各高校能夠很容易地操縱他們的一些措施,以便在關鍵指標上獲得更高的分數,例如,入學選擇性、生均財務資源、全職教師工資等指標,排名數據的可靠性不夠。埃倫伯格(Ehrenberg)觀察到,為提高排名,康奈爾大學在計算校友捐贈比例之前清除未順利畢業(yè)的校友,這一變化提高了康奈爾的校友捐贈率,即使它與康奈爾大學的基本學術質量沒有關系[6]。
排名的巨大影響力和大學校長對排名的過度關注,使各高校很有可能通過操縱制度的各個方面來“操控數據”[15-16]。雖然大學校長公開宣稱美新大學排名不能充分衡量大學質量,但他們努力從幕后最優(yōu)化他們的排名[6]。比如在聲譽調查中,許多校長和教務長因不想參加“選美比賽”而拒絕填寫,但是其中一部分可能出于自身利益,故意將與他們關系密切的大學評價得非常差[6]。霍斯樂(Hossler)、波洛克(Pollock)和斯特克洛(Stecklow)提出,有證據表明大學提供了不準確的數據來提高排名,比如偽造考試成績和錄取數據等[17-19]。
大學排名經常因指標使用不完整而受詬病,諸多研究者對美新大學排名指標的全面性進行了研究。瓜里諾(Guarino)構建了貝葉斯?jié)撛谧兞磕P停l(fā)現(xiàn)學生擇校是衡量大學“質量”的主要指標[20]。美新大學排名對相關指標給予了一定重視,不過該排名對學業(yè)優(yōu)秀的學生群體(在該學者提出的模式中,該變量本身就是一個應該予以重視的潛在變量)和與之相關的其他質量指標不夠重視。韋伯斯特(Webster)采用主成分回歸分析法對大學排名11個指標的相關貢獻度進行了實證研究[1],發(fā)現(xiàn)11個指標之間存在嚴重的多重共線性。因此,在此基礎上賦予各指標的權重不能準確反映每個指標對排名的貢獻。
美新大學排名在20世紀90年代多次改變排名方法(指標或指標權重),即使高校教育質量沒有發(fā)生變化,學校的排名也會與之前不同。1998年之后,一級指標在一定時期內透明且相對穩(wěn)定,但這些指標的計算方法既不一貫,也不完全透明[21]。指標體系的頻繁改變和權重的隨意分配是兩個不可分割的問題,正如薩爾米(Salmi)和薩羅揚(Saroyan)在研究中指出的那樣,權重分配的主觀性和隨意性是該排名的根本缺陷[22]。在權重分配時,排名毫無理性地為了強調某些指標而賦予相應權重,而不是根據指標的重要性賦予權重[17]。在結果上,排名相差若干名的學校在各項數據的對比上也可能沒有顯著差異[20]。針對這個問題,埃倫伯格(Ehrenberg)也指出該排名方法的微小變化如何導致大學的排序發(fā)生重大變化,比如加利福尼亞理工學院從1998年的第9位躍升至1999年秋季美國新聞排名的第1位的主要原因就是排名計算方法的變化[23]。迪切夫(Dichev)進行時間序列數據的實證研究后發(fā)現(xiàn),隨著時間的推移,大學排名得分中只有10%的變化來自大學質量的變化,其余的變化主要是來自計算方式的變化[24]。
《美國新聞與世界報道》是世界規(guī)模最大的新聞雜志之一,是典型的商業(yè)機構。作為商業(yè)機構,該公司以營利為最終目標,但是當大學排名涉及商業(yè)利益時,可能會給消費者帶來像“商業(yè)廣告”一樣的誤導。國內學者李函穎和劉寶存指出該排名的商業(yè)化邏輯:大學排名作為一件商品,如果其連續(xù)兩年的排名結果完全保持不變,消費者就沒有購買的必要[2]。也就是說,如果排行榜的結果不發(fā)生變化,該排名的銷量就會急劇下降,這將帶來嚴重的經濟損失。埃倫伯格(Ehrenberg)意識到了同樣的問題,并指出這可能是該排名指標體系、指標權重或計算方法經常改變的內在原因[6]。
大學排名是否能夠真正反映各高校教育質量一直是研究者關心的問題。現(xiàn)有研究表明,美新大學排名和質量之間存在脫節(jié)。在方法上,該排名無法有效衡量各高校的質量。同時,排名行為本身擴大了學校之間微不足道的差異并創(chuàng)造以前根本不存在的差異,無法真正反映大學的質量[25]。許多實證研究支持了此觀點。14所公立研究型大學的全國學生參與度調查(NSSE)分數與該排名比較的數據發(fā)現(xiàn),排名標準與學生接受的教育質量關系不大[26];研究者對Wabash系統(tǒng)和該排名數據的分層線性模型發(fā)現(xiàn),排名并不能預測學生是否參與良好實踐[16]。克里斯托佛(Christopher)通過建立貝葉斯層次潛在特征模型,并使用包括美新排名在內的全球八個大學排名的數據,發(fā)現(xiàn)現(xiàn)有排名在測量大學質量上有很大誤差,排名100與排名30、排名300與排名250的大學在質量上很難區(qū)分。在這八個排名中,美新大學排名是最不準確的排名之一,這可能是因為使用了大量無關緊要的指標[27]。
高等教育的價值一直是高等教育界爭論不休的話題。高等教育發(fā)展離不開一定的價值導向,高等教育實踐也必須遵循一定的價值取向,并表現(xiàn)為一個價值實現(xiàn)的過程[28]。即便不爭論高等教育人才培養(yǎng)、科學研究與社會服務三大職能孰輕孰重,單純追求“排名靠前”不應該是一個高等教育機構的價值追求。
然而,在排名影響下,高校管理人員感受到了以排名為導向作出決策的壓力,而不是以質量為導向的趨勢[29],這就容易引發(fā)一系列不合理決策,比如,“通過經濟行為與排名公司搞好關系”“賄賂評估人員”“片面強調畢業(yè)率而忽視畢業(yè)生質量”“強制校友捐贈”,甚至數據造假。在排名影響下,學術機構紛紛試圖改變他們的行為以提升排名,其中一些行為可能在教育上有意義,其中一些可能在教育上沒有任何意義,甚至不符合國家的高等教育體系的整體利益[6]。
《美國新聞與世界報道》大學排名在美國和全世界的大學排行榜中有非常重要的地位,推動了世界上其他大學排名實踐和高等教育評估理論的發(fā)展,對學生及家長、高校、政府部門都有不可磨滅的影響。但不可忽視的是,該排行不是完美的,國內外研究者尤其是國外研究者指出了該排名存在的許多問題,涉及該排名的指標體系、數據來源、計算方法等方方面面。學生在使用時要理性對待,各國在借鑒時也要理性分析。

秦 云紋