施 亮
(河海大學(xué)圖書館 江蘇南京 210098)
高等院校肩負(fù)著人才培養(yǎng)、科研創(chuàng)新、社會(huì)服務(wù)和文化傳承等功能,而科研創(chuàng)新能力是衡量一所高校學(xué)術(shù)發(fā)展水平的重要標(biāo)志。我國(guó)于1995年提出“211工程”項(xiàng)目,到1999年,國(guó)務(wù)院批轉(zhuǎn)教育部《面向21世紀(jì)教育振興行動(dòng)計(jì)劃》,“985工程”正式啟動(dòng)建設(shè),20余年的時(shí)間里,我國(guó)的高等教育事業(yè)有了長(zhǎng)足進(jìn)步。隨著我國(guó)經(jīng)濟(jì)社會(huì)的高速發(fā)展,國(guó)家在原有“211工程”“985工程”等項(xiàng)目的基礎(chǔ)上,統(tǒng)籌規(guī)劃了建設(shè)世界一流大學(xué)和一流學(xué)科的新設(shè)想,進(jìn)一步明確了高等教育事業(yè)發(fā)展的新國(guó)家戰(zhàn)略,即“雙一流建設(shè)”,其中特別提出以國(guó)家重大需求為導(dǎo)向,提升高水平科學(xué)研究能力,為經(jīng)濟(jì)社會(huì)發(fā)展和國(guó)家戰(zhàn)略實(shí)施作出重要貢獻(xiàn)這一指導(dǎo)思想。
社會(huì)上眾多的信息評(píng)估機(jī)構(gòu)歷年來都會(huì)發(fā)布相關(guān)的大學(xué)排行榜,其中科研競(jìng)爭(zhēng)力水平占有著相當(dāng)大的權(quán)重,目前最具影響的包括中國(guó)管理科學(xué)研究院發(fā)布的《中國(guó)大學(xué)評(píng)價(jià)》,因課題組組長(zhǎng)為武書連,也簡(jiǎn)稱為《武書連中國(guó)大學(xué)排行榜》;深圳網(wǎng)大公司自1999年開始發(fā)布的中國(guó)大學(xué)排行榜,數(shù)據(jù)來自向院士、學(xué)者和校長(zhǎng)發(fā)放的調(diào)查問卷;基于人才培養(yǎng)、科學(xué)研究和社會(huì)服務(wù)三大職能的中國(guó)校友會(huì)網(wǎng)大學(xué)研究團(tuán)隊(duì)開展的中國(guó)大學(xué)評(píng)價(jià)。但對(duì)于科研發(fā)展的未來預(yù)測(cè),目前為止尚未出現(xiàn)大范圍的研究,究其原因在于少數(shù)據(jù)、貧信息的不確定性所造成的預(yù)測(cè)偏差。
學(xué)科服務(wù)作為圖書館深入學(xué)校教、學(xué)、研陣地的前沿服務(wù),為支撐學(xué)校學(xué)科建設(shè)提供了高效、快捷、準(zhǔn)確、精深的文獻(xiàn)資源保障體系。在此基礎(chǔ)上,圖書館可借用海量的科研評(píng)價(jià)文獻(xiàn)資源、高效的分析工具,為學(xué)校的各學(xué)科進(jìn)行競(jìng)爭(zhēng)力的分析與定位。本文先從宏觀的視野出發(fā),利用灰色預(yù)測(cè)理論,根據(jù)有限的原始數(shù)據(jù),定量預(yù)測(cè)高校未來科研整體競(jìng)爭(zhēng)力的變化趨勢(shì),在此基礎(chǔ)上借助弱化緩沖算子的作用,使預(yù)測(cè)的精度進(jìn)一步提高。本文將系統(tǒng)闡述GM(1,1)的改進(jìn)模型,并以《武書連中國(guó)大學(xué)排行榜》中科學(xué)研究指數(shù)為依據(jù),預(yù)測(cè)10所高水平大學(xué)未來的科研競(jìng)爭(zhēng)力水平。
現(xiàn)代預(yù)測(cè)學(xué)旨在控制系統(tǒng)的隨機(jī)性以及減少無知的程度,通過應(yīng)用相關(guān)的數(shù)學(xué)模型和程序,制定事物未來發(fā)展的可靠預(yù)測(cè),揭示過去發(fā)生事件的準(zhǔn)確結(jié)果[1]1。目前較為流行的數(shù)學(xué)預(yù)測(cè)模型包括微分方程預(yù)測(cè)、線性回歸預(yù)測(cè)、馬爾科夫鏈預(yù)測(cè)、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)、模糊預(yù)測(cè)和灰色預(yù)測(cè)等。
筆者以“高校科研”和“預(yù)測(cè)”為關(guān)鍵詞,在CNKI按主題共搜索出相關(guān)文獻(xiàn)30篇,其中直接相關(guān)文章共有4篇:李桂影、周琴的《高校科研競(jìng)爭(zhēng)力分析及學(xué)科發(fā)展預(yù)測(cè)——以西安交通大學(xué)為例》[2]通過計(jì)算學(xué)科比重Qj值預(yù)測(cè)該校未來學(xué)科發(fā)展趨勢(shì);董奮義、劉斌的《高校科技產(chǎn)出與投入的灰色關(guān)聯(lián)分析和趨勢(shì)預(yù)測(cè)》[3]和楊正亞、萬穎的《高校科技經(jīng)費(fèi)投入趨勢(shì)預(yù)測(cè)與比較研究》[4]盡管都應(yīng)用了GM(1,1)模型,但僅對(duì)單一的科研發(fā)展指標(biāo)進(jìn)行預(yù)測(cè),且預(yù)測(cè)精度仍有待提高。韋恒的《基于ESI的學(xué)科情報(bào)分析模型構(gòu)建與實(shí)證研究》[5]通過構(gòu)建基于ESI的學(xué)科情報(bào)分析模型研究江蘇高校分子生物學(xué)與遺傳學(xué)的發(fā)展水平。而本文將構(gòu)建4種弱化緩沖算子,分別作用于初始數(shù)據(jù)之上,能夠弱化、削弱沖擊擾動(dòng)帶來的初始數(shù)據(jù)失真,通過分析比較選擇模擬誤差最小的緩沖算子,再根據(jù)GM(1,1)模型構(gòu)建相應(yīng)的預(yù)測(cè)系統(tǒng)分析高校未來的科研競(jìng)爭(zhēng)力指數(shù)。
20世紀(jì)80年代,著名學(xué)者鄧聚龍教授在荷蘭期刊System & Control Letters上發(fā)表了題為“Control Problem of Grey System”的研究論文[6],正式標(biāo)志著灰色系統(tǒng)理論的創(chuàng)立。該理論認(rèn)為地球上的各種生態(tài)系統(tǒng)或社會(huì)系統(tǒng)都屬于灰色系統(tǒng),這類系統(tǒng)雖然有許多隨機(jī)現(xiàn)象的發(fā)生,但都是有序、有界且有一定規(guī)律的。而灰色預(yù)測(cè)理論就是針對(duì)這類灰色系統(tǒng)進(jìn)行預(yù)測(cè),其中最常用的是GM(1,1)預(yù)測(cè)模型[7],它是對(duì)于一個(gè)變量建立一階方程,而該方程同時(shí)兼具指數(shù)、差分、微分等數(shù)學(xué)性質(zhì)。
設(shè)X(0)= (x(0)(1),x(0)(2),…,x(0)(n)),X(1)= (x(1)(1),x(1)(2),…,x(1)(n)),Z(1)= (z(1)(2),z(1)(3),…,z(1)(n)),其中z(1)=(x(1)(k)+x(1)(k-1)),則稱x(0)(k)+az(1)(k)=b為GM(1,1)模型的基本形式。其中將參數(shù)-a稱為發(fā)展系數(shù),b稱為灰色作用量。
記X(1)為X(0)的即一次累加序列:滿足X(1)=(x(1)(1),x(1)(2),…,x(1)(n)),其中x(1)(k);記Z(1)為X(1)的緊鄰均值生成序列:滿足Z(1)= (Z(1)(2),z(1)(3),…,z(1)(n)),其中z(1)=(x(1)(k)+x(1)(k-1)),k=2,3,…,n,則GM(1,1)模型中[a, b]T=(BTB)-1BTY,

GM(1,1)模型的構(gòu)建過程可按照公式計(jì)算得到參數(shù)a,b,然后再代入時(shí)間響應(yīng)函數(shù),并還原原始數(shù)據(jù)序列模擬預(yù)測(cè)值。該結(jié)論有詳細(xì)的數(shù)學(xué)證明,這里就不一一敘述。
由于預(yù)測(cè)客觀上存在模擬誤差,可以通過求取模型的誤差精度來判斷該模型的適用性。通常的檢驗(yàn)方法有殘差檢驗(yàn)、后驗(yàn)差檢驗(yàn)和關(guān)聯(lián)度檢驗(yàn),這里只介紹殘差檢驗(yàn),這也是最常用的檢驗(yàn)方法之一。
設(shè)初始數(shù)據(jù)序列X(0)={x(0)(1),x(0)(2),…,x(0)(n)},模擬數(shù)據(jù),則殘差序列,其中(i=1,2,…,n)。計(jì)算相對(duì)誤差:平均相對(duì)誤差是GM(1,1)的模型精度。
通常認(rèn)為當(dāng)模型精度大于90%的時(shí)候,該預(yù)測(cè)模型建立的近似微分方程達(dá)到了較好的精度要求,非常接近真正的微分方程。
前文介紹了GM(1,1)模型的基本形式,簡(jiǎn)單來說就是通過計(jì)算時(shí)間響應(yīng)函數(shù)序列,可以模擬預(yù)測(cè)下一個(gè)時(shí)間點(diǎn)的數(shù)學(xué)指標(biāo),再通過模型精度檢驗(yàn),可以判定該模型的實(shí)際精度。但在實(shí)際操作過程中,由于初始數(shù)據(jù)的沖擊擾動(dòng),為模型的預(yù)測(cè)帶來了很大的誤差。為解決這一問題,很多學(xué)者提出消除初始數(shù)據(jù)沖擊擾動(dòng)的方法,即構(gòu)造弱化緩沖算子[8]。本篇將列舉4種弱化緩沖算子的構(gòu)造方式[1]17-25,結(jié)果表明,弱化緩沖算子均能弱化或削弱沖擊擾動(dòng)帶來的數(shù)據(jù)失真現(xiàn)象,提高模型精度。
設(shè)X=(x(1),x(2),…,x(n))為系統(tǒng)的初始數(shù)據(jù)序列,且x(i)> 0,(i=1,2,…,n);令緩沖序列XD1=(x(1)d1,x(2)d1,…,x(n)d1),XD2=(x(1)d2,x(2)d2,…,x(n)d2),XD3=(x(1)d3,x(2)d3,…,x(n)d3),XD4= (x(1)d4,x(2)d4,…,x(n)d4),則四類弱化緩沖算子的構(gòu)造如下。
第一類弱化緩沖算子:

第二類弱化緩沖算子:

第三類弱化緩沖算子:

第四類弱化緩沖算子:

根據(jù)公開發(fā)表的《武書連中國(guó)大學(xué)排行榜》中關(guān)于高校科研競(jìng)爭(zhēng)力指數(shù)的相關(guān)評(píng)估,本文截取2012—2018年共7年間排名前10的高水平大學(xué)的數(shù)據(jù)進(jìn)行分析預(yù)測(cè),其數(shù)據(jù)統(tǒng)計(jì)結(jié)果如表1所示。

表1 2012—2018年排名前10的高校科研競(jìng)爭(zhēng)力指數(shù)
以北京大學(xué)為例,令初始數(shù)據(jù)X(0)=(114.29,110.76,114.84,113.55,123.06,75.97),根據(jù)GM(1,1)原始模型,計(jì)算得出時(shí)間響應(yīng)序列為:

通過該模型還原初始數(shù)據(jù)X(0),得到的模擬數(shù)據(jù)為:
對(duì)該模型進(jìn)行殘差檢驗(yàn),并與初始數(shù)據(jù)進(jìn)行比較,計(jì)算殘差及相對(duì)誤差,結(jié)果如表2所示。

表2 傳統(tǒng)GM(1,1)模型的殘差檢驗(yàn)結(jié)果
模型精度檢驗(yàn)結(jié)果高于90%的標(biāo)準(zhǔn)線,但初始數(shù)據(jù)的沖擊擾動(dòng)確實(shí)為建模帶來了很大的影響。雖然武書連的高校科研發(fā)展指數(shù)的評(píng)估并未公開其標(biāo)準(zhǔn)和方式,但從這10所高校科研發(fā)展指數(shù)的變化可以看出,在2012—2015年期間,各高校的變化基本是在可預(yù)計(jì)的范圍內(nèi)波動(dòng),但2016年評(píng)估數(shù)值整體增大明顯,而2017—2018年的評(píng)估數(shù)值突然又出現(xiàn)很大幅度的整體降低。可見在評(píng)估過程中,評(píng)估的權(quán)重分配、數(shù)據(jù)來源、建模方式發(fā)生過變化,這對(duì)于預(yù)測(cè)勢(shì)必帶來很大的干擾。若加入弱化緩沖算子的作用,或許能一定程度上弱化干擾帶來的預(yù)測(cè)失真,以下仍以北京大學(xué)為例,用4種弱化緩沖算子對(duì)初始數(shù)據(jù)進(jìn)行操作,研究其模擬變化與模型精度,進(jìn)而再推廣至10所高校,預(yù)測(cè)其未來發(fā)展趨勢(shì)。
經(jīng)弱化緩沖算子D1,D2,D3,D4作用后的弱化緩沖序列分別為XD1,XD2,XD3,XD4,通過MATLAB計(jì)算結(jié)果如表3所示。

表3 4種弱化緩沖算子作用下的模擬數(shù)據(jù)
將表3的數(shù)據(jù)通過折線圖的方式直觀表現(xiàn)出來,可知4種弱化緩沖算子均是以2018年數(shù)據(jù)為基準(zhǔn),通過修復(fù)往年的數(shù)據(jù),使之振動(dòng)幅度趨于緩和(見圖1)。

圖1 4種弱化緩沖算子作用下模擬數(shù)據(jù)與原始數(shù)據(jù)折線圖
接下來以XD1,XD2,XD3,XD4緩沖序列為初始序列,建立相應(yīng)的GM(1,1)模型,再計(jì)算時(shí)間響應(yīng)函數(shù)模擬2012—2018年的科研指數(shù)(見表4),選擇與2018年科研指數(shù)誤差最小的弱化緩沖算子。

表4 4種弱化緩沖算子作用下的模擬數(shù)據(jù)
2018年北京大學(xué)的科研競(jìng)爭(zhēng)力實(shí)際指數(shù)是66.89,通過表4計(jì)算平均相對(duì)誤差可知:XD1的平均相對(duì)誤差為7.00%;XD2的平均相對(duì)誤差為12.23%;XD3的平均相對(duì)誤差為4.26%;XD4的平均相對(duì)誤差為7.18%。數(shù)據(jù)結(jié)果表明,XD3模擬誤差是最小的,基本接近于實(shí)際數(shù)值,可見其確實(shí)能弱化沖擊帶來的數(shù)據(jù)干擾,提高模擬精度。以下將以XD3的構(gòu)造方式處理10所高校的初始數(shù)據(jù),而后采用GM(1,1)模型預(yù)測(cè)其2019—2021年的科研競(jìng)爭(zhēng)力指數(shù)和變化趨勢(shì),如表5所示。

表5 2019—2021年排名前10的高校科研競(jìng)爭(zhēng)力指數(shù)預(yù)測(cè)
結(jié)合表1和表5可知,10所高校的科研競(jìng)爭(zhēng)力大致可以分成4個(gè)檔次:第一檔高校由北京大學(xué)、清華大學(xué)、浙江大學(xué)組成,2012—2016年這3所高校的排名順序依次為浙江大學(xué)、北京大學(xué)、清華大學(xué)。從2017年開始,清華大學(xué)上升至第一,并將保持至2019年,2020年浙江大學(xué)重新回到第一,清華大學(xué)次之、北京大學(xué)第三,2021年浙江大學(xué)保持不變,北京大學(xué)將超越清華大學(xué)排名第二。第二檔高校由上海交通大學(xué)、復(fù)旦大學(xué)和南京大學(xué)組成,這3所高校的科研競(jìng)爭(zhēng)力排名維持不變,但從數(shù)據(jù)上可以看出復(fù)旦大學(xué)和上海交通大學(xué)的差距將逐步縮小,而南京大學(xué)的發(fā)展相之這兩所高校有所緩慢,差距有增大的趨勢(shì)。第三檔高校由華中科技大學(xué)和武漢大學(xué)組成,雖然排名相對(duì)穩(wěn)定,但武漢大學(xué)的發(fā)展速度較華中科技大學(xué)有所加快。第四檔高校由中國(guó)科學(xué)技術(shù)大學(xué)和西安交通大學(xué)組成,從2017年開始,兩校排名更替,這一情況將延續(xù)至2021年,但差距將逐步縮小,西安交通大學(xué)未來大有趕超的趨勢(shì)。
改進(jìn)的GM(1,1)預(yù)測(cè)模型區(qū)別于普通的評(píng)估體系,它是對(duì)未來發(fā)展趨勢(shì)的定性計(jì)量,而弱化緩沖算子的介入,進(jìn)一步提高了預(yù)測(cè)的精準(zhǔn)度,事實(shí)證明該模型在科研發(fā)展的預(yù)測(cè)領(lǐng)域具有有效的應(yīng)用價(jià)值,對(duì)于高校在師資培養(yǎng)、人才建設(shè)、學(xué)科布局、資源投入等方面具有一定的前瞻性、指導(dǎo)性作用。另一方面,在大數(shù)據(jù)時(shí)代,各高校可以以預(yù)測(cè)模型為基礎(chǔ),聯(lián)合圖書館、科技處、各學(xué)院等多部門之力,通過抓取有效的基礎(chǔ)數(shù)據(jù),適當(dāng)改良,建立適合本校實(shí)際發(fā)展的一整套預(yù)測(cè)體系,為高校事業(yè)的未來規(guī)劃提供理論依據(jù)。