999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于熵值修正PLS權重的圖書情報領域作者影響力綜合評價研究

2019-02-18 02:10:08
圖書館研究與工作 2019年2期
關鍵詞:評價模型

(達州圖書館 四川達州 635000)

科研人員學術影響力的評價問題一直是國內外學者關注的重要問題,其評價結果對識別領域內核心作者具有重要意義。Hirsch教授結合“質”和“量”提出h指數,受到廣泛的認可與應用[1]。隨著對h指數的研究逐漸加深,國內外學者又提出諸多h指數衍生指數以期實現更為精準的學者評價。在指標選取上,基于作者合作的hm指數[2]、hp指數[3]、GN-C指數[4]等;考慮高被引論文的g指數[5]、R指數[6]等;時間維度的AR指數[6]、s指數[7]等。在研究方法上,利用灰色關聯法綜合時間、合作、期刊影響因子等分析作者影響力[8];基于特征因子算法對作者引用網絡分析量化作者影響力[9];采用知識關聯網絡從評價內容、指標與流程維度評估作者影響力[10];基于DEA和AHP方法對科研人員績效進行評價等[11]。可以發現,上述大多數研究主要針對一個或多個變量,研究方法也較為陳舊。此外,由于領域作者影響力量化的復雜性,單一評估指標所蘊含的信息量有限,導致評價結果存在片面和局限。某位作者的學術影響力是多重指標綜合而成的結果,因而需要一種綜合的多屬性評價工具。

結合以上討論,本文嘗試性將偏最小二乘法(partial least squares,PLS)方法運用到領域作者影響力量化中。在利用PLS模型確定評價指標外部權重系數基礎上,利用熵值法對權重系數進行修正以避免決策者的主觀判斷而導致權重偏倚。隨后,在確定參數指標最終權重基礎上,利用圖書情報作者數據進行實證分析。最后,詳細討論基于熵值修正PLS模型計算結果與h指數、g指數在作者名次變化穩定性和作者區分性,以探討將熵值法、PLS方法綜合應用于科研人員影響力評估的可行性。

1 領域作者影響力評估指標選取

1.1 影響力指標確定

h指數結合了作者發文的“質”(論文被引頻次)和“量”(論文數量),是目前評價作者學術影響力的經典指數[1]。作為h型指數之一,g指數重點考慮了高被引文獻作用,其合理性與接受程度僅次于h指數[5]。對科研人員學術成就的影響因素分析、整合,本文選取了h指數、g指數、總被引頻次、篇均被引頻次、高被引論文數等14個指標作為本研究構建的模型觀測變量,具體如表1所示。

借鑒黃賀方以及王妍的相關研究[12-13],本文將14個影響力指標分為以下三類:論文數量、高被引論文數量等指標構成的產出指標;h指數、g指數等指標組成的引文指標;總下載量、篇均下載量等指標組成的傳播指標(見表1)。

表1 領域作者影響力評估指標

1.2 數據來源與標準化

本文以中國知網為數據唯一來源,檢索過程中以學科為“圖書情報與數字圖書館”,來源類別設定為“全部期刊”,時間范圍設定為“截至2016年12月31日”,40位作者的題錄數據全部以Excel表格單獨保存,具體包括題名、下載次數、被引次數、時間以及作者等。

由于部分指標數值較大(總被引頻次、總下載量等),與h指數等指標相差非常懸殊。因此,為避免指標差距過大造成的結果偏頗,本文對上述指標進行0-1的標準化處理,見公式(1)。其中,zj是評價指標j的初始數值,max(zj)是數據集中的最大值,min(zj)是數據集中的最小值,yj是評價指標j標準化后的數值。

2 領域作者影響力PLS模型構建

2.1 初始模型構建及指標篩選

基于以上討論,本研究構建了科研人員學術影響力評價的PLS模型(見圖1)。在PLS模型中,以“產出指標、引文指標、傳播指標”作為潛在觀測變量,以“綜合影響力”為外部潛變觀測量。根據Wetzels M等提出的復合結構方程模型[14],本文的“綜合影響力”通過潛在觀測變量間接實現度量。

圖1 科研人員影響力評價初始及修正模型

由于PLS方法適合小樣本量的數據分析、不要求數據服從正態分布、融合多種統計學數學分析方法、可對評價指標進行篩選[15-16]等優點,所以本研究采用PLS方法構建科研人員影響力評價模型。

本研究利用smart-PLS 2.0軟件中的迭代抽樣方法分別計算了評價指標的T值,設置迭代次數為2 000,計算發現指標“篇均下載量”對綜合影響力的顯著性T值小于1.96的閾值,說明篇均下載量不能有效解釋綜合影響力,因而刪除該指標。最終,本文確定領域作者影響力評價體系由產出指標4個因素、引文指標5個因素和傳播指標4個因素組成。

2.2 影響力評價模型有效性檢驗

本文從內容有效性、內容一致性、內容區分性以及模型適配度4個方面檢驗領域作者影響力模型是否有效。

(1)有效性維度上,本文選取的科研人員影響力指標充分借鑒已有成果,且通過PLS模型修正,可以認為評估指標滿足內容有效性要求[17]。

(2)一致性維度上,本文選取組合信度(CR,composite reliability)、克朗巴哈系數(Cronbach's alpha)、平均方差提取率(AVE,average variance extracted)、因子共同度(communality)4個指標來評估領域作者影響力模型的有效性。結合表2,4個變量指標的CR和Cronbach's alpha全部大于0.85,且產出指標、傳播指標、引文指標、綜合影響力的AVE都大于0.6,說明本文構建的模型具有良好的一致性。因子共同度(communality)是衡量潛在變量對度量變量的反映效果。結合表2,4個潛在變量的因子共同度均大于0.6。

表2 評價模型相關參數值

(3)內部區分性維度上,潛在變量的AVE平方根要大于0.5,且同時要大于該變量與其他變量之間的AVE平方根。從表3可知,除綜合影響力外,其他3個指標的值都大于各自與其他潛變量的相關系數。因此,4個變量的內部獨立性較好,且變量之間具有明顯的區分性。

(4)模型適配度方面,本文選取GoF值來衡量整體模型的預測效用和結構模式,見公式(2)。一般認為,GoF值為0.1、0.25、0.36是模型適配度低、中、高的閾值[14]。根據公式(2),計算可知本文作者影響力PLS模型適配度為0.435的強適配度。因此,本文構建的PLS模型適配度較強,可以實現較準確的科研人員評價。

表3 AVE平方根

利用smart-PLS 2.0軟件計算各指標之間的相關系數、顯著性值,見圖1及表4。產出指標的路徑系數及顯著性T值為0.396(T=8.208),引文指標為0.401(T=6.113)、傳播指標為0.339(T=18.859),全部在0.001閾值下正相關,其中引文指標對領域作者影響力的貢獻度最高。

表4 科研人員學術影響力評價參數值

從表4數據可知,產出指標與論文數量的相關性最強(0.973),相關性大于0.9的還有論文數量、核心論文數等指標。引文指標與參數g指數的權重系數最強(0.989),與篇均被引頻次的相關關系最弱(0.760)。傳播指標與最高下載量的權重系數最弱(0.634),與總下載量、合作者數量和被引成果數的相關系數都大于0.85,與總下載量的相關系數最強(0.965)。綜合影響力與總被引頻次、總下載量的路徑系數最高(都為0.938),與篇均被引頻次的相關系數最低(0.332)。綜合影響力與總被引頻次、總下載量的外部權重最大(0.119),與篇均被引頻次的系數最小(0.042)。

2.3 基于熵值修正PLS指標權重

“熵”的概念來自于熱力學,是評估系統狀態不確定性的一種指標。在信息論理論中,信息是衡量系統有序程度的一種指標,而“熵”是衡量系統無序程度的一種指標,二者之間是一種符號相反但絕對值相等的關系[18]。根據此性質,可以通過備選方案提供的固有數據信息,通過熵值法計算各評估指標的信息熵。信息熵越小,說明信息的無序程度越低,其信息的效用價值越大,進一步表明指標的權重就越大。

熵值法的最大優點在于直接根據原始決策數據所給出的信息來計算評估指標相對重要性權重,避免了因引入決策者的主觀判斷而導致的權重偏倚。基于此,本文利用熵值法計算差異系數對PLS模型確定的外部權重系數進行修正,具體步驟簡述如下:

步驟1,計算評估對象i在評價維度j下的權重值比重 pij:

在此基礎上得到各維度數據的歸一化矩陣P={pij}。

步驟2,計算維度j所對應的熵值ej:

其中,常數K與被評估的對象數量n有關。由于本文共量化評估40位作者的影響力,故而n=40,K=1/ln(40)=0.2711。

步驟3,計算維度j的差異系數dj。對于第j項評價維度而言,如果該指標的差異系數d越大,則表示該維度的重要性越大,則該維度所對應的熵值就越小。定義差異系數 dj的計算公式如下:

步驟4,確定維度j的指標權重wj,用差異系數dj對PLS模型確定的外部權重pj進行修正:

通過熵值法對PLS模型確定的13個指標權重的修正,計算結果見表5。根據表5可知,修正后的13個指標中,第一作者論文數量對領域作者影響力的權重系數最大,為0.138,緊隨其后的是總被引頻次,達到0.134;其余依次為總下載量(0.114)、最高下載量(0.088)、最高被引頻次(0.087)、核心論文數量(0.072)、合作者數量(0.069)、被引用成果數(0.068)、高被引論文數(0.065)、論文數量(0.064)、g指數(0.037)、篇均被引頻次(0.033)、h指數(0.031)。熵值法修正之后,第一作者論文數量、總被引頻次和總下載量是對領域作者影響力貢獻度最高的3個指標,g指數、篇均被引頻次和h指數是權重系數最小的3個指標。

表5 熵值法修正后領域作者綜合影響力權重系數wj

2.4 領域作者影響力結果比較分析

本文認為,衡量評價指數或模型的有效性主要體現在以下方面:(1)與以往評價指數或模型相比較,核心作者位次波動應在合理范圍內;(2)名次相同的作者占比少,能夠有效區分作者的影響力。

2.4.1 比較1:作者名次變化穩定性

根據修正PLS模型確定的13個觀測變量對綜合影響力的外部權重,筆者計算了40位作者的綜合影響力。為詳細討論修正PLS模型確定的領域作者影響力與h指數、g指數的評價異同點,本文分別繪制了40位作者的h指數、g指數和PLS名次圖,見圖2和圖3。可以看出,因為存在部分作者的h指數和g指數數值相同,h指數和g指數均呈現出階梯狀分布,說明僅僅利用h指數和g指數是無法進一步區分數值相同作者的影響力。反之,基于熵值修正的PLS模型可以得到數值完全不相同的學者影響力排名。

此外,本文進一步統計了40位作者的h指數、g指數與PLS模型的排名名次之差(變化1為h指數排名減PLS排名,變化2為g指數排名減PLS排名),正值表示PLS名次排名靠前,負值說明PLS名次排名靠后,見圖3。

圖2 h指數、g指數排名情況

圖3 PLS排名、排名變化情況

從表6可以看出,編號1的作者(邱均平)、編號3的作者(柯平),以及編號9的作者(范并思)從h指數和g指數來看,都在40位作者中排名靠前。三位作者的PLS影響力排名分別位列前3,這說明他們的科研成果影響力較高,得到研究領域內作者的高度認可(文獻被引用多),因此屬于領域內核心作者。

編號22的作者(朱慶華),雖然其h指數和g指數的排名較為靠后,但PLS影響力排名卻位列第8。分析原因可能是:①最高被引頻次較高,共被引260次,40位作者中排名第9;②總下載量較多,達到60 976次,40位作者中排名第9;③核心論文數量多,77篇論文中有72篇屬于核心論文。這說明本文提出的領域作者影響力評估指標具有一定的有效性,能識別出雖然h指數和g指數較低但影響力較高的作者。

表6 h指數、PLS數值和g指數排名及作者編號(以h指數降序排列)

編號23的作者(李國新),雖然其h指數和g指數排名較為靠前,但其PLS影響力排名卻位列第22位,下降幅度非常明顯。分析可知,雖然編號23號學者的第一作者論文數量可觀,但是其總被引頻次、總下載量等指標落后于很多h指數和g指數比其低的作者,因而導致其排名發生明顯變化。

此外,本文對40位作者的名次變化情況進行描述性統計分析,以更深入地揭示PLS模型計算的學者影響力名次變化的穩定與波動情況(見表7)。

表7 40位作者名次變化描述性統計結果

根據圖3以及表7詳細分析可知,40位作者的PLS名次相比于h指數和g指數分別平均微跌0.85位和0.53位,標準差(9.93/9.97)和方差(98.69/99.49)較大,整體數據的變化較為顯著。01-10區間作者的排名分別上升5.3、5.9個排名,標準差(7.92/7.43)和方差(62.68/55.21)處于3個分段中的最小值,說明利用修正PLS模型的計算結果領域內核心作者名次變化較為穩定。11-30區間作者的名次分別微跌0.65和上升0.05個名次。與h指數相比,修正PLS模型的作者名次標準差(9.63)和方差(92.77)在三個分段中最大,說明該階段的名次變化最為突出,最大值和最小值相差38位之多。與g指數相比,修正PLS模型的作者名次標準差(8.76)和方差(76.68)一般。31-40區間作者的名次平均下降7.4位和8.1位,作者名次標準差(8.91/10.18)和方差(79.38/103.66)都較大,說明該階段的作者名次變化明顯,通過h指數和g指數排名靠后的學者名次上升明顯,原因可能是修正PLS模型盡可能多地將影響作者學術成就的因素納入到計算范疇。

2.4.2 比較2:作者影響力區分度分析

h指數和g指數在評估領域作者影響力時,統計發現h指數共有11組31位作者數值相同,占作者總人數的77.50%;g指數共有10組24位作者數值相等,占作者總人數的60.00%。可以發現,僅僅依靠h指數和g指數無法精確區分作者之間的學術影響力。

進一步分析可知,h指數和g指數相同的作者影響力,通過修正PLS模型計算的40位科研人員綜合影響力不存在相同的情況:編號3的作者(柯平)和編號23的作者(李國新)兩位學者的h指數都為28,而通過熵值修正PLS模型計算出結果并非相同:編號3作者綜合影響力為12 213.94,編號23作者僅為4 905.05,原因可能是李國新作者除篇均被引頻次上略高于編號3作者之外,其余12個指標全部低于后者,尤其是在總下載量上,二者相差60 000多次。類似的情況還有編號21和編號25等。

編號5的作者(鄭建明)和編號28的作者(王子舟)兩位學者的g指數都為35,且編號28的作者h指數(h指數為22)要高于編號5的作者(h指數為17),基于熵值法修正PLS模型計算出的綜合影響力上,編號5作者要領先于編號28的學者,主要原因是其在論文數量、核心論文數量、總被引頻次、最高被引頻次、總下載量、最高下載量和被引用成果數指標上領先編號28作者較多。類似的情況還有編號20和編號38、編號27和編號34等。

總體來看,在11組31位作者h指數相同和10組24位作者g指數相同的情況下,修正PLS模型計算出的綜合影響力能夠百分之百地區分h指數和g指數相同作者的影響力大小,區分效果非常突出。

3 結語

為精準評價科研人員影響力的研究,本文基于熵值法、PLS模型對領域內作者影響力進行綜合量化評價。在確定產出指標、傳播指標和引文指標三個一級維度,以及h指數、g指數、總被引頻次等二級指標基礎上,借助smart-PLS軟件構建并修正作者影響力評估的度量模型,計算發現總被引頻次、總下載量和被引用成果數對作者影響力貢獻度最高。隨后,利用熵值法計算差異系數對PLS模型確定的外部權重系數進行調整,確定評估指標的最終權重,發現第一作者論文數量、總被引頻次和總下載量權重較高。最后,通過對圖書情報領域40位作者的實證分析,將熵值修正PLS模型方法計算的領域作者影響力與h指數、g指數從名次變化穩定性和區分性兩個角度進行詳細比較,分析發現熵值修正PLS模型方法在名次變化較為明顯,對h指數和g指數相同的作者區分性達到100%。綜上所述,將熵值法、PLS方法綜合運用于領域作者影響力計算上具有一定可行性。

然而,本文仍然存在以下幾點不足:①由于《情報學報》記錄的缺失,導致40位作者的數據記錄存在不完整性,實際結果可能存在一定出入。②熵值修正PLS模型僅僅以圖書情報領域40位作者為實證對象,樣本的研究領域與范圍仍需要進一步擴大。③替代計量學方興未艾,論文的評論、轉發與分享數等“社會影響力”指標未曾在評估指標中涉及。

猜你喜歡
評價模型
一半模型
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
中藥治療室性早搏系統評價再評價
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
基于Moodle的學習評價
關于項目后評價中“專項”后評價的探討
保加利亞轉軌20年評價
主站蜘蛛池模板: 国产自在线拍| 亚洲第一区精品日韩在线播放| 免费三A级毛片视频| 欧美视频免费一区二区三区 | 精品91在线| 无码福利日韩神码福利片| 国产熟女一级毛片| 国产美女无遮挡免费视频网站| 香蕉综合在线视频91| 日本91视频| 无码高清专区| 91美女视频在线观看| 亚洲国产成人精品一二区| 久久黄色毛片| 亚洲九九视频| 免费大黄网站在线观看| 久久久久国产一级毛片高清板| 噜噜噜久久| 国产乱论视频| 精品福利网| 欧美国产三级| 欧美啪啪一区| 四虎永久在线精品国产免费| 国产18页| 国产亚洲成AⅤ人片在线观看| 伊人久久婷婷五月综合97色| 波多野结衣一区二区三区AV| 欧洲欧美人成免费全部视频| 91国内视频在线观看| 伊在人亚洲香蕉精品播放| 91精品国产丝袜| 亚洲精品无码久久毛片波多野吉| 91精品国产一区自在线拍| 色成人亚洲| 久久精品人妻中文视频| 亚洲天堂日韩在线| 日韩精品一区二区三区大桥未久| 免费看av在线网站网址| 国产精品太粉嫩高中在线观看| 国产欧美日本在线观看| 韩日午夜在线资源一区二区| 中文字幕亚洲综久久2021| 国产一区三区二区中文在线| 亚洲天堂伊人| 精品人妻无码中字系列| 国产精品久线在线观看| 国模粉嫩小泬视频在线观看| 国产麻豆精品久久一二三| 91在线无码精品秘九色APP| 午夜限制老子影院888| 日韩精品中文字幕一区三区| 亚洲人成影院在线观看| 国产原创演绎剧情有字幕的| 亚洲高清在线播放| 无码精品国产VA在线观看DVD| 亚洲黄网在线| 国产综合另类小说色区色噜噜| 中文国产成人精品久久| 日本成人在线不卡视频| 日本亚洲成高清一区二区三区| 欧美劲爆第一页| 激情综合网激情综合| 国产在线精彩视频二区| 一边摸一边做爽的视频17国产| 国禁国产you女视频网站| 一级毛片在线免费视频| 欧美午夜视频在线| 国产成人久久综合一区| 91精品啪在线观看国产60岁| 久久大香香蕉国产免费网站| a级毛片免费网站| 丝袜亚洲综合| 四虎影视国产精品| 日韩精品久久久久久久电影蜜臀| 日韩福利视频导航| 91免费在线看| 久久美女精品| 日韩国产黄色网站| 亚洲经典在线中文字幕| 国产精品永久在线| 精品午夜国产福利观看| 美女潮喷出白浆在线观看视频|