王蕊 劉永
摘? 要:本文通過對本學科領域關于用戶畫像分析研究成果的梳理,提出了期刊畫像分析方法。進而,選取檔案學類核心期刊論文作者機構、所在地區、基金論文、被引頻次等指標,進行了機構地區基金分布畫像、高產高被引期刊作者畫像和《檔案管理》作者跨刊發文畫像并根據畫像特征進行了比較分析,據此提出了期刊發展的建議。
關鍵詞:《檔案管理》;用戶畫像;期刊畫像;關鍵詞云;比較分析
Abstract: This paper presents a method for analyzing the portraits of journals in this subject area. Furthermore, the authors of the core journals of archival sciences, geographical location, fund papers, citation frequency and other indicators were selected, and the portraits of the regional fund distribution, the portraits of the high-yield and high-cited journal authors, and the authors of the Archives Management were published. According to the characteristics of the portraits, a comparative analysis was made, and the recommendations for the development of the journals were put forward accordingly.
Keywords: Archives Management; User portrait; Journal portrait; Keyword cloud; Comparative analysis
本文從文獻計量視角,按照文獻計量原理,運用關鍵詞云技術提出《檔案管理》期刊畫像思路,通過指標和數據實例與檔案學類核心期刊畫像進行比較分析,總結期刊優劣勢特征并對期刊發展提出建設性意見。
在圖書情報與檔案領域,利用用戶畫像方法來推行精準服務成為熱點研究問題。如袁軍[1]探討了用戶畫像方法在圖書館閱讀推廣和讀者管理等方面可能的應用。梁榮賢[2]探討了圖書館用戶畫像的基本概念及其發展狀況。都藍[3]則利用用戶畫像方法分析了圖書館收集的閱讀數據,以提升閱讀推廣服務能力。用戶畫像的一般過程可以總結為用戶數據整合、數據關聯、建立標簽體系和用戶畫像框架模型的構建等。
學術期刊是科研成果的載體與交流平臺,同一學科內,不同期刊的辦刊宗旨也有差異,這種差異反映在期刊所發表的論文中。期刊論文一般包括標題、作者、作者所屬機構、摘要、關鍵詞、中圖分類號、正文、參考文獻等結構化信息。如果把期刊比作用戶,把論文比作期刊對作者成果的使用,則可以利用這些結構化信息,運用畫像技術描繪期刊特征進行分析。
本文基于用戶畫像技術,提出期刊畫像方法,并以《檔案管理》及本領域核心期刊所刊載論文的結構化信息為分析對象,進行實例分析。具體方法是根據文獻計量理論,作者機構、所在地區和基金論文能在一定程度上體現期刊在核心期刊方陣中的地位和在本專業領域的學術影響及社會影響。同時,論文的被引次數是衡量學術論文影響力和質量的標尺,也是評價文獻影響力的重要指標。通過知網[4]數字資源庫進行檢索并整理檔案學類核心期刊論文作者機構、所在地區、基金論文、被引頻次等指標,運用關鍵詞云技術對期刊進行畫像特征分析和提出發展對策與建議。
本文數據全部來自中國知網期刊論文全文數字資源庫。檢索方式為期刊精確檢索,時間范圍的確定按照核心期刊評估周期適當延長至2019年,確定2014年5月1日到2019年5月1日時間段,按期刊名稱檢索全部文獻。
在檢索結果中,對作者所屬機構進行歸一化處理,即同一機構不同部門(非獨立法人),如高校的院系、附屬醫院等,都統一歸集到所屬單位名稱下,不做區分。行業按照高校、醫院(高校附屬醫院歸集到高校)、文化(廣播、出版社、電視臺)、企業、研究所(企業所屬研究所歸集到企業)、軍隊、政府機構(含政府屬具有社會管理功能的事業單位,如檔案館、圖書館等)進行分類,提取獨立機構的名稱。
同時,針對作者發文量、作者跨刊發文量、作者論文被引頻次、期刊論文被引頻次等指標分別進行期刊畫像,刻畫《檔案管理》高產作者、高被引作者和跨刊發文作者等特征并進行直觀分析。
3.1 機構地區基金分布畫像。根據上述數據收集和處理方法,結果為352個機構分布在全國28個省、自治區、直轄市(軍隊單位不包括在內),8個高校、政府機構、企業,涉及10類基金項目。利用關鍵詞云方法,對上述數據進行標準化處理并畫像,結果如圖1、圖2所示。
機構類型-地區-基金分布畫像顯示,“河南”“高校”“政府機構”關鍵詞最為突出,其次是國家社會科學基金;再次是企業、醫院、研究所、河南省軟科技計劃基金資助論文數量占一定比例。這些特征反映了《檔案管理》立足地方,服務全國的學術定位。進一步按機構分布畫像,從圖2可以看出高校類占據了全部數量的絕大多數,其中鄭州大學、上海大學這兩個關鍵詞最突出,其次是濮陽市檔案局。


機構基金分布反映《檔案管理》作者的主要單位,多位來自高校和行政機關,這樣的核心作者團隊有利于檔案的理論研究與檔案工作實踐相互融合。由于國家層面基金的資助種類較少,須強化學術共同體協同,注重作者機構和地區的平衡,加大對基礎研究的支持力度,提高基金論文,尤其是國家級高水平基金論文的錄用比例,以激勵更多的學術成果產出。
3.2 高產高被引期刊作者畫像。在數字資源庫中檢索,得到檔案學類核心期刊高產高被引作者相關數據。限于篇幅,不再進行數據列表,僅就畫像分析作以說明。畫像結果如圖3、圖4、圖5所示。
圖3顯示,在8個檔案學類核心期刊中,中國檔案、檔案管理、檔案學研究這三個期刊發文量較大、較為突出。圖中作者姓名字體大小差別不大,說明這些高產作者在各個期刊發表論文的數量較為均衡。檔案學類核心期刊高產作者也是《檔案管理》的潛在作者,如加強聯系和互動,可進一步提高稿件的數量與質量。
圖4顯示,期刊引文畫像清楚顯示檔案管理在整個檔案學類核心期刊中的位置,即近5年檔案學類核心期刊中高被引的期刊主要集中于檔案學通訊和檔案學研究兩個期刊,其他期刊的引文數量比較接近,說明《檔案管理》在期刊引文量上還有提升空間。



圖5顯示,近5年《檔案管理》的高被引作者是劉東斌、吳雁平、陳忠海,其次是丁華東、傅榮校等,其他的作者被引量差別較小。《檔案管理》高被引作者是刊物的核心作者,重點關注并針對核心作者采取積極有效的激勵措施,可促進更高質量論文的產出。
3.3 《檔案管理》作者跨刊發文畫像。跨刊發文能夠在一定程度上反映作者學術創新的跨界能力。高產高被引期刊作者畫像分析得出了期刊和作者發文數量和質量特征,據此還可以分析作者跨刊發文活躍情況,以判斷期刊吸引作者向本刊投稿的可能性。通過數據檢索并畫像,得到跨檔案學類核心期刊發文的活躍作者畫像結果,如圖6、圖7所示。

圖6顯示,《檔案管理》作者群中跨刊發表論文情況數量不多。圖7顯示,將各個期刊歸類之后,有少量作者存在跨檔案學類核心期刊、非檔案學類期刊、檔案學類非核心期刊發文現象,跨刊發文活躍程度不是很高,但這是刊物作者群中的重要力量,反映每個期刊都有自己的核心作者群,期刊之間聯系與合作還存在薄弱環節。建議《檔案管理》雜志社注重對作者和同行刊物的協同,加強開放性,促進跨界合作與知識交流,激勵作者與刊物之間的共謀雙贏。
結合上述期刊畫像分析,可以得出期刊作者所在地區較集中,所在機構和基金資助不平衡;檔案學類核心期刊作者相對穩定、數量較少、跨刊發文活躍度較低等結論。
首先,機構類型-地區-基金分布畫像顯示,期刊所在地區、所在政府機構、全國高校、國家社會科學基金等特征比較明顯,但全國范圍的地區和機構數量偏少;繼續按機構分布畫像,僅少數高校如鄭州大學和上海大學等發文量較為突出,國家基金資助種類偏少等。建議強化學術共同體協同,注重作者機構和地區的平衡,加大對基礎研究的支持力度,提高基金論文,尤其是國家級高水平基金論文的錄用比例,以激勵更多的學術成果產出。
其次,高產高被引期刊作者畫像和《檔案管理》作者跨刊發文畫像顯示,各類期刊核心作者相對穩定,各類期刊核心作者數量均較少,高產高被引作者跨刊發文活躍度不高,建議《檔案管理》雜志社加強與高產高被引期刊作者以及核心作者群的聯系和互動,采取積極有效的激勵措施,進一步促進更多和更高質量論文的產出;同時,《檔案管理》雜志社要注重對作者和同行刊物的協同,加強開放性,促進跨界合作與知識交流,激勵作者與刊物之間的共謀雙贏。
本文僅針對有限指標進行了《檔案管理》期刊畫像比較分析,得出的結論和建議相對有限。下一步可以增加指標分析,如非核心期刊、相近領域期刊、期刊作者結構、期刊作者被引期刊和引文網絡等進行畫像分析,使分析結論更加科學合理。
[1]袁軍.大數據環境下用戶畫像在高校圖書館的應用研究[J].圖書館研究與工作,2019(06): 22-26.
[2]梁榮賢.基于用戶畫像的圖書館精準信息服務研究[J].圖書館工作與研究,2019(04): 65-69.
[3]都藍.基于用戶畫像的高校圖書館年度閱讀報告研究[J].圖書館雜志,2019,38(04): 27-33.
[4]劉芳.文獻計量指標的學術評價功能淺析[J].長沙鐵道學院學報(社會科學版),2006(02):266-267.