昝棟
摘 要 人才隊伍建設作為高校工作的永恒主題,在科研教學、學科發展等諸多方面發揮著至關重要的作用。本文從人才引進的角度入手,設計了一種基于“百家姓”姓氏篩選方法,可用于學者信息的數據處理和分析。
關鍵詞 人才分析;中文姓氏;學科建設
1 高校人才隊伍建設的重要性
2015年我國提出了加快建成一批世界一流大學和一流學科的長遠目標,在高校開展的實踐和探索過程中,高層次人才的引進不但帶來了嶄新的思維方式,為學校的師資隊伍注入了新的活力,也成為高校人力資源引進的重點工作方向[1]。
2 高校人才引進工作的現狀
人才引進工作必須與學校教學科研需求相適應,目前高校在人才的引進仍面臨著一些困難:
一是在信息發布方式,人事部門通過網絡、現場招聘等渠道發布需求信息。這種方式消息發布周期短、關注度低,在獲取備選人員方面存在很大的局限性。
二是在學科匹配度方面,雖然人事部門會與用人院系進行溝通,在人員研究方向上提出建議或推薦人選,但人事部門對學科領域內的人才分布總體情況缺乏掌握,難以保證選拔工作的科學性。
圖書館作為高校的信息資源服務中心,基于電子資源的深層次服務,開展了通過情報服務提升自身核心競爭力的探索實踐[2],可將事實數據與情報分析方法進行有機結合,切實為學校的教學科研、學科建設提供多元化的信息參考。如果將圖書館現有學科服務與情報分析的工作經驗應用到人才引進的數據分析領域,將有效的緩解現有高校在人才引進工作方面面臨的困境,為學科人才的遴選與引進提供好的信息參考和借鑒。
3 基于中文姓氏規律的學科人才分析方法介紹
3.1 學科人才選拔的需求分析
各個學校在人才選拔方面都有自己的特殊要求,需兼顧國籍、年齡、研究領域、學術成就等多方面因素,特別是目前國內高校的人才引進多以華人學者為主。開展具體工作時,可針對學校人才選拔條件,以學科領域的專業期刊為基礎,結合地域分布、合作機構等信息,對華人科研人員的數據進行整理分析,綜合學者的論文產出及規范化影響力等多種因素進行人才綜合評價[3],為本校學科人才引進提供情報參考。
3.2 中文姓氏作者篩選方法的比較
以往開展的人才分析,在對中文姓氏的作者甄別方面,往往采用人工擇取的方式,數據整理周期長、效率低。在整理WOS平臺導出的學者字段時,通過在國家或地區字段選擇China Mainland,也可以較為便利的將絕大多數的中文作者信息篩選出來,但是這種方法對于論文信息中沒有標注機構名稱或國家地區等字段信息缺失的學者往往會被忽略掉;同時對于在海外發展的華人科學家的信息無法進行有效的甄別,因此,如何快速地將華人作者的信息從檢索結果中快速篩選出來是在開展人才分析時,是一個需要重點解決的問題。
本項目利用我國傳統《百家姓》中的姓氏,進行音序轉化,同時結合 InCites 平臺收錄數據中,作者姓名信息的錄入規律,進行姓氏分離,通過姓氏音節的對比,實現了中文姓氏科研人員的數據篩選工作。
3.3 百家姓篩選方法介紹
該方法以中國傳統蒙學讀物《百家姓》中收錄的中國姓氏為基礎,在此基礎上通過對比樣本庫,差異化增補的方式,形成了中文特征姓氏的對比基礎數據集。百家姓中原收集姓氏411個,后增補到504個,其中單姓444個,復姓60個,另外通過樣本增補的方式補充部分姓氏,最后達到了接近330個不同音序姓氏的基礎數據集。將該數據集以姓氏音序轉化為拼音后,作為源數據集備用。
Wos平臺中中文作者的表達形式存在著一定的規律,即姓氏在前,名字在后,中間用逗號分隔,例如:李明表述為Li,Ming;也有部分名字后半部分僅保留了首字母的縮寫,例如:王玲玲,翻譯為Wang,LL。但是總體而言,姓氏部分的音節保存相對完整,基本符合漢語拼音的拼讀規則。利用這一特征,可以和華人以外的姓名進行快速的區分。
3.4 方法使用效果驗證
筆者對2014-2018年5年間JCR中Fisheries學科Q1和Q2區發表Article和Review論文的學者進行篩選,符合條件的作者共計8034人。直接按照國家地區進行篩選,得到中國地區作者為2009人。通過百家姓篩選法對8034位學者進行篩選,符合中文姓氏規律的作者2528人,其中包含大陸地區以外542人,同時在中國地區內的作者有23人并不符合中文形式規律,應該屬于在大陸工作的外籍學者。
通過上述方法對比可以看出,“百家姓”篩選的方法可以更加有效的解決中文姓氏規律學者的篩選問題,比通過國家地區的方法效率更高,準確性也更勝一籌。尤其在針對中國大陸地區以外的其他國家地區的華裔學者開展分析時,通過該方法可以快速將具有中文姓氏特征的學者篩選出來,從而快速進入身份信息梳理工作環節。
4 結束語
本文介紹的“百家姓”音序數據集可不斷進行增補和完善,以提升數據篩選的準確性,該方法主要用于對學者信息的初步篩選,可快速分離出符合中文姓氏規律的學者信息,有效縮小初選數據集規模,提升篩選的工作效率,以便在此基礎上順利開展學者研究領域判別和身份信息梳理等深層次的分析工作。
參考文獻
[1] 許日華,樂傳永.“雙一流”建設中地方高水平大學高層次人才引進的困境與突圍[J]. 教育發展研究,2017,37(21):46-51.
[2] 楊新涯,王瑩,尹偉宏.數據驅動的新型情報服務研究[J].文獻與數據學報,2019,1(1):32-41,117.
[3] 龐弘燊,王超,胡正銀.“雙一流”大學建設中人才引進評價指標庫及指標體系構建[J].情報雜志,2019,38(3):67-74.