2021年8月2日國務院辦公廳發布《關于完善科技成果評價機制的指導意見》,特別提出要利用大數據、人工智能等技術手段,開發信息化評價工具。2021年8月3日國家社會科學基金重大項目公布“大數據驅動的科技文獻語義評價體系研究”的年度招標選題,同步提出基于語義內容創新科技成果評價工具和模式。可見,完善科技成果評價機制,從原理機理、方法技術、場景應用等層面優化科技成果評價理論框架和方法體系,已成為當前學術評價乃至科研管理工作亟待突破的重要課題。
目前,我國科研論文量化評價基本沿用以文獻計量指標為主導的評價體系,基于引文指標來評價學術影響力、基于網絡指標來評價社會影響力,總體上屬于形式評價范疇,這種模式導致科學評價中過度強調論文發表數量、被引頻次、期刊影響因子等外在量化指標,沒有深入到論文內容層面,從全文內容數據、引用數據、關注數據、使用數據等進行語義分析,忽視了從科學性、價值性、創新性、規范性方面進行評價。
所以,推進科研論文語義評價,需要在建立科研論文語義評價的資源體系基礎上,探討語義評價的方法體系,形成語義評價的解析流程,探討科研論文評價中的貢獻、創新、價值和影響的表達形式和識別方法,繼而完善知識單元及其關系的圖譜構建,結合科研論文評價目標、要素和場景進行應用示范和驗證。首先,需要充分利用各類信息資源及其使用數據,建設跨行業、跨部門、跨地區的知識庫、需求庫、案例庫和評價工具方法庫;其次,將自然語言處理與文本挖掘技術應用于文本內容的自動分析與語義理解,對論文篇章結構進行自動解析,抽取科研論文中表現創新性、實用性、重要性的知識單元;再次,通過語義關聯計算,從文本、圖片、翻譯到釋義、觀點、思路間的相似性,對論文進行相似檢測,輔助論文結構規范性評價和論證邏輯性評價,發現科研論文中的新知識、新價值和新貢獻、新突破;最后,建立科研論文評價數據服務平臺,提供語義關聯的知識圖譜,實現對知識單元影響力、創新力的可視化展示,支撐同行評議,優化學術評價行業生態。
學術評價從文獻計量、替代計量走向語義計算,從外在到內在,從文本到語義,從實體概念識別到語義理解對標,需要將語義關聯、知識組織與科學評價相結合,將大數據、人工智能技術融入到科學計量學中,從外在統計評價轉向知識單元評價,識別其中的新發現、新原理、新方法,測度文獻規范性、文本相似性和觀點創新性,革新和完善現有文獻計量評價體系,形成定量與定性、形式與內容相結合的語義評價體系,開創信息化、語義化、智能化評價工具,豐富知識計量理論方法與工具體系。