安 源,翟夏普,龍藝璇
(1.中國鐵道科學研究院集團有限公司 科學技術信息研究所,北京 100081;2.中國國家鐵路集團有限公司 科技成果知識產權管理辦公室,北京 100081)
鐵路行業快速發展過程中,鐵路科技創新發揮了關鍵作用[1],而高效、安全、智能的科研管理信息系統一直是我國鐵路行業科技創新發展的堅實保障。2006年,原鐵道部編制并下發《鐵路科技管理信息化專項規劃》(科技運〔2006〕71號),在此指導下首次開展初代鐵路科研管理信息系統開發工作。2008年,該系統完成技術驗收(科技綜〔2009〕75號),并在鐵路推廣試用[2]。如今,在大數據智能浪潮的強力沖擊之下,跨學科合作密集、學科交叉明顯、科研數據量與日俱增,數據關聯關系日漸復雜[3-4]。此外,伴隨著科研環境的變化,用戶需求開始向個性化、定制化、精準化、扁平化、快速響應化邁進[5]。
現階段已有不少學者針對大數據環境下的科研管理服務進行了研究。楊曉剛等人[6]從社會媒體環境出發,針對科研人員知識共享開展了相關平臺研究;韓麗華等人[7]分析了大數據環境下信息資源管理模式的轉變;解海燕[8]針對大數據背景下科研環境的變化,提出了精準科研信息服務體系。但現有研究多以理論研究為主,從宏觀角度為科研管理服務發展指明方向,鮮有從平臺構建或系統設計角度出發,探索如何落地科研管理智能服務模式。
本文在初代鐵路科研管理信息系統的基礎上,經由中國國家鐵路集團有限公司(簡稱:國鐵集團)統一部署,結合當前鐵路行業科研管理服務面臨的挑戰,開發了以科研項目管理為基礎,集立項管理、合同管理、執行管理、變更管理、結題管理于一體,并具備科技專家管理、知識產權管理、科技資源數字化加工、科技成果共享及科技門戶等功能的科研管理智能服務平臺,2021年通過技術評審(信技網技函〔2021〕29號),并在鐵路推廣使用。實踐證明,該平臺為鐵路科技創新提供了更廣闊的空間。
科研管理智能服務平臺集云平臺、數據匯集層、信息關聯層、信息分析層、知識組織層以及創新服務層為一體,總體架構如圖1所示。

圖1 科研管理智能服務平臺總體架構
為實現海量科研信息資源的高效處理與分析,以開源架構為基礎,以云平臺作為支撐,優先國產化替代,采用國產化組件,利用Nginx、Tomcat等中間件,設計前后端分離架構和內外穿網部署,通過場景化、差異化流程模版配置,提供科研管理云服務。其中,后端數據庫部署在中國鐵路主數據中心內部服務網;前端資源在鐵路內部服務網和外部服務網各部署一套。在充分保障安全的同時,解決內外網使用割裂的問題,提高數據資源計算效率,保障鐵路行業科研管理智能服務平臺的數據安全和運行流暢。
數據匯集層包含科研全創新要素信息和鐵路領域語料庫2部分。
1.2.1 科研全創新要素信息
科研全創新要素信息主要分為以下3類。
(1)科研項目和成果數據:根據國鐵集團科研管理相關辦法,依托科研管理信息系統,高效匯集鐵路內部數據,包括國鐵集團、中國鐵道科學研究院集團有限公司、18 個鐵路局集團公司的立項、合同、結題、評審、獎勵、科研成果等涉及科研管理全流程的數據,保障數據的權威性,同時引進專利、標準、期刊、會議等外部數據,保障數據全面性。
(2)創新人才和機構數據:包括科研人員、企業人員、領域專家等人員類型及研究機構、企業公司、第三方等機構類型數據。
(3)產業市場數據:包括鐵路產業鏈上各企業的產品數據。
通過“科研信息+創新主體+行業市場”的數據關聯,打通科研項目到行業市場的通道,從源頭提高科技資源利用效率,解決科技成果轉化問題。
1.2.2 鐵路領域語料庫
鐵路領域語料庫涉及鐵路行業的理論基礎、科學研究方法、相關政策、新聞動態等多維度完備的領域信息,是機器理解領域知識的基礎,可為科研信息分析提供先驗知識,有利于提高信息分析的智能性和準確性。
信息關聯層以科研項目為核心,對鐵路科研全創新要素數據進行系統表達和建模,其架構如圖2所示。

圖2 信息關聯層架構
該層負責描述科研項目全生命周期中存在的實體及實體間的關系。其中,科研項目中的實體包括課題基本信息、參與人員、參與機構、資助機構及研究成果;實體之間的關系包括人員與項目之間的負責/參研關系、機構與項目之間的主持/參與關系、資助機構與項目之間的資助關系、項目與成果之間的產出關系等。
平臺通過信息關聯層理清數據之間的邏輯關系,關聯科技大數據的知識、技術、人才、資本全創新要素,打通國鐵集團及其所屬單位各類科研數據之間的壁壘,從而實現鐵路行業科研數據一張網的目標。
信息分析層是整個平臺的核心技術支撐。在數據匯集層及信息關聯層的基礎上,通過數據融合、關聯分析、機器學習、自然語言處理等信息技術,開展科研實體識別、關系抽取與知識表示學習,為知識組織層模型庫、本體庫與規則庫奠定基礎,完成領域知識圖譜的繪制,并基于知識圖譜與知識推理技術,實現科研信息的智能服務。
傳統的科研信息組織只包含“用代屬分參”關系,難以揭示科研信息中復雜的語義信息。因此,本文使用算法模型及知識圖譜的方法組織信息。
(1)模型庫中的算法模型主要采用數據挖掘、機器學習等方式自動生成,存儲成計算機可理解的、以數字符號形式呈現的知識,用于計算機對未知信息的預測分析。
(2)采用自然語言處理技術、知識表示學習等結合人工配合的方式生成的知識圖譜,以本體庫與規則庫為基礎,包含了科研信息語義分析、科研知識可視化以及科研知識推理等功能,用于存儲人類可理解的、以文字、圖形或符號形式呈現的知識。
創新服務層指依據實際科研需求,智能感知用戶偏好,敏捷應對外部需求變化,為用戶提供個性化、定制化、專業化的科技情報服務。
(1)個性化科研知識推送:主動抓取用戶需求,為科研人員推送課題內容相關的最新科研成果。
(2)智能檢索式構建:通過語義計算提供滿足科研用戶全方位科研需求的檢索結果。
(3)顛覆性技術分析:提供科學研究主題的關鍵技術知識圖譜,揭示關鍵技術突破可能帶來的顛覆性技術創新機會。
(4)全要素知識圖譜:提供人才—科學—技術—成果四維一體的全創新要素關聯知識圖譜,滿足成果轉移轉化過程中產學研創新主體及風險投資機構個性化的技術、人才和機構的信息需求。
(5)潛在合作推薦:提供研發合作網絡知識圖譜,揭示研發合作網絡的機構、熱點領域和核心團隊分布。
(6)產業發展態勢追蹤:提供面向重大產品全創新鏈的“科學—技術—產業”成長知識圖譜,協助科研用戶及時了解產業發展態勢和學術研究發展動態,為鐵路行業重大新產品研發、科技成果技術成熟度評價、科技成果信息的知識管理與運用提供決策支持。
平臺通過創新服務,初步實現了智能化科研、網絡化協同、場景化配置、服務化延伸及數字化管理,促進了鐵路行業科研管理向更加柔性化轉變。
科研管理智能服務平臺為所有用戶提供統一的登陸門戶與身份認證平臺,其功能如下。
在科研管理活動中,科研管理智能服務平臺可提供從科研項目立項、執行、結題到成果產業化全流程中每一環節的定制化、配置化專屬流程服務。
科研管理智能服務平臺提供豐富的面向課題研究的服務。
(1)課題立項階段:為科研人員提供國家重大專項、重大計劃、科學技術部項目等基金項目信息,并基于科研人員的研究方向制定個性化的基金項目推送。
(2)課題執行階段:為科研人員提供課題研究內容相關的信息推送,及時跟進研究最新動態,推進科研項目研究進展。
(3)課題結題階段:依據合同要求評價課題完成情況,使用語義查重系統鑒定課題成果的原創性。
(4)課題成果產業化階段:利用平臺為企業需求與科研成果對接提供機會,加速科研成果的轉移轉化,推動鐵路行業高質量發展。
科研管理智能服務平臺可根據科研用戶實際需求,提供智能檢索、研究趨勢預測及知識圖譜展示等功能。
(1)在智能檢索模塊,基于知識圖譜對用戶檢索式進行語義擴展,提高檢索查全率。
(2)在研究趨勢預測模塊,基于權威專家判斷結論、文獻和專利計量的統計與聚類分析結果、權威機構發布的研究報告、科學技術獎勵等統計數據及多維度分析指標,分析研究前沿與研究熱點,發現潛在的突破性或顛覆性技術。
(3)在知識圖譜可視化模塊,基于國家重大科技專項和重點研發計劃項目成果信息及相關產業創新發展信息,實現關鍵技術突破、研發合作網絡、全創新要素關聯及面向重大產品全創新鏈等多種類型的知識圖譜展示。
科研管理智能服務平臺已在國鐵集團、中國鐵道科學研究院集團有限公司、蘭州局集團公司、太原局集團公司、廣州局集團公司等單位成功應用,社會效益顯著。
該平臺匯集了國鐵集團及各所屬單位的科研項目立項、合同、結題、技術評審、獎勵等科研全過程數據,鐵路企業主要產品等產業鏈數據,鐵路行業全領域的論文、專利等公開數據,數據條數達千萬級別,最早可追溯至1957年。通過開發自動化數據加工平臺,基于鐵路技術詞表和產業詞表對科研數據進行標引,構建機車車輛、牽引供電、通信信號等行業細粒度專題庫。利用數據挖掘、自然語言處理等信息技術,對各類資源進行關聯分析,嘗試實現創新鏈、技術鏈、知識鏈、產業鏈之間的互聯互通,改善了鐵路各單位系統分散、技術標準不統一的現狀,形成了鐵路行業科研資源知識服務生態體系,如圖3所示。該平臺的應用為鐵路行業工作人員提供了智能、精準、及時的個性化定制科研信息服務,為實現科研決策提供支撐。

圖3 鐵路行業科研資源知識服務生態體系
本文結合鐵路行業科研管理現狀,構建了集云平臺、數據匯集層、信息關聯層、信息分析層、知識組織層及創新服務層于一體的鐵路行業科研管理智能服務平臺,并面向鐵路行業開展了應用實踐。該平臺將面向科研成果的被動知識服務升級為面向科研用戶需求的主動知識服務,以科研為主線,貫穿科研項目管理、科技成果管理、科研項目后評估等活動,為不同等級、不同角色的科研管理人員設定不同權限,實現科研全流程數字化管理,極大地提高了科研管理工作效率。
未來,將繼續圍繞鐵路科技創新生態體系,進一步從科研管理信息服務的精準度、及時度、專業度、智能化及個性化等角度升級完善平臺的數據與服務;進一步集成科技專家、知識產權、科技評價、科技獎勵、技術標準、質量抽查、產品認證等業務子系統,對其整合并實行分級分類授權,以提高科技資源使用率,為鐵路科研成果的高效管理與科技成果的轉移轉化提供有力支持。