鐘玉泉 羅學剛
摘要:釩鈦科技數據分析整理將為釩鈦戰略資源綜合開發利用和開發提供強有力的支撐。為了更好地整合釩鈦科技文獻數據,該文提出基于知識服務構建釩鈦科技資源數據全流程共享服務平臺,提供釩鈦科學數據和文獻資源的異構數據源匯集、整合服務,釩鈦資源仿真計算服務和測試服務以及釩鈦產學研資源綜合利用交流服務。該平臺為釩鈦科技人員建立標準化、規范化的釩鈦特色主體數據庫,支撐面向廣大釩鈦產學研提供技術和數據服務的產業協同創新和數據共享服務。
關鍵詞:知識服務;釩鈦科技數據;釩鈦特色數據庫
中圖分類號:G642? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)04-0019-03
1 引言
隨著中國經濟社會發展的加速、技術創新進步和各類釩鈦產品市場的拓展,政府對攀枝花釩鈦資源利用定位和產業規劃發展目標更加明確,開發利用的深度和廣度進一步加深,利用攀枝花豐富的釩鈦資源,進一步做好釩鈦資源綜合開發利用,推進釩鈦產業縱深發展,國家批準建立了攀西國家戰略資源創新開發試驗區,國家發改委牽頭制定了《釩鈦資源綜合利用和釩鈦產業發展“十二五”規劃》,將釩鈦資源的綜合開發利用和釩鈦產業的發展上升到國家戰略。四川省委、省政府高度重視釩鈦及相關產業的發展,將釩鈦磁鐵礦資源列為全省重點開發的四大資源之一,同時釩鈦產業也被列為工業強省的七大支柱產業之一。為全面落實國家攀西戰略資源開發試驗區的部署,結合攀西戰略資源創新開發試驗區實際,需加強推動釩鈦產業協同大數據創新平臺的建設,以指導釩鈦產業的信息處理和知識生產、管理、利用和創新,實現釩鈦專業知識最大程度的共享與利用。
“數據驅動研發”是未來產業技術革新和升級的主要推動力,對于行業而言,積累釩鈦數據、分析數據,是改進產品和工藝的關鍵因素。而釩鈦產業鏈的特點導致釩鈦數據采集和應用效率較低,從而影響釩鈦產業的創新和增效。例如:(1)較長的釩鈦產業鏈涉及的產品和工藝數據多源異構,傳統的數據文件存儲的管理模式導致信息檢索和分析效率低;(2)不同企業對同類數據描述方式各不相同,數據一致性較差;(3)從采礦到成材深加工鏈條長,各企業形成數據孤島,產品問題難以追溯原因,產業鏈統籌發展難度大;(4)釩鈦產業的環境問題突出(例如釩清潔生產和鈦冶煉),缺乏環境影響數據指導企業決策;(5)專家與技術資源分散,缺乏平臺來驅動協同創新;(6)缺少基于數據的行業發展分析。
根據如上所述的問題,釩鈦產業需要一個能夠解決釩鈦全生命周期數據管理和分析,為廣大釩鈦產、學、研、用、政提供技術和數據服務的產業協同創新和大數據服務平臺。該平臺是推動世界釩鈦研究中心和產業園區由大變強,引領釩鈦產業在全球制造業產業分工和價值鏈中占據領先地位的需要,是增強釩鈦產業制造業集群競爭力,為建設世界一流釩鈦創新基地提供高質量支撐的需要,是順應釩鈦產業發展規律,促進釩鈦資源優化組合高效配置,高水平協同參與全球競爭的需要,最終將構建起釩鈦產業平臺經濟體,引領世界釩鈦產業的發展。因此,本文基于知識服務構建了釩鈦科技資源數據全流程共享服務平臺。該平臺為釩鈦科研人員提供釩鈦科學數據和文獻資源的異構數據源匯集、整合服務,釩鈦資源仿真計算服務和測試服務以及釩鈦產學研資源綜合利用交流服務。
2 基于知識服務的整體平臺構架
2.1平臺描述
為了充分發揮四川釩鈦資源集中的地緣優勢和國家攀西戰略資源開發試驗區先行先試的政策優勢,全力打造釩鈦技術與釩鈦科技數據共享服務的服務平臺,打造促進釩鈦科技成果產業化的支撐平臺,打造數據共享服務平臺,充分發揮大數據平臺傳播科技信息的基礎性作用,通過整合積聚釩鈦知識資源、創新數據管理分析服務、技術服務、行業標準、完善數據收集,科研協同創新,計算服務和釩鈦科普教育服務等業務開展的釩鈦科技數據共享,促進各類釩鈦科研和生產數據的在線管理和分析服務,擴大攀枝花“釩鈦之都”的影響力。
本平臺主要循著“知識服務、數據管理、技術服務”這三個維度展開,即以數據資源整合建設完善的釩鈦科技知識平臺;以數據管理提供各類釩鈦科研和生產數據的在線管理和分析服務;以技術服務推動技術要素的知識傳播;平臺立足于釩鈦產業技術發展,著力釩鈦知識服務,提高釩鈦深度應用,促進釩鈦產品服務,形成釩鈦科研數據的標準。
平臺建設內容主要有:
1)建設釩鈦數據資源分類體系及元數據目錄庫。通過對各類釩鈦相關信息進行描述、定義、分類與編碼,建立一套完整、科學的釩鈦科技數據的分類體系,并在分類體系的基礎上建立釩鈦信息元數據目錄庫。
2)整合釩鈦數據收集與多源異構數據。包括數據錄入、網絡數據采集和多源異構數據的整合。
3)建設主體釩鈦知識倉庫。包括釩鈦科學數據資源庫、釩鈦科技文獻資源庫、釩鈦科技信息庫、釩鈦專利與標準庫和釩鈦科技人才庫等 5 個子庫。
4)實現計算服務和仿真實驗服務功能。計算服務功能是借助攀枝花市釩鈦資源優勢,整合釩鈦產業單位的計算硬件和軟件資源,為用戶在線申請或預約可用的計算資源進行計算,計算結果數據保存至數據服務相應數據庫中,供用戶查閱和分析;仿真測試服務可為釩鈦中小企業提供釩鈦專業數據和資源服務,通過平臺提供的測試接口,可以完成目前釩鈦研究重要的仿真軟件的數據實驗,提供軟件共享服務。
5)建設釩鈦特色資源知識共享服務門戶。通過整合國內外釩鈦相關知識資源,提供方便快捷的檢索功能,建立完善、高效的信息知識服務系統,做到信息的保存、共享、統計、分析,實現資源的優化配置,實現知識門戶、知識倉庫、搜索引擎、互動平臺、權限管理、系統維護等功能,為相關人員提供支持和服務,主要包括釩鈦知識倉庫檢索、釩鈦知識可視化、釩鈦知識科普與統計、釩鈦行業互動平臺、專家庫介紹以及數據定制化展示等服務。
2.2 平臺體系結構
釩鈦科技數據共享服務平臺系統架構如圖1所示。平臺由下到上分為系統層、數據層、服務層、應用展現層。系統層是數據平臺的硬件支持,數據層中存儲釩鈦的科學數據、文獻數據和互聯網資訊數據;服務層定義了服務平臺的業務模塊,如數據的采集、預處理、存儲、搜索和分析等;應用展現層為用戶提供操作界面接口與信息呈現,用戶通過應用展現層使用平臺提供的數據服務、資訊服務以及其它服務。
該平臺的核心功能由服務層實現,服務層包括以下的功能模塊:
1)數據采集與預處理服務提供對于各類數據的輸出和輸出前預處理服務,響應瀏覽器前端的數據獲取,數據查詢,數據排序,數據比較,數據關聯,數據可視化等服務請求。
2)網絡數據采集服務按照項目需求對服務欄目,網絡采集資源數據,界面設計進行二次開發,給用戶提供全面的釩鈦材料專業知識服務,實現實時更新網絡資源、一站式搜索信息(互聯網資訊、文獻、科技報告、專業知識)、個性化定制專業資訊、專題分析報告生成等功能。
3)數據存儲管理服務提供對存儲資源的抽象,支撐數據輸入、輸出、索引建立、數據備份恢復等上層功能模塊。
4)數據搜索服務采用企業級的搜索引擎Elastic Search方案,提供對各類數據的索引建立和搜索訪問。
5)論壇模塊采用定制的Discuz平臺,按照釩鈦產業的特點實現論壇的功能需求。
6)權限控制模塊為上層用戶功能應用提供服務層接口,采用Spring Security技術支持用戶類型建立,用戶類型權限設置,用戶權限檢測;并采用Spring AOP技術,對于用戶操作節點自動產生日志記錄,實現數據的可追溯。圖2描述了釩鈦特色資源知識倉庫,主要有CNKI釩鈦科技文獻資源,釩鈦領域專家成果,科技文獻庫和其他相關資源構成。
3 釩鈦科技數據共享服務平臺實現
本平臺的技術框架采用SSM(Spring、SpringMvc和MyBatis)框架技術實現,以知識服務為基礎,前端以JSP和Ajax技術進行數據展現和交互,后端使用Java和MySQL進行數據訪問和持久化操作,融合軟件工程與面向對象編程思想構建。平臺由下到上分為接口層、數據層、服務層、服務門戶四大結構框架。接口層是數據平臺的資源支持和數據采集,數據層中存儲釩鈦的科研數據、生產數據和互聯網資訊數據,構架釩鈦元數據目錄庫和分類體系,采用HDFS、MapReduce、Hive、NoSQL等數據處理和存儲技術構建釩鈦多源異構數據服務知識庫;服務層定義了服務平臺的業務模塊,如數據的采集、預處理、存儲、搜索和分析等;服務門戶為用戶提供操作界面接口與信息呈現,用戶通過應用展現層使用平臺提供的數據服務、知識服務以及其他服務。
實現的功能導航如圖3所示,主要有釩鈦文獻數據庫、金屬數據庫、微觀組織、晶體結構、釩鈦專利和標準庫等模塊構成。釩鈦知識庫是釩鈦科技數據平臺的數據倉庫,其內容涵蓋釩鈦資訊、文獻、統計、專利、標準、分析報告、科技報告、科普、成果獎勵、專題分析、企業信息、專家人才等。數據來源于申報單位已有的釩鈦信息資源,以及平臺建成后通過互聯網采集和信息情報單位購買的釩鈦科技信息。通過統一的數據結構、統一的數據元編碼方式、統一的信息存儲方式、統一的信息資源目錄體系和統一的信息交換體系建立共享的釩鈦科技知識庫。知識庫中的信息資源存儲在云端服務器,為整個釩鈦行業用戶提供行業信息和資源服務。
釩鈦知識數據庫的數據內容具體包括:①釩鈦材料標準牌號性能數據庫(包含標準號、化學成分、性能等數據);②釩鈦元素相關的晶體結構數據;③釩鈦實驗二元相圖及三元相圖數據;④釩鈦金屬材料及合金微觀組織數據;⑤釩鈦科技文獻可在線瀏覽題錄;⑥釩鈦國內外科技報告題錄和原文;⑦釩鈦行業資訊;⑧釩鈦材料相關國內外專利數據;⑨釩鈦人才信息數據。
圖4為平臺門戶首頁展示頁面,有平臺應用服務、專業知識應用服務和專業數據分析三大板塊構成,主要實現功能描述如下:(1)專業知識管理分為資訊內容管理、科技報告管理、專利內容管理、微觀組織管理、期刊論文管理、學位論文管理、書籍管理、企業庫管理、專家庫管理。(2)資訊內容管理:對已有的資訊內容進行修改或者刪除,也可添加新的資訊。(3)科技報告管理:對已有的科技報告內容進行修改或者刪除,也可添加新的科技報告。(4)專利內容管理:對已有的專利內容進行修改或者刪除,也可添加新的專利內容。(5)微觀組織管理:對已有的微觀組織內容進行修改或者刪除,也可添加新的微觀組織。(6)期刊論文管理:對已有的期刊論文內容進行修改或者刪除,也可添加新的期刊論文。(7)學位論文管理:對已有的學位論文內容進行修改或者刪除,也可添加新的學位論文。(8)書籍管理:對已有的書籍內容進行修改或者刪除,也可添加新的書籍。(9)企業庫管理:對已有的企業信息進行修改或者刪除,也可添加新的企業信息。(10)專家庫管理:對已有的專家信息進行修改或者刪除,也可添加新的專家信息。
4 結論
本文介紹了釩鈦科技資源數據全流程共享服務平臺,從釩鈦產業的釩鈦知識和專業數據管理應用的數據共享服務,建立釩鈦科學數據目錄數據庫和海量多源異構的釩鈦知識數據、專業數據的數據標準化和數據融合,平臺需具備良好的擴展性,對各類非結構化知識數據和專業數據的采集和處理支持較好,實現了對各類釩鈦知識和專業數據的管理以及各類分析應用工具的集成和擴展。
參考文獻:
[1] 陳尚松, 杜旭英, 俞歡軍. 基于Struts+Hibernate+Spring框架的畢業設計管理系統[J]. 計算機工程與設計, 2008(15):230-233.
[2] 葉小樂. 基于Struts和Hibernate的圖書館重點學科導航系統[J]. 圖書館學研究, 2008(9):34-37.
[3] 畢達天, 曹冉, 杜小民. 科學數據共享研究現狀與展望[J]. 圖書情報工作, 2019,63(24):70-78.
[4] 張紹麗, 鄭曉齊, 張輝,等. 科技資源共享網絡模式創新與實踐——以中國科技資源共享網為例[J]. 科技管理研究, 2018,38(13):50-59.
[5] 席寧. 基于云計算的信息資源共享管理系統的構建[J]. 電腦編程技巧與維護, 2019(6):109-110.
[6] 蔡代純. 個性化信息服務研究綜述[J]. 圖書館學刊, 2007(1):86-87.
收稿日期:2021-06-10
基金項目:四川省重大科研平臺建設項目(2019JDPT0014)
作者簡介:鐘玉泉(1967—),男,教授,博士,研究方向為科研管理與信息化建設;羅學剛(1983—),男,副教授,博士(后),研究方向為計算機視覺、圖像處理等。