楊高均
(貴陽市服務外包及呼叫中心產業發展辦公室 貴州省貴陽市 550001)
近年來,我國對科技研發和生產的重視程度不斷提高,并要求各省市科技業務部門積極開展科技專家庫管理系統建設工作,以期利用科技專家庫管理系統這一匯聚科技專家的信息智庫為科研人員、科技管理者等提供良好的信息服務,從而促進其科研決策更加精準和管理質量更加高效。然而,我國當前大部分省市的科技專家庫管理系統構建現狀來看,不少省市構建的科技專家庫管理系統對大數據技術應用不足或應用不合理,從而導致構建的專家基礎資源少、數據庫專家信息結構單一,難以滿足大數據時代背景下,科技專家庫管理系統海量的數據信息管理要求,從而難以充分發揮科技專家庫管理系統的信息服務作用[1]。基于此,就需要各科技業務部門工作人員積極探索構建基于大數據的科技專家庫管理系統的方法,構建一個科學、完善的科技專家庫管理系統,才能為相關使用者提供良好的科技信息和咨詢服務,從而才能推動我國科技不斷進步和發展。
科技專家庫管理系統指的是收集各行業科技評審專家及其咨詢意見和建議的信息智庫,利用該信息智庫為相應的科技項目抽取合適的評審專家,以減少科技決策失誤和促進科技成果更好地進行轉化。從這個概念可以看出,科技專家庫管理系統包含的管理內容眾多,基于此,就需要相關技術人員積極構建基于大數據的科技專家庫管理系統,利用大數據技術對專家信息數據進行全面收集和充分挖掘,并進行結構化處理,才能實現專家精確分類。并且,利用大數據技術進行數據轉換、傳輸,還能更好地實現數據共享,從而有助于提升科技專家庫管理質量和效率[2]。
隨著我國科技創新評審和咨詢項目的不斷增多,我國不少省市科技業務部門均開展了科技專家庫管理系統建設工作,但是,從我國當前的科技專家庫管理系統構建現狀來看,大部分省市構建的科技專家庫管理系統信息化程度和對大數據技術的利用程度均較低,如不少科技業務部門按照各自管理需要構建了各類專家庫管理系統和對專家進行標準分類入庫,并按照評審項目所屬技術領域或學科大類對項目進行分組,然后,根據分組統一標準匹配入庫專家,雖在一定程度上促進了各類專家的信息標準規范與科技業務部門管理需求和本級所屬業務相符,并實現了與評審項目對應的專家合理抽取[3]。但是,在實際建設過程中,也存在不少的問題,如:
(1)專家基礎資源少,指的是構建的科技專家庫管理系統平臺中各專家信息系統相互獨立,分別由不同的部門管理和使用,從而導致科技專家信息資源過度分散,相互之間難以進行有效聯通和共享,且專家信息來源方式單一和專家基礎資源少,多是專家自我填寫,常會導致庫有專家數量難以匹配參評科技項目數量要求。
(2)數據庫專家信息結構單一,當前大部分科技業務部門多是采用關系數據庫線性表描述和存儲數據庫專家信息關系及相關數據信息,這種信息結構描述方式不僅會造成系統相關數據信息的重復和疊加,還會影響數據庫專家信息的全面和高效展示,從而會使科技項目對評審專家的精準匹配需求受到一定影響。
要構建一個合理和優質的基于大數據的科技專家庫管理系統,首先就需要做好專家庫管理信息系統架構設計,然后,采用關鍵性的大數據技術做好專家管理信息系統設計,下面是筆者總結的專家庫管理信息系統架構設計方法及專家管理信息系統設計方法。
基于大數據的科技專家庫管理系統指的是以大數據技術作為基礎,聯合科學的專家庫管理信息系統架構設計方法將科技評審專家、科技項目、科技文獻、進行科技研究所需的儀器設備、成果等科技創新要素進行有機結合,從而為科研人員、科技管理者、社會公眾等開展專家推薦、咨詢、管理和科研決策等活動提供良好的信息服務,要達到這一目標要求,就需確保設計和構建的專家庫管理信息系統架構包含基礎數據層、數據存儲分析層和數據服務層三個子系統[4]。
3.1.1 基礎數據層設計
為確保科技專家庫管理系統能夠為各類用戶提供完善的科技信息服務,首先,就需要設計基礎數據層,該數據層應涵蓋專家信息基本庫、專家庫接入管理系統的歷史項目數據、現有項目數據以及其他各類與科技計劃管理相關的數據,如機構信息庫、人員信息庫、論文資源庫,只有具備這些海量的數據,才能實現系統對評審專家的精準匹配需求[5]。
3.1.2 數據存儲分析層設計
通過設計和構建基礎數據層雖能為科技專家庫管理系統獲取海量的數據信息,但是,這些數據信息存在結構各異、類型和標準不一等特點,若直接將這些數據信息提供給用戶,將會導致專家標準規范多,從而也難以滿足精準的匹配需求,為解決這一問題,就需要設計數據存儲分析層,利用該分析層和據識別、數據傳輸、數據感知等大數據技術對專家庫中的基礎數據進行匯聚、標準清洗及加工處理,最后形成數據中心庫,該數據中心庫不僅能對相關數據進行分析、計算和關聯分析,同時還能自動將最終得到的分析結果傳輸給數據服務層,以促進數據服務層為用戶提供良好的數據服務。
3.1.3 數據服務層設計
為給各類用戶提供良好和高效的科技項目咨詢、專家管理和科研評審等服務,就需要根據科技項目的實際業務需求,對大數據技術、互動交流技術、互聯網可視化技術等進行有機整合,這樣不僅能有效實現專家庫管理信息系統的合理應用,還能實現專家庫管理信息前端的顯示,從而能提升用戶對科技專家庫管理系統使用的滿意度[6]。
完成專家庫管理信息系統架構設計和構建后,便是采用合理的大數據技術進行專家管理信息系統設計,常用的大數據技術有數據存儲技術、大數據挖掘分析技術等,構建的專家管理信息系統主要包含了專家管理和專家推薦兩大類別,下面具體介紹構建專家管理信息系統應用的大數據技術及方法。
3.2.1 專家管理信息系統設計和構建中應用的大數據技術
數據存儲技術、大數據挖掘分析技術不僅是兩項關鍵性的大數據技術,同時也是構建專家管理信息系統必不可少的兩大技術。
(1)數據存儲技術,上面已說到基礎數據層中的數據具有海量、結構各異、類型和標準不一等特點,這主要是因為這些數據來源于不同類型的數據庫,而不同類型的數據存儲和管理方式有存在顯著的差異,一般來說,數據信息可分為非結構化和結構化兩種類型,其中,結構化數據信息多采用關系型數據庫進行存儲和管理,非結構化數據信息存儲和管理就相對復雜,且相比于單純的非結構化數據信息,海量異構的非結構化數據信息存儲和管理更加復雜,對此,為實現這些數據信息的結構、類型統一,就需要采用No SQL 數據庫(HBase)、布式文件系統(HDFS)、大數據倉庫(Hive)、MPP 數據庫等大數據存儲技術對一些零散的數據信息進行有機整合、實時處理、存儲和管理,才能有效實現結構化數據、非結構化數據的合理轉換與存儲。
(2)大數據挖掘分析技術,指的是采用文本分析、關聯分析、回歸分析、網絡分析、聚類分析等大數據挖掘分析技術獲取各類基礎數據中隱藏的有價值的信息,才能為用戶在海量的數據庫中快速、準確地匹配到其所需的數據信息。由于科技專家庫管理系統本身是一個數據規模龐大、數據類別多且數據分散的系統,若采用傳統的數據挖掘分析技術對其進行處理,不僅要耗費較長的時間,同時也難以確保數據挖掘分析結果的有效性,而采用大數據挖掘分析技術則能借助于科學的數據挖掘分析方法對數據信息進行挖掘分析,如在文本分析方法中可采用關鍵詞提取、詞義聯系、自動摘要、詞性分析、分詞工具、依存文法、漢字轉拼音、繁體轉換、簡體轉換等多種技術對相關數據信息進行多維關聯分析,并形成關系圖譜,從而能實現數據信息的高效處理[7]。
3.2.2 專家管理信息系統設計和構建方法
構建基于大數據的科技專家庫管理系統的最終目標一方面是為科研人員、科技管理者、社會公眾等系統使用用戶提供高效的信息服務,另一方面還能為科技專家提供科學的管理服務,要同時達到這兩個目標要求,就需要以大數據技術為技術基礎,以信息技術為輔,根據專家庫管理系統業務需求合理設計和構建一個科學的專家管理信息系統,該系統應由專家管理和專家推薦兩部分組成,才能實現科技專家的規范、高效管理和為用戶提供良好的數據支撐及科技咨詢服務。
(1)專家管理。在構建專家管理信息系統過程中,構建人員應以大數據存儲技術為主要手段,以信息標準規范為基準,全面采集或征集科技專家相關的信息,并采用大數據信息挖掘分析技術對專家信息進行動態化和高效管理,另外,還需嚴格做好篩選出的有價值的專家信息的入庫、出庫審核工作,才能全面提高專家管理設計和構建質量。
(2)專家推薦。為實現評審專家與科技項目的精準匹配以及根據科技項目特點為用戶提供良好科技咨詢服務等功能,在設計和構建專家推薦系統過程中,構建人員需采用專家數據分析技術聯合關聯分析技術對多維度的專家信息進行采集和分析,如學歷、基本信息、工作經歷、承擔項目、榮譽、科研成果等,并生成專家信息,然后,利用支撐、人才稱號等限制條件對入選的專家進行層層篩選,這樣不僅能促進參評項目或咨詢服務與專家實現精準化匹配,還能提高系統的專家推薦效率。完成專家推薦系統構建后,系統管理人員還需對專家推薦系統進行科學評價,才能全面提升專家推薦和科技評審質量[8]。
科技專家庫管理系統是一個收集了各行業科技評審專家及其咨詢意見和建議的信息智庫,該信息智庫具有數據信息量大、管理相對復雜等特點,需要借助于大數據技術對相關信息數據進行全面收集、充分挖掘、結構化處理、存儲和管理,才能提高科技專家庫管理質量和效率,從而才能為相關使用者提供良好的信息服務,然而,當前不少科技業務部門工作人員并未掌握構建基于大數據的科技專家庫管理系統的方法,基于此,筆者總結了專家庫管理信息系統架構設計方法,包含基礎數據層設計、數據存儲分析層設計及數據服務層設計,另外,還需采用數據存儲技術、大數據挖掘分析技術等關鍵性大數據技術做好專家管理、專家推薦兩大專家管理信息系統構建,才能實現科技專家的規范、高效管理和為用戶提供良好的數據支撐及科技咨詢服務,從而才能推動我國科技水平的不斷發展和進步。