徐志娟
(常州信息職業技術學院 江蘇常州 213164)
大數據背景下,數據成為了重要資產,促進了各行各業的發展。高校作為科研活動的重要基地,應積極引用大數據這個嶄新的技術手段,通過數據挖掘和提取,提高高校的科研數據儲備、學術創新、綜合水平能力,創新科研數據的管理服務,為促進高校的課題研究和科研效果,提高社會服務水平,實現高校可持續發展具有重大的意義和價值。
目前,大數據在學術界還沒有統一的界定,是需要通過新的處理技術對其內容進行挖掘、管理和采用的數據集合。大數據不僅僅是一種資源和分析能力,也是一種創新思維和技術。[1]根據大數據的特點,我們可將其歸納為以下幾點。
1.規模大。大數據的數據儲存規模十分龐大,是眾多大規模科學實驗、計算和結論等長時間搜集、分析和統計的數據信息集合,大小遠超傳統數據庫集和數據化結構。
2.種類多。大數據的類型多樣化,除了能夠用傳統的數字形式或統一結構表現的結構化數據以外,數據格式還包括文本、音頻、圖片、影像等非結構化,以及資源庫、云圖書館、程序、郵件等半結構化數據。
3.速度快。大數據根據數據流頻率不斷更新而快速增長,要求處理數據的速度也要實時快速,具有很強的時效性,以便及時掌控數據流,有效利用數據提取所需知識而產生價值。
4.價值密度低。大數據中有價值的信息涵蓋量非常少。如何從海量的數據挖掘中,有效提取數據中有效的價值信息是重點。另外,大數據的利用密度低,在超長的數據查詢進度中,需求的數據長度可能只要很小一段。
5.線上應用高。大數據資源豐富,線上搜索、查詢、分析、統計等方面高效便捷,與傳統借助圖書館資料、中外文獻等查看方式相比,更加及時準確。
因此,可以看出,大數據是通過線上各類大型數據中快速提取有用信息,解決數據資源匱乏問題的有效技術手段,是創建數據管理和快速服務的重要基礎。
科研數據也稱科學數據、科技數據和研究數據等,是研究過程中能以數字形式儲存在計算機上,也能是非數據形式的任何數據,如實驗數據、文本、圖像、音頻資料等。科研數據涵蓋所有的科研活動過程中產生的原始數據、過程數據以及結果數據,通過對科研數據地充分獲取、存檔、分析和處理等輔助材料,是高校科研活動項目(如實驗、調研、探測、建模等)順利進行的必要條件。[2]
科研數據管理服務是一種以科研數據為資源管理的信息服務形式,通過統一的技術平臺管理(高校一般是以圖書館現有的資源進行管理),為研究者提供科研數據的查找、引用、整理、分析、存儲等服務,幫助科研人員解決學術問題,是在科研活動中利用科研數據開展資源管理、數據再利用的研究服務。高校科研數據管理服務是以用戶(老師、學生、社會人員等)需求為重點。從高校科研數據的獲取方式來看,一般是科研活動過程中的觀測(自然現象與社會現象的觀測等)、運算(硬件和軟件的計算等)、實驗(化學和社會實驗等)和記錄(訪問和使用記錄等)數據。科研經費的來源(政府指定的科研、單位發布的科研、校內課題的科研、自主選題的科研等項目)決定了科研數據的質量和使用權限(數據的公開性受研究內容和條件限制)。高校科研數據相對于國家和社會研究的科學數據來說屬于小規模數據,而且由于高校科研人員來自不同的院系,所研究的學科課題也各式各樣,容易產生復雜且多樣的眾多數據。同時,高校的科研課題由于受教學時間和經費的影響而出現了虎頭虎尾的情況,因而難以得到完整的科研數據。[3]
因此,高校科研數據管理服務的有效進行,對高校科研活動的順利發展和社會服務活動有著不可替代的作用。
在高校科研過程中,數據的搜集、分析和整理等是整個工作中最為繁瑣的過程,研究人員需要耗費大量的時間和精力,從而阻礙了科研信息的準確性和工作效率。大數據能對大量全面的科研信息數據進行管理,對所需的科研數據可以進行智能化獲取和分析服務,有效節省了科研工作的時間,工作效率也得到了質的飛躍,極大地滿足了科研所需,推進了科研資源的再利用,使科研成果得到迅速轉化。[4]
科研選題和材料申報是高校進行科研的主要內容。如何精準地選擇好的內容是科研工作成功的必要條件。由于高校選題范圍的局限性,其限制了科研人員的思維,不能有效地對社會的需求問題進行探究,造成申報內容不符合發生環境的情況。在大數據背景下,科研數據為高校科研提供了有利的數據支持,通過對科研數據資源的有效分析,準確整理出關聯內容,使科研工作更加準確和具有可信度,根據科研人員自己的實時性需求,借助相關的科研成果,從中總結和分析,查漏補缺,進而確保了科研選題和材料申報更加合理嚴謹,促進了科研工作的有效進行。
大數據的到來不斷提高了高校的科研數據存儲量和科研工作效率,也提高了高校學生學術監督的效果。論文查重是論文提交發表的重要環節。利用大數據的大量化和準確性來進行相關學術的數據查重,避免了學術論文弄虛作假現象的發生,能有效提高學術監督效果。[5]
當前,從科研體制現狀分析得知,縱向科研課題都是由各級各類科研主管部門發布的選題,但是大多時候存在數據缺乏、信息不對稱等情況,容易造成選題重復。首先是各地區、各部門之間的溝通不及時,研究簡單且重復,特別是省級以下的科研主管部門發布的選題之間容易造成重復。其次是同一科研主管部門不同年度的選題之間重復。最后是某一科研主管部門的選題與其他部門往年研究選題重復等。大數據背景下建立共享各主管部門研究生報數據的功能,各個部門研究之間分別建立、開展研究工作的數據庫,很好地避開選題重復的問題,節約了大量的研究人力、物力及資源的投入,有利于科研課題的不斷創新,確保每一次科研工作的開展都是創新的。
高校在開展課題研究的過程中,對研究成果的判斷過于注重結果,對成果研究過程中的付出并不重視。然而,在大數據背景下,通過建立科研項目完整的數據庫,將科研過程中形成的階段性數據進行共享,有利于不同項目組之間相互借鑒和參考,更加節約時間,便捷信息采集,及時解決類似問題。另外,通過大數據還能有效、便捷地了解到政府部門、企事業部門和單位的公眾需求,建立更加有效的銜接制度,利于科研成果的轉化和共享。
高校科研信息化管理目前還停留在數據收集的層面,數據的來源和規范無法得到有力保證,管理服務功能主要以基本的教學計劃、成績、項目、經費等方面的管理,查詢、錄入等服務為主。系統管理只有簡單的排序和統計功能,科研人員難以全面、準確地掌握科研的數據信息,數據的儲存過于表面,嚴重影響了科研數據的及時性和準確性,對科研數據的采集、分析和整合缺乏有效挖掘。
高校科研工作需要將所有數據進行關聯性分析,需要利用科研數據來進行整合、分析,通過深度挖掘和分析找到有效的價值信息,來確定科研的方向和目標。高校科研數據背后隱藏的信息沒有被挖掘,科研數據的統計分析局限于以前的工作經驗,對數據無法有效再利用,造成無法為科研管理起到決策性的指導作用,科研數據也難以轉化為可用的成果。
高校科研數據管理服務平臺協同程度低。高校各部門、各機構的統計分析各自為戰,且各個部門運行不同的管理系統,無法形成一個信息共享的服務平臺,信息和資源無法相互連通,缺乏共享功能,造成數據不能及時更新,難以滿足科研人員在課題研究中,對信息收集、數據分析等資源的需求,阻礙了科研工作的順利開展。
在大數據背景下,科研數據管理服務工作得到了巨大發展,科研管理人員的思想觀念也需得到相應的提升。由于長期受以往高校科研管理方式的影響,科研人員在數據記錄和整理的過程中過于被動,沒有深刻意識到科研數據管理服務對科研工作數據轉化和指導的重要性。為此,我們需要提高科研管理人員的創新理念和服務意識,激發科研管理人員全面提升自身素質。
1.要加大科研管理人員教育培訓力度,通過定期開展數據管理技能培訓,樹立科研管理人員大數據創新思維,提高科研管理人員數據采集、分析能力,能夠及時準確地將數據轉換為可利用的共享信息,為科研工作的創新發展提供精確服務。
2.要強化科研管理人員的創新服務意識。科研管理人員應突破傳統的服務觀念,主動為科研工作需要的數據進行深度挖掘和分析,創新工作方法,尋找新的思路,為科研工作的順利進行提前做好準備。
3.引進專業的科研管理人才。專業科研管理人才的引進能極大程度地提高科研管理工作的質量,對促進高校科研管理人員隊伍建設和科研管理工作的有序發展有著巨大的作用。
大數據背景下,高校科研數據管理服務創新離不開數據采集分析。為避免各部門各機構科研數據信息的各自為政,實現科研數據的共享互通,保證數據信息采集和分析具有大量豐富的價值性,高校應整合各類科研管理數據信息平臺,建立完善的科研數據共享信息系統,確保數據可以進行深度挖掘和分析,嚴格控制學術監督體系,促進科研數據的及時準確性。這將有助于課題立項、研究內容、成果轉化等數據管理,集科研數據收集、整理、分析、存儲和處理服務為一體的科研數據管理服務共享信息系統的建立。高校要通過科研數據管理服務,讓科研人員在科研過程中查漏補缺,促進科研工作的順利進行。[6]
在大數據背景下,高校科研數據管理服務機制應安排專人進行系統運行維護。科研管理者要利用大數據思維,通過革新科研績效考核機制,綜合科研人員的學術成果,對學術的格式進行記錄,對符合條件的科研信息進行整理匯總,再將信息與科研人員進行核對。這樣既減少了科研人員的錄入工作,也減少了科研管理人員復核統計的工作量。在考核評定中,高校要結合質量水平、數量評定等方面綜合考慮,使考核結果更具有全面性,促進科研數據管理服務水平能不斷提升。
高校科研數據管理的目的是為科研工作者服務,應利用大數據豐富科研資源,通過大數據的分析,使高校學術研究的選題更加突出,提高研究效率,避免資源的閑置浪費。組建科研團隊,為科研人員指出正確的方向,對項目、人員、經費等提供精準的指標,使科研工作更具有科學性和有效性。
高校科研數據管理服務的創新需要管理人員在實踐中不斷探索,順應大數據時代的發展,提高自身創新思維和服務意識,建立完善的科研數據共享信息系統,構建高校科研數據管理服務機制,把握好高校科研數據的管理服務需求,提高科研數據的及時準確性,為科研工作的高效順利發展打下良好的基礎。