肖鵬飛 謝英 劉秀蘭



摘要:利用歷史大數據,通過數據挖掘技術發現教改課題與科研項目研究過程中的規律,在教改課題與科研項目管理中,應用數據挖掘技術實現對歷史數據價值的提煉與分析,為教改課題與科研項目的申報條件設計提供參考,能實時掌握研究人員在每年度項目課題研究中的情況,與預期進行對比分析,及時捕捉到項目課題在研究過程中的異常,及時采取相關措施改善項目課題研究。通過前端圖形化的直觀展示,為教改課題與科研項目管理決策提供數據支持,多維度分析研究整體與個體情況,提供實時的數據支持服務,實現服務型教改課題與科研項目研究管理的目標。
關鍵詞:數據挖掘;科研項目管理;教學改革
引言
醫學高等院校及附屬醫療機構每年在教學改革課題管理與科研項目管理的過程中累積了海量的教改與科研項目的相關歷史數據,在一定時間周期內必須進行數據分割備份,以保證系統的運行效率,這些備份的數據僅提供簡單的查詢備份所用,各部門只能從一個個信息孤島中進行人工關聯提出有用信息,費時費力,計算也并不一定科學。數據挖掘技術更多是從實際的數據出發,利用機器學習中頻繁模式、分類和聚類的技術來分析、挖掘、預測一些對實際有用的結果。近年來高校及附屬醫院及醫療機構紛紛建設了各具特色的大數據平臺系統,有效地利用這些數據也是教改的一個重要研究內容,這些課題的數據通過數據挖掘技術和方法[1],能充分、快捷、準確地實現信息化的科研管理方式。
1. 教改課題管理系統的現狀
各高校及各大附屬醫療機構的教改課題與科研項目管理單位一般由教務科與科研科進行共同管理,主要存在以下幾個問題[2]。
1.1 管理數據來源廣泛,審核過程冗繁
目前的教改課題與科研項目管理一般采用研究人員填報、各級部門和教務科研科聯合審核的方式進行,數據填報和審核量大,申報的需要審核的相關數據基本包含了申報團隊的基本信息、申報書、提供的評審材料、相關的財務支撐數據等,各部門審核過程相對冗長煩瑣。
1.2 容易形成數據孤島
高校及各大附屬醫療機構的教改課題管理系統與各職能部門的信息系統相互獨立運行,相關數據無法集成,形成了大量的數據孤島。多年的教改與科研項目周期,積累了大量的教改課題與科研項目管理的歷史研究數據,并沒有開展進一步的挖掘和分析,只是進行了簡單導出導入的再次分析功能,統計結構簡單。對歷史數據的挖掘主要內容是課題研究相關的頻次,如重點項目與課題的參與率、不同職稱和不同學歷的參與率、項目課題的延續性等,通過趨勢圖、分布圖來挖掘分析形成各類報表則很難實現。
1.3 重結題管理,輕研究服務指導
教改課題與科研項目管理由于技術與人力的短缺,主要是以結題管理為主,輕個性化的研究指導服務。相關研究人員除了關心本人的課題與項目申報及結題,更希望了解和學習教改課題申報書的撰寫方法和課題的研究方法,并能提供相關專業研究人員的專項培訓,從而提高教改課題與科研項目的申報和研究水平。
2. 數據挖掘技術的應用
數據挖掘(data mining,DM)是一門新興的、匯聚多個學科的交叉性學科,這是一個很了不起的處理過程,即從龐大的數據中,將未知、隱含及具備潛在價值的信息進行提取的過程。數據挖掘將高性能計算、機器學習、人工智能、模式識別、統計學、數據可視化、數據庫技術和專家系統等多個范疇的理論和技術融合在一起。數據挖掘技術在教改科研課題管理中的應用研究,流程圖如圖1所示。
3. 數據挖掘技術在科研項目管理中的需求分析與設計
3.1 科研項目管理包括縱向課題、橫向課題、專項任務的管理
縱向課題的管理包括課題申報、課題立項、課題評審、課題變更、課題中檢、課題結題等內容;橫向課題和專項任務包括合同評審、階段評審、驗收等內容[3]。
科研成果包括論文成果、著作成果、專利成果、音像軟件的鑒定、申報以及推廣應用;科研檔案管理包括電子檔案管理和紙質檔案管理;科研經費管理是科研管理中的重要工作,分為縱向經費管理和橫向經費管理,包括合同經費、配套經費、經費預算、經費到賬、經費報銷等管理;科研設備管理部分主要分為設備采購、設備日常管理、計量設備管理、倉庫出入庫管理、涉密設備管理;網絡評審管理是基于局域網實現項目基本信息管理、網絡評審、網絡審批、網上公文傳遞等功能。
3.2 應用大數據的挖掘技術
應用大數據的挖掘技術,可以實現對各類科研項目課題研究的歷史數據進行價值挖掘,通過前端圖形化展示使各類科研項目課題研究的特點更加直觀,通過多維的數據挖掘評價維度,展示項目承擔者的學術能力水平與發展潛力,可以從不同角度分析包括教改課題研究在內的整體與個體情況。充分利用歷史數據構建數據倉庫,通過數據挖掘技術發現教改課題與科研項目研究過程中的規律,開展不同維度上的課題研究數據分析,實現對每個課題的深度分析,展現課題研究的趨勢信息和預警信息。利用大數據高性能計算的優勢,展示課題研究的實時數據,為有針對性的教改課題研究指導提供依據,并且能夠及時發現教改課題研究在各項指標上的異常,通過趨勢圖、統計圖等,可以使教務科研管理部門及時捕捉到教學改革課題與科研項目研究過程中的異常,并及時采取相關改進措施。
3.2.1 成立信息技術與大數據數據處理團隊
根據需要,成立專門的信息技術與大數據數據分析專家團隊。歷史大數據倉庫的構建受到軟硬件、專業技術人員能力等客觀因素的影響,成立專門的信息技術與大數據的數據分析專家團隊,保障歷史大數據的數據倉庫設計具有完整與正確可靠的設計,保障決策數據來源與數據倉庫模型的準確性。
3.2.2 大數據處理過程
歷史大數據倉庫的數據抽取、清洗與分析設計。大數據主要來源于教改課題與科研項目管理系統、人事管理系統、研究人員發展評價管理系統、財務系統等,數據在進入數據倉庫前需要進行抽取、清洗去除無效數據,保證基礎數據準確進入數據倉庫,根據專家組、教務科研科、研究人員等角色的需求分析設計各類維度表與指標KPI的度量值,實現將數據轉化為知識,為決策服務的目的。
3.2.3 圖形化展示結果
研究數據結果的直觀圖形化展示。數據挖掘分析結果的前端圖形化展示,使教改課題與科研項目研究中的特點更加直觀,為管理決策提供直接的數據支持。通過趨勢圖、統計圖、直方圖、百分比圖等使管理者能及時捕捉到研究過程中的變化,及時采取相關應對措施。
3.3 大數據挖掘的實現過程
系統在醫院內部網絡環境下運行,技術路線圖如圖2所示。
4. 數據挖掘技術在教改科研課題管理中的應用研究
(1)利用相關的教改與科研課題項目及相關財務、人事、研究人員發展評價系統等的歷史大數據構建數據倉庫,確定管理數據倉庫的主題包括課題申報、課題評審、研究進度、研究成果等,進一步設計教改課題研究分析維度和粒度,建立數據倉庫的模型。通過數據挖掘技術發現課題與項目中研究過程的規律,完善教改課題的結題指標和相關立項政策的制定。
(2)進入數據倉庫的數據必須進行抽取、清洗與加載,去除無效的數據,確保數據的完整性、正確性和可靠性。通過清洗的數據如指南方向、負責人、研究成果、參與人、年度等相關數據進入大數據中心,這些數據通過后續的數據挖掘可以得出每個課題的按期結題概率分析,經費使用合理性分析,整體研究進展趨勢信息情況、整體經費使用情況、研究成果推廣情況等的預警與指導。
(3)數據挖掘技術的設計主要采用神經網絡與決策樹等相關人工智能算法。決策樹(decision tree,DT)分類算法是一種以決策樹形式表示的分類規則,能夠根據一定的規則將眾多的數據分類,從中挖掘出有價值的、潛在的信息,適合分類及處理預測模型的任務,結論易于解釋和理解。神經網絡系統具有高度的抗干擾能力,所以,在各個領域內神經網絡算法應用廣泛,基于關聯規則分析的分類算法搜索頻繁模式與類標號之間的強關聯,有效避免了決策樹歸納一次只考慮一個屬性的限制,使其比一些傳統的分類算法更為準確。通過對教改課題與科研項目數據進行分析,達到趨勢分析、預測偏差預警,來發現影響教改課題研究的因素和影響機制,實現將數據轉化為知識,為決策服務的目的[4]。
通過前面對系統業務流程的分析及功能模塊的描述說明,可將科研業務管理系統中實體對象如教師職工、課題、論文、校本教材等實體數據集開發系統整體的功能圖,如圖3所示。
5. 數據挖掘技術在教改科研課題中的研究應用效果評價
(1)為教改科研項目課題申報管理提供依據,通過數據挖掘技術掌握項目課題研究與教師職稱、專業、研究方向、研究成果之間的關聯關系,有針對性地為課題管理提供專業研究學習,同時為申報條件設計提供參考。
(2)為教改科研項目課題研究提供參考,研究人員可以實時掌握自身在年度課題研究中的位置,掌握本人相關評價指標在研究進度、研究成果等不同維度上與其他課題組比較存在的優勢和不足,為研究人員改善課題研究情況提供依據。
(3)通過大數據的數據挖掘技術可以對教改科研課題研究的進展與預期進行對比分析,及時發現此研究在各項指標上的異常,通過趨勢圖、統計圖、百分比圖等使教務科研管理部門及時捕捉到教學改革課題與科研項目在研究過程中的異常,有利于及時采取相關應對措施。
結語
在科研管理信息化中充分利用歷史數據構建數據倉庫,通過數據挖掘技術發現教改課題與科研項目研究過程中的規律,開展不同維度上的課題研究數據分析,實現對每個課題的深度分析,展現課題研究的趨勢信息和預警信息利用大數據高性能計算的優勢[5],展示課題研究的實時數據,為有針對性的教改課題研究指導提供依據,為科研項目課題的管理決策者提供數據支持,并及時采取相關改進措施。
參考文獻:
[1]戴麗娟.大數據技術在高校教育中的應用探討[J].信息與電腦(理論版),2019, (15):39-240.
[2]吳學會,李佳恒,叢慧源,等.大數據技術在中醫高校教改課題管理中的應用研究[J].中國中醫藥現代遠程教育,2019, 17(7):146-148.
[3]胡曉林,劉劼,葛宏,等.信息化在科研管理中的應用及發展[J].技術與創新管理,2014,35(1):17-20.
[4]谷建英.基于.NET的科研管理系統的設計與實現[D].石家莊:河北科技大學,2013.
[5]彭靜,李秀瀅.數據挖掘技術在教務管理系統中的應用[J].信息系統工程,2021,(4):44-46.
作者簡介:肖鵬飛,碩士研究生,高級工程師,研究方向:計算機應用技術、智能大數據、圖形圖像處理。
基金項目:湖南中醫藥大學教學改革項目(編號:2019-JG056)。