于文磊 南京航空航天大學
大數據是一個較為抽象的概念,其融合了統計學、數據分析學以及數據整理等多個學科知識與技術,可以全面的對事物做出較為準確的分析與判斷,近年來,大數據技術已經進入了各行各業之中,尤其是與物聯網、云計算技術等結合應用,共同推動了社會的發展。大數據技術可以高速捕獲、發現和分析大量多樣化的數據中的價值。傳統的大學管理主要是以經驗為主的主觀管理模式,在管理過程中依賴于決策層自身的能力,雖然也有調研、交流、學習等方式提升管理過程中的科學性,但是整體上效率偏低,尤其是管理效果難以及時評估,需要較長時間之后才能看出效果,這對于大學管理較為不利。
數據分析的理念與概念出現的較高,通過數據分析結果,做出決策是一種科學理想的決策思維。但是傳統的數據收集、處理、分析技術效率地下,需要大量的人力與物力,依然難以做到面面俱到。而隨著人類社會的發展,數據的增量已然極為恐怖。大數據技術是基于這樣的背景下誕生的高校的數據收集、處理、分析技術。
作為最高等級的教育場所,以數據為依據進行決策是其科學性的重要體現。這一點在每個的大學院校中體現的極為突出,美國院校基本都設有數據分析與研究機構,其主要職能就是通過數據分析為院校決策提供依據,進行科學的大學管理。通過數據分析與研究,可以建立有效的數字模型,決策者可以通過模型直觀的看出管理中的問題,當大學管理出現問題時,首先就是對數據分析結果進行回溯,然后以此為依據進行決策,實現以數據分析為基礎的科學管理。
大數據的大不單單指的是數據量大,還包括了數據類型大、數據來源大以及數據復雜性大。一般情況下,我們可以簡單的將數據分為結構化數據與非結構化數據,結構化數據是指不同數據之間的存在著較為明顯的聯系性,結構化數據分析的作用很多,但是全面性不足,傳統的數據分析技術由于分析能力有限,主要是對結構化數據進行分析。非結構數據分析極大的提升了數據分析的全面性,在大學管理中應用,可以提供更為全面科學的決策依據。比如在對學生進行評價時,不單單是分數、技能、學術活動、在校經歷等指標性的評價,學生的價值觀、道德觀、人生態度等非指標性的評價也非常重要。指標性評價的數據統計分析非常簡單,通過歷次考試與活動的記錄即可以清晰評價,但非指標性的評價要想保持客觀性較為困難,因此在傳統評價中多以主觀為主。而大數據可以解決這一問題,其通過對學生在校期間產生的所有數據,如社交平臺數據等,進行分析處理,可以全面的揭示學生行為與心理發展過程,進而進行全面科學的評價。
有因就有果,這是我們常說的一句話。因果關系是我們探索世界的基本思維模式,大數據技術就是探尋數據因果關系的一種技術。數據相關性是數據研究的基礎,隨著大學教育信息管理系統的完善,院校數據庫越來越豐富,其內蘊含的財富也越來越巨大,院校決策者與研究人員從中尋找因果關系,發現新問題成為提升大學管理的重要途徑。比如,我們常認為按時吃早餐可以有效提高學習效率,但是復旦大學宓詠老師通過挖掘學生早餐消費次數與成績績點(GPA)的關系發現,早餐次數較多的學生成績績點不會太低,但早餐消費次數較少的學生中成績績點高的也大有人在。說明,早餐與成績并無直接關系,這打破了我們原有的慣性思維認知帶來的偏差。
現階段我們正位于大數據蓬勃發展的時代,大數據在我國高校中的應用效果也初見端倪,但是需要承認的是,在整體上我國的院校研究還落后于先進國家,尤其是美國,而相比于我國的電子商務等行業,大數據技術在院校研究中的應用也有所不足。突出表現在軟件、算法、工具等方面,要想改變這一現狀,需要做好以下幾點內容:
大數據及時的核心是數據,因此數據文化的營造非常重要,只有營造好數據文化,切實意識到數據的重要性,提高數據的質量才能更好的發揮大數據技術的特點與優勢。首先要認識到數據是客觀存在的,是理性思維,科學決策的基礎,避免經驗主義,主觀決策的思想;其次要保證數據收集的真實性與一致性,提高數據質量,高質量的數據才可以提供高質量的決策依據,尤其是在數據爆炸的當下,不實數據與垃圾數據橫向,要缺少提高數據的甄選能力。
數據系統的建設是大數據技術有效實施的基礎,在大數據時代的院校研究中要切實加快數據系統的建設,盡快將不同院校納入到數據系統之中,實現數據信息的公開、共享與應用。比如學術數據系統,知網空間就是一個較為成功的范例。要做到以下幾點:
(1)完善以國家為主導建設的教育信息管理系統,推動其逐漸向社會與高校開發,通過設置不同權限保證其安全性的同時,提高其共享性,發揮社會功能。
(2)建立高效減的數據系統聯盟,實現高校間的數據共享。在推動過程中,要注意設置不同高校間的界限,嚴格區分可共享數據與不可共享數據,促進學術交流的同時,保護院校師生的個人信息安全。
(3)制定統一的院校數據標準,開發一套共同話語和標準界定以及科學的操作流程,有效整合院校研究數據和資源,實現行業整合發展。
數據系統的建設是基礎,數據挖掘分析是手段,而數據的應用是目的。做好數據系統的基礎后,要切實提高數據的挖掘分析能力。數據挖掘技術是針對計算機的數據庫進行全方面的分析與判斷,從而尋找出有效信息的一種技術。在我們的日常生活中會產生大量的數據,這些數據可能是有用的,也可能是無效的,數據挖掘就是對所有的信息進行深入的發掘,尋找有用的信息。分析不同信息之間的關聯,進行聚類與分類。通過數據挖掘之后,原本紛亂繁雜的信息并的井井有條,可以為相關的數據分析與數據決策提供基礎。數據挖掘的應用場景不同,其應用目的與相關算法也有所區別,要根據實際應用需求選擇與數據特征相關的算法。數據系統建成之后,數據挖掘技術是實現大數據技術進行院校研究的基本手段。
總之,對當前中國院校研究而言,知識和智慧是最有價值的,但是數據庫建設和運用數據的技術是最為緊迫和關鍵的。數據也是現代大學管理的一個新的戰略制高點,我們必須通過有效的院校研究,用數據改進大學管理、用數據推動中國大學創新。