黃安
(廣西農業職業技術大學,廣西南寧,530007)
隨著大數據時代的到來,依靠大數據技術進行高校信息化建設也得到快速發展[1]。大數據已經深入到全國高校信息化建設的方方面面。國內高校面對大數據的快速發展,是加快校園信息化建設的良好機遇,同時也面臨更大的挑戰。通過大量的查閱相關文獻,以及上網查找資料發現,國內很少有高校提出通過hadoop建立校本數據中心的實施方案可供我們參考。
對于校內的數據綜合查詢,以往的做法都是直接或間接的訪問校內各業務信息系統的數據庫,往往一個數據項又出行在多個數據庫里,這就造成了數據的不統一性,甚至對數據的安全性產生影響,冗余數據還會導致查詢效率降低。依賴于校園各信息系統的相關教學質量、數據分析管理決策、科研分析等拓展業務就很難開展。正因為如此,我們就借助Hadoop技術在大數據方面的優越性,以此來建立校本數據中心,通過該平臺,采集校內各大信息系統的數據,建立常用的主題數據庫。在此基礎上,根據使用者不同的角色,提供不同層面的數據實時查詢和數據實時分析,為學校領導及廣大師生提供可靠準確的數據,有助于使用者做相關的思考和決策。
校本數據中心采用Hadoop分布式文件系統 (HDFS) 、分布式數據庫Hbase和數據倉庫Hive進行搭建。Hadoop是一個由 Apache 基金會所開發的分布式系統基礎架構,提供了可靠的、可擴展的、可分布式計算的開源服務[3]?!?br>