藍善根
摘 要在大數據時代,數據信息數量快速增長,為了實現對這些數據信息的有效存儲和利用,本文提出了一套基于商業智能的數據分析系統。智能數據分析系統的存在能夠為政府或者企業的工作提供重要的數據信息支持。文章在闡述智能數據分析系統設計和實現的基礎上,具體分析智能數據分析系統在政務系統中的應用。
【關鍵詞】智能 數據分析系統 關聯分析 聚類分析
1 智能數據分析關鍵技術
1.1 智能數據抽取工具——ODI
ODL作為Qracle公司的智能數據抽取工具,實現對大量數據信息的收集、轉換、加載和整理,并實現多種關系型數據庫的繼集成操作。智能數據挖掘方法如圖1所示。
1.2 智能數據分析工具——BIEE
智能數據分析系統以Qracle公司的BIEE作為數據分析軟件,數據分析軟件的功能十分強大,具體分為物理層、邏輯層、展現層等數據模型。通過應用這個模型實現企業各異構數據源的有效連接。BIEE范圍與預測準確度的關系如表1所示。
1.3 智能系統功能模塊
智能系統功能模塊主要包括數據的關聯性分析、數據相關性分析、數據聚類分析、數據回歸分析等。其中,數據相關分析模塊是指在相應的路徑下導入所需要的分類文件,之后選擇變量,應用MTC的方法來對變量相關性問題展開分析。確定多變量信息,借助多變量之間的相關性數據分析來對數據中各個變量的關聯大小問題進行分析。數據關聯分析模塊。數據關聯分析模塊能夠應用關聯性的規則算法來來對各個數據之間的影響問題展開分析,在分析之后確定數據之間有效的關聯規則。數據分析分類模塊需要在一定路徑下導入分類數據文件。數據聚類分析模塊能夠借助數據間相關性的大小問題來實現對導入數據信息的自動化分類管理。
2 智能數據分析系統設計
2.1 數據模塊設計
智能數據系統被劃分為數據管理、權限管理、數據抽取、數據開發等四個管理模塊。
2.1.1 數據管理模塊
數據管理模塊是指通過對用戶提交數據信息的記錄來實現數據管理。用戶在提交數據之前需要創建表格和增添字段,之后將上交之后的數據信息存儲到表格中,導入相應的數據。數據管理模塊一般包括表管理、數據管理、字段管理。
2.1.2 權限管理模塊
權限管理模塊主要是實現對用戶、角色、菜單、權限和日志等內容的管理,其中最為重要的管理內容是是角色分配權限和為用戶安排角色的功能。
2.1.3 數據抽取模塊
數據抽取模塊主要是對數據信息的抽取,在抽取數據信息之后將數據信息分別安排在不同的數據庫中。在這個操作過程中涉及到的內容包括資料庫的建設、物理架構和邏輯架構的建設、項目模型接口的建設。
2.1.4 報表開發模塊
報表開發模塊主要表現在對數據模型的創建、BIEE報表的開發、JAVA集成操作等。在報表開發過程中需要涉及到報表的制作、數據模型的創建、報表的展示等。
2.2 數據信息抽取方案的設計
數據信息抽取的目標是將數據信息模塊系統中分散的數據整合在一起,通過ODI建立相應的數據倉庫,具體操作過程如下所示:
(1)打造主要資料庫。主要的資料庫保存了企業發展過程中所有的IT資源拓撲結構。主要資料庫能夠保存重要的項目和數據模型信息,為ODI圖形模塊使用提供重要支持。
(2)打造工作資料庫。在工作資料庫中保存各個項目和數據信息。在工作中資料庫和主資料庫的關系是彼此對應的。
(3)創建數據服務器。結合不同用戶的需求來創建多個物理架構。
(4)創建邏輯架構。邏輯架構的創建往往和物理架構是一一對應的關系。
(5)創建項目,每個項目也都需要對應一個相應的邏輯架構。
(6)模型的創建。每個模型的創建都需要對應一個邏輯結構。
(7)接口的創建。在接口創建完成之后每個模型都需要對應一個邏輯架構。
2.3 數據信息分析模塊的設計
2.3.1 物理模型設計
物理模型設計是指對數據庫分析對象的設計,物理模型設計是邏輯模型在數據倉庫中的物理實現。物理模型的設計需要對數據庫管理系統、數據庫系統運作環境、數據庫外部設備特點進行全面的了解,在全面了解之后將數據在數據庫中以表格的形式來展現。
2.3.2 邏輯模型的設計
邏輯模型是在物理模型設計基礎上對數據的進一步細化處理,能夠將多種數據表格轉化為維表,并對維表進行有層次的劃分,設置相應的劃分規則。BIEE的邏輯模型形式有很多,比如雪花模型、星型模型,在經過調查分析之后實現對數據信息的預處理。系統模型的優勢是能夠簡化事實表和維度表之間的關系,為用戶提供更為直觀的數據信息。在星型模型中,事實表處于最中心的位置上,各個維度表在周圍,形成了一個輻射狀。在這個模式中,用戶能夠從數據倉庫中查詢到具體的業務數據。邏輯模型SSIS的體系結構如圖2所示,SSIS的體系由四個關鍵部分組成,分別是服務、對象模型、運行時可執行文件、封裝數據流引擎和數據流組件。
2.3.3 展現模型的設計
展現模型是數據庫用戶在經過一系列操作之后最終看到的模型,每個展現模型都會對應一個分析主題,對維度和事實表之間的關系問題做出了清晰的描述,向人們清楚的展現了事物之間的關系。展現層模型和用戶數據模型比較接近,具體包括辦公室數據、工作績效數據、個人行為數據。
3 智能數據系統功能實現和測試
3.1 智能數據系統的實現
智能數據系統包含三個層面的內容,分別是物理層、邏輯層、展現層。在BIEE的后臺管理下能夠完成對數據模型的創建。以個人行為績效模型的構建為例,智能數據系統實現操作步驟如下所示:
(1)BIEE管理工具通過OCI的方式來將數據庫中的數據信息加載到資料檔案庫物理層中。
(2)BIEE報表的開發。BIEE報表在開發之前要登錄到BIEE服務器上,安裝操作完成之后進行登錄瀏覽操作。
經過分析之后得到相應的圖形分析結果,并結合用戶的需求來制作不同形式的報表。報表制作完成之后,通過Web Service接口將報表嵌入到網頁中,具體操作如下:首先,下載wsdl文件,啟動BIEE服務,打開瀏覽器輸入地址。其次,生產客戶端代碼,應用Axis插件來將wsdl文件生產客戶端代碼。最后,調用代碼說明。在應用BIEE登錄之后,采取logonex的方式來驗證。
3.2 智能數據系統的調試
智能數據系統的運行服務器操作系統是windows2008,硬盤有500G,實際運行內存有4G。系統分析軟件應用的是Oracle BIEE。數據抽取軟件應用的是Oracle ODI11g,客戶端使用的操作系統是Windows8系統,硬盤1T,內存有4G。在系統應用操作中,發現用戶管理模塊、用戶角色管理模塊、菜單管理模塊、權限管理模塊的開發和刪除管理等都比較正常,顯示出系統良好的社會適應性。
4 結束語
綜上所述,文章結合最新技術發展情況,基本討論了基于BIEE數據分析系統研究的意義和價值,并介紹了基于系統實現的重要技術形式,經過實際運行發現系統的數據采集精確度很高、傳輸速度快、總體性能穩定、數據存儲量大、數據分析操作簡單、系統性能穩定、數據存儲量大,能夠充分滿足人們的使用需求。
參考文獻
[1]張朝霞,韓素青.智能數據分析系統的研究與實現[J].太原師范學院學報(自然科學版),2017,16(02):32-36.
[2]李文瓊.電子商務企業數據分析與智能系統[J].信息系統工程,2015(01):80+71.
[3]太原高新區智能數據分析處理系統[J].中國高新區,2011(01):120.
作者單位
貴州省郵電規劃設計院有限公司 貴州省貴陽市 550003