陳文怡
【摘 要】本文提出了一種基于大數據理論的項目管理分析方法。在此方法研究中,將全局信息引入項目管理系統中,主要采用大數據管理、信息系統數據挖掘理論中的聚類分技術,快速準確地分析出項目進展及狀況,最終完成總體分析。為項目管理分析開辟了新的應用領域。運用大數據挖掘從大型數據庫信息中自動提取有效的、新穎的、潛在有用的信息,且大數據挖掘理論可為項目管理數據應用的研究做出重要貢獻。
【關鍵詞】大數據挖掘;數據分類;項目管理;聚類分析
【Abstract】This paper proposes a project management analysis method based on big data theory. In this method research, the global information is introduced into the project management system, mainly using the clustering technology in the big data management and information system data mining theory to quickly and accurately analyze the project progress and status, and finally complete the overall analysis. Opened new application areas for project management analysis. Using big data mining to automatically extract effective, novel and potentially useful information from large database information, and big data mining theory can make an important contribution to the research of project management data application.
【Key words】Big data mining;Data classification;Project management;Cluster analysis
1. 引言
(1)大數據挖掘是從大量數據中有效地發現有價值的、不明顯的信息,這種涉及從數據中提取信息的過程也是一種探索性數據分析。大數據挖掘是從存儲在數據庫、數據倉庫或其他信息庫中的大量數據中發現有趣的信息,如模式、關聯、變化、異常和重要結構的過程。大數據挖掘通常用于非常大的數據庫,由于數據庫的復雜性和容量龐大,使得它通常是不能被解讀或分析。大數據挖掘的目的是從這些大型數據庫中發現有用的信息,這種過程被稱為數據庫知識發現(KnowledgeDiscoveryinDatabases,KDD)。大數據挖掘涉及數據庫技術、統計學、機器學習、高性能計算、模式識別、神經網絡、數據可視化、信息檢索等多學科的技術集成。大數據挖掘中的一個常見問題是查找數據屬性之間的關聯。大數據挖掘任務有以下類別:分類描述;關聯分析;聚類分析;孤立點分析;進化分析。故障是指與觀察到的變量或與設備相關聯的計算參數在可接受范圍內發生了偏離,即故障是一個過程異常或癥狀。總的來說,故障與設備或儀表的正常行為相背離。它們可能出現在基本設備或其控制儀器中,并代表著性能惡化、部分故障或全部故障。故障分析的目的是通過行為異常識別系統來保證操作成功。由于適當的過程監控,使停機時間最小化,改善了操作的安全性,降低了制造成本。一般來說,故障分析的過程可分為三個主要步驟:報警、識別、評估。電力系統是一個最復雜的人工綜合控制系統,其安全、穩定、經濟可靠運行,在社會經濟的發展中起著非常重要的作用。
(2)為了解決項目管理系統資源平衡和任務分解落實這一難題,必須對系統本身及其復雜性不斷提高分析、運行和控制水平。當發現系統從正常運行狀態到異常運行故障時,其資源量可能發生顯著的異常變化。異動檢測觸發器就是利用數據嗅探的突然變化來判別系統是否發生故障或運行異常。通過對數據測量與正常系統參數的對比,可以檢測出項目管理系統資源異動位置,因此,可以實現選擇性故障排除。在本研究中,全局信息將被引入后備保護系統中。在某些故障后,利用監督管理管理單元進行實時定量檢測。然后對故障分量和故障區段數據進行快速準確的分析,最終完成故障隔離。
(3)基于統計理論,還將對非線性復雜系統進行大量的基礎研究,采用大數據挖掘中的聚類分析技術項目管理中的資源利用檢測問題。
2. 數據挖掘中的分類
分類是大數據挖掘領域的經典課題之一。聚類是將數據對象分類成一組不相交類的過程,稱為簇,因此類中的對象之間具有高度的相似性。聚類是無監督分類的一個分支。“分類”是指將數據對象分配給一組類的過程。“無監督”意味著集群不依賴于預定義的類,而對數據對象進行分類。聚類分析的應用包括以下三個方面:(1)識別原始數據中的簇;(2)確定原始數據中簇的個數;(3)驗證原始數據中發現的簇。聚類分析具有很強的數據分析能力,已成功應用于各個領域的研究。假設有n個樣本,每個樣本有m個指標,觀測數據可以表示為αij(i=1nj=1m)。最常用的描述關系程度的測量是距離dij通常表示樣本ξ(i)和η(j)之間的距離。
3. 基于數據挖掘的故障分析
例如,其中的熱工元件是熱工保護中進行信號采集的重要組成部分,熱工元件能否安全可靠地運行,直接關系到熱工保護的安全性和可靠性。但是,由于溫度、壓力流量以及閥門位置燈原因,常常會造成誤發信號,使得主輔機產生保護異常的現象。有的熱力發電廠中,因熱工元件故障引起的熱工保護異常甚至占到了所有故障發生率的一半以上,通過數據采集分析發現,主要原因是元件的質量不高、部分元件老化。因此,要加強對熱工元件的選購和設計,盡量避免單點參與機組保護的模式,盡最大可能降低機組保護異常的風險。同時,從各種數據采集和分析挖掘中,可以得到其他信息源的類似分析和結論。
4. 結語
在電力項目管理系統的控制中,特別是在電力系統的廣域后備保護中,保護裝置的準確、快速、可靠性能的前提是相應的故障類型和故障位置可以快速識別并準確定義。在本研究中,全局信息已經被引入到后備保護系統中。基于大數據挖掘理論,主要利用聚類分析技術來尋找電量的顯著變化特征。然后,對故障部件和故障部分進行快速準確的識別,最后完成故障分析。本文的主要技術貢獻和創新在于將全局信息引入到電力項目管理系統中,為電力項目管理系統的故障分析開發新的應用。大數據挖掘被定義為從大型數據庫中自動提取有效、新穎、潛在有用且全面的信息挖掘過程。它在學術和應用科學研究中得到了廣泛的應用,在這些研究中,數據集是通過實驗產生的。大數據挖掘理論的最重要特征是其跨學科性和普遍性。大數據挖掘在很大程度上與機器學習有關,在機器學習中,科學家開發算法和技術來發現和描述數據中的潛在規律。因此,大數據挖掘為信息處理、模式識別和人工智能等許多領域提供了有用的技術。
參考文獻
[1] 王元卓,賈巖濤,劉大偉,等.基于開放網絡知識的信息檢索與數據挖掘[J].計算機研究與發展,2015,52(02):456~474.
[2] 李濤,曾春秋,周武柏,等.大數據時代的數據挖掘——從應用的角度看大數據挖掘[J].大數據,2015,1(04):57~80.
[3] 趙建華.半監督學習在網絡入侵分類中的應用研究[J].計算機應用研究,2014,31(06):1874~1876.
[4] 馬昱欣,曹震東,陳為.可視化驅動的交互式數據挖掘方法綜述[J].計算機輔助設計與圖形學學報,2016,28(01):1~8.
[5] 梁吉業,錢宇華,李德玉,等.大數據挖掘的粒計算理論與方法[J].中國科學:信息科學,2015,45(11):1355~1369.
[6] 吉根林,趙斌.面向大數據的時空數據挖掘綜述[J].南京師大學報(自然科學版),2014,37(01):1~7.
[文章編號]1619-2737(2018)05-25-847