李洪濤 張小琴
摘要:在大數據分析挖掘技術內容當中,數據庫主要的作為依托的對象,負責收集所需要的數據,同時對涉及到數據進行儲存以及進一步的分析,以及綜合從而更好的幫助決策者進行決策以及分析,而服務器則主要的提供相應幫助有關數據的分析以及綜合,同時還能夠根據用戶發出的指令,對于信息進行提取,在進行數據的收集以及胎兒過程當中,主要來使用了知識庫,從而對于所需要的多個數據以及信息進行分析歸納以及整合而進行模式評估則是需要根據搜尋者之前所搜尋的,判斷出其大致的興趣之后進行度量而完成整個數據的尋找以及整合處理,從而確定出具體的評定參數。
關鍵詞:數據挖掘技術;軟件工程;應用分析
計算機數據挖掘技術作為一種先進的數據分析技術,目前在各個行業中都得到了廣泛的應用,將計算機挖掘技術應用到互聯網行業中,能夠給互聯網行業的發展提供更多科學、合理的數據分析,給企業決策提供可靠的數據支撐,更好地進行目標定位,并制定準確的發展戰略,從而促進企業的長遠、健康發展。在實際的互聯網行業中,可以通過計算機數據挖掘技術來加強對消費者的行為分析,把握消費者的消費能力、消費習慣,同時分析客戶感知評價,從而為企業的政策制定提供可靠的參考。
1軟件工程應用數據挖掘的意義
1.1深化對信息的理解
基于數據挖掘含有傳統數據信息技術的各項功能,在將大量數據信息進行集中采集后,企業能夠根據數據信息的基本類型進行自動化分類管理。而在此種數據采集模式下,數據采集所涉及的范疇廣泛,內容豐富,可以根據不同數據信息的基本體系展開針對性分析,建立出體系完善的管理平臺,方便企業快速查詢及獲取所需的信息資源。而在軟件研發階段,數據挖掘可以將大量零散的數據資源進行集約化的整合處理,使企業能夠多角度、全方位的了解并掌握不同數據信息的內涵。
簡而言之,數據挖掘能夠以類似大數據技術的手段對大量信息進行針對性分析及識別,并根據既定程序命令,將不同信息以屬性、類型、內容等多種方式進行分類,以便于軟件工程企業在全面理解各項信息資源的同時,提升信息資源的利用效率。
1.2提升信息錄入準確性
數據挖掘擁有強悍的運算功能。傳統的數據信息處理系統在具體運算過程中,需要消耗大量的時間成本,甚至因數據規模的龐大,導致運算系統崩潰。而在數據挖掘的支持下,軟件工程企業能夠在有限時間內提升數據信息的運算速度,規避數據信息混亂與丟失問題的發生,能夠有效提高信息的完整性。而在規模龐大的數據運算過程中,存在部分不具備研發價值的垃圾數據,如果不對此類數據進行處理,將會使其滯留在處理系統中,影響系統的穩定性與運行效率。因此應用數據挖掘手段,能夠有效識別并篩選無用數據,提升數據處理系統的整體質量。
2大數據分析挖掘技術在項目過程當中的具體應用
2.1程序代碼方面應用
首先,需要指明的一點是,這里所說的“程序代碼”主要是指“克隆代碼”。所謂“克隆代碼”,顧名思義,是指那些先以“復制—粘貼”式簡單化操作獲得,繼而被投入到二次使用過程中的代碼。縱觀數據挖掘技術的應用簡史,我們不難發現,數據挖掘在克隆代碼方面的應用當屬于該項技術的早期應用形式,至于具體的應用方法,較為常見的主要包括以下兩種:一是以標識符作為基礎的對比法;二是以文本為基礎的對比法。雖然數據挖掘在檢測克隆代碼當中的應用總體而言已經較為普遍,但需承認,其還有需進一步完善自身關于語義挖掘及語法信息這兩個方面的技術,從而促使檢測精準性及科學性的提升。
其次,數據挖掘技術在程序代碼中的另一重大應用形式表現為其對橫切關注點的挖掘。而其之所以能在這方面獲得一席用武之地,主要還在于關注點自身所具有的一些特性——其在程序中所使用的代碼相似度極高甚至完全相同。就技術的當前發展程度而言,已有多種挖掘方法可應用于Aspect,而以其各自所具有的特點為劃分標準,則主要包括以下幾種:一是形式概念分析法;二是文本和類型分析法;三是聚類分析法;四是自然語言分析法。其中,若將數據挖掘技術應用于執行模式方面,則應該以形式概念分析法作為優先選擇。
最后,數據挖掘技術還有一個應用場景,即其可以被用于挖掘數據庫中的目標代碼或說構件。而從應用實際層面來說,該項技術的引入的確帶動了檢索效率及精準度等的提升。
2.2項目管理具體應用
軟件工程企業如果想將數據挖掘應用在管理活動中,需要從以下兩個層面入手,其一是版本數據控制中有關組織關系的信息挖掘;其二是版本數據控制挖掘。在軟件工程企業管理層面,其自身擁有著顯著的繁瑣及系統特征,開展組織關系工作,能夠有效實現不同數據資源的應用與調配。而如果將管理流程作為系統的整體,依據形成共享文件或電子郵件,實現對信息的實時挖掘,可以形成不同工種間的組織關系,以此規避流程混亂問題的發生,保障功能管理的有效落實。此外,數據挖掘中的版本控制可以推進對數據內部變化情形的的錄入,進而將其作為客戶理解并掌握數據內容的有效依據。而將數據挖掘引入到控制信息內,可以降低維護成本,提升軟件的穩定性。除此之外,數據挖掘還具有警示功能,能夠對系統修復中的問題進行提示,以此提升軟件管理的質量。
2.3漏洞檢測具體應用
為了能夠及時發現并修復存在于軟件開發過程中的系統錯誤或者系統漏洞,從而保障軟件的應用可靠性,一般都需要進行針對軟件的漏洞檢測。將數據挖掘技術應用于故障檢測工作,其實是指可以對程序的執行記錄進行數據方面的挖掘,從而為定位和檢測軟件故障提供包括程序的交互模式及說明在內的依據。
而有關數據挖掘技術在漏洞檢測方面的具體應用,則大致可以歸結為如下兩大步驟。首先,需要確定和規劃與軟件測試相關的各方面內容,具體來說流程應該是:先確定對應的項目,繼而再以用戶需求為導向制定出其中的各項具體內容,待項目框架與內容細節都規劃好了之后,便進入測試方式的擬定階段;接著,收集、清理和轉換存在于漏洞庫中的各項數據信息,詳細地說就是,先將所需數據信息采集來,繼而經過對它們的細致分析得到與軟件缺陷有關的數據集,同時清理掉其他與軟件漏洞無關的多余數據信息,并于最后記得對丟失的項目采取一定補充措施,將數據屬性轉變為數值型屬性。
3結語
綜上所述,數據挖掘是基于數據庫信息處理的現代技術,能夠幫助軟件工程企業提升數據運算效率及質量,降低研發與維護成本,推動企業的長遠發展。進而推進軟件工程企業的自動化、現代化進程,為我國科學技術的快速發展奠定堅實有力的基礎。
參考文獻:
[1]梁波.計算機數據挖掘在互聯網行業中的應用[J].電子技術與軟件工程,2018,145(23).
[2]劉繼.數據挖掘在計算機網絡安全領域的應用[J].數碼世界,2017(11).
(作者單位:中車大連機車車輛有限公司)