劉知云
摘要:近年來,信息技術(shù)的快速發(fā)展使得數(shù)據(jù)挖掘技術(shù)也在各個行業(yè)中獲得了廣泛的應(yīng)用,并且數(shù)據(jù)挖掘技術(shù)也充分展現(xiàn)出了顯著優(yōu)勢,推助許多行業(yè)的快速發(fā)展。計算機(jī)技術(shù)也已經(jīng)成為人們生產(chǎn)生活中不可或缺的工具,而數(shù)據(jù)挖掘技術(shù)在計算機(jī)軟件工程中的運用則具有現(xiàn)實意義。信息化時代下,以往的信息處理技術(shù)難以滿足海量信息的處理和存儲要求,數(shù)據(jù)挖掘技術(shù)的應(yīng)用則很好地解決了這些問題,在軟件工程中的運用能夠?qū)?shù)據(jù)挖掘技術(shù)的優(yōu)勢全面發(fā)揮,在改善軟件工程研發(fā)效率的同時也降低了管理成本。本文主要圍繞軟件工程中數(shù)據(jù)挖掘技術(shù)的運用展開論述,探討了有關(guān)的應(yīng)用策略。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);軟件工程;應(yīng)用對策
在大數(shù)據(jù)分析領(lǐng)域中,數(shù)據(jù)挖掘是一項新興的概念,數(shù)據(jù)挖掘的關(guān)鍵便是針對數(shù)據(jù)量大且價值密度低的數(shù)據(jù)進(jìn)行高效分析,從中提取出具有應(yīng)用價值和研究價值的信息數(shù)據(jù),從而進(jìn)一步提高數(shù)據(jù)的應(yīng)用率。軟件工程經(jīng)歷了多年的發(fā)展,在軟件開發(fā)與項目管理等方面也面臨著數(shù)據(jù)分析的問題,如漏洞分析和源代碼管理等。軟件在長時間運作之下不斷累積數(shù)據(jù),但數(shù)據(jù)量越來越大的同時傳統(tǒng)的處理手段無法實現(xiàn)全面處理,所以數(shù)據(jù)挖掘技術(shù)在軟件工程中的有效應(yīng)用成為當(dāng)下研究的重點方向。
1 數(shù)據(jù)挖掘技術(shù)簡介
數(shù)據(jù)挖掘技術(shù)屬于現(xiàn)代化的信息處理技術(shù),與傳統(tǒng)的信息處理技術(shù)對比之下具有非常明顯的功能性優(yōu)勢,因此也在許多行業(yè)中獲得了普遍運用。目前在軟件工程領(lǐng)域中,對于數(shù)據(jù)挖掘技術(shù)應(yīng)用價值的研究仍然較少,很多軟件工程都在沿用傳統(tǒng)的數(shù)據(jù)處理技術(shù),導(dǎo)致數(shù)據(jù)處理效率難以提升。而數(shù)據(jù)挖掘技術(shù)則包含了多種功能,不同功能之間也有著明顯的聯(lián)系性,可以實現(xiàn)全面評估,對于部分軟件工程來說,數(shù)據(jù)挖掘技術(shù)的應(yīng)用最明顯的優(yōu)勢便在于數(shù)據(jù)處理效率獲得了顯著提升,同時數(shù)據(jù)丟失等問題也得到了很好的解決,對企業(yè)的發(fā)展帶來了有效保障。
2 數(shù)據(jù)挖掘技術(shù)應(yīng)用于軟件工程的關(guān)鍵意義
2.1 有助于信息的獲取
數(shù)據(jù)挖掘技術(shù)也包括傳統(tǒng)信息處理中的各項重要功能,在完成信息采集工作后,可以按照數(shù)據(jù)信息的具體類型進(jìn)行分類處理。在這一處理機(jī)制下,數(shù)據(jù)挖掘技術(shù)所涉及的業(yè)務(wù)范圍也有了進(jìn)一步的拓展,可以結(jié)合數(shù)據(jù)的具體特征進(jìn)行分析,在海量數(shù)據(jù)資源中建立一個功能性完備的信息管理系統(tǒng),可以幫助人們快速檢索到需要的數(shù)據(jù)資源。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于軟件工程中,也可以將許多信息進(jìn)行整合處理,幫助企業(yè)快速掌握各方面數(shù)據(jù)信息。
2.2 信息的正確錄入
數(shù)據(jù)挖掘技術(shù)的運算水平非常高,常規(guī)數(shù)據(jù)信息系統(tǒng)在運算過程中往往會需要較高的時間成本,并且部分情況下也可能由于數(shù)據(jù)處理量過高導(dǎo)致運算系統(tǒng)崩潰等問題。而數(shù)據(jù)挖掘技術(shù)的應(yīng)用則可以有效避免這一問題,運算效率更高的同時在運算期間也能夠進(jìn)一步規(guī)避數(shù)據(jù)丟失或運算混亂等問題,加強(qiáng)數(shù)據(jù)處理的整體效果。對于大規(guī)模數(shù)據(jù)的運算來說,一些垃圾數(shù)據(jù)并沒有利用價值,但可能會存儲于數(shù)據(jù)處理系統(tǒng)中影響系統(tǒng)運作效率,數(shù)據(jù)挖掘技術(shù)的應(yīng)用也可以將這些垃圾數(shù)據(jù)進(jìn)行處理,將具有價值的信息錄入到系統(tǒng)中。
2.3 提高數(shù)據(jù)處理效率
對于數(shù)據(jù)挖掘技術(shù)來說,數(shù)據(jù)轉(zhuǎn)換也是最主要的優(yōu)勢之一,能夠?qū)⒒靵y的數(shù)據(jù)信息進(jìn)行整合處理,成為使用形式,而這些混亂的信息也可以在整合之后進(jìn)行合理利用。雜數(shù)據(jù)挖掘過程中,可以自動選擇合理的分析模式,針對模糊數(shù)據(jù)進(jìn)行及時處理,使最后的數(shù)據(jù)結(jié)果能夠全面利用。結(jié)合獲取到的數(shù)據(jù),從不同方向著手考查數(shù)據(jù)的真實性和價值,將真實地數(shù)據(jù)進(jìn)行整合,讓數(shù)據(jù)可讀化,也就是將分析結(jié)果作為全新的知識以供參考。數(shù)據(jù)分析過程一般較為煩瑣,需要對不同過程進(jìn)行多次驗證,才能獲取真實的運算結(jié)果,而數(shù)據(jù)挖掘技術(shù)在軟件工程中的有效應(yīng)用則可以全面改善數(shù)據(jù)運算的效率與質(zhì)量[1]。
3 數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用策略
3.1 信息挖掘
軟件工程可以實現(xiàn)信息數(shù)據(jù)的全方位管控,而且軟件工程的應(yīng)用范圍也非常廣闊,在軟件開發(fā)過程中需要涉及的信息類型多種多樣,而軟件工程的版本則可以對這些信息數(shù)據(jù)進(jìn)行統(tǒng)一控制,確保軟件在開發(fā)期間的各種數(shù)據(jù)資源都能進(jìn)行同步更新,進(jìn)一步確保軟件開發(fā)的質(zhì)量以及開發(fā)過程的效率性,讓開發(fā)項目的目標(biāo)能夠順利實現(xiàn)。在數(shù)據(jù)挖掘過程中,包括軟件開發(fā)更替的數(shù)據(jù),技術(shù)人員可以快速區(qū)別軟件的內(nèi)部結(jié)構(gòu),并且還可以充分應(yīng)用數(shù)據(jù)挖掘技術(shù)的優(yōu)勢,在后續(xù)的工作中能夠迅速找出軟件內(nèi)部問題并解決,完成軟件開發(fā)任務(wù)。
3.2 軟件漏洞檢測
在軟件工程中,漏洞檢測作為其中不可或缺的工作內(nèi)容,可以確保軟件開發(fā)質(zhì)量和系統(tǒng)的安全運作,及時發(fā)現(xiàn)隱患并及時排除隱患。軟件漏洞的快速修復(fù)可以為用戶提供更加穩(wěn)定的保障。在數(shù)據(jù)挖掘技術(shù)的應(yīng)用方面,漏洞檢測中不但要針對軟件進(jìn)行基本的測試內(nèi)容,而且也應(yīng)當(dāng)進(jìn)行相關(guān)性檢測,與軟件漏洞有關(guān)的項目內(nèi)容也應(yīng)該進(jìn)行全面檢測,才能滿足軟件開發(fā)的現(xiàn)實要求。數(shù)據(jù)挖掘技術(shù)可以結(jié)合所記錄的內(nèi)容來分析數(shù)據(jù),針對分析結(jié)果進(jìn)行改進(jìn),之后再決定選擇哪種測試模式完成測試工作,確保測試模式的選擇更加符合軟件工程的現(xiàn)實需求。在漏洞數(shù)據(jù)的處理方面,數(shù)據(jù)挖掘技術(shù)需要先清理掉數(shù)據(jù),之后利用相關(guān)的數(shù)據(jù)進(jìn)行分析和提取,清除掉沒有應(yīng)用價值的數(shù)據(jù),再對缺失的部分內(nèi)容進(jìn)行補(bǔ)充,以數(shù)據(jù)的方式呈現(xiàn)出來。除此之外,數(shù)據(jù)挖掘技術(shù)在軟件漏洞中的運用需要選擇合理有效的數(shù)據(jù)模型來完成分析與驗證工作,盡量選擇可行的挖掘模式,使其成為測試集。具有關(guān)聯(lián)的系統(tǒng)也需要針對運算結(jié)果進(jìn)行類比,選擇最為合理的結(jié)果。在漏洞檢測中,還要對軟件漏洞進(jìn)行分類與描述,在數(shù)據(jù)庫中及時更新軟件漏洞數(shù)據(jù),如此一來但凡其他的相關(guān)軟件或系統(tǒng)在遭遇相似問題時便可以及時從數(shù)據(jù)庫中調(diào)取數(shù)據(jù),從而進(jìn)行快速操作,降低漏洞檢測所需時間的同時也為漏洞的檢測與解決提供參考依據(jù),因此在漏洞數(shù)據(jù)更新方面也要保證數(shù)據(jù)分類的合理性[2]。
3.3 開源軟件的數(shù)據(jù)挖掘