摘 要:所謂的數(shù)據(jù)挖掘指的是通過搜索海量的數(shù)據(jù)信息,將有用的知識和信息挖掘出來。在數(shù)據(jù)挖掘技術(shù)中,軟件工程數(shù)據(jù)挖掘技術(shù)是一項(xiàng)重要的內(nèi)容。通過表示、分析和提取等方法,將對軟件開發(fā)有用的知識和信息挖掘出來。本文簡要介紹了軟件工程數(shù)據(jù)挖掘,并對軟件開發(fā)階段需要應(yīng)對的問題和解決方案進(jìn)行了簡要的分析。
關(guān)鍵詞:軟件工程;數(shù)據(jù)挖掘;軟件開發(fā);
文章編號:1674-3520(2015)-07-00-01
在數(shù)據(jù)挖掘技術(shù)中,軟件工程數(shù)據(jù)挖掘是一個(gè)重要的領(lǐng)域,對軟件工程的發(fā)展有著極大的影響。所謂的軟件工程數(shù)據(jù)挖掘指的是在海量的數(shù)據(jù)中將有用的知識和信息提取出來,為軟件開發(fā)服務(wù)。
一、軟件工程數(shù)據(jù)挖掘
所謂的軟件工程數(shù)據(jù)挖掘的主要特點(diǎn)有以下幾個(gè)方面。首先,其能夠解決軟件開發(fā)者的數(shù)據(jù)選擇問題;其次,能夠解決挖掘算法的選擇問題;最后,能夠解決軟件工程的數(shù)據(jù)處理和提取問題[1]。
軟件工程數(shù)據(jù)挖掘,可以分為三個(gè)階段:結(jié)果評估、數(shù)據(jù)挖掘、數(shù)據(jù)預(yù)處理。其主要任務(wù)在于提取復(fù)雜混合的信息、異常檢測、估計(jì)預(yù)測、分類等等。與傳統(tǒng)的數(shù)據(jù)挖掘相比,軟件工程數(shù)據(jù)挖掘具有一定的特殊性。
(一)軟件工程數(shù)據(jù)挖掘具有更加復(fù)雜的數(shù)據(jù),包括版本信息、軟件報(bào)告等結(jié)構(gòu)化數(shù)據(jù),以及注釋、代碼等非結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)具有緊密的聯(lián)系,但是卻不能使用同一種算法進(jìn)行計(jì)算。這也造成了軟件工程數(shù)據(jù)挖掘的數(shù)據(jù)更為復(fù)雜。……