摘 要:現(xiàn)在信息技術(shù)在不斷的發(fā)展和進(jìn)步,在我們的生活和工作中,信息技術(shù)得到了廣泛的運(yùn)用,因此能得到很多不同種類(lèi)的數(shù)據(jù)信息。但是,這些數(shù)據(jù)信息都是比較雜亂的,如果公司想要通過(guò)些數(shù)據(jù)來(lái)開(kāi)展研發(fā)工作,會(huì)是徒勞無(wú)功的。所以,開(kāi)展數(shù)據(jù)挖掘技術(shù)研究是首要的工作。目前,數(shù)據(jù)挖掘技術(shù)在軟件工程項(xiàng)目應(yīng)用中顯得格外重要,它可以把平時(shí)工作和生活中應(yīng)運(yùn)而生的零散數(shù)據(jù)轉(zhuǎn)變成具有實(shí)用意義的數(shù)據(jù)信息,我們可以根據(jù)數(shù)據(jù)挖掘技術(shù)的根本特點(diǎn)來(lái)研究它在軟件工程項(xiàng)目中的重要性。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);數(shù)據(jù)信息
中圖分類(lèi)號(hào):TP311.5文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2096-4706(2018)05-0025-02
Application and Research of Data Mining Technology in Software Engineering
ZHANG Yu
(Beijing Municipal Institute of Labour Protection,Beijing 100054,China)
Abstract:Now information technology is constantly developing and progresses. In our life and work,information technology will be widely used,so as to get a lot of different kinds of data information. However,the data generated are all messy,if the company wants to carry out research and development work with these data,it is useless,so the development of data mining technology is the first thing to do. At present,the data mining technology is particularly needed in the application of software engineering projects. It can transform the scattered data from the ordinary work and life into very useful data information. We can study the importance of the data mining technology in the software engineering project according to the basic characteristics of the data mining technology.
Keywords:data mining technology;data information
1 數(shù)據(jù)挖掘技術(shù)概述
1.1 挖掘技術(shù)的含義
現(xiàn)在是信息時(shí)代,我們生活和工作中都會(huì)運(yùn)用信息系統(tǒng),肯定會(huì)得到很多的數(shù)據(jù)信息,而數(shù)據(jù)挖掘技術(shù)是把這些信息進(jìn)行重新編輯,現(xiàn)在軟件工程需要的數(shù)據(jù)信息更多,這就要求數(shù)據(jù)挖掘技術(shù)在眾多的數(shù)據(jù)庫(kù)里面找到具有實(shí)用價(jià)值的信息。所以,數(shù)據(jù)挖掘技術(shù)在未來(lái)的軟件工程中會(huì)被廣泛地運(yùn)用。數(shù)據(jù)挖掘技術(shù)是目前應(yīng)用在數(shù)據(jù)庫(kù)中的新技術(shù),經(jīng)過(guò)很長(zhǎng)時(shí)間的發(fā)展,數(shù)據(jù)挖掘技術(shù)已經(jīng)在數(shù)據(jù)庫(kù)中占據(jù)了相當(dāng)重要的位置。數(shù)據(jù)挖掘技術(shù)就是對(duì)信息進(jìn)行有效率、有組織的編輯加工處理,讓數(shù)據(jù)信息更有實(shí)用意義,但是數(shù)據(jù)挖掘技術(shù)是一個(gè)比較復(fù)雜高深的技術(shù),期待以后能被大量投入實(shí)際應(yīng)用中。
1.2 數(shù)據(jù)挖掘技術(shù)的運(yùn)作流程
現(xiàn)在的數(shù)據(jù)挖掘技術(shù)分為四個(gè)階段,分別是數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模式評(píng)估和知識(shí)表示。在實(shí)際應(yīng)用中,我們要事先按照要求采集相關(guān)內(nèi)容的數(shù)據(jù),數(shù)據(jù)清洗可以把原先損失的數(shù)據(jù)進(jìn)行修復(fù)和還原,數(shù)據(jù)抽取可以得到與之有聯(lián)系的數(shù)據(jù),然后明確這次挖掘的目的,運(yùn)用挖掘算法得到想要的數(shù)據(jù)。每一項(xiàng)技術(shù)的發(fā)明,都是因?yàn)槲覀冃枰@種技術(shù)去解決問(wèn)題。
1.3 數(shù)據(jù)挖掘技術(shù)的應(yīng)用范圍
現(xiàn)在數(shù)據(jù)挖掘技術(shù)基本用在銀行、交通等擁有很大數(shù)據(jù)量的地方,這些地方應(yīng)用數(shù)據(jù)挖掘技術(shù)主要是為了分析營(yíng)銷(xiāo)手段、客戶類(lèi)別等,可以很大程度地提高效率,增加收益。金融方面,比如銀行和證券公司,他們的日常數(shù)據(jù)信息非常多,利用數(shù)據(jù)挖掘技術(shù)可以幫助他們對(duì)客戶信息進(jìn)行整理,提高工作效率,降低風(fēng)險(xiǎn)。數(shù)據(jù)庫(kù)挖掘技術(shù)當(dāng)然也在軍事、互聯(lián)網(wǎng)這些地方被廣泛利用,具有很高的存在價(jià)值。
2 數(shù)據(jù)挖掘技術(shù)在軟件工程中的使用
2.1 數(shù)據(jù)挖掘技術(shù)在軟件工程中的發(fā)展
數(shù)據(jù)庫(kù)挖掘技術(shù)開(kāi)始是以數(shù)據(jù)庫(kù)為基礎(chǔ)發(fā)展的,隨著其不斷地進(jìn)步,現(xiàn)在已經(jīng)從理論發(fā)展到實(shí)際應(yīng)用中,而且在實(shí)際應(yīng)用中產(chǎn)生了更多更深層次的科目與之一起發(fā)展。軟件工程是一個(gè)工程化的學(xué)科,可以根據(jù)不同的項(xiàng)目任務(wù)和資金以及客戶的不同要求研究開(kāi)發(fā)一個(gè)產(chǎn)品。之前的工程軟件開(kāi)發(fā)比較復(fù)雜,但是在后期快速地發(fā)展起來(lái),并被大量地應(yīng)用在實(shí)際工作中,實(shí)用性很強(qiáng),將來(lái)會(huì)被應(yīng)用到更多項(xiàng)目中。數(shù)據(jù)挖掘技術(shù)主要是挖掘軟件工程里面的數(shù)據(jù)庫(kù)信息,它可以儲(chǔ)存很多有研究意義的內(nèi)容,對(duì)未來(lái)發(fā)展具有深遠(yuǎn)意義。
2.2 信息挖掘
軟件工程可以掌控信息的挖掘,其應(yīng)用十分廣泛。軟件工程版本可以將軟件開(kāi)發(fā)時(shí)處理的信息實(shí)現(xiàn)統(tǒng)一,保證數(shù)據(jù)在軟件開(kāi)發(fā)過(guò)程中及時(shí)進(jìn)行更新,保證軟件開(kāi)發(fā)的質(zhì)量,順利完成項(xiàng)目任務(wù)。目前,軟件開(kāi)發(fā)更改的數(shù)據(jù)信息也包含在數(shù)據(jù)挖掘中,可以更好地看出軟件內(nèi)部的區(qū)別,以后可以利用這一點(diǎn)在運(yùn)用中快速找到存在的問(wèn)題,及時(shí)解決,高效地完成目標(biāo)任務(wù)。
2.3 軟件漏洞的檢測(cè)和挖掘
數(shù)據(jù)挖掘技術(shù)中最重要的一項(xiàng)是檢測(cè)軟件漏洞,對(duì)它的運(yùn)用可以發(fā)現(xiàn)在軟件開(kāi)發(fā)過(guò)程中出現(xiàn)的錯(cuò)誤,然后對(duì)這個(gè)錯(cuò)誤進(jìn)行修改,找到解決方法并加以處理,可以很好地保證工程質(zhì)量和安全等級(jí)。數(shù)據(jù)挖掘技術(shù)在檢測(cè)漏洞的時(shí)候,應(yīng)該很確切地知道漏洞檢測(cè)的內(nèi)容,我們要清楚客戶的需求,然后根據(jù)這些需求找到相應(yīng)的測(cè)試內(nèi)容,找到合理的辦法對(duì)軟件進(jìn)行測(cè)試,最后得到完美的方案。由軟件工程對(duì)數(shù)據(jù)進(jìn)行處理,找到漏洞信息后,應(yīng)當(dāng)處理掉多余的信息,保證數(shù)據(jù)信息的完整性。在實(shí)際運(yùn)作中,我們應(yīng)該按照科學(xué)方案,正確地使用數(shù)據(jù)挖掘技術(shù)。在軟件工程中,我們要運(yùn)用科學(xué)方法對(duì)軟件工程中的漏洞進(jìn)行分析,并找出錯(cuò)誤點(diǎn),這樣可以讓操作者更容易地修復(fù)漏洞。目前,數(shù)據(jù)庫(kù)挖掘技術(shù)主要是對(duì)數(shù)據(jù)信息進(jìn)行轉(zhuǎn)化,轉(zhuǎn)化后的信息都存到信息庫(kù)里面,然后再根據(jù)需求對(duì)軟件進(jìn)行測(cè)試,查看是否存在漏洞,方便后續(xù)工作的進(jìn)行。
2.4 開(kāi)源軟件代碼的挖掘
開(kāi)源軟件代碼挖掘,可以歸為軟件工程中挖掘技術(shù)要運(yùn)用的對(duì)象挖掘類(lèi)型,開(kāi)源軟件代碼挖掘技術(shù)通常被應(yīng)用到代碼克隆檢測(cè)上,可以更容易地把代碼的漏洞處理掉,在很大程度上提高了工作的時(shí)效性。
2.5 軟件執(zhí)行記錄的挖掘
軟件執(zhí)行記錄挖掘在數(shù)據(jù)挖掘技術(shù)中的運(yùn)用也非常重要,在進(jìn)行數(shù)據(jù)挖掘時(shí),可以分析大量的數(shù)據(jù),研究不同代碼之間的關(guān)系,我們可以根據(jù)軟件系統(tǒng)的行蹤更好地進(jìn)行研究和管理,從而保證軟件工程的穩(wěn)定。
3 軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù)的方法
數(shù)據(jù)挖掘技術(shù)在應(yīng)用上可以進(jìn)行分類(lèi)。在進(jìn)行工作之前,我們可以對(duì)模型進(jìn)行分析,然后按照一定的規(guī)律對(duì)數(shù)據(jù)進(jìn)行收集,方便后續(xù)的應(yīng)用。在進(jìn)行數(shù)據(jù)挖掘時(shí),我們可以把數(shù)據(jù)信息更加的細(xì)致化地分成不同的類(lèi)別,聚類(lèi)劃分的對(duì)象是不能預(yù)測(cè)的,此種學(xué)習(xí)方法是可歸為無(wú)指導(dǎo)的。在數(shù)據(jù)挖掘技術(shù)中運(yùn)用的關(guān)聯(lián)方法是非常龐大的數(shù)據(jù)信息之間的聯(lián)系,和軟件工程代碼克隆相似,軟件工程的數(shù)據(jù)檢索功能是最初的數(shù)據(jù)挖掘方式。數(shù)據(jù)挖掘過(guò)程包括數(shù)據(jù)信息的錄入、查找和內(nèi)容分析,數(shù)據(jù)的錄入過(guò)程是把軟件工程整理出來(lái)的數(shù)據(jù)信息錄入的程序,軟件工程的使用者可以把數(shù)據(jù)下載下來(lái),同時(shí)會(huì)出現(xiàn)下載記錄,這樣可以方便地找到相關(guān)的客戶信息,然后進(jìn)行客戶分析。
4 軟件工程中數(shù)據(jù)挖掘技術(shù)未來(lái)的發(fā)展形勢(shì)
目前,軟件工程運(yùn)用數(shù)據(jù)挖掘技術(shù)時(shí),所用的數(shù)據(jù)庫(kù)本身有著自己的特質(zhì),所以在實(shí)際運(yùn)用中可能會(huì)對(duì)其造成一定的影響,面臨一定的困難和挑戰(zhàn)。因?yàn)檐浖こ虜?shù)據(jù)是一項(xiàng)非常深層次的學(xué)科,運(yùn)用很難,所以必須勇敢嘗試。運(yùn)用軟件工程得到的數(shù)據(jù)可以分為結(jié)構(gòu)式數(shù)據(jù)和非結(jié)構(gòu)式數(shù)據(jù),這兩種不同的類(lèi)型不能在軟件工程中通用,比如一些應(yīng)用代碼如果存在缺陷,會(huì)極大地增加軟件工程的進(jìn)展難度。在運(yùn)用數(shù)據(jù)挖掘技術(shù)時(shí),軟件工程中會(huì)出現(xiàn)很多不易處理的系統(tǒng)數(shù)據(jù),給分析帶來(lái)一定的難度。軟件工程中的數(shù)據(jù)挖掘技術(shù)的最終目的是將設(shè)計(jì)好的軟件交給客戶使用,但是處理軟件工程里的數(shù)據(jù)并不簡(jiǎn)單,在軟件工程中運(yùn)用數(shù)據(jù)挖掘技術(shù)會(huì)對(duì)產(chǎn)生的結(jié)果進(jìn)行系統(tǒng)評(píng)價(jià),在一些比較成熟的項(xiàng)目里這些評(píng)價(jià)相對(duì)比較成熟,而一些剛發(fā)展起來(lái)的項(xiàng)目的評(píng)價(jià)系統(tǒng)就不是很完整,所以在軟件工程開(kāi)發(fā)方面要處理的數(shù)據(jù)信息非常復(fù)雜。在撰寫(xiě)軟件工程代碼時(shí)會(huì)出現(xiàn)一些沖突,直接導(dǎo)致工作效率的降低。現(xiàn)在處于一個(gè)信息發(fā)展的時(shí)代,如何處理數(shù)據(jù)信息是一個(gè)難題,這也給數(shù)據(jù)挖掘技術(shù)也提出了一個(gè)新的考驗(yàn)。
5 結(jié) 論
軟件工程想要得到更好的發(fā)展需要經(jīng)過(guò)一個(gè)艱難的過(guò)程,這也體現(xiàn)了數(shù)據(jù)挖掘技術(shù)的重要性,要盡量滿足現(xiàn)在人們多樣化的要求。最近幾年,數(shù)據(jù)挖掘技術(shù)已經(jīng)收獲了很好的成績(jī),幫助廣大客戶得到了期望的數(shù)據(jù)結(jié)果,所以在未來(lái),在軟件工程中數(shù)據(jù)挖掘技術(shù)會(huì)得到更廣泛的應(yīng)用和發(fā)展。
參考文獻(xiàn):
[1] 童凌.軟件工程數(shù)據(jù)挖掘研究進(jìn)展 [J].中國(guó)新通信,2016,18(9):14.
[2] 許曼.淺析軟件工程數(shù)據(jù)挖掘研究進(jìn)展 [J].數(shù)字通信世界,2017(4):66-67.
[3] 薄學(xué).淺析軟件工程數(shù)據(jù)挖掘研究進(jìn)展 [J].電腦知識(shí)與技術(shù),2017,13(26):20-21.
作者簡(jiǎn)介:張宇(1986.06-),女,回族,北京人,本科。研究方向:軟件工程。