劉奕
摘要:在軟件工程中實(shí)施數(shù)據(jù)挖掘技術(shù)是非常重要的,能夠解決在以往軟件工程中運(yùn)行卡頓和錯(cuò)誤的問(wèn)題,網(wǎng)絡(luò)信息傳輸能夠具備通暢性的特征,在實(shí)際工作中需要加強(qiáng)對(duì)數(shù)據(jù)挖掘技術(shù)的合理性研究,通過(guò)數(shù)據(jù)的傳輸以及整合來(lái)提高數(shù)據(jù)最終的處理能力,保證數(shù)據(jù)準(zhǔn)確性以及來(lái)源的安全性,推動(dòng)我國(guó)軟件工程的穩(wěn)定發(fā)展,因此需要正確地選擇數(shù)據(jù)挖掘技術(shù),為后續(xù)的開(kāi)發(fā)提供重要的基礎(chǔ)。
關(guān)鍵詞:軟件工程;數(shù)據(jù)挖掘技術(shù);應(yīng)用研究
中圖分類(lèi)號(hào):TP311 ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)35-0070-02
隨著科技水平的不斷提高,網(wǎng)絡(luò)通信技術(shù)在不斷的進(jìn)步,對(duì)于海量信息來(lái)說(shuō),需要建立與之匹配的軟件進(jìn)行過(guò)濾以及整合,為了更好地滿足用戶(hù)本身的需要,需要充分地利用數(shù)據(jù)挖掘技術(shù)來(lái)保證信息的有效整合,提高軟件本身的數(shù)據(jù)處理能力。在實(shí)際工作中需要充分地挖掘數(shù)據(jù)和數(shù)據(jù)收集儲(chǔ)存技術(shù),在數(shù)據(jù)庫(kù)中過(guò)濾無(wú)用的信息,提高軟件工程發(fā)展水平[1]。
1 數(shù)據(jù)挖掘技術(shù)的概述
在軟件工程中融入數(shù)據(jù)挖掘技術(shù)之前,需要了解數(shù)據(jù)、挖掘技術(shù)本身的特點(diǎn),從而為后續(xù)工作提供重要的基礎(chǔ)。在近幾年來(lái)隨著科技水平的不斷發(fā)展,我國(guó)已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代,面對(duì)爆炸信息需要進(jìn)行信息的科學(xué)處理,并且提取有價(jià)值的數(shù)據(jù),滿足軟件開(kāi)發(fā)的需要。在實(shí)際工作中需要開(kāi)發(fā)出能夠高速處理數(shù)據(jù)的技術(shù),這是數(shù)據(jù)挖掘技術(shù)產(chǎn)生的主要前提。數(shù)據(jù)發(fā)展技術(shù)需要根據(jù)軟件操作目的,通過(guò)分類(lèi)以及排序等步驟提取有用的信息,為相關(guān)工作人員提供重要的數(shù)據(jù)。在運(yùn)用過(guò)程中可以按照一定的算法進(jìn)行數(shù)據(jù)的合理性劃分,找到數(shù)據(jù)的規(guī)律建立之匹配的模型,完成后續(xù)的預(yù)測(cè)工作。同時(shí)還可以根據(jù)某些特定數(shù)據(jù)開(kāi)展針對(duì)性的分析,利用相似性挖掘不同數(shù)據(jù)之間的聯(lián)系,獲得有意義和有價(jià)值的數(shù)據(jù)[2]。
數(shù)據(jù)挖掘技術(shù)不僅僅是動(dòng)態(tài)數(shù)據(jù)的分析,本質(zhì)上是動(dòng)態(tài)化的范疇,數(shù)據(jù)挖掘離不開(kāi)提前的預(yù)處理,在實(shí)際工作中需要通過(guò)宏觀性的角度發(fā)揮其關(guān)鍵性的作用,例如通過(guò)獲取和辨別來(lái)梳理數(shù)據(jù)信息的整體脈絡(luò),根據(jù)其中的邏輯關(guān)系為數(shù)據(jù)挖掘創(chuàng)造更高層次的使用價(jià)值。其次在數(shù)據(jù)挖掘基礎(chǔ)實(shí)施的過(guò)程中,需要先進(jìn)行預(yù)處理,根據(jù)最終的結(jié)果進(jìn)行數(shù)據(jù)價(jià)值的進(jìn)一步挖掘,例如掌握挖掘的算法和目標(biāo)之后再完成數(shù)據(jù)的分類(lèi)和總結(jié),使得數(shù)據(jù)挖掘效果能夠得到全面的提高。在完成這些操作之后需要進(jìn)行深入的分析,做好數(shù)據(jù)的評(píng)估,彰顯出數(shù)據(jù)最終的價(jià)值,為后續(xù)數(shù)據(jù)管理提供必要性的支撐。通過(guò)這些技術(shù)的合理性利用,不僅可以提高軟件數(shù)據(jù)處理能力,還使得軟件運(yùn)行效果能夠得以充分的改善,給用戶(hù)帶來(lái)不一樣的體驗(yàn)[3]。
在新時(shí)期下,在科技水平逐漸發(fā)達(dá)的現(xiàn)代,數(shù)據(jù)挖掘技術(shù)得到了全面的優(yōu)化和升級(jí),作用是非常突出的,在軟件工程中的地位越來(lái)越重要,有助于推動(dòng)軟件行業(yè)的穩(wěn)定發(fā)展。
2 在軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù)的重要意義
現(xiàn)階段,我國(guó)的高科技技術(shù)已經(jīng)實(shí)現(xiàn)了快速發(fā)展的趨勢(shì),手機(jī)軟件技術(shù)在各個(gè)領(lǐng)域的應(yīng)用也在緩慢進(jìn)行,但從具體的可預(yù)見(jiàn)性分析來(lái)看,其應(yīng)用的實(shí)際效果還不夠明顯。在具體應(yīng)用的整個(gè)過(guò)程中,都會(huì)產(chǎn)生大量運(yùn)算的數(shù)據(jù)。而數(shù)據(jù)作為一種具有高使用價(jià)值的資源,可以促進(jìn)各個(gè)領(lǐng)域的經(jīng)濟(jì)增長(zhǎng)。因此,在軟件開(kāi)發(fā)企業(yè)內(nèi)部合理使用數(shù)據(jù)挖掘技術(shù),可以進(jìn)一步提高數(shù)據(jù)資源使用的實(shí)際效果,也可以在常見(jiàn)故障發(fā)生時(shí)妥善處理,進(jìn)一步提高時(shí)效性。
2.1 錄入正確的信息
由于數(shù)據(jù)挖掘技術(shù)具有很強(qiáng)的計(jì)算效應(yīng),基礎(chǔ)數(shù)據(jù)信息管理系統(tǒng)在具體計(jì)算的整個(gè)過(guò)程中會(huì)消耗大量的時(shí)間,甚至因?yàn)楹A康臄?shù)據(jù)會(huì)對(duì)計(jì)算系統(tǒng)軟件造成一定的危害,數(shù)據(jù)挖掘技術(shù)的效果 這類(lèi)問(wèn)題不容易發(fā)生,而且還可以節(jié)省計(jì)算時(shí)間。另外,在對(duì)數(shù)據(jù)進(jìn)行計(jì)算的整個(gè)過(guò)程中,也不容易丟失數(shù)據(jù)。在大規(guī)模的數(shù)據(jù)中,有些數(shù)據(jù)的使用價(jià)值不大。它們歸咎于浪費(fèi)數(shù)據(jù),這將損害系統(tǒng)軟件的整體高效率。利用數(shù)據(jù)挖掘技術(shù),可以保存準(zhǔn)確的數(shù)據(jù),摒除垃圾數(shù)據(jù)。相應(yīng)地,質(zhì)量得到保證。
2.2 縮減數(shù)據(jù)處理時(shí)間
數(shù)據(jù)挖掘技術(shù)可用于對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換、整合和解決混亂的數(shù)據(jù),并將其轉(zhuǎn)變?yōu)橐环N使用方式。從這種數(shù)據(jù)的角度分析可以專(zhuān)業(yè)使用。在整個(gè)數(shù)據(jù)挖掘過(guò)程中,不明確的數(shù)據(jù)都會(huì)被清除,以保證獲得的數(shù)據(jù)的合理性。從各個(gè)不同的角度,對(duì)數(shù)據(jù)的真實(shí)性和有效性進(jìn)行評(píng)估,并整合數(shù)據(jù)。換句話說(shuō),將分析結(jié)果提供給管理人員并有效應(yīng)用于軟件開(kāi)發(fā),從而減少數(shù)據(jù)解析時(shí)間。
3 數(shù)據(jù)挖掘技術(shù)在軟件工程中的具體應(yīng)用
3.1 開(kāi)源軟件數(shù)據(jù)挖掘技術(shù)
在這一技術(shù)實(shí)施時(shí),要根據(jù)源代碼的開(kāi)放性特征來(lái)提高實(shí)際的開(kāi)發(fā)效果,但是由于其中的數(shù)據(jù)具有多樣性的特征,那么很容易會(huì)對(duì)用戶(hù)使用帶來(lái)諸多的管理和安全問(wèn)題。因此在實(shí)際實(shí)施時(shí)需要通過(guò)數(shù)據(jù)挖掘技術(shù)解決以往軟件運(yùn)行時(shí)的一些問(wèn)題,提升軟件的質(zhì)量。通過(guò)這一技術(shù)的實(shí)施能夠具備基本的數(shù)據(jù)處理功能,另外還可以在數(shù)據(jù)支持下有效地挖掘和整合大規(guī)模的數(shù)據(jù),根據(jù)復(fù)雜性軟件的特點(diǎn)來(lái)提高最終的數(shù)據(jù)處理功能,實(shí)現(xiàn)用戶(hù)群體的科學(xué)管理。
3.2 項(xiàng)目軟件數(shù)據(jù)挖掘技術(shù)
在項(xiàng)目軟件數(shù)據(jù)挖掘技術(shù)中,包含的是挖掘組織關(guān)系和版本控制信息,軟件項(xiàng)目管理過(guò)程是非常復(fù)雜的,因此需要相關(guān)管理里面組織好其中的影響關(guān)系,控制好資源的浪費(fèi)情況,對(duì)于大型軟件工程來(lái)說(shuō),其中在研發(fā)時(shí)會(huì)產(chǎn)生不同的信息數(shù)據(jù),例如電子文檔或者電子郵件等,如果并沒(méi)有進(jìn)行妥善處理和控制的話,那么會(huì)對(duì)后續(xù)的軟件使用造成非常嚴(yán)重的影響。因此在實(shí)際工作中,需要利用軟件項(xiàng)目數(shù)據(jù)挖掘技術(shù)有效地區(qū)分和過(guò)濾一些沒(méi)有價(jià)值的信息,完成有價(jià)值信息的整合,保證后續(xù)軟件項(xiàng)目能夠更加通暢地進(jìn)行[4]。
3.3 代碼數(shù)據(jù)挖掘技術(shù)
代碼數(shù)據(jù)挖掘技術(shù)體現(xiàn)的是代碼搜索和克隆代碼檢測(cè)等兩個(gè)組成部分,代碼搜索要以用戶(hù)所接受的關(guān)鍵字為主要的輸入內(nèi)容,輸入關(guān)鍵字匹配,并且向用戶(hù)返回一段代碼,代碼搜索引擎能夠?qū)⒆⑨尯痛a看作成文本內(nèi)容之后,再根據(jù)程序的特點(diǎn)對(duì)代碼庫(kù)執(zhí)行相對(duì)應(yīng)的搜索命令,以文檔信息為主要的返回結(jié)果,優(yōu)化整個(gè)工作流程。大多數(shù)編程語(yǔ)言要涵蓋于函數(shù)和變量中,強(qiáng)調(diào)的是重視和標(biāo)識(shí)對(duì)于可讀性的重要推動(dòng)作用,但是值得注意的是,在實(shí)際應(yīng)用時(shí)經(jīng)常會(huì)存在著編程不統(tǒng)一的問(wèn)題,對(duì)于返回正確結(jié)果來(lái)說(shuō)造成了一定的影響,所以在實(shí)際工作中,需要充分利用數(shù)據(jù)挖掘技術(shù)本身的優(yōu)勢(shì),使得代碼搜索過(guò)程能夠具備精準(zhǔn)性的特點(diǎn),為后續(xù)用戶(hù)使用提供更多的便捷。另外還需要加強(qiáng)對(duì)提取關(guān)鍵字的挖掘理解程序的應(yīng)用過(guò)程,采取關(guān)鍵字的方法進(jìn)行程序的準(zhǔn)確性表達(dá),提高軟件開(kāi)發(fā)的水平。
在克隆代碼檢測(cè)中和以往代碼搜索原理是非常相似的,主要是根據(jù)代碼本身來(lái)描述整個(gè)軟件的行為,在使用時(shí)需要輸入已知行為代碼,克隆代碼檢測(cè)會(huì)向用戶(hù)返回與代碼相似的一段內(nèi)容,根據(jù)已知行為代碼能夠描述相近的代碼文本。通過(guò)克隆代碼的檢測(cè)技術(shù),能夠充分發(fā)揮數(shù)據(jù)挖掘技術(shù)本身的優(yōu)勢(shì),優(yōu)化整個(gè)開(kāi)發(fā)過(guò)程,提高軟件開(kāi)發(fā)的效果和水平[5]。
3.4 軟件故障數(shù)據(jù)挖掘技術(shù)
在軟件故障數(shù)據(jù)挖掘技術(shù)實(shí)際實(shí)施的過(guò)程中促進(jìn)要完成挖掘任務(wù),還需要做好數(shù)據(jù)的執(zhí)行記錄說(shuō)明和記錄,通過(guò)檢測(cè)和判定軟件發(fā)生的故障來(lái)提高后續(xù)的工作針對(duì)性。數(shù)據(jù)挖掘過(guò)程中需要先確定挖掘的目標(biāo),獲取跟蹤或者是了解的信息,使得實(shí)際問(wèn)題處理能力能夠得到全面的提高。另外還需要提高相對(duì)應(yīng)程序應(yīng)用的熟悉度,在諸多挖掘工具中,需要通過(guò)自動(dòng)化和規(guī)范性的原則來(lái)提高數(shù)據(jù)挖掘的應(yīng)用效果,并且在各種因素的推動(dòng)作用下避免對(duì)軟件造成一定的影響。在實(shí)際實(shí)施時(shí),要通過(guò)程序普查對(duì)程序運(yùn)行軌跡的抽象定位,利用對(duì)比排查的方式,找到最終的故障,從而使得故障排查效率和準(zhǔn)確性能夠得到全面的提高。
4 軟件工程中數(shù)據(jù)挖掘技術(shù)的發(fā)展研究
在當(dāng)前軟件工程中運(yùn)用數(shù)據(jù)挖掘技術(shù)有助于提高軟件的質(zhì)量以及開(kāi)發(fā)效率,能夠根據(jù)用戶(hù)的使用需要精準(zhǔn)性的完成軟件的開(kāi)發(fā)過(guò)程,另外通過(guò)數(shù)據(jù)挖掘技術(shù)還可以滿足各個(gè)領(lǐng)域方面的使用需要。隨著科技水平的不斷進(jìn)步,數(shù)據(jù)挖掘技術(shù)在不斷地更新,但是在具體實(shí)施時(shí)也會(huì)存在不同程度的質(zhì)量問(wèn)題,因此需要加強(qiáng)技術(shù)的研究力度,明確數(shù)據(jù)挖掘技術(shù)今后的發(fā)展方向,從而使得軟件開(kāi)發(fā)效果能夠得到全面的提高。隨著軟件工程規(guī)模的不斷擴(kuò)大,軟件需求也在不斷地增加,開(kāi)發(fā)周期在無(wú)限地延長(zhǎng),為了使數(shù)據(jù)挖掘技術(shù)應(yīng)用效果能夠得到全面提高,相關(guān)開(kāi)發(fā)者要圍繞著數(shù)據(jù)降維特征來(lái)選擇正確的數(shù)據(jù)處理方式。同時(shí)還可以根據(jù)數(shù)據(jù)流和在線挖掘算法,研究出更高效率的挖掘模式,充分發(fā)揮人工智能等新型的數(shù)據(jù)挖掘技術(shù),開(kāi)發(fā)出更加全面的軟件工程數(shù)據(jù)挖掘技術(shù)。
其次,還需要根據(jù)當(dāng)前數(shù)據(jù)挖掘工作中的缺陷,搭建高性能的挖掘算法,例如通過(guò)軟件規(guī)則檢索,由關(guān)鍵詞向自然語(yǔ)言而不斷地發(fā)展,在檢索內(nèi)容方面需要通過(guò)動(dòng)態(tài)或者靜態(tài)方面的特征,為后續(xù)檢測(cè)工作提供重要的基礎(chǔ)。
5 結(jié)束語(yǔ)
數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用是非常廣泛的,但是其中一些技術(shù)問(wèn)題還是有待解決的,因此需要優(yōu)化數(shù)據(jù)挖掘技術(shù)的發(fā)展模式,在挖掘算法方面進(jìn)行不斷的研究,從而提高數(shù)據(jù)挖掘技術(shù)發(fā)展水平。另外還需要將挖掘后的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,以提高數(shù)據(jù)安全性為主來(lái)保證軟件開(kāi)發(fā)過(guò)程的有序進(jìn)行。
參考文獻(xiàn):
[1] 梅擁軍.軟件工程中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].電子技術(shù)與軟件工程,2019(1):141.
[2] 劉宏杰.關(guān)于對(duì)軟件工程中的數(shù)據(jù)挖掘技術(shù)的研究[J].數(shù)字化用戶(hù),2017,23(42):117.
[3] 李喆.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J].數(shù)碼設(shè)計(jì)(下),2019(11):216-217.
[4] 張立鑒.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(6):47-48.
[5] 吳文慶.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].科技資訊,2019,17(13):7-8.
【通聯(lián)編輯:梁書(shū)】