張萬舜
(山東英才學院 山東 濟南 250104)
通過分析軟件工程中的數據能夠看得出,按照一般性的理解能夠將其分成兩種類型,其一是結構化的數據部分,指的是軟件的版本信息和軟件程序的缺陷報告等;其二是非結構化數據部分,指的是軟件中的文檔數據、代碼數據等內容。因為軟件工程中數據分成了兩種類型,因此不同的數據類型需要使用不同的算法實現[1]。但是兩種數據類型之間還存在緊密的聯系,比如在結構化數據種類中的缺陷報告數據中,報告中的缺陷代碼在數據結構化數據種類的同時還屬于非結構化數據種類,因此這使得軟件工程數據管理的難度增加,造成了數據挖掘有效性降低。
軟件工程數據挖掘過程中需要保證軟件信息數據轉化完全,最終得到數據共享的目的。但是依據傳統的挖掘方法分析,這種方法不僅形式單一,同時還是得很多原軟件數據中的圖片等信息無法得到轉化,最終造成了數據失真的問題。但是軟件開發商需要較高的軟件數據信息,因此這種傳統的數據挖掘手段已經不適合現代的軟件工程管理[2]。為了能夠使得軟件程序有效開發,需要做好信息整合工作,以相適應的案例完成數據挖掘工作,使得軟件的功能更實用,促進數據挖掘的有效性。
數據挖掘工作受到了傳統工作方法的慣性影響嚴重,因此造成的結果就是軟件工程數據挖掘的有效性大打折扣。傳統的數據挖掘工作已經使用了很長的時間,相對來說這種方法的實踐性更高,但是從軟件工程的數據管理角度出發就能夠看得出,要想做好數據挖掘工作首先應當保證工作人員具有全面的數據信息,因為軟件中數據的復雜性較高,因此使得在實際的工作中無法使軟件程序中的數據有效表達,最終造成了評價結果不統一,影響了評價結果的實際效果。因為軟件工程的數據信息量大,數據結構復雜,因此在進行數據挖掘工作的時候應當結合軟件工程的實際分析,合理的分析軟件工程的數據代碼和注釋。
軟件開發過程中的數據代碼等處于展開狀態,這一過程中的數據挖掘主要是針對程序編寫過程和程序成果進行挖掘[3]。在編寫階段,數據挖掘工作應當首先分析程序結構、程序功能等信息,然后在軟件系統數據代碼庫中選擇合理的模式,也就是說在這一階段的數據挖掘工作中應當尤其注重軟件的檢索功能作用,提高工作效率,降低手工檢索的工作量。在軟件系統的檢索欄中鍵入需要的關鍵字就能夠快速的查找需要的信息,實現數據挖掘的智能化管理,提升數據管理的有效性。最后應當注重靜態規則的作用,合理地分析軟件的調用關系、多重繼承關系等信息,通過遞歸測試的方法指導數據挖掘工作,提高工作的效率,使得工作者快速的掌握數據關聯信息,提高關聯信息的準確性。除此之外,還應當注重動態規則的作用[3]。通過動態規則用于設定靜態代碼,使之能夠對應到數據庫中,進而使得缺陷代碼顯露出來,提高數據挖掘的有效性,降低工作的失誤率。針對軟件編程的結果階段中,應當提交修改的數據信息,使得缺陷代碼顯露出來,同時工作人員還應當充分分析需求者的要求,對缺陷代碼定位,通過軟件檢測工作完成多種缺陷檢測,并將檢測的過程和結果記錄下來,以方便處理軟件程序中的錯誤。
隨著現代軟件工程技術的不斷發展,數據挖掘技術已經跟不上軟件工程的更新速度,因此需要注重技術的創新。現代數據挖掘過程中需要重視軟件檢索的作用,通過軟件檢索能夠降低工作量,提高數據挖掘工作的效率[4]。利用軟件的樹狀網絡結構和軟件的靜態網絡規則能夠建設軟件鏈表結構,這也是保證數據挖掘工作的有效途徑。結合軟件結構的網絡情況能夠使得技術得到創新,使得數據挖掘工作效率提升。為了提高數據挖掘工作的有效性,需要將數據進行準確的預測。在傳統軟件缺陷定位中,數據挖掘工作需要通過整合數據實現,這使得缺陷表達受到了影響,因此在現代的軟件工程數據挖掘過程中應當注重運用高性能的方法完成軟件中缺陷查找,及時尋找病毒的位置,提高病毒檢測的能力[5]。
通過我國目前的軟件工程管理情況分析,我國的數據挖掘工作還處于探索階段,未來還需要很長的一段路要走。國內很多企業已經建設了軟件工程數據體系,但是因為規模小,技術落后,因此這種數據建設工作仍舊沒有達到商業化的水平。為了提高軟件工程數據的開發效率,我國應當創新數據挖掘的方法,提高數據挖掘的有效性,建設自動化的數據庫工作體系。因此注重軟件開發過程和開發技術成為提高數據挖掘效果的有效手段。