999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Weka 數據挖掘平臺及其二次開發

2020-11-24 20:47:07王靖雯何美琪屈克誠山東協和學院
數碼世界 2020年1期
關鍵詞:二次開發數據挖掘可視化

王靖雯 何美琪 屈克誠 山東協和學院

引言

Weka 平臺作為數據挖掘的常用工具,是一種典型的維度較高的聚類應用平臺,在對于特定的聚類特征選擇及特征空間生成的過程中,運用不同的方法,加強對于特征權重的計算。數據挖掘工具可以實現對于數據的智能分析,Weka 數據挖掘平臺經過10 多年來的研究,走向了大數據時代的實際應用范疇。由于未挖掘平臺源代碼的開放性,使用其進行數據挖掘時,可以探索一些新的聚類算法,有效地嵌入到Weka 之中,從而能夠擴充其系統功能,這就是對于Weka 挖掘平臺的二次開發進程。

一、Weka 數據挖掘平臺的使用基礎

(一)Weka 數據挖掘平臺的使用背景

Weka 數據挖掘平臺,作為開放的源代碼平臺,先輸入要測試的數據,然后對于帶測試的數據進行預先的處理。在處理數據并且集中布置之后,其學習方案往往是根據分析結果將已有的分析模型帶入到預測的實例之中。Weka 數據挖掘平臺的基礎使用,為了能夠達成最佳的性能,常常分為5 個不同層次的功能階段。

(二)Weka 數據挖掘平臺的功能層次

數據輸入層是Weka 數據平臺基于不同的文件格式,從站點下載和導入ARFF、CSV、C4.5、BSI 等幾個類型的文件,采用系統的HTTP 和FTP 協議接口來輸入數據庫并進行導入的層面。

數據挖掘層面成為Weka 挖掘數據的核心,它通過多種多樣的分類和聚類功能,進行數據的預處理。對于數據的表象和裝載,利用缺失數據項的填補功能進行屬性的過濾。Weka 數據導入層和Weka 數據相互配合,將數據集中放置于學習方案之中。

模式評估層面和可視化層面之間相互配合,對于數據挖掘并且提供良性的輔助工具,既提升了挖掘的效率,同時又在可視化的層面給予人記錄和使用的可能,最終導入到特定的儲存層之內。

二、Weka 數據挖掘平臺的二次開發

(一)Weka 數據挖掘平臺的常見問題

通過對于Weka 的研究和挖掘實驗,很多研究者認為,Weka 數據挖掘平臺并不能夠真正的適應目前市面上所存在的各種類型的企業應用需求,當數據使用量比較大時,很多算法出現了挖掘時間過長的問題。

另外Weka 系統所集成的算法并不能夠很好的反映出最新的研究成果,尤其是在復雜的聚類層面上,即使是最具有優先遍歷的算法Farthest First 也沒有能夠起到很好的收效。

Weka 數據挖掘系統由于提供了記事本,這種文本輸出格式在與其他系統進行集成的過程中,可能有時會造成資源的浪費。即使實現了挖掘過程和挖掘結果的可視化,但是對于很多企業來說,這種可視化的形式并不夠非常完善。

(二)Weka 數據挖掘平臺的二次開發

對該數據挖掘平臺的二次開發,是基于原有的基礎之上,為了使得Weka挖掘平臺的算法越來越多樣化,可以使用嵌入的k-中心點輪換算法,以便解決原有算法和距離算法的不完善之處。

利用k-中心點輪換算法,是基于劃分k-均值算法的基礎上,進行了改進和優化,根據隨機選擇的對象作為初始點,在初始中心點的基礎之上,剩余的對象按照中心點的距離差異分配,形成近距離簇。距離結果的質量可以使用目標函數來估算:

這種算法由于對所有的對象,都給予了詳盡的中心點與其所歸屬的簇偏差總和的計算,一般常用的計算方式是使用歐式距離平方作為距離度量。因為這種計算方法可以非常便捷的測量目標函數值,當數據集中使用的時候,按照不同的尺度來確定不同屬性。

大量的科學研究表明,利用k-中心點名換算法的規則,可以在Weka 數據挖掘平臺下,使用eclipse 環境之下的Java 語言,將k-中心點輪換算法嵌入到Weka 平臺之中。在充分調動原有的計算包之后,對于抽象的聚類進行封裝,這種算法能夠很好的杜絕對于中心點和起始點的敏感,并且可以結合特定的方法來進行聚類效果的評估和測試。

K-中心點輪換算法,可以使用評估類的ClusterEvaluation 進行聚類模型的評估,并且可以進行驗證嵌入算法性能的測試。測試的數據進行錯誤率的對比之后就可以發現,檢測聚類數據致密性的算法怎樣才能達到合理的目標函數分布。

三、結論

通過對于Weka 數據挖掘平臺進行二次開發,結合一些嵌入式的算法,使得Weka 平臺的計算量保持在一個正確的差值范圍之內。經過多次的Weka 挖掘實驗,為了解決其存在的問題,嵌入支持用戶算法的k-中心點輪換算法。通過改進傳統的中心點算法,加強對于事先輸入數目和伸縮性的管控,有望在未來,有更進一步的改進和提升。

猜你喜歡
二次開發數據挖掘可視化
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
探討人工智能與數據挖掘發展趨勢
基于CGAL和OpenGL的海底地形三維可視化
淺談基于Revit平臺的二次開發
甘肅科技(2020年20期)2020-04-13 00:30:02
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
淺談Mastercam后處理器的二次開發
模具制造(2019年3期)2019-06-06 02:11:02
西門子Easy Screen對倒棱機床界面二次開發
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 亚洲欧美另类日本| 国产精品偷伦在线观看| 国产午夜福利在线小视频| 亚洲视频四区| 久久亚洲国产视频| 国产在线八区| 综合色区亚洲熟妇在线| 亚洲日韩在线满18点击进入| 91无码视频在线观看| 她的性爱视频| 国产亚卅精品无码| 色视频国产| 国产精品亚洲综合久久小说| 在线日韩日本国产亚洲| 国产精品尤物在线| 日本黄色不卡视频| 丁香五月亚洲综合在线| 美女毛片在线| 2020亚洲精品无码| 制服丝袜一区| a国产精品| 国产女人在线| 午夜天堂视频| 福利姬国产精品一区在线| 亚洲三级影院| 国产手机在线ΑⅤ片无码观看| 国产丝袜丝视频在线观看| 日韩高清无码免费| 好久久免费视频高清| 国内精品久久久久鸭| 国产丝袜第一页| 精品福利一区二区免费视频| 亚洲精品第一在线观看视频| 99这里只有精品在线| 国产成人精品日本亚洲77美色| 日韩黄色在线| 亚洲福利片无码最新在线播放| 国产91熟女高潮一区二区| 福利一区三区| 成人福利在线看| 欧美激情综合| 91久久精品日日躁夜夜躁欧美| 欧美色视频在线| 九色综合伊人久久富二代| 怡春院欧美一区二区三区免费| 亚洲欧州色色免费AV| 亚洲色无码专线精品观看| 免费中文字幕在在线不卡| 国产精品专区第一页在线观看| 特级做a爰片毛片免费69| 在线国产三级| 男女男免费视频网站国产| 综合五月天网| 国产成人h在线观看网站站| 日韩一区精品视频一区二区| 国产精品亚洲va在线观看| 欧美亚洲国产精品久久蜜芽| 激情综合婷婷丁香五月尤物| 色悠久久久久久久综合网伊人| 亚洲精品国产综合99久久夜夜嗨| 国产99视频在线| 欧美激情福利| 中日韩一区二区三区中文免费视频| 人妻21p大胆| 国产精品网曝门免费视频| 亚洲精品va| 97超爽成人免费视频在线播放| 一本综合久久| 麻豆国产精品一二三在线观看| 日韩在线播放中文字幕| 国产精品自在自线免费观看| 成色7777精品在线| 亚洲成综合人影院在院播放| 99久久精品国产精品亚洲| 国产乱子伦一区二区=| 51国产偷自视频区视频手机观看| 青草视频免费在线观看| 91精品啪在线观看国产91九色| 午夜一级做a爰片久久毛片| 欧美第一页在线| 国产欧美在线观看一区| 国产经典三级在线|