王曙霞 焦家林 黃志武
(湖北工程學院計算機與信息科學學院,湖北 孝感 432000)
移動互聯終端的海量云數據挖掘技術研究
王曙霞 焦家林 黃志武
(湖北工程學院計算機與信息科學學院,湖北 孝感 432000)
在如今的計算機管理技術不斷發展的過程中,用戶在使用過程中更加注重信息挖掘速度。傳統數據挖掘技術已經不能滿足實際需要,對移動互聯終端的海量云數據挖掘技術成為研究熱點。本文通過對移動互聯終端的海量云數據挖掘服務架構的研究,提出云數據挖掘技術建模流程以及云數據挖掘模型體系結構,從而有效提高了移動互聯終端的海量云數據挖掘的實用性與速度。
移動互聯終端;云數據;數據挖掘
隨著計算機信息管理技術的不斷發展,對于數據管理要求水平也在不斷提高。在計算機信息管理過程中,用戶對于信息提取速度更加關注。在互聯網移動終端,客戶在使用過程中的信息挖掘速度是影響計算機信息管理效率非常重要的一個指標[1]。目前,海量云數據挖掘技術已經成為了人們關注的熱點研究問題。算法包括基于馬爾科夫算法的數據挖掘方法、基于K均值聚類算法的數據挖掘方法以及基于集中式云數據計算的海量云數據挖掘方法。其中,基于集中式云數據計算是最常見的計算方法。海量云數據挖掘方法的應用十分廣泛,作為最實用的研究課題,受到許多有關專家和學者的重視,未來的發展前景十分廣闊。在移動互聯終端的海量云數據信息管理過程中,數據對象差異比較大并且具有復雜性較大等特點。
目前,移動互聯終端海量云數據具有超大規模的存儲以及計算能力,云數據具有結構與資源動態的伸縮性,同時通過虛擬化的技術與龐大的資源提供服務。基于移動互聯終端的海量云數據特點讓數據分析、儲存和應用具有商業化發展的特點,讓云數據挖掘成為一個非常具有應用價值的研究領域。在業務的不斷增長中,企業數據庫對于商業數據的積累數量在不斷增加,傳統的移動互聯終端海量云數據挖掘技術已經無法滿足如此大量數據對計算能力的需求。且傳統的集中式海量云數據計算法在對數據進行挖掘處理的時候,會使算法陷入一個無窮對比的情況,存在時間復雜度高、算法不收斂等弊端,大大降低了信息管理的效率。所以需要建立一個高性能計算能力的移動互聯終端海量數據挖掘模式[3]。同時為了適應數據數量的不斷增長以及滿足實際的跨地區服務需要,企業的數據儲存要分布儲存在數據中心,構建一個能夠處理分布式執行數據、分布式數據儲存的數據挖掘模式。
現在大多數的數據挖掘解決方案都是以系統為中心,更加注重系統工程以及算法,但是往往忽略了從用戶角度出發的數據挖掘技術應用,增加了用戶在使用系統過程中的難度。使得一些數據挖掘工具只能針對技術人員使用,如果對于算法不了解,很難得出好的模型,這對于企業縱向開發數據挖掘技術平臺不僅增加了難度,同時也增加了企業成本。移動互聯終端的海量云技術從面向服務的方面為數據挖掘提供更好的解決方案。在移動互聯終端的海量云數據的存儲、應用等過程中都是可以共享的資源[4]。作為一種商業計算模式,能夠將移動互聯終端的海量云數據挖掘作為一種服務按需出售,同時降低了一些中小企業的數據挖掘成本,為移動終端的海量云數據挖掘商業應用提供更好的平臺。移動互聯終端的海量云數據挖掘的功能集合包括分析、挖掘、數據選擇、數據集成等,并通過對這些功能的混合搭配形成新的復合應用。并且通過虛擬化、接口、集成等技術[5],將軟硬件封裝打包成為相對應的服務模塊,相應基礎設施、平臺應用等不同的服務請求,從而形成一整套完整的服務模式,因此在移動互聯網終端的海量數據挖掘下,能夠為用戶提供出一整套良好的解決方案,根據數據挖掘的行為和需要,結合云計算的系統體系,設計一套完整的數據挖掘服務結構,如下圖1所示。

圖1 基于移動互聯終端的海量云數據挖掘服務結構
實現移動互聯終端的海量云數據挖掘,最重要的是通過對上述的系統框架進行分析,建立一個數據挖掘組件模型。通過對于實際服務應用的數據、識別、描述的關聯,構建出一個完整的組件模型。具體的組建流程如圖2所示。

圖2 移動互聯終端的海量云數據挖掘技術服務創建流程
在問題領域中理解并且收集數據挖掘服務的相關信息,對于其核心功能定位同時支撐所需服務數據的產出。通過對于獲取數據挖掘的相關業務形成服務數據挖掘項目中的候選項目。同時在功能和數據組成的數據挖掘服務中,對于相關數據建立關聯。通過對于整體方法和服務的數據綁定,實現服務定義的功能。通過對服務結構的統一,實現獨立的服務組件。
為了實現上述移動互聯終端的海量云數據服務創建流程,在模型中的體系結構如表1所示。

表1 移動互聯終端海量數據挖掘模型體系結構
在移動互聯終端海量數據挖掘模型體系結構中,基礎設施層主要提供數據挖掘服務所需的存儲資源。基礎設施層通過終端接口將各種物理資源接入到網絡中,實現互聯網與現實物理資源的共享,并且為虛擬化的服務過程提供接口[6]。同時虛擬化層通過虛擬化工具的利用,將移動互聯終端的海量云數據下的分布式資源相匯聚,并且進行集中、統一的資源管理,從而實現移動互聯終端的海量云數據挖掘中資源的合理分配,將封裝資源統一提供給平臺層進行開發應用。而平臺層作為數據挖掘服務中的核心服務層,為數據挖掘服務的實施和管理提供各種核心的功能,用于任務實施的管理、計算以及調度等等。最終的結果由應用層來進行處理,應用層由接口層和終端層兩部分組成,是提供用戶認證、管理、請求的主要服務端口。用戶可以通過PC機、頁面、移動終端等等實現訪問與云數據挖掘。
在移動互聯終端的海量云數據挖掘技術中,仍存在研究和應用上的不足。根據海量云數據的需信息資源服務模式,本文提出了數據挖掘模型的結構與流程,幫助搭建一個完整的數據挖掘服務體系,并且闡述了數據挖掘的整個過程,從而有效提高了移動互聯終端的海量云數據挖掘的實用性與速度。
[1]黃潮.云計算環境下的海量光纖通信故障數據挖掘算法研究[J].激光雜志,2017(1):96-100.
[2]陳炎龍,段紅玉.基于改進Hadoop云平臺的海量文本數據挖掘[J].湖南師范大學自然科學學報,2016,39(3):84-88.
[3]米允龍,米春橋,劉文奇.海量數據挖掘過程相關技術研究進展[J].計算機科學與探索,2015,9(06):641-659.
[4]胡敏,王鵬,于京杰.基于移動互聯網和數據挖掘技術的門診排隊流程設計[J].醫學研究生學報,2015(2):192-194.
[5]萬祥,胡念蘇,韓鵬飛,等.大數據挖掘技術應用于汽輪機組運行性能優化的研究[J].中國電機工程學報,2016,36(2):459-467.
[6]曾志華,李聰.云計算環境下頻繁出現異常數據挖掘方法研究[J].計算機仿真,2016(03):339-342.
[7]鄧仲華,劉偉偉,陸穎雋.基于云計算的大數據挖掘內涵及解決方案研究[J].情報理論與實踐,2015,38(7):103-108.
Research on the Massive Cloud Data Mining Technology for Mobile Internet Terminal
Wang Shuxia Jiao Jialin Huang Zhiwu
(Hubei Engineering University,Xiaogan 432000,Hubei)
In the development of computer management technology,users pay more attention to the speed of information mining.The traditional data mining technology has been unable to meet the actual needs,the massive cloud data mining technology for mobile Internet terminal becomes a hot research topic.This paper studies on the massive cloud data mining service architecture for mobile terminal,puts forward the modeling process and the structure of cloud data mining,effectively improving the practicability and speed of massive cloud data mining for mobile terminal.
mobile internet terminal;cloud data;data mining
T9311
A
1008-6609(2017)10-0026-03
王曙霞(1975-),女,湖北荊門人,碩士,副教授,研究方向為大數據、智能計算、網絡安全等。
湖北工程學院科學研究計劃項目,項目編號:201615。