祝旭
DOI:10.16660/j.cnki.1674-098X.2016.22.094
摘 要:在龐大數(shù)據(jù)信息充斥的網(wǎng)絡環(huán)境下,對數(shù)據(jù)處理分析及數(shù)據(jù)挖掘服務都提出了更高的標準及要求。傳統(tǒng)的數(shù)據(jù)挖掘服務模式已經(jīng)無法滿足當前網(wǎng)絡發(fā)展需求,在此形勢下,云計算背景下的數(shù)據(jù)挖掘服務被提出。該服務旨在提升挖掘網(wǎng)絡數(shù)據(jù)的效率,并使其成為一項具有商業(yè)化性質的應用服務。該文針對云計算背景下數(shù)據(jù)挖掘服務的結構類型、建模流程、服務體系以及服務流程,探討了云計算背景下完整的數(shù)據(jù)挖掘服務模式。
關鍵詞:云計算 數(shù)據(jù)挖掘 服務模式 結構 服務體系
中圖分類號:TP274 文獻標識碼:A 文章編號:1674-098X(2016)08(a)-0094-02
目前,有關云計算的研究已經(jīng)成為了全球性的熱點研究項目,國內外絕大部分的信息技術企業(yè)將云計算列為了未來企業(yè)發(fā)展和提升核心競爭力的關鍵性技術支持。云計算的實現(xiàn)是以虛擬化技術與高速寬帶技術為基礎,以各類運算法作為支撐,從而形成云計算環(huán)境?,F(xiàn)階段而言,云計算研究尚處于起步階段,在學術界對云計算沒有統(tǒng)一的定義,但根據(jù)研究成果,其特點可歸納為:具有計算和存儲大規(guī)模數(shù)據(jù)的能力、具備動態(tài)收縮性的結構和資源、提供的服務根據(jù)具體資源需求而定。這些特點為云計算背景下的數(shù)據(jù)挖掘服務模式的商業(yè)化提供了更多的可能性。
1 云計算背景下數(shù)據(jù)挖掘的服務模式分析
1.1 服務結構
數(shù)據(jù)挖掘中所包括的行為與功能的集合即為數(shù)據(jù)挖掘服務,服務內容涵蓋選擇數(shù)據(jù)、預處理數(shù)據(jù)、分析、集成、挖掘數(shù)據(jù)、顯示結果及評價等,再采用混合搭配的方式,使這些功能形成新的應用服務。云計算背景下,計算機設備集成開發(fā)環(huán)境、存儲設備、應用軟件、服務器集群等實現(xiàn)了網(wǎng)絡環(huán)境的共享。以此為基礎,結合虛擬化技術與高速寬帶,封裝打包軟硬件,進而形成用戶的服務請求。用戶的服務請求又被分為了三個不同層次:IssS(Infrastructure as a Service,基礎設施即服務)、PaaS(Platform as a Service,平臺即服務)和SssS(Software as a Service,軟件即服務)。三個不同層次的用戶服務請求共同組成了完整的云計算背景下的數(shù)據(jù)挖掘服務模式。
在數(shù)據(jù)挖掘服務整體結構下涵蓋多種服務類型,如數(shù)據(jù)資源、流程、基礎設施、測試、應用、集成、平臺、安全等?;A設施服務以數(shù)據(jù)中心服務為基礎,負責在數(shù)據(jù)挖掘中為客戶提供計算資源,并可對其進行遠程訪問。數(shù)據(jù)資源服務主要為目標客戶提供快捷、方便的遠程數(shù)據(jù)訪問及數(shù)據(jù)下載。流程服務負責業(yè)務流程的梳理,其運行可多個操作系統(tǒng)下完成,并可對關鍵信息數(shù)據(jù)和模塊進行綁定。應用服務可將所有的應用程序作為一個整體進行打包,終端客戶可以直接通過網(wǎng)絡平臺獲取。測試服務是利用遠程測試工具,測試平臺或是本地數(shù)據(jù)的挖掘狀態(tài),以此判斷應用是否處于正常情況。平臺服務可為數(shù)據(jù)挖掘系統(tǒng)提供開發(fā)服務,用戶利用平臺中的各項功能可自行創(chuàng)建企業(yè)級應用。集成服務可實現(xiàn)異構數(shù)據(jù)與異質系統(tǒng)的集成,并可將其交予客戶。安全服務在現(xiàn)有的云計算技術下,還存在較大的缺陷,但可以優(yōu)化系統(tǒng)的身份管理、加密等安全服務,能夠為系統(tǒng)提供一定程度上的安全防護。
1.2 建模流程
實現(xiàn)云計算背景下的數(shù)據(jù)挖掘服務的關鍵在于結合上文所述的服務結構,建立服務組件模型與每一個數(shù)據(jù)挖掘服務形成一一對應的關系。通過數(shù)據(jù)之間的關聯(lián)性描述和識別服務,可以構建出一個完整的服務組件。其具體創(chuàng)建流程如下。
1.2.1 定義服務
通過對問題域中數(shù)據(jù)挖掘服務相關信息的收集,實現(xiàn)對該服務核心功能的定義以及服務及數(shù)據(jù)支撐所需的產(chǎn)出。通過定義服務,獲取相關數(shù)據(jù)挖掘業(yè)務的服務描述,最終使候選服務在數(shù)據(jù)挖掘服務目錄下形成。
1.2.2 綁定服務和數(shù)據(jù)
數(shù)據(jù)和功能共同構成了完整的數(shù)據(jù)挖掘服務,結合服務的定義,建立關聯(lián)數(shù)據(jù)與候選服務之間的聯(lián)系。在此過程中,可提供服務行為所需信息,通過調用規(guī)定服務信息,獲取關聯(lián)信息服務。
1.2.3 構建服務組件
將服務綁定的數(shù)據(jù)和服務描述中的方法進行整合后,可以讓服務定義的功能實現(xiàn),并封裝打包服務,使其成為獨立的組件。對調用服務的接口進行統(tǒng)一定義,最后得到完整獨立的服務組件。
1.3 體系結構
云計算背景下,數(shù)據(jù)挖掘服務結構的實現(xiàn)還需要構建體系結構,通常情況下體系結構可被分為以下四個層次。
1.3.1 基礎設施層
基礎設施層為數(shù)據(jù)挖掘服務提供所需的儲存與計算資源?;A設施層利用終端接口,將網(wǎng)絡與各種物理資源相連接,共享和互聯(lián)網(wǎng)絡資源的同時,提供接口給數(shù)據(jù)挖掘服務中虛擬化過程。
1.3.2 虛擬化層
虛擬化層將云計算背景下各種分布式資源通過虛擬化工具進行匯聚,并將其封裝為透明統(tǒng)一、集中邏輯的服務資源、通過管理這些資源,實現(xiàn)資源在數(shù)據(jù)挖掘過程中調度與分配的合理性。封裝的資源,也可被用于平臺層的開發(fā)及應用。
1.3.3 平臺層
作為云計算背景下數(shù)據(jù)挖掘服務的核心服務層,平臺層提供各種核心功能與服務,實現(xiàn)數(shù)據(jù)挖掘服務的綜合管理與實施。其中主要包括服務目錄的管理及組合功能、實施服務的描述任務功能、管理數(shù)據(jù)功能、調度計算資源功能等。
1.3.4 應用層
終端層和接口層共同組成了應用層。應用層的接口層為用戶提供認證、管理、處理請求、表達請求與評價結果的管理服務。終端層根據(jù)訪問介質的不同,提供相應的訪問接入,通過計算機、用戶界面、專用終端、移動終端等,各種云計算背景下的數(shù)據(jù)挖掘服務均可被用戶使用與訪問。
1.4 服務過程
云計算背景下的數(shù)據(jù)挖掘服務從技術層面上看是一種軟件產(chǎn)品,從管理層面上看是服務的過程。根據(jù)軟件的生命周期理論,在開發(fā)云計算分布式技術過程中,需充分考慮其服務過程。云計算背景下的數(shù)據(jù)挖掘服務過程包含以下三個階段。
1.4.1 分析階段
在這一階段下,主要是根據(jù)結合需求對服務進行識別和發(fā)現(xiàn),對相應的服務描述進行定義。該階段標志著服務的開始。
1.4.2 設計階段
在這一階段,生成服務相關說明書,說明書的生成需根據(jù)對服務的描述及定義,同時對服務的契約和接口進行設計,設計內容包括服務的非功能性特性和語義,以及服務代理、提供商與消費者三者之間的契約關系。
1.4.3 開發(fā)階段
在開發(fā)階段,需要將服務功能特性進行具體實現(xiàn),并在服務的定義區(qū)間內,完成功能集合。集合需根據(jù)高內聚、低耦合原則,進而形成服務組件。服務組件必須具備獨立性,功能的調用與溝通可利用服務接口實現(xiàn)。
2 結語
現(xiàn)階段而言,由于云計算背景下數(shù)據(jù)挖掘服務模式相關研究起步時間晚、發(fā)展時間尚短,因而不可避免地存在著一些缺陷和問題。針對這些問題,通過優(yōu)化云計算背景下數(shù)據(jù)挖掘服務模式的服務結構、建模流程、體系結構以及服務過程,能夠進一步實現(xiàn)云計算背景下數(shù)據(jù)挖掘服務。同時,云計算背景下的數(shù)據(jù)挖掘服務模式需要與時俱進,順應社會經(jīng)濟和科技的發(fā)展,不斷改進和創(chuàng)新。
參考文獻
[1] 曹小春,曾安,潘丹.云計算環(huán)境下面向領域的數(shù)據(jù)挖掘服務平臺研究[J].自動化儀表,2014(9):9-13.
[2] 吳麗娜.基于云計算環(huán)境下的數(shù)據(jù)挖掘服務模式[J].電子技術與軟件工程,2015(15):195.
[3] 潘鈞.云計算服務模式的數(shù)據(jù)挖掘應用平臺的構建對策[J].數(shù)字技術與應用,2015(10):90.