吳 浩,李廷鵑,李玉健,向夢蕓,龐雅琪
(1.青海省科技發展服務中心,青海西寧 810000;2.青海省科學技術信息研究所有限公司,青海西寧 810000)
數據挖掘思想對于數據類型的要求并不十分嚴格,可用于挖掘處理的數據參量既可以是結構化狀態參量,也可以是半結構化狀態參量,甚至一些形態特殊的異構型參量也可以被作為挖掘指令的處理對象。在既定數據庫存儲環境中,數據挖掘方法既可以總結出信息參量的數學歸納規律,也能夠將主變量指標與因變量指標的數學關系對調,從而使得數據庫主機能夠對傳輸信息參量完成準確記錄[1-2]。與其他類型的搜索算法相比,數據挖掘方法對于信息參量的包容性更強,既不需要準確掌握待處理數據來源,也不限制信息參量的實時傳輸速率。
數據庫信息查詢機制是指網絡主機在數據庫環境中,按照向量分布形式,提取數據信息文件的執行算法,能夠將已存儲數據的參量全部篩選出來,并可以借助傳輸通路,將這些數據文本反饋回核心網絡主機[3]。隨著待處理數據信息參量的不斷累積,數據庫信息查詢機制會出現明顯的缺失狀態,極易使網絡主機無法對數據信息參量的訪問連接行為做出有效控制。
傳統RBAC 訪問控制系統以B/S 架構為基礎,能夠聯合云計算主機與TLoa 設備對已存儲信息查詢,并可以將完成檢測的指令文件存儲于數據庫主機之中[4]。然而,此類型應用系統并不能提升數據庫信息查詢機制的完整度水平,不利于有效控制數據信息參量的訪問連接行為。為解決上述問題,設計基于數據挖掘的數據庫信息查詢訪問控制系統。
在數據庫信息查詢訪問控制系統中,CloudFile User 控制主機負責與TCP 端口、UDP 端口進行對接,可以在建立數據庫訪問機制的同時,協調數據信息參量的實時存儲行為,并可將所生成執行指令借助網絡通信模塊,傳輸至下級硬件應用設備之中[5-6]。對于CloudFileUser 控制主機而言,TCP 端口與UDP 端口是兩個完全獨立的連接結構,前者負責處理已存儲的數據信息參量,后者負責記錄與查詢機制相關的執行指令,但在訪問連接行為非可逆的情況下,兩者之間會建立虛擬數據反饋關系。完整的CloudFileUser 控制主機連接形式如圖1 所示。

圖1 CloudFileUser控制主機連接結構
為避免數據庫主機對待查詢信息參量的實時存儲能力受到影響,訪問連接指令的傳輸方向只能由TCP 端口與UDP 端口指向下級客戶端平臺。
Server 查詢模塊作為CloudFileUser 控制主機的下級負載結構,能夠借助連接管腳深入數據庫主機內部,并可以對其中存儲的信息參量實現分類提取。在數據挖掘算法的作用下,由Server 查詢模塊提取的信息參量可被系統主機直接調取,完成調取指令后的數據信息可以暫時存儲于數據處理模塊中,以便控制設備可將其直接用于完善系統主機所遵循的查詢機制[7-8]。Server 查詢模塊的設計主要針對String、Array、List等多個端口節點。

表1 Server查詢模塊設置標準
在數據庫信息查詢訪問控制系統中,Server 查詢模塊的連接位置存在于CloudFileUser 控制主機與數據處理模塊之間。
數據處理模塊由處理終端、控制主機兩部分組成。完整的數據處理模塊連接結構如圖2 所示。

圖2 數據處理模塊的結構示意圖
其中,數據處理終端以CSP 服務器作為核心應用結構,可以準確地提取數據庫信息參量,并可以在數據庫主機元件的作用下,規范查詢機制的作用形式[9-10]。為增強數據庫信息查詢機制的完整性,在建立數據處理模塊時,要求信息參量不具有雙向傳輸的執行能力。
數據簇中心是指數據庫信息參量的核心存儲位置。在數據挖掘算法中,系統主機只有準確掌握數據簇中心的定義表達式,才能夠最大化提升查詢機制的完整性水平[11-12]。定義數據簇中心表達式需要確認訪問行為系數、連接行為系數的實際取值。設e表示訪問行為系數取值,w表示連接行為系數取值,在數據挖掘算法的影響下,e指標、w指標的最小取值結果都等于物理自然數1。設re表示基于系數e的參量查詢特征,rw表示基于系數w的參量查詢特征。聯立上述物理量,可將基于數據挖掘的數據簇中心提取表達式定義為:
式中,β表示查詢參量的提取系數,ΔP表示數據庫信息的單位提取量。為使數據簇中心提取表達式的求解結果更符合實際應用需求,系數re與系數rw的賦值不能同時等于極大值或極小值。
數據集轉換是執行數據挖掘算法的必要處理環節,可以將待檢測數據庫信息參量與查詢機制對應起來,從而使得控制主機能夠對信息訪問行為進行按需調節[13-14]。設Z表示一個標準的數據庫信息參量集合空間,其定義式如下:
其中,i1,i2,…,in表示n個不同的信息參量定義系數。設d1,d2,…,dn表示與信息參量定義系數相關的數據轉換度量值,φ表示信息參量調節系數,γ表示數據庫信息參量的查詢向量。在上述物理量的支持下,聯立式(1)、式(2),可將數據集轉換條件定義為:
挖掘深度對系統主機數據庫信息參量的處理能力具有關鍵性影響[15-16]。由于數據挖掘算法的執行不具備逆運算的能力,所以在計算挖掘深度指標時,要求數據庫信息參量的傳輸必須滿足一致性原則。設λmax表示數據庫信息參量挖掘特征的最大取值結果,v1、v2表示兩個隨機選取的信息參量挖掘定義項系數。數據庫信息在查詢訪問控制系統中的挖掘深度計算式為:
當挖掘深度指標符合既定實值標準時,增大λmax系數取值可以充分激發查詢訪問控制系統對于數據庫信息參量的處理能力[17-19]。
數據庫信息查詢機制的完整性(η)可以描述網絡主機對于數據信息參量訪問連接行為的控制有效性,且完整度水平越高,網絡主機對于數據信息參量訪問連接行為的控制也就越有效。
數據庫信息查詢機制的完整性(η) 的計算式如下:
式中,M表示數據庫信息檢測總量,B表示趨向性訪問行為系數。
以基于數據挖掘的數據庫信息查詢訪問控制系統作為實驗組應用方法,以傳統RBAC 訪問控制系統作為對照組應用方法,分別將兩類應用系統的執行程序輸入所選定的實驗主機,記錄在相同實驗時間內,實驗組、對照組變量指標的數值變化情況。具體實驗流程如圖3 所示。

圖3 實驗流程圖
以60 min 作為實驗時長,分別記錄該段實驗時間內,實驗組、對照組數據庫信息檢測總量(M) 與趨向性訪問行為系數(B)的數值變化情況,詳情如表2、表3 所示。

表2 數據庫信息檢測總量

表3 趨向性訪問行為系數
分析表2 可知,實驗過程中,實驗組、對照組數據庫信息檢測總量均呈現出不斷增大的數值變化狀態,二者上升幅度相差不大,但實驗組數據庫信息檢測總量均值高于對照組。
分析表3 可知,實驗組趨向性訪問行為系數呈現出先增大后穩定的變化狀態,但其整體均值水平相對較低。對照組趨向性訪問行為系數在整個實驗過程中始終保持不斷增大的數值變化狀態,且其均值水平明顯高于實驗組。
根據表2、表3 中的數據可計算數據庫信息查詢機制的完整性(η),計算結果如圖4 所示。

圖4 數據庫信息查詢機制的完整性測試
分析圖4 可知,在整個實驗過程中,實驗組η指標的均值水平更高,其最大值達到了71.6%;對照組η指標的均值水平則相對較低,其最大值只能達到43.3%,與實驗組最大值相比,下降了28.3%。
綜上可知,在數據挖掘算法的應用下,數據庫信息查詢機制的完整性提升了近30%,與傳統RBAC訪問控制系統相比,新型應用系統更能確保網絡主機對于數據信息參量訪問連接行為的控制有效性。
應用數據挖掘算法,設計新型數據庫信息查詢訪問控制系統,重新規劃了CloudFileUser 控制主機與Server 查詢模塊之間的實時連接關系,又借助數據處理模塊,對數據簇中心進行按需提取。在實用性方面,新型控制系統增強了數據庫信息查詢機制的完整性,使得網絡主機可以有效控制數據信息參量的訪問連接行為,符合實際應用需求。