李淑蘭 王景珊
(景德鎮學院 江西景德鎮 335100)
分布式數據庫是一種運用物理存儲介質的分散單元存儲方式進行數據的存儲及耦合性融合的數據庫,具有儲存空間大、數據整合能力強等特征,能夠滿足規模較大及云數據的存儲需求。在云計算等技術不斷發展的情況下,分布式數據可能夠發揮出更大的優勢。但隨著儲存量的不斷增加,分布式數據在數據查詢上可能會受數據耦合關系的影響而出現誤差問題。因此,為了有效保障分布式數據庫在查詢數據上的準確性,必須要對其查詢技術進行優化。本文將對分片關系變化為基礎的自適應查詢技術在分布式數據庫中的實現進行簡單探討,通過建立模型、數據提取、仿真測試等方式檢驗自適應查詢技術的運用效果。
要做到分布式數據可分片關系變化自適應查詢,首先需要對分布式數據庫在數據存儲方面的結構展開分析,分析方式主要以數據分段屬性辨識與特征分解兩種為主。此時需要對分布式數據庫的存儲樣本集及數據庫中存儲數據的種類進行定義,同時對分布式數據庫中需要查詢的樣本和分簇聚類模型進行定義,并列出定義式。之后將定義式中分布式數據庫存儲數據樣本采樣幅值和樣本集維數利用分段融合方法進行模糊聚類,得出數據庫的存儲向量空間,并得出幾何矩。將幾何矩中的分片中心點用自適應特征分解法進行信息整合,得出數據庫樣本查詢的聚類中心式。運用領域搜索法對分布式數據庫中所存儲信息的詞語、節點等特加以分解,得出特征分解的目標函數式。在該目標函數中設定一個數據圖和一組查詢關鍵詞,利用查詢節點權重自適應法得出模糊度點集以及數據庫查詢的聚類交叉項。由此構建出數據庫結構模型,結合數據庫結構及查詢節點對其查詢方法進行設計。
在分簇聚類模型構建的前提下,利用數據關系集特征融合方式完成數據庫的狀態向量空間組合,并得出本體特征分布式。利用向量量化分解法進行分片處理,得出分片變換輸出式。利用自適應融合對數據集的分片結果進行處理,得出數據融合聚類結果。結合數據庫中關系元組的梳理得出數據查詢的模糊聚類中心向量,結合分片屬性分解自適應特征和改進型耦合關系的變換,得出兩個聚類簇,用數據關系集的本體特征分量提取出二階、三階以及中心距,最終實現通分布式數據庫自適應查詢效果。
在完成分簇聚類模型構建以及狀態向量空間組合、特征提取之后,需要對數據庫查詢技術進行優化。首先列出數據特征分部向量集的分片關系變換式,并根據分片屬性對自適應特征進行分解,得出分布式,在該式中,具有絕不是數據庫查詢數據集的規范正交基,提取出互信息熵特征量。在進行分片屬性、門限值設置時,需要通過對提出的信息熵進行自適應配置,自聚類中心就能得出數據庫查詢輸出式。可利用自適應全局概率搜索法對其中的最優迭代步長進行數據集搜索,搜索后得出查詢數據集的中心分量。在輸出查詢的樣本值中選擇適應度最高的作為訓練集。結合數據的指向性聚類結果得出數據庫查詢的輸出特征融合向量集,迭代步長增量出現。由此實現分布式數據庫的優化查詢。
要確保查詢技術的應用效果,需要通過仿真實驗加以驗證。首先,確定實驗所用的查詢數據庫類型、分布式數據庫中待查詢的數據樣本集數量、數據的規模長度、數據集采樣帶寬、數據庫查詢節點連接關系數量,進行多次查詢實驗后得出查詢數據集的時域波形圖。將時域波形圖的數據集作為樣本,進行數據分片變換處理及信息融合處理,得出特征分布圖。最后,根據特征分布圖的數據分布情況對融合聚類、特征進行提取,完成對數據庫查詢的優化,利用多種方式對其查詢準確率進行檢測,得出檢測結果。從檢測結果中可以看出,利用分片關系變換自適應查詢技術進行數據庫查詢,準確率會隨著分片尺度的增加而增加,同時可以看出其準確率在特定分片尺度情況下可以達到100%,這比傳統查詢技術要高出很多。由此可見,在分布式數據庫查詢中利用分片關系變換自適應查詢技術進行數據查詢,能夠有效提高查詢結果的準確性,同時也說明了現有的數據庫查詢技術有待完善。[1-3]
隨著互聯網與計算機技術的飛速發展,信息數據的儲存需求越來越大,數據庫的應用需求也隨之不斷增加。分布式數據庫具有存儲量大等優點,在很多具有大規模存儲需求中得到了廣泛運用,但因為其存儲數據量巨大,在數據查詢上會存在效率及準確率問題。加強對分布式數據庫數據查詢技術的進一步研究,是保障數據查詢準確性的重要途徑,同時也是提高分布式數據庫運用效果的重要方式。通過研究,分片關系變換自適應查詢技術能夠有效改善分布式數據庫在查詢準確率方面的問題,在分布式數據庫查詢中開應該加強對此查詢技術的運用。