劉云萍



摘要:傳統(tǒng)查詢全縮減計算方法存在計算速度較慢的缺陷,以此開展了基于并行計算的分布式數據庫樹查詢全縮減計算方法的設計。計算種群中整體數量與樣本之間的正向射向關系,設計采樣流程圖,查詢采樣條件;設計分布式數據庫樹查詢函數,計算查詢數據值,提供計算適應度數值;計算參數數值,完成分布式數據庫樹查詢全縮減計算。經過對比實驗,證明所提出的分布式數據庫樹查詢全縮減計算方法可降低查詢計算時間,提高計算效率,因此更具有實際應用價值。
關鍵詞:并行計算;分布式;數據庫樹;查詢全縮減計算
中圖分類號:TP311.133.1? ? ? 文獻標識碼:A
文章編號:1009-3044(2020)16-0050-03
并行計算又稱平行計算,基于市場內涌現的大量的數據集合,并行計算已經廣泛應用于大數據查詢中,作為以此計算可同時執(zhí)行多種計算指令的查詢算法,具有提升計算效率、縮短計算時間的特點,可將問題延伸解決,延展計算規(guī)模。解決實際中大型且復雜的問題,并在實踐中擺脫時間或空間上的約束[1]。時間層面是指大量數據的流水線技術可同時實施,空間層面是指計算中出現的多個數據處理器可并發(fā)運行。使用并行計算方法通常將較復雜的計算流程或計算步驟進行分散處理,有助于問題的同步解決,結合計算設備提出的多個計算指令,為后續(xù)計算提供實時幫助,大內存資源包下載的速度將明顯低于逐個資源包下載的速度[2]。分布式數據庫是數據在系統(tǒng)中以離散式方式存在,每臺計算設備中均包含一份相對完整的文件拷貝副本,或副本的部分文件具備自身獨立的數據庫,且每個離散數據庫之間由網絡進行互連,共同構成一個相對完善且全局分布緊密的數據庫數。為了更好地應用數據庫樹,數據庫樹查詢全減縮計算方法成了有關部門的研究重點,檢索查詢指令中一個相對優(yōu)化的策略成為數據庫樹在系統(tǒng)中可持續(xù)運行的基礎。由于自身計算方法存在的計算速度慢的缺陷,導致查詢計算結果通常為局部最優(yōu)解而非全過程最優(yōu)解[3]。以此有關研究人員將并行計算方法與數據庫樹查詢全減縮計算兩者實施動態(tài)化連接,提出一種新的函數計算方式,在計算中保持參數運行數值的穩(wěn)定,使用提取的查詢條件,完成數據庫樹查詢全減縮計算方法的設計。
1基于并行計算的分布式數據庫樹查詢全縮減計算方法
1.1基于并行計算采樣查詢條件
查詢數據種群問題規(guī)模指數呈現正極增長趨勢,瀏覽整體數據庫數據集合歷時較長,基于并行算法將收斂局部最優(yōu)解,保持數據集合多樣性的同時對查詢數據有針對采樣[4]。假定查詢時間內數據個體最佳舒適程度未得到提升,數據種群樣本中的函數比例數值高于原始數據種群數值。自定義[st]表示當前需檢索的數據查詢次數,[W]表示為查詢數據庫數樣本值大小。基于并行計算理論依據,設計如下數據采樣流程。如下圖1:
根據上圖可知,賦予數據庫數查詢樣本數值空值,使用并行計算提供的優(yōu)化查詢方式,評估樣本數據中最右束支,判斷查詢數據種群是否為初次采樣,若分析結果表示為“[Y]”,持續(xù)向數據庫數中插入[n]個隨機種群定向向量;若輸出結果為“[N]”,保留原始樣本中最優(yōu)查詢數值,插入[x]個定向查詢向量。計算種群中整體數量與樣本之間的正向射向關系。制定操作區(qū)域中3個預設值,利用有圖理論建立操作區(qū)域基礎查詢模型,依照查詢不同定向標準劃分正向度量標準數值。分析數據種群中是否包含交叉變異數據值[5]。判斷查詢數據種群中的差異變化數值,保持數據查詢檢索值不變,在提取的新數據值樣本中保留最優(yōu)種群。降低樣本收斂速度,數據庫數值種群隨著攝入向量數量的增多,進化次數減小。自定義全減縮集合為[u=λu],當[λ]數值為0~1之間任意一個常數時。采樣條件中每次進化次數[t]會隨著[λ]的降低而降低。當條件保持在一個相對穩(wěn)定的數據采樣范圍內時,維持減縮集合的數據值,判斷是否輸出條件,識別采樣數據集合。通過上述采樣方式,可在保持原始數據集合的基礎上,向分析樣本中調入新的數據向量,基于并行計算對所有數據集合統(tǒng)一查詢,維持數據集的穩(wěn)定,避免出現數據庫樹過早收斂[6]。
1.2設計分布式數據庫樹查詢函數
數據庫在不同運行狀態(tài)下的動態(tài)化表現形式是不同的,隨機狀態(tài)下某一概率將由其中一個概率轉移至另一個概率值,下一時期查詢計算狀態(tài)僅取決于數據庫當期的運行狀態(tài)及數據計算出現轉移的概率,不存在后期效率性[7]。全減縮計算是在數據不斷轉移、交叉、變異過程中,分析數據集合之間存在的某種動態(tài)化鏈接。以此基于并行計算實際操作依據,設計分布式數據庫樹查詢函數,如下所示:
上述公式為分布式數據庫查詢函數,公式中:[p]表示為數據庫查詢種群;[p]表示為查詢種群的權值數值;[F]表示為數據庫樹中的字符串;[F]表示為字符串的權值數值;[γ]表示為查詢函數的短期變異參數,即可能出現數據交叉或重組等現象;[x]表示查詢的數據組別;[i]表示組別的查詢基礎個數;[xi]表示查詢組別表現出的數值特征;[j]表示為主句轉移概率,計算單位為%。采用上述查詢函數,將全減縮計算流程近似看作馬爾科夫決策流程,將最有計算方法按照5元組的方式描述[8]。可表示為:
公式中:[S]表示為數據集合的特征有限數據集合,集合中數據值為1~k中任意自然整數,表示為[S=(S1,S2,S3…Sk)];[A]表示為查詢數據庫樹中數值存在的交叉率,變異參數記為[η];P表示為在時間t的種群狀態(tài)下,[s]的原始數值及其獎勵數值,按照并行計算原理,數值個體適應程度越高,數值獎勵程度越大;[R(s)]表示為特殊種群中數值個體的最近適應程度,定義[s']表示查詢數值與計算數值兩者之間的匹配程度,匹配程度越高,可為函數計算提供下一步適應度數值,為計算提供正確決策;[π]表示為數據庫樹第二次計算的決策函數,可表達其期望數值與查詢減縮方向。根據上述查詢函數及計算公式,結合數據進化值與數據期望值,求解Q值,提供后續(xù)計算方向[9]。
1.3查詢全減縮計算
基于上述建立的數據庫樹查詢函數及最優(yōu)采樣條件,定義計算中多個計算參數數值,評價初始化數據種群,記錄最優(yōu)查詢計算方式,實施較差變異操作,計算查詢參數數值[10]。如下公式:
公式中,[P]表示為查詢全減縮計算的適應程度;[m]、[n]表示多種計算參數的變異概率,計算單位為%;[f]表示為最有計算算法;[λ]表示可調節(jié)誤差。通過上述公式,計算最佳數值實用度,適應程度越高,計算結果精準化程度越高,標記計算數值種群,判斷群體之間的參數關系,完成計算。
2對比實驗
2.1實驗準備
提出對比實驗,選定某實驗研究室為此次實驗的實驗對象,隨機選取實驗室某計算機,模擬此次實驗的實驗環(huán)境。為了提高實驗結果的準確性,整體實驗均在[Matlab]上進行,安裝雙端口萬兆位的路由協調控制器,選型計算機運行系統(tǒng)及相關配置。遵循標準安裝流程將互聯網與PC設備連接,并允許地方區(qū)域互聯網資源共享,在確保網絡格局相同的條件下,搭建計算節(jié)點緩沖區(qū)域。相關準備設備參數如表1所示。
結合上述表中設定的參數數值,先用傳統(tǒng)的數據庫樹查詢全減縮計算方法對指定PC機上數據庫樹中數據,實施查詢全減縮計算,收集10組實驗數據,采用云平臺處理數據的方式計算輸出數據與輸入數據之間的時間差,記該組為對照組。再用本文設計的基于并行計算的分布式數據庫樹查詢全縮減計算方法,進行相同步驟的操作,記該組為實驗組。
2.2實驗結果分析
根據上述提出的實驗環(huán)境及實驗步驟,將數據查詢全檢索計算時間作為此次實驗的關鍵對比指標,整理收集的數據,并將其繪制表格,如下表2所示。
根據上述表2及實驗過程中產生的數據,可得出如下結論:本文設計的基于并行計算的分布式數據庫樹查詢全縮減計算方法,在實際計算中,可縮短輸入數據與輸出數據之間的時間差,進而提升計算速度,起到提高查詢全減縮計算效率的作用。
3結束語
基于并行計算的理論依據,本文提出了基于并行計算的分布式數據庫樹查詢全減縮計算方法的研究。并通過設計仿真實驗進一步證明,本文設計的計算方法在實際應用中,可起到縮短計算時間,縮短計算效率的作用。盡管本文研究已經趨近于完善,但在后期的發(fā)展中,仍需針對提高數據分辨率等問題,實施更加深化的研究,推動分布式數據庫的發(fā)展。
參考文獻:
[1]黃天恩,郭慶來,孫宏斌,等. 模型-數據混合驅動的電網安全特征選擇和知識發(fā)現關鍵技術與工程應用[J]. 電力系統(tǒng)自動化,2019,43(1):95-101,208,102-104.
[2]劉春成,顧漢明,陳寶書,等. 基于GPU和CPU協同并行的三維各向異性介質地震波場正演模擬[J]. 地質科技情報,2019,38(5):240-246.
[3]閆華,汪貽生,王銳淇,等. 基于GPU的大規(guī)模多階段任務系統(tǒng)可靠性并行計算方法[J]. 系統(tǒng)工程與電子技術,2019,41(1):215-222.
[4]宋佩濤,張志儉,梁亮,等. 基于CPU-GPU異構并行的MOC中子輸運計算并行效率優(yōu)化研究[J]. 原子能科學技術,2019,53(11):2209-2217.
[5]易俊,秦曉萌,岑穎珊,等. GPU并行計算在FD-OCT成像中加速插值計算的應用[J]. 儀器儀表用戶,2019,26(9):40-44.
[6]方睿,董樹鋒,唐坤杰,等. 基于最大測點正常率與GPU并行加速的不良數據辨識方法[J]. 電力系統(tǒng)自動化,2019,43(16):86-094,115.
[7]李楊,李朝奎,方軍,等. 基于數據級任務分解的大范圍地質災害預警并行計算架構設計與應用[J]. 地理信息世界,2018,25(2):97-101.
[8]章立宗,張鋒明,蔣正威,等. 基于并行概率潮流計算的含光伏配電網電壓風險評估[J]. 浙江電力,2018,37(8):7-14.
[9]張子興,吳斌,吳心宇,等. 路徑-維度GraphOLAP大規(guī)模多維網絡并行分析框架[J]. 軟件學報,2018,29(3):545-568.
[10]曹禮群,陳志明,許志強,等. 科學與工程計算的方法和應用——基于國家自然科學基金創(chuàng)新研究群體項目研究成果的綜述[J]. 中國科學基金,2018,32(2):141-149.
【通聯編輯:張薇】