999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ETL 及XML 技術的分布式數據庫多層數據同步機制研究

2022-09-02 06:24:58劉雅莉
電子設計工程 2022年16期
關鍵詞:數據庫機制效率

劉雅莉

(商洛學院 經濟管理學院,陜西商洛 726000)

隨著網絡技術的發展,各行各業對信息管理的需求日趨復雜,信息系統的性能、數據的安全性、數據的復用率成為系統使用者關注的問題。分布式數據庫作為邏輯上的統一整體,滿足信息既獨立、又協同的處理需求,在不同節點數據庫之間的數據傳輸、不同數據源異構數據的信息共享方面表現優異,而分布式數據庫的同步機制直接影響系統性能,是系統開發過程中必須解決的問題,因此,建立一套性能優異的數據同步機制既能節省信息化系統建設成本,又能發揮出數據的最大價值。

1 現有同步機制分析

1.1 分布式數據庫簡介

分布式數據庫通常由一組數據構成,數據分布于多個服務器,每個服務器均可執行局部應用,也可以利用部署的分布式集群網絡實現全局應用。從邏輯表面看,數據比較分散,但實際上是一個整體。分布式數據庫具有數據獨立、站點自治、分布透明、冗余透明、系統分層、并行處理等特性,為多層級結構模式,在諸多領域的應用中有優異表現。

1.2 主流機制對比分析

目前,主流數據同步機制主要包括數據庫復制技術、ETL 機制、SQLServer、Sybase 等。數據庫復制技術利用自身同步機制進行定期巡檢,發現不一致則進行復制并發送給其他站,融合能力較高且利于節點就近獲取數據。ETL 機制可實現異構數據的采集、清洗、轉換以及數據加載。SQLServer 和Sybase 都基于“Publisher-Subscriber”模式,區別在于SQLServer 主要支持快照、事務以及合并復制。Sybase 主要支持分布式主段、主復制等模式[1-2]。

1.3 同步機制設計目標

文件傳輸模式的數據同步由于固定間隔傳輸導致實時性欠佳,而數據庫內嵌的復制同步機制如果頻繁更新,則無法確保網絡穩定性且存在數據一致性缺陷,因此多層分布式數據庫同步機制的設計目標首先要保證數據準確,其次要保證同步效率。綜合比較之下,該研究選擇了觸發器以及XML 技術,采用觸發器技術記錄數據庫表更新情況并寫入中間表;基于XML 彌補了觸發器單表綁定的缺陷,實現了多表數據讀取。

2 基于ETL的增量抽取機制

2.1 ETL技術簡介

ETL(Extraction Transformation Loading)技術包括數據的抽取、轉換、清洗以及裝載。數據處理不是直接單一的存儲和查詢過程,而是多個ETL 過程。

1)數據抽取:主要是確定哪些數據與后續執行決策有關,收集這部分數據的字段信息,確定抽取間隔、傳送格式,并傳送到目標服務器。

2)數據轉換:主要是將多源數據進行格式化,確保數據的一致性,便于應用系統進行操作。具體包括兩個方面:一方面是將操作型數據轉換為查詢分析型數據,另一方面是在導入之前統一數據標識。

3)數據清洗:無效數據會影響后續的分析效果,因此需要校驗源數據質量,針對容易出現的數據丟失、出錯、冗余以及不一致的情況進行補充、修正或剔除,數據清洗過程也是數據的標準化過程,是提高源數據質量的有效方式。

4)數據裝載:主要是將數據載入到目標數據庫,包括全部裝載、更新、刷新等幾種方式。全部裝載是對整個數據庫進行裝載,更新是對有變化的數據進行記錄,刷新是在指定周期進行重新裝載。

2.2 性能影響因子

網絡中所有機器全部完成一次上傳與下載所需時長是分布式數據庫數據同步性能關鍵的判斷標準。設網絡內計算機記為S1,S2,S3,…,Sn,兩臺機器間傳輸帶寬記為Wij,單位時間內同步數據量作為同步效率記為Kij,則兩臺計算機實現一次數據同步所需時間為tij=。通過帶寬矩陣和效率矩陣獲取所需的時間矩陣,得出耗時最長為tmax=max(t12,t13,t14…,t1m,t21,t22,…,t2m,…,tn1,tn2,…,tnm)。若各條帶寬均相同記作,其中,B為總帶寬,n為計算機總數,n(n-1)/2 為連接總數。那么可以得出t==Kijn(n-1)/2B。若計算機數量固定,同步效率低于帶寬,則時間與效率、數量函數成正比,同時與Kij、B有關;同步效率高于帶寬可能導致數據擁堵,從而導致同步效率下降。因此,影響分布式數據庫數據同步性能的影響因子包括:同步效率Kij、計算機總數n、網絡總帶寬B[3-4]。

2.3 數據導入過程

海量數據時代涉及大量事務的分析與處理,機器自動化抽取、加載數據勢在必行,相對于傳統數據庫,數據倉庫更適用于對大量事務的分析與處理,因此,采用數據倉庫中的ETL 工具來實現數據導入,為避免全量加載而影響性能,只需抽取增量更新數據。根據操作類型、是否更新等進行數據分類,然后將有記錄時間的數據實行增量導入,沒有記錄時間的轉為分析數據庫日志。數據導入流程如圖1 所示。

圖1 數據導入流程

2.4 增量數據提取

在使用ETL 工具時,關鍵是如何判斷數據的變化,文中采用觸發器和時間戳相結合的方式,在待維護的數據表上建立插入、修改、刪除三類觸發器,當源表數據發生更新時,對應的觸發器將數據寫入維護表,并增加時間戳及標記操作類型[5-6]。觸發器實現代碼如下:

2.5 斷點續傳

對于由斷電或其他網絡因素導致傳輸中斷的情況,恢復后從中斷位置繼續傳輸即可。在斷點續傳的過程中,主要包括請求、回復兩個動作,在請求消息包中設置Range 關鍵字,記錄開始傳輸的位置,實現代碼如下:

回復消息的數據采用如下格式:

3 基于XML的異構數據同步實現

3.1 XML技術簡介

XML(Extensible Markup Language)是一種可擴展的標記語言,利用自我定義的方式對存儲的數據進行描述,描述信息不但包括各類數據內容,還包括數據相互間的關聯關系。XML 技術具有可擴展性、結構性以及平臺獨立性,可以描述各種結構化以及非結構化的數據,可以有效解決兩個系統之間、不同應用之間、不同數據源之間的數據同步問題。XML可以將多個程序的數據寫入同一個XML 文件并進行傳輸,接收文件的服務器通過解析XML 文件獲取信息,進而實現本地的編輯操作。鑒于XML 的優良特性,應用在數據同步機制中,不僅滿足了轉換需要,而且可以起到簡化異構數據的效果,降低了同步模型的復雜程度。

3.2 異構數據同步模型

分布式數據庫的數據同步過程包括采集、轉換、傳輸以及導入四個階段,利用數據倉庫提取增量數據并存入緩存區;利用ETL 實現數據流轉,增強數據一致性;經過XML 轉換后傳至其他節點,接收后進行反向轉換,增強數據的規范性[7-8]。根據總體工作機制,構建異構數據同步模型如圖2 所示。應用系統之間共享數據可通過不同服務器間接口,按照協議格式進行封裝,通過XML 文檔格式進行數據的加密、解密以及數據傳輸,利用轉換模塊實現XML 文檔與數據庫的正反映射,不同中心之間利用同步模塊進行上傳與下載,實現數據共享。

圖2 異構數據同步模型

3.3 XML文檔映射算法

XML文檔包括包含描述信息的Schema文檔以及包含表結構及關聯關系的映射文檔。首先,將關系模式映射為文檔,確認全局變量。其次,在XML 中利用數據庫名構建根元素,利用表名構建表元素。最后,建立類型與表字段結構一一對應。其中xs:schema包括標識、命名等信息,xs:element 代表數據庫表字段,xs:sequece 代表順序,xs:unique 代表是否唯一,xs:keyref 代表約束,PrimaryKet 代表元素主鍵[9-10]。

3.4 正向轉換

XML 文檔向數據庫表正向轉換:首先,校驗文檔格式是否符合標準。其次,利用讀取函數生成創建語句。再次,從文檔中讀取相關屬性和約束,生成insert、update 或delete 語句。最后,在數據庫中執行語句并返回結果[11-12]。具體轉換流程如圖3 所示。

圖3 正向轉換流程

3.5 反向轉換

從數據庫到XML 文檔的反向轉換只針對有效數據,將數據庫中提取出來的數據寫入文檔,轉換流程如圖4 所示。利用GerFileName 函數獲取文件名,打開文件后,根據XML 文檔映射算法寫入Schema 格式的信息內容,然后完成轉換[13-14]。

圖4 反向轉換流程

4 同步效果實證分析

為了驗證所設計的數據同步機制的實際應用效果,獲取國內某市醫院數據庫作為實驗數據,在Matlab 上搭建實驗平臺,創建同步信息表sync_test,包含30 個字段,記錄數據同步時間及數據完整性,結果如表1 所示。

表1 同步機制實證效果

隨著數據量級的增長,同步模型時延始終控制在5 μs 以內且無數據丟失,同步效果較好且性能優異[15-16]。

5 結束語

為了實現分布式數據庫多層數據同步,利用觸發器、時間戳相結合的方法增量抽取待同步數據,經過實證分析,基于XML 構建的同步模型時延較小、性能良好。但同步機制尚未實現完全自動化,所采用的技術相對比較單一,在數據庫訪問效率方面的研究還有待提升。

猜你喜歡
數據庫機制效率
提升朗讀教學效率的幾點思考
甘肅教育(2020年14期)2020-09-11 07:57:42
自制力是一種很好的篩選機制
文苑(2018年21期)2018-11-09 01:23:06
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
破除舊機制要分步推進
中國衛生(2015年9期)2015-11-10 03:11:12
跟蹤導練(一)2
注重機制的相互配合
中國衛生(2014年3期)2014-11-12 13:18:12
“錢”、“事”脫節效率低
中國衛生(2014年11期)2014-11-12 13:11:32
主站蜘蛛池模板: 色婷婷亚洲综合五月| 亚洲无码久久久久| 在线观看av永久| 欧美成人午夜影院| jizz在线免费播放| 极品国产在线| 四虎成人精品在永久免费| 欧美国产精品不卡在线观看| 又爽又大又黄a级毛片在线视频 | 欧美另类第一页| 永久免费无码日韩视频| 麻豆a级片| 情侣午夜国产在线一区无码| 精品精品国产高清A毛片| 国产成人精品2021欧美日韩| 亚洲综合极品香蕉久久网| 午夜福利在线观看成人| 国产综合另类小说色区色噜噜| 免费xxxxx在线观看网站| 久久久久无码精品| 国产欧美日韩免费| 精品亚洲麻豆1区2区3区| 国产探花在线视频| 欧美高清三区| 日韩欧美国产成人| 久久久久久久久亚洲精品| a毛片基地免费大全| 免费人成黄页在线观看国产| 国产欧美综合在线观看第七页| 手机在线免费毛片| 国产精品极品美女自在线看免费一区二区 | 中文字幕日韩视频欧美一区| 熟妇人妻无乱码中文字幕真矢织江| 又猛又黄又爽无遮挡的视频网站| 国产亚洲精| 欧美日韩成人| 九九九精品视频| 久久国产精品夜色| 激情综合网激情综合| WWW丫丫国产成人精品| 亚洲国产精品日韩av专区| 在线免费a视频| 五月激情综合网| 婷婷伊人五月| 亚洲日韩精品欧美中文字幕| 国产粉嫩粉嫩的18在线播放91 | 无码日韩精品91超碰| 亚洲免费黄色网| 国产乱子伦无码精品小说| 国产在线自在拍91精品黑人| 国产午夜福利亚洲第一| 亚洲精品无码不卡在线播放| 色一情一乱一伦一区二区三区小说| 在线观看亚洲天堂| 免费观看男人免费桶女人视频| 国产99免费视频| 欧美日韩国产成人在线观看| 无码福利视频| 久久香蕉国产线| 人人爱天天做夜夜爽| 夜精品a一区二区三区| 一级毛片在线免费视频| 中文字幕色在线| 无码国内精品人妻少妇蜜桃视频| 国产日产欧美精品| lhav亚洲精品| 99热这里只有成人精品国产| 亚洲AV无码乱码在线观看代蜜桃| 国产尤物在线播放| 毛片网站观看| 亚洲欧州色色免费AV| 亚洲一级无毛片无码在线免费视频| 亚洲日韩精品无码专区| 精品久久久久久成人AV| 亚洲AV免费一区二区三区| 在线观看无码av免费不卡网站| 国产区福利小视频在线观看尤物| 亚洲人成影院午夜网站| 中文字幕色在线| 一级片免费网站| 男人天堂伊人网| 国产毛片片精品天天看视频|