999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據時代檔案管理系統分布式文件存儲的幾點思考

2021-04-28 08:14:54耿正臣
山東檔案 2021年1期
關鍵詞:數據庫

文·耿正臣

隨著信息技術以及信息產業的高速發展,以數字化、網絡化、智能化、智慧化為特征的信息化浪潮蓬勃興起。現如今,信息化在社會各個領域中得到了廣泛深入應用,已成為創新驅動發展的先導力量。信息技術的發展和應用,也讓檔案信息資源的生成環境、生成方式、傳播媒介等產生了革命性變化,數字檔案資源日漸成為檔案信息資源的主要形態,建立一個側重于數字檔案資源管理與服務的檔案數字資源中心也勢在必行。它可以圍繞著數字檔案生成、歸檔、管理、存儲、安全、傳播與利用等方面的特點,利用云計算、大數據、移動互聯網、可視化、物聯網、人工智能等新技術,解決數字檔案的收集歸檔、長期存儲、信息安全、有序管理與高效利用等問題。其中,文件存儲是檔案管理系統中的重要組成部分,由于計算機操作系統自帶的文件系統在容量大小、容量增長速度、數據備份、數據安全等方面的表現都差強人意,所以如何長久、安全地保存電子文件、多媒體文件等就成為一個必須研究的問題。筆者認為,檔案信息資源中心文件存儲應采用當下主流、業界認可的文件存儲架構,即分布式文件存儲架構,以提高文件管理的安全性,支持大文件及海量文件的有效管理,并實現文件的高效傳輸。

一、分布式文件存儲

分布式文件存儲,就是借助分布式文件存儲系統把大量數據分散到不同的節點上存儲,從而減小數據丟失的風險。分布式文件系統具有冗余性,部分節點的故障并不影響整體的正常運行,而且即使出現故障的計算機存儲的數據已經損壞,也可以由其它節點將損壞的數據恢復出來。因此,安全性是分布式文件系統最主要的特征。分布式文件系統通過網絡將大量零散的計算機連接在一起,形成一個巨大的計算機集群,使各主機均可以充分發揮其作用。此外,集群之外的計算機只需要經過簡單的配置就可以加入到分布式文件系統中,具有極強的可擴展能力。

(一)分布式文件存儲技術

主流的分布式文件系統架構,包括主控服務器(或稱元數據服務器、名字服務器等,通常會配置備用主控服務器以便在故障時接管服務,也可以兩個都為主的模式)、多個數據服務器(或稱存儲服務器,存儲節點等)以及多個客戶端(客戶端可以是各種應用服務器,也可以是終端用戶)。

分布式文件系統的數據存儲解決方案,歸根結底是將大問題劃分為小問題。大量的文件,均勻分布到多個數據服務器上后,每個數據服務器存儲的文件數量就少了。另外,通過使用大文件存儲多個小文件的方式,總能把單個數據服務器上存儲的文件數降到單機能解決的規模;對于很大的文件,將大文件劃分成多個相對較小的片段,存儲在多個數據服務器上,如圖1分布式數據分塊結構圖所示。

圖1 分布式數據分塊結構圖

應用分布式文件存儲系統的優點是:一提高數據安全性。分布式文件存儲系統中每個文件都被分割為不同大小的數據塊,每個數據塊都有多個數據副本保存在不同的存儲空間中,并使用了糾刪碼的方式來節省副本存儲空間,在文件損壞時可快速對數據進行恢復;二支持單個文件的大容量存儲,也支持海量的數據文件存儲;三提高數據吞吐量。分布式文件系統采用“一次性寫,多次讀”的簡單的數據一致性模型,該簡單模型大大地提高了吞吐量;四可以單次大量文件提取。通過流式數據訪問技術,對數據進行批量處理,支持應用對系統的單次大量數據訪問;五可以進行文件權限控制。通過分布式文件系統的權限控制,進而增加文件使用的安全保障。理論上,分布式文件系統可以只有客戶端和多個數據服務器組成,客戶端根據文件名決定將文件存儲到哪個數據服務器。但其弊端是,一旦有數據服務器失效,因客戶端并不知道數據服務器宕機的消息,仍然連接它進行數據存取,會導致整個系統的可靠性極大降低,而且完全由客戶端決定數據分配也非常不靈活,因為它不能根據文件特性制定不同的分布策略。

二、數據庫架構

眾所周知,應用系統執行效率的瓶頸一般都在數據庫方面。因為單機運行的數據庫對磁盤讀寫壓力大,數據的查詢檢索在單機的計算壓力也非常大,在數據安全性方面也存在著不足。檔案信息資源中心建設中,不僅涉及了多數據庫的使用需求,還對數據庫的容量與安全有著較大的需求。因此需要采用分布式數據庫架構來解決大數據存儲、快速數據讀寫、高數據安全性等問題。

(一)分布式數據庫

分布式數據庫系統通常使用較小的計算機系統,每臺計算機可單獨放在一個地方,每臺計算機中都可能有DBMS 的一份完整拷貝副本,或者部分拷貝副本,并具有自己局部的數據庫。位于不同地點的許多計算機通過網絡互相連接,共同組成一個完整的、全局的邏輯上集中、物理上分布的大型數據庫。分布式數據庫可分為四層,即全局外層、全局概念層、局部概念層、局部內容。數據庫可看作為邏輯上的全局數據庫和局部的物理數據的集合。全局數據庫到局部數據庫由分配合分片的模式進行描述。

(二)分布式數據庫架構技術

水平分片是解決數據庫存儲容量限制的直接途徑,以邏輯表中的數據行記錄為單位,把原有邏輯數據庫切分成多個物理數據庫分片,表數據記錄分布存儲在各個分片上,如圖2水平分片實現原理所示。分布式數據庫系統中則實現了自動水平分片,應用無需關心某個數據該存儲在哪一塊分片上。

圖2 水平分片實現原理

分片架構的特點是底層數據通過一定的規則,比如hash 或者range ,讓數據打散分別分布到不同的數據節點上,計算時底層多個節點共同參與計算,可以算是一種 mpp 并行計算的架構,同時數據節點可以擴展,上層由協調節點進行 sql 解析和轉發,這是目前典型的分布式數據庫架構。分布式數據庫三大組件,協調節點、數據節點、全局事務管理器。協調節點負責 SQL 解析轉發,充當的是類似 proxy 的角色,數據節點負責計算和數據存儲,全局事務管理器負責全局事務一致性的保證。

應用分布式文件存儲系統的優勢是:一提高檔案數據的可靠性和可用性。當數據和分布式數據庫軟件分布在多個節點上時,一個節點可能會失敗而其他站點繼續運行,因此可以提高可靠性和可用性;二數據容量更易擴展,在分布式環境中,可是實現動態數據庫擴容;三更快的數據讀寫能力,分布式數據庫的讀寫分離功能能有效地加快數據讀寫速度,并對數據讀寫進行控制。

猜你喜歡
數據庫
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
兩種新的非確定數據庫上的Top-K查詢
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
數據庫
財經(2015年3期)2015-06-09 17:41:31
數據庫
財經(2014年21期)2014-08-18 01:50:18
數據庫
財經(2014年6期)2014-03-12 08:28:19
數據庫
財經(2013年6期)2013-04-29 17:59:30
主站蜘蛛池模板: 高清不卡一区二区三区香蕉| 一级看片免费视频| 久久semm亚洲国产| 亚洲第一色视频| 全午夜免费一级毛片| 理论片一区| www亚洲精品| 亚洲欧洲日韩国产综合在线二区| 四虎永久在线视频| 国产成人一级| 精品人妻一区无码视频| 亚洲一区二区三区麻豆| 国内视频精品| 欧美激情视频二区| 免费精品一区二区h| 亚洲欧美成人在线视频| 五月激情综合网| 四虎成人免费毛片| 婷婷六月综合网| 国产正在播放| 内射人妻无码色AV天堂| 亚洲欧美日韩中文字幕在线| 国产精品成人一区二区| 99久视频| 欧美伊人色综合久久天天| 国产精品浪潮Av| 成年片色大黄全免费网站久久| 久久窝窝国产精品午夜看片| 9丨情侣偷在线精品国产| 天天躁夜夜躁狠狠躁图片| 亚洲日韩Av中文字幕无码| 色婷婷视频在线| 中文字幕1区2区| 国产91丝袜在线播放动漫| 人妻少妇久久久久久97人妻| 日韩免费成人| 国产又爽又黄无遮挡免费观看| 亚洲熟女中文字幕男人总站| 精品91在线| 国产屁屁影院| 久久性视频| 亚洲精品成人片在线观看| 国产原创第一页在线观看| 国产日韩欧美一区二区三区在线 | 欧美日韩一区二区在线免费观看 | 免费无码又爽又刺激高| 高清无码一本到东京热| 在线欧美一区| 波多野结衣二区| 四虎国产精品永久在线网址| 亚洲欧美在线精品一区二区| 一级毛片免费不卡在线| 伊人丁香五月天久久综合 | 欧美怡红院视频一区二区三区| 天天婬欲婬香婬色婬视频播放| 国产成年女人特黄特色毛片免 | 久久五月天综合| 亚洲人在线| 亚洲精选高清无码| 亚洲一级毛片免费观看| 中国一级毛片免费观看| 激情亚洲天堂| 欧美成人免费| 国产成人综合久久精品尤物| 9999在线视频| 国国产a国产片免费麻豆| 日韩无码真实干出血视频| 在线五月婷婷| 啪啪免费视频一区二区| 免费看a毛片| 久久黄色免费电影| 天天综合色网| 国产成人亚洲欧美激情| 91系列在线观看| 午夜国产不卡在线观看视频| 免费无遮挡AV| 久热这里只有精品6| 国产成人精品2021欧美日韩| 欧美成人影院亚洲综合图| 97国产一区二区精品久久呦| 久草视频中文| 国产成人精品18|