999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

分布式WEB信息存儲技術的應用研究

2018-12-21 21:23:46黃澤長沙市雅禮中學
數碼世界 2018年2期
關鍵詞:文本信息管理

黃澤 長沙市雅禮中學

隨著互聯網的普及和應用,各種各樣的信息呈爆炸式的趨勢增長,如何對信息進行有效的收集和管理,提高企業的信息利用率成為企業關注的重點問題。現如今,越來越多的企業選擇建立企業競爭情報系統的方式收集自身所需的情報信息,因此對系統中的分布式WEB信息存儲技術提出了更高的要求。

1 WEB信息存儲和管理技術

1.1 WEB信息的壓縮存儲

在WEB信息的壓縮存儲中主要采用文本壓縮技術來實現,這種技術能夠利用較少的比特或者字節還表示文本,從而減少在計算機中占用的存儲空間。隨著互聯網技術的發展,信息量逐漸增加,有限的存儲空間無法滿足無限增長的信息,單方面依靠擴大內存也不是長久之計,因此通過對文本的壓縮來實現減少占用空間的方式不失為一個行之有效的好辦法。同時,利用此項技術還有利于減少系統輸入或者輸出管理的開銷以及縮短信息延遲。在利用文本壓縮技術時,主要的時間花費是在文本編碼和解碼上面,利用已經壓縮文件的大小除以未被壓縮文件的大小則能夠得到該本文的壓縮率。

進行存儲文本壓縮最大的挑戰就是信息存取的隨機性,若想在壓縮文本中查找某個單詞,通常需要將所需單詞的所有本文進行解碼,可以將較大的文本分割成幾個小模塊,再逐一尋找。但是隨著模塊越小,壓縮率也就越低。因此,在選擇文本壓縮方式時,既應該考慮到空間的壓縮率,又要注重壓縮文檔的編碼以及解碼的速度,尤其是解碼的速度更為重要。例如,在企業的競爭情報系統中,將收集到的WEB信息進行存儲之后,需要反復操作才能夠被讀出,影響了企業工作效率。

1.2 WEB信息的版本管理

在現實網絡環境中,同樣的WEB信息將以不同版本的方式存在,例如新浪網的主頁,地址都是新浪網站但每天的內容都在更新。還有些網站中的信息被以不同人的需要拷貝走進行更改,因此形成了多種多樣的版本。因此,如何對這些大同小異的WEB信息進行管理成為分布式WEN信息存儲系統中的主要難題。

分布式共享存儲系統是分布式海量存儲系統中的副本管理系統,它能夠根據文件受歡迎的程度進行動態的管理,當其所管理的某個文件的點擊頻率超過設置的閾值時,則會自動生成副本,從而實現降低訪問延遲以及平衡負載的目的。

2 基于負載平衡的分布式存儲機制

2.1 基本的負載平衡算法

負載平衡能夠有效提升分布式WEB信息系統的整體性能,平衡策略設計的質量與分布式存儲系統的存儲均衡程度息息相關。設計質量較差的策略算法會給系統的負載帶來較大不利影響,甚至會導致負載失衡。在選擇均衡算法的同時,應根據算法本身的適用環境和特點,可以結合不同算法和技術來使用。

2.1.1 輪詢法

每個部分在任務隊列節點中都具有相同的地位,輪詢法能夠實現將這些組成部分進行順序輪轉選擇。在負載平衡的條件下,算法將會將新的請求輪流傳達給節點隊列中的一點節點,然后進行順序輪轉,如此反復下去,使得每個節點在輪轉中都具有相同的地位參與其中。在輪詢法中,假如有N個節點,則每個節點被選中的幾率為N/1,因此較為容易算出節點的負載分布情況,也是操作性最強的一種方法。

2.1.2 最少連接法

在最少連接法中,主要是記錄一些目前來看最活躍的連接,將新的請求傳達給目前含有最少連接數的節點。這種算法主要應用于TCP連接,但是受網絡延遲等因素的制約,將會產生當前連接數與實際反映應用負載不相符的情況,這主要是由于沒有注重節點性能和請求強度的原因導致,使得平衡負載的效果明顯降低。為了避免這個弊端的出現,應設置最大的連接數上限。

2.1.3 散列法

散列法是指按照一定的規則,利用單向性的函數將節點分配出去,但是在WEB信息量較大的情況下時,承擔計算任務的每個Hash函數值的負擔都比較重。

2.2 體系結構

在負載平衡的WEB數據分布式模型體系中包含多個存儲節點主機,每個主機都代表著網絡“家族”中的一員,并且以單獨的形式存在,具有單獨的存儲空間,能夠動態的加入或者退出。在此模型中,能夠在網絡中各存儲節點的空間磁盤中,建立一個大型的存儲池,使得用戶可以在全局空間內自由搜索自己所需的WEB信息,從而真正實現存儲空間的分布式共享。同時,利用管理服務器能夠對各個存儲節點進行動態的信息表管理,當用戶發送存儲請求時,管理服務器中采用的負載平衡算法將能夠實現各節點之間的動態分配。

雖然管理服務器中的功能多樣,但是不能夠對任何WEB信息進行保存,所有的WEB信息都放置在存儲節點當中,并且另外配備一個備份服務器可以避免管理服務器突然失效產生不良后果。此外,所有的存儲節點信息都在節點信息保存表中進行保存,其中包括節點目前的IP地質、節點狀態、節點剩余空間等等。信息表的存在主要是為了能夠維護一個完整的系統拓撲結構,根據節點的加入和推出不停的更新節點狀態,從而保障其同步和有效。當對企業競爭情報系統中的其他模塊發送存儲請求時,應在存儲節點信息表中進行查詢,獲得適應的節點集,再利用輪詢法進行計算,從而獲得最適宜的存儲節點進行存儲后更新WEB信息表。

3 結束語

綜上所述,隨著互聯網中涵蓋的商業信息量的增加,部分企業為了能夠在激烈的市場競爭中搶得先機,都紛紛加強與互聯網的融合,建立企業競爭情報系統。本文從分布式WEB信息存儲關鍵技術方面對其進行分析,構建企業競爭情報系統應用模型,為企業提供更多可拓展、高效率的海量存儲服務。

[1]許崇龍.分布式WEB信息存儲關鍵技術研究[D].哈爾濱工業大學,2012.

[2]李韌.基于Hadoop的大規模語義Web本體數據查詢與推理關鍵技術研究[D].重慶大學,2013.

猜你喜歡
文本信息管理
棗前期管理再好,后期管不好,前功盡棄
今日農業(2022年15期)2022-09-20 06:56:20
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
“這下管理創新了!等7則
雜文月刊(2016年1期)2016-02-11 10:35:51
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
人本管理在我國國企中的應用
現代企業(2015年8期)2015-02-28 18:54:47
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
管理的另一半
主站蜘蛛池模板: 国产青青草视频| 最新亚洲av女人的天堂| 亚洲无码91视频| 亚洲无码精彩视频在线观看| 日本人妻丰满熟妇区| 欧美成人精品高清在线下载| 亚洲狼网站狼狼鲁亚洲下载| 无码粉嫩虎白一线天在线观看| 日韩精品一区二区深田咏美| 久久国产精品麻豆系列| 台湾AV国片精品女同性| 国内精品免费| 老司机久久99久久精品播放| 亚洲国产清纯| 国产免费网址| 久操线在视频在线观看| www亚洲精品| 亚洲Av综合日韩精品久久久| 国产精品林美惠子在线播放| a毛片免费观看| 欧美成人午夜视频| 国产精品人人做人人爽人人添| 九九免费观看全部免费视频| 蜜臀AV在线播放| 久久亚洲中文字幕精品一区| 久久综合色天堂av| 国产极品粉嫩小泬免费看| 午夜三级在线| 中文成人无码国产亚洲| 91精品国产一区自在线拍| 国产成人福利在线| 久热99这里只有精品视频6| 久久99精品久久久大学生| 成人免费黄色小视频| 亚洲无码视频喷水| 91成人在线免费观看| 亚洲性视频网站| 2021国产乱人伦在线播放| 亚洲色图欧美一区| 日韩美毛片| 九九九精品成人免费视频7| 91无码国产视频| P尤物久久99国产综合精品| 精品无码国产一区二区三区AV| 国产精品视频久| 欧美另类第一页| 亚洲乱伦视频| 日韩欧美国产三级| 国产成人啪视频一区二区三区| 国产精品视频a| 老司国产精品视频| 制服丝袜 91视频| 天天综合天天综合| 456亚洲人成高清在线| 国产成人91精品| 看你懂的巨臀中文字幕一区二区| 日韩A∨精品日韩精品无码| 日韩精品毛片人妻AV不卡| 污视频日本| 亚洲第一视频网| 26uuu国产精品视频| 日韩午夜伦| 国产天天射| 成人午夜久久| 日本少妇又色又爽又高潮| 国产精品亚洲欧美日韩久久| 97久久精品人人| 日日碰狠狠添天天爽| 1769国产精品视频免费观看| 欧美福利在线观看| 黄色网址免费在线| 91最新精品视频发布页| 女人18一级毛片免费观看| 乱人伦视频中文字幕在线| 亚洲自偷自拍另类小说| 午夜无码一区二区三区在线app| 最新亚洲人成无码网站欣赏网| 亚洲免费毛片| 色窝窝免费一区二区三区| 日韩免费毛片视频| 亚洲综合极品香蕉久久网| 亚洲无码免费黄色网址|