李珊珊
摘 要:知識管理是隨著知識經(jīng)濟的到來,知識管理是以網(wǎng)絡(luò)化、數(shù)字化、信息化、知識化為基礎(chǔ),以"信息高速公路"為主干,以知識創(chuàng)新為核心的一種全新的管理模式。但數(shù)據(jù)的不斷海量增長給傳統(tǒng)的存儲系統(tǒng)帶來了極大的挑戰(zhàn),越來越多的企業(yè)開始將目光轉(zhuǎn)移到新興的云模式之上。作為云模式不可或缺的基礎(chǔ)設(shè)施存儲系統(tǒng)也越來越受到企業(yè)的關(guān)注,其需要綜合考量存儲設(shè)備的安全與穩(wěn)定性、靈活性、可擴展性以及易用性等因素。
關(guān)鍵詞:知識管理;文檔;云存儲
0 引言
在知識經(jīng)濟時代的今天,知識已成為企業(yè)最重要的資源,知識資源成為企業(yè)創(chuàng)造收益的實際生產(chǎn)力,并成為衡量企業(yè)成功的實際推動力。知識管理是企業(yè)識別自己擁有的,并對其加以整理、分類、索引、存儲,以便有效地利用知識,獲取競爭優(yōu)勢的過程,對于設(shè)計所這類知識型的組織更是如此。而首當其沖的是需要全局考慮知識的存儲問題,任何一個企業(yè)的知識都是經(jīng)過多年的積累和沉淀,其數(shù)據(jù)量都較為龐大;而且隨著知識的不斷利用和挖掘,知識的產(chǎn)生速度也會不斷加劇,這些因素都會對知識的存儲架構(gòu)提出較高的要求。
1 傳統(tǒng)存儲方式存在的問題
(1) 文檔存儲安全
采用文檔存儲的方式產(chǎn)生的主要問題在于數(shù)據(jù)的安全風(fēng)險較高以及知識的利用率較低。從數(shù)據(jù)安全的層面,一旦存儲設(shè)備發(fā)生故障(例如硬盤損壞),則其中的所存文檔數(shù)據(jù)都將面臨損壞的風(fēng)險;而且,即便對文檔進行備份工作,但該工作量較大,且無法做到實時同步。從知識利用的層面,文檔方式過于分散,知識的粒度較粗,不利于知識的索引和檢索,更談不上高效的利用。
(2)文檔版本管理
傳統(tǒng)存儲方式對文檔版本管理的考慮并不是很充分,對于文檔修改的迭代信息并沒有進行很有效的管理,部分企業(yè)采用文件名上帶版本號的方式進行版本的管理,但是即便這樣,由于文檔本身存放較為分散,用戶往往無法獲知當前文檔的最新版本。
(3)文檔權(quán)限管理
在傳統(tǒng)存儲方式中,對于文檔權(quán)限的管理主要從文檔訪問的主體(用戶)出發(fā),應(yīng)用系統(tǒng)主要對文檔訪問主題的權(quán)限進行控制(授權(quán)),這種方式的粒度較粗,無法滿足對文檔訪問權(quán)限的細分,例如:只能讀取不能下載,只能讀取不能修改;這些權(quán)限的細分需要從訪問客體(文檔)的角度進行權(quán)限的定義,并作為授權(quán)的依據(jù)。
(4)協(xié)同工作
知識的形成是一個匯集和迭代的過程,一個文檔可能需要多個人同時編寫,每個人還要進行多次的修改,然后進行組合,形成最終文檔。編寫任務(wù)的分配、進度的跟蹤、工作的協(xié)同都較為頻繁,如果沒有一個系統(tǒng)的管理手段,就會造成總體進度的拖延、工作推諉、合成質(zhì)量較差的結(jié)果。
2 云存儲的技術(shù)特點
云存儲:主要文檔和數(shù)據(jù)都保存在云端,在授權(quán)許可的情況下,用戶可以隨時訪問相關(guān)文檔和知識庫。
分布式網(wǎng)絡(luò)存儲:企業(yè)和個人的文檔資料根據(jù)算法和安全策略采用分布式存儲。
文件傳輸校驗:文件傳輸涉及到高并發(fā)、斷點續(xù)傳。
文檔轉(zhuǎn)換瀏覽:用戶需要在線瀏覽云端各種文檔的部分或全部內(nèi)容,無需下載到本地用專門軟件打開。
文檔安全及權(quán)限管理:包括文檔存儲的安全和文檔訪問的安全。
智能數(shù)據(jù)采集:文檔中的相關(guān)數(shù)據(jù)會做采集并進行智能分析,形成知識庫。
3 擬解決的關(guān)鍵問題
1)文檔是企業(yè)的重要資產(chǎn),如何保證文檔的安全尤其是面向多企業(yè)服務(wù)時文檔數(shù)據(jù)的隔離和安全,是知識管理系統(tǒng)能夠大范圍推廣使用的關(guān)鍵問題;
2)高效智能的知識挖掘算法、知識庫構(gòu)建技術(shù)以及智能搜索算法設(shè)計,將對知識管理系統(tǒng)有舉足輕重的影響;
3)海量文檔如何在"云"環(huán)境下存儲、組織管理及分類對系統(tǒng)的成功實施有著重要影響,也是需要解決的關(guān)鍵技術(shù)問題;
4 云存儲的選型(Hadoop)
建設(shè)企業(yè)私有云,通過虛擬化、分布式技術(shù)、集群應(yīng)用、網(wǎng)格技術(shù)、負載均衡等技術(shù),將所網(wǎng)絡(luò)中大量的存儲設(shè)備通過軟件集合起來高效協(xié)同工作,共同提供低成本、高擴展性的數(shù)據(jù)存儲服務(wù)。
Hadoop的Hadoop Distributed File System (Hadoop分布式文件系統(tǒng))做為云存儲選型,主要考慮以下幾個方面:
1)HDFS是技術(shù)層面最好,使用最廣泛的文件存儲方案,現(xiàn)在360、百度網(wǎng)盤等都使用該項技術(shù),中國科學(xué)院計算技術(shù)研究所在Hadoop上開展了數(shù)據(jù)挖掘和地理信息處理等的研究。
2)HDFS自己實現(xiàn)了文件冗余,因此不需要額外再使用NAS等存儲設(shè)備做備份,如果要做異地備份,HDFS本身也提供了相應(yīng)的策略,配置很容易。
3)HDFS存儲擴展方便,后期只需要添加文件存儲節(jié)點,實施方便。
4)HDFS可以作為統(tǒng)一的文件存儲服務(wù)器,提供給第三方軟件廠商使用,如藍波的打印系統(tǒng)。這樣也解決所有文件存儲的問題。
5)如果不采用HDFS作為文檔存儲服務(wù)的話,如果將來上文件的話,所有文件要進行加密存儲,各家采用的加密算法不一樣,將來程序修改維護、升級都會有大量的問題。
6)總部已經(jīng)在準備推進云計算和大數(shù)據(jù)分析,應(yīng)該也是采用HDFS技術(shù),在技術(shù)上710所也將會走在前面,技術(shù)上也有繼承性。
7)使用HDFS,主要從長遠,一體化解決文件存儲以及將來大數(shù)據(jù)分析方面考慮的。
8)HDFS具有高容錯性,并且可以被部署在低價的硬件設(shè)備之上,有利于高效利用所內(nèi)比較緊張的硬件資源,讓不同時期采購的硬件設(shè)備協(xié)同工作。
5 建設(shè)意義
通過建設(shè)企業(yè)私有云存儲平臺,整合了零散的知識存儲,提高了硬件的利用效率,同時兼顧了數(shù)據(jù)存儲擴展,為將來進行高可靠性、高性能的云計算和大數(shù)據(jù)挖掘分析提供了基礎(chǔ)支撐。
參考文獻:
[1]龔靖,雷俊智,龍洋.云存儲解析.人民郵電出版社.
[2]中國云計算機網(wǎng).網(wǎng)址:http://www.chinacloud.cn/default.aspx.
[3]張為民.云計算:深刻改變未來.科學(xué)出版社,2009.
[4]左美云.國內(nèi)外企業(yè)知識管理研究綜述[J].工業(yè)企業(yè)管理.
[5]慕繼豐、馮宗憲、陳方麗.知識管理和知識管理網(wǎng)絡(luò)[J].科技與管理.