李 晶
摘 要:我國科學技術(shù)發(fā)展以來,在數(shù)字檔案環(huán)境下,新媒體得到較快發(fā)展,其中數(shù)字檔案對新媒體資源實施有效開發(fā),能夠?qū)n案進行信息化建設,這在較大程度上也是網(wǎng)絡檔案信息資源的必然選擇。此外,通過新媒體資源開發(fā)對數(shù)字檔案信息資源實施有效挖掘與整合,能夠通過檔案信息網(wǎng)提供大量符合相關(guān)要求的信息,這在較大程度上可全面滿足用戶檔案查閱與研究等需求,以此實現(xiàn)互聯(lián)網(wǎng)檔案資源有效開發(fā)與檔案信息網(wǎng)資源增值服務,從而為提升用戶獲取信息質(zhì)量奠定良好的基礎(chǔ)。
關(guān)鍵詞:數(shù)字檔案 新媒體資源 交流平臺
中圖分類號:G25文獻標識碼:A文章編號:1003-9082(2020)01-00-01
前言
我國經(jīng)濟建設的過程中,在數(shù)字檔案環(huán)境下對檔案信息資源實施有效開發(fā),不但能夠提高檔案信息化建設質(zhì)量,而且可有效利用網(wǎng)絡檔案信息資源。為此,需要對互聯(lián)網(wǎng)中檔案信息資源開發(fā)利用進行全面探索與研究,以此構(gòu)建互聯(lián)網(wǎng)信息資源的檔案信息平臺。此外,數(shù)字檔案信息資源在整合的過程中,能夠為檔案信息網(wǎng)提供大量符合用戶需求的信息資源,這在較大程度上能夠?qū)崿F(xiàn)信息資源集成與服務,為新媒體資源開發(fā)與交流平臺的有效構(gòu)建奠定良好的基礎(chǔ)。
一、新媒體檔案信息交流平臺的功能
1.檔案信息資源采集
在進行新媒體檔案信息資源實施開發(fā)的過程中,應對網(wǎng)絡中檔案網(wǎng)站以及檔案博客中的信息資源進行全面的采集與跟蹤,采集功能不但支持傳統(tǒng)網(wǎng)頁,而且為檔案信息挖掘提供較為豐富的數(shù)據(jù)資源。此外,檔案信息在采集的過程中,主要是通過網(wǎng)絡獲取數(shù)據(jù),一般情況下對網(wǎng)絡采集器進行有效優(yōu)化,包括采集深度、頁面腳本解析以及搜索控制等。在會對信息進行預處理過程中,主要是對采集信息實施有效加工,以此實現(xiàn)內(nèi)容的分析與信息抽取,包含了數(shù)據(jù)清洗、Web頁面解析以及頁面數(shù)據(jù)索引等。因不同數(shù)據(jù)源之間具有一定的差異性,這就需要對數(shù)據(jù)結(jié)構(gòu)信息進行全面合并處理,主要體現(xiàn)在以下兩個方面:(1)檔案網(wǎng)頁自動分析。我國新媒體檔案信息資源主要通過不同形式存在,類型相對較為復雜,在此過程中,采集工具在采集期間可有效對檔案頁面結(jié)構(gòu)統(tǒng)計分析計算,同時對檔案頁面信息與屬性進行全面識別,以此使檔案信息得到有效分析;(2)支持模板的元數(shù)據(jù)解析。在應用模板的基礎(chǔ)上支持檔案元數(shù)據(jù)解析功能,在對網(wǎng)頁進行采集的過程中,能夠?qū)Πl(fā)文時間、內(nèi)容以及標題等元數(shù)據(jù)。
2.檔案信息挖掘分析
新媒體檔案信息交流平臺在實現(xiàn)的過程中,需要對數(shù)據(jù)進行全面挖掘、分析以及整合,以此形成專報同時實施有效發(fā)布,主要表現(xiàn)在以下幾個方面:(1)檔案信息聚類。聚類主要是在分類未知的情況下,文本能夠自動組成數(shù)據(jù)挖掘技術(shù),采用此種方法計算的過程中,一般情況下使檔案文本形成不同類別檔案,以此對檔案信息中的特征、頻度以及分布模式等進行有效統(tǒng)計,從而為用戶發(fā)掘有用價值信息,提升用戶對檔案記載內(nèi)容的客觀認識;(2)檔案信息分類。通過分類的計算方法對檔案信息類別自動劃分,并在此基礎(chǔ)上構(gòu)建檔案資源分類體系;(3)關(guān)聯(lián)分析。關(guān)聯(lián)分析主要對數(shù)據(jù)之間的關(guān)聯(lián)性進行有效發(fā)掘,并將不同檔案信息進行有效聯(lián)系,以此使用戶從不同角度對檔案情況實施全面了解,其中該關(guān)聯(lián)信息主要寶山文件注解、文件間關(guān)聯(lián)以及要素關(guān)聯(lián)等;(4)檔案數(shù)據(jù)統(tǒng)計分析與可視化。根據(jù)分析結(jié)果生成不同量化統(tǒng)計數(shù)據(jù),這在較大程度上能夠為用戶學習提供數(shù)據(jù)支持;(5)專報發(fā)布。將不同功能進行有效結(jié)合,以此使不同檔案專題信息在有效范圍內(nèi)進行發(fā)布,這在較大程度上可為檔案工作研究提供數(shù)據(jù)支持[1]。
3.新媒體檔案信息資源集成
把采集開發(fā)的互聯(lián)網(wǎng)檔案信息與現(xiàn)有檔案信息網(wǎng)站進行有效結(jié)合,以此使用用戶利用網(wǎng)絡信息平臺中的相關(guān)數(shù)據(jù),這在較大程度上可有效提升檔案工作者研究交流水平,主要體現(xiàn)在以下幾個方面:(1)對檔案信息網(wǎng)站功能進行有效擴展,以此能夠?qū)崿F(xiàn)對網(wǎng)絡新媒體檔案資源與信息的全面采集與整理,這在較大程度上能夠通過信息平臺提高資源服務質(zhì)量。此外,新媒體檔案資源還具有共享功能,能夠為檔案網(wǎng)站服務增值奠定良好的基礎(chǔ),這對我國檔案事業(yè)的發(fā)展具有較大促進作用;(2)對現(xiàn)有檔案信息網(wǎng)與互聯(lián)網(wǎng)檔案信息資源進行有效整合并規(guī)劃,以此形成查詢快捷、內(nèi)容集中的檔案信息資源,以此實現(xiàn)檔案信息資源集成。
二、新媒體檔案信息資源開發(fā)系統(tǒng)的結(jié)構(gòu)
1.系統(tǒng)工作流程
新媒體檔案信息資源開發(fā)系統(tǒng)工作流程主要表現(xiàn)在以下幾個方面:(1)在對信息采集器進行應用的過程中,主要是從檔案博客以及檔案灣站中進行信息的有效采集,并在此基礎(chǔ)上將采集到的數(shù)據(jù)存儲到AIS中;(2)檔案信息分析工具能夠?qū)IS中的檔案信息實施有效智能分析,并在此基礎(chǔ)上對其進行全面加工;(3)檔案信息發(fā)布平臺將AIS中的數(shù)據(jù)向Web中進行分布;(4)用戶對交流平臺在進行研究的基礎(chǔ)上,對檔案信息與專報等功能,對相關(guān)信息進行有效加工;(5)信息集成接口提供AIS,并與上海檔案信息網(wǎng)進行有效交互[2-4]。
2.檔案信息采集業(yè)務流程
信息采集主要是指從互聯(lián)網(wǎng)信息源中獲取數(shù)據(jù)的采集過程,在采集期間需要對檔案信息源進行確定,并在此基礎(chǔ)上還需要確定采集范圍,再對數(shù)據(jù)規(guī)模實施全面估計,同時對軟硬件配置與方案進行有效確定。采集器在Web腳本解析與頁面清洗等技術(shù)中,完成檔案信息在數(shù)據(jù)庫中進行保存,在此過程中需要使用到硬件:需要多臺服務器,不同數(shù)據(jù)類型的存儲以及不同應用,由于服務器在其中尤為重要,在對其進行選擇的過程中,一般情況下需要根據(jù)內(nèi)側(cè)、CPU以及網(wǎng)卡性能指標,并且在此基礎(chǔ)上滿足工作旗艦店負載平衡;軟件需求:互聯(lián)網(wǎng)檔案信息采集工具以及信息分析工具等。
三、新媒體檔案信息資源的開發(fā)與應用價值
1.檔案信息加工分析與業(yè)務流程
通過不同文本挖掘技術(shù)對檔案數(shù)據(jù)庫中的不同信息進行加工分析,并在此基礎(chǔ)上把分析結(jié)果存入檔案信息服務引擎中,以此為用戶提供瀏覽檢索、挖掘功能以及檢索功能,其中檔案信息加工分析與業(yè)務流程主要表現(xiàn)在以下幾個方面:(1)與在線檔案信息網(wǎng)對接。互聯(lián)網(wǎng)檔案信息與不同記背檔案機構(gòu)中的檔案信息網(wǎng)實施有效對接,該需求主要是提供檔案信息網(wǎng)數(shù)據(jù)庫與數(shù)據(jù)接口;(2)檔案信息資源交流平臺研制。隨著我國科學技術(shù)的不斷發(fā)展,不同種類瀏覽器相對較多,一些瀏覽器在進行頁面處理的過程中,對同一處理行為具有一定差異性,此種差異性大小不同,應支持跨瀏覽器訪問。Web平臺在設計的過程中,應符合Web標準,并在此基礎(chǔ)上支持不同瀏覽器的有效訪問,該軟件與功能主要有以下幾個方面:(1)檔案網(wǎng)絡信息采集軟件;(2)檔案信息挖掘分析工具,其中主要有文本分類、文本聚類以及關(guān)聯(lián)分析等功能;(3)檔案信息資源網(wǎng)絡共享平臺;(4)加工后的互聯(lián)網(wǎng)新媒體檔案信息資源[5]。
2.應用效益與價值
在進行新的媒體檔案資源交流平臺進行構(gòu)建的過程中,需要建立在信息資源需求特點基礎(chǔ)之上,并在此基礎(chǔ)上對新媒體檔案信息資源開發(fā)與利用方法進行有效研究,同時對數(shù)據(jù)檔案信息采集、分析與存儲等相關(guān)技術(shù)與理論進行全面探討,這在較大程度上能夠?qū)n案信息建設指導方向全面把握,以此有效推進檔案信息化創(chuàng)新與應用,從而為信息化建設過程中解決構(gòu)建開發(fā)信息資源奠定良好的基礎(chǔ),為其提供實踐技術(shù)與經(jīng)驗,這對有效豐富檔案信息化理論方法的與實踐體系具有較大的促進作用[6]。
由此可以看出,通過該研究具有較高的實用性與先進性,主要表現(xiàn)在以下幾個方面:(1)促進互聯(lián)網(wǎng)檔案信息資源共享。檔案信息資源交流共享平臺可為用戶提供較多不同類型資源,并在此基礎(chǔ)上不同檔案信息資源能夠進行有效共享;(2)用戶在對檔案信息獲取的過程中,能夠有效提升用戶自身獲取數(shù)據(jù)的便捷性,并在此基礎(chǔ)上提高其專業(yè)性。此外,根據(jù)數(shù)據(jù)挖掘技術(shù)對不同檔案信息源進行有效整合,這在較大程度上能夠挖掘信息資源的利用價值,同時還可提升檔案信息服務的知識化水平,與此同時為檔案信息組織提供訪問入口,以此消除檔案信息的單一性,從而形成檔案信息的有效集成,這在較大程度上可降低用戶成本;(3)使互聯(lián)網(wǎng)檔案資源與檔案局信息網(wǎng)信息資源間的有效整合,在一定程度上是信息增值服務較為重要的方法,能夠使信息組織得到充分發(fā)揮,并在此基礎(chǔ)上為檔案信息的有效整理奠定良好的基礎(chǔ)。
結(jié)語
綜上所述,在數(shù)字檔案環(huán)境中進行新媒體資源有效開發(fā),是檔案信息化建設的基礎(chǔ),并且在此基礎(chǔ)上也能夠?qū)W(wǎng)絡檔案新資源進行有效利用,這在較大程度上能夠全面解決檔案用戶與工作者網(wǎng)絡新媒體檔案信息資源困難問題,以此可有效提升操作性與技術(shù)性,同時能夠?qū)n案信息化研究實施有效創(chuàng)新,實現(xiàn)了檔案信息之間的共享,這對我國檔案信息資源的開發(fā)與利用具有較大促進作用,同時也為檔案與網(wǎng)絡化服務進行有效結(jié)合奠定良好的基礎(chǔ)。
參考文獻
[1]智思敏.新媒體環(huán)境下數(shù)字檔案記憶的開發(fā)[J].科技視界,2017(33):5-6.
[2]王蘭成.新媒體環(huán)境下數(shù)字檔案管理新技術(shù)發(fā)展與應用[J].中國檔案,2017(1):64-66.
[3]張恩成.新媒體環(huán)境下數(shù)字檔案管理新技術(shù)發(fā)展與應用[J].科學技術(shù)創(chuàng)新,2017(13):246.
[4]趙洪來.淺談新媒體環(huán)境下數(shù)字檔案管理新技術(shù)的發(fā)展以及應用[J].辦公室業(yè)務,2017(23):73-74.
[5]王耀彬.探討新媒體環(huán)境對高校檔案管理的影響與應對對策[J].辦公室業(yè)務,2017(23):121.
[6]陳亞利.新媒體時代高校檔案資源利用的現(xiàn)狀、問題與對策[J].山西檔案,2018(2):63-65.