999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數(shù)據(jù)技術(shù)的檔案數(shù)據(jù)挖掘?qū)Σ哐芯?/h1>
2022-01-01 23:56:22
企業(yè)改革與管理 2021年9期
關(guān)鍵詞:數(shù)據(jù)挖掘檔案管理數(shù)據(jù)庫

賴 倩

(山東省青島第二中學(xué)分校,山東 青島 266071)

進入新時期以來,行業(yè)內(nèi)的競爭加劇,為實現(xiàn)自身競爭力的提升,很多企業(yè)開始探索以大數(shù)據(jù)技術(shù)為基礎(chǔ)的檔案數(shù)據(jù)挖掘在檔案管理中的應(yīng)用,目的是解決現(xiàn)存的檔案數(shù)據(jù)挖掘問題,進一步提升企業(yè)的信息處理效率,實現(xiàn)企業(yè)競爭力的提升。在企業(yè)檔案管理信息化發(fā)展的同時,為保障檔案數(shù)據(jù)挖掘技術(shù)在企業(yè)檔案管理中的可持續(xù)發(fā)展,需以數(shù)據(jù)挖掘為核心構(gòu)造企業(yè)管理系統(tǒng),采取以人為本的管理模式,為數(shù)據(jù)挖掘的安全長遠發(fā)展提供全面的保障。

一、大數(shù)據(jù)技術(shù)概述

大數(shù)據(jù)技術(shù)特征可從以下四個方面進行簡要概述:

1.信息龐大

信息龐大是大數(shù)據(jù)技術(shù)的主要特征,相關(guān)技術(shù)人員將龐大的數(shù)據(jù)信息進行搜集與整理,并統(tǒng)一地存放于數(shù)據(jù)系統(tǒng)中。

2.信息多樣化

數(shù)據(jù)庫中存放著各種類型的信息,例如,生態(tài)系統(tǒng)信息、國防安全信息與日常生活信息等,都會按照其具體類型進行保存。

3.高附加價值

各行各業(yè)中人們的生活信息與工作信息都會保存在數(shù)據(jù)庫中,這為相關(guān)有需要的人員進行數(shù)據(jù)處理與數(shù)據(jù)采集提供了較大便利。

4.高效性

相關(guān)人員在數(shù)據(jù)庫中就相關(guān)信息進行檢索時能夠快速地獲取所需信息,這能在一定程度上有效地提升相關(guān)人員的工作效率。

二、檔案數(shù)據(jù)挖掘技術(shù)

大數(shù)據(jù)背景下,檔案數(shù)據(jù)挖掘需要相關(guān)工作人員在檔案管理過程中進行不斷探索。現(xiàn)階段的數(shù)據(jù)挖掘技術(shù)可從以下三個方面進行簡要論述:

1.分類技術(shù)

分類技術(shù)是數(shù)據(jù)挖掘中常用的技術(shù)手段,通過決策樹技術(shù),定義數(shù)據(jù)庫中所有記錄的輸出屬性與輸入屬性,選取數(shù)據(jù)庫中的部分?jǐn)?shù)據(jù)進行訓(xùn)練,從而找出數(shù)據(jù)屬性之間的規(guī)則,通過規(guī)則實現(xiàn)新的數(shù)據(jù),并可記錄預(yù)測。企業(yè)在對供應(yīng)商管理以及銀行客戶管理中應(yīng)用決策樹技術(shù)較多,主要用來預(yù)測客戶行為,且準(zhǔn)確性很高。在檔案管理中應(yīng)用分類技術(shù)可結(jié)合客戶資料與檔案信息的每年詳細數(shù)據(jù)進行相關(guān)信息的及時修正[1]。

2.聚類技術(shù)

聚類技術(shù)對檔案數(shù)據(jù)庫中的所有數(shù)據(jù)進行相似性分析,從而將屬性較為相似的數(shù)據(jù)歸為一類實現(xiàn)分類化與集中化管理。聚類技術(shù)對數(shù)據(jù)沒有特別高的要求,因此,應(yīng)用較為廣泛。在檔案管理中應(yīng)用聚類技術(shù)可實現(xiàn)不同渠道與不同部門之間數(shù)據(jù)的有效關(guān)聯(lián),實現(xiàn)數(shù)據(jù)間的深層次聯(lián)系,有效提升數(shù)據(jù)管理效率。

3.關(guān)聯(lián)技術(shù)

關(guān)聯(lián)技術(shù)主要用于描述數(shù)據(jù)項間的關(guān)系規(guī)則,通過一件事物中的事項導(dǎo)出其他事項的出現(xiàn),以此來挖掘數(shù)據(jù)之間隱藏的關(guān)聯(lián)性。檔案數(shù)據(jù)之間一般會存在方方面面的聯(lián)系,這些聯(lián)系體現(xiàn)事物之間的某些規(guī)律,通過對這部分?jǐn)?shù)據(jù)的挖掘,能夠促進決策與預(yù)測的科學(xué)合理化發(fā)展,但是,這種技術(shù)的實現(xiàn)通常需要較為豐富的數(shù)據(jù)庫。

三、檔案數(shù)據(jù)挖掘現(xiàn)狀

檔案數(shù)據(jù)挖掘現(xiàn)狀可從以下兩個方面進行簡單論述:

1.檔案數(shù)據(jù)管理方式落后

當(dāng)前許多研究機構(gòu)、企業(yè)以及國家相關(guān)部門仍采用較為落后的檔案管理方式,不同部門之間獨立管理,不同類型檔案文件缺乏關(guān)聯(lián),這使得在檔案管理中浪費了大量的人力物力資源。隨著信息技術(shù)的快速發(fā)展,檔案管理開始積極吸取各種先進的管理經(jīng)驗,呈現(xiàn)多元化發(fā)展態(tài)勢,這也從側(cè)面反映出檔案數(shù)據(jù)挖掘技術(shù)的重要性[2]。

2.檔案管理從業(yè)者管理意識陳舊

大數(shù)據(jù)背景下,信息技術(shù)在各行各業(yè)實現(xiàn)了快速發(fā)展,其檔案信息量不斷攀升,然而部門檔案管理工作人員缺乏足夠的先進意識,依然忙于各種數(shù)據(jù)儲存,不能實現(xiàn)數(shù)據(jù)之間的有效關(guān)聯(lián),從而無法發(fā)揮數(shù)據(jù)的最大功效,同時也不利于企業(yè)的快速發(fā)展。

四、大數(shù)據(jù)技術(shù)背景下的檔案數(shù)據(jù)挖掘

大數(shù)據(jù)技術(shù)背景下的檔案數(shù)據(jù)挖掘可從多方面進行論述,在此不能完全涵蓋,僅從以下幾個方面進行簡單論述。通過大數(shù)據(jù)技術(shù)深度挖掘檔案數(shù)據(jù);通過大數(shù)據(jù)技術(shù)實現(xiàn)數(shù)據(jù)挖掘的精細化發(fā)展;綜合性對策實現(xiàn)檔案數(shù)據(jù)的深度挖掘。

1.通過大數(shù)據(jù)技術(shù)深度挖掘檔案數(shù)據(jù)

(1)數(shù)據(jù)采集層管理

數(shù)據(jù)采集是大數(shù)據(jù)技術(shù)中的基礎(chǔ)環(huán)節(jié),其質(zhì)量高低直接關(guān)系大數(shù)據(jù)技術(shù)的功效大小。只有完備化、高質(zhì)量的數(shù)據(jù)信息才能協(xié)助大數(shù)據(jù)技術(shù)提取出有用的隱含信息。由于大數(shù)據(jù)的動態(tài)性與實時性特征,離線、近線、在線等數(shù)字資源皆在采集范圍之內(nèi)。為突出采集數(shù)據(jù)的有效性與代表性,應(yīng)選擇合理的數(shù)據(jù)信息采集方式,收集所需的數(shù)據(jù),為檔案數(shù)據(jù)挖掘打好基礎(chǔ)。

(2)數(shù)據(jù)管理層管理

各種方式與渠道挖掘的數(shù)據(jù)結(jié)構(gòu)多樣、種類繁多,通過數(shù)據(jù)管理層的處理、集成與存儲,可實現(xiàn)以下功能:

其一,將結(jié)構(gòu)復(fù)雜、難于管理的數(shù)據(jù)轉(zhuǎn)化為便于處理、結(jié)構(gòu)單一的數(shù)據(jù)。現(xiàn)代互聯(lián)網(wǎng)環(huán)境下,非結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用幅度不斷增長,這些資源數(shù)據(jù)逐漸成為館藏重要來源;其二,對挖掘數(shù)據(jù)采取“清洗”與“去噪”處理,以此保障數(shù)據(jù)的可靠性與高質(zhì)量。由于剛采集數(shù)據(jù)有冗余數(shù)據(jù)以及噪聲數(shù)據(jù),對數(shù)據(jù)進行解析、清洗以及重構(gòu),能夠有效地提升挖掘數(shù)據(jù)質(zhì)量;其三,儲存數(shù)據(jù)。為不同的數(shù)據(jù)建立獨立的數(shù)據(jù)庫并進行存放,縮短訪問與查詢時間,提升數(shù)據(jù)獲取效率[3]。

(3)分析層管理

數(shù)據(jù)分析是大數(shù)據(jù)技術(shù)的核心部分,通過對檔案數(shù)據(jù)關(guān)聯(lián)性的分析,挖掘數(shù)據(jù)之間的密切聯(lián)系,提升數(shù)據(jù)挖掘的深度與廣度。相關(guān)性分析能夠?qū)崿F(xiàn)檔案資源功效的最大化,大數(shù)據(jù)技術(shù)的關(guān)鍵性作用即是發(fā)掘出檔案數(shù)據(jù)獨有的價值,不管是儲存的“冷數(shù)據(jù)”,還是基于網(wǎng)絡(luò)實時在線的“熱數(shù)據(jù)”,通過大數(shù)據(jù)技術(shù)對檔案數(shù)據(jù)的挖掘、整合、分析,激活檔案數(shù)據(jù)中潛在的資源,實現(xiàn)數(shù)據(jù)功效的同時,創(chuàng)造出新價值與新知識,有效破除信息孤島壁壘效應(yīng),實現(xiàn)孤立而互不聯(lián)通檔案數(shù)據(jù)庫間的信息共享。

2.通過大數(shù)據(jù)技術(shù)實現(xiàn)數(shù)據(jù)挖掘的精細化

(1)檔案資源挖掘

其一,通過大數(shù)據(jù)技術(shù)明確“大檔案”思路,在日常的數(shù)據(jù)挖掘中重視數(shù)據(jù)積累,不但需要完善檔案資源管理體系,還應(yīng)確立數(shù)據(jù)資源體系觀;其二,建立檔案數(shù)據(jù)資源共享庫。以省級為基本建設(shè)單位,建立共享的、規(guī)范的、集中的檔案數(shù)據(jù)庫,實現(xiàn)各個檔案館藏的關(guān)聯(lián),形成資源豐富依托于網(wǎng)絡(luò)空間的檔案數(shù)據(jù)庫;利用處理技術(shù)與云計算平臺構(gòu)建檔案數(shù)據(jù)網(wǎng),用于實時接收最新檔案數(shù)據(jù),并分類處理非實時性數(shù)據(jù),為檔案用戶提供更加優(yōu)質(zhì)的服務(wù)平臺。

(2)數(shù)據(jù)挖掘

其一,用戶信息挖掘。挖掘用戶的需求,查看其訪問服務(wù)器留下的日志,實現(xiàn)對用戶的在線跟蹤,根據(jù)用戶需求進行個性化服務(wù);其二,發(fā)掘用戶瀏覽記錄與檢索記錄。通過統(tǒng)計分析,選取點擊率較高的檔案數(shù)據(jù)進行數(shù)字化處理;歸納整理用戶常用搜索詞來充實檔案數(shù)據(jù)庫中的關(guān)鍵詞,降低搜索時間,提升查準(zhǔn)率[4]。

(3)關(guān)系洞察、趨勢分析

不論是用戶數(shù)據(jù)還是檔案資源,通過挖掘只能獲取單方面數(shù)據(jù),無法將獨立的數(shù)據(jù)匯集成完整的網(wǎng)絡(luò)。因此要實現(xiàn)數(shù)據(jù)的集中化管理,將其集成為完整的管理網(wǎng)絡(luò),需要對其進行全面深入的分析。通過整合孤立數(shù)據(jù)點,形成完整的檔案網(wǎng)絡(luò),有效促進檔案的可持續(xù)發(fā)展。

3.綜合性對策實現(xiàn)檔案數(shù)據(jù)的深度挖掘

(1)實現(xiàn)“以人為本”的用戶關(guān)系管理

通過大數(shù)據(jù)技術(shù)可以實時掌握用戶此前行為與當(dāng)下行為,并預(yù)測分析用戶未來行為,深入挖掘檔案數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián),促進資源的集成化與創(chuàng)新化;利用大數(shù)據(jù)技術(shù)實現(xiàn)對用戶儲存行為、利用興趣、使用習(xí)慣、行為軌跡、搜索方式的分析,發(fā)掘用戶的隱性訴求。根據(jù)不同的用戶建立個性化數(shù)據(jù)庫,并在其中放入數(shù)據(jù)挖掘結(jié)果以及用戶所需。

(2)合理應(yīng)用“智慧因子”

智慧城市在提出以后,其概念已經(jīng)輻射到各個領(lǐng)域,其中也包括智慧檔案館,將智慧因子植入大數(shù)據(jù)技術(shù),利用物聯(lián)網(wǎng)技術(shù)將用戶、數(shù)據(jù)、網(wǎng)絡(luò)、檔案、館舍統(tǒng)一在智能網(wǎng)絡(luò)中,達到深度挖掘與有效整合的目的。大數(shù)據(jù)技術(shù)不但能實現(xiàn)關(guān)系洞察、用戶數(shù)據(jù)、檔案資源、趨勢分析數(shù)據(jù)的融合,還能通過智慧服務(wù)理念實現(xiàn)個性化服務(wù),推動檔案數(shù)據(jù)信息的知識空間構(gòu)建。

五、結(jié)語

綜上所述,現(xiàn)階段的檔案數(shù)據(jù)挖掘還存在著一些問題亟待解決,這對于檔案管理工作的可持續(xù)發(fā)展有著一定的阻礙作用。基于這種狀況,很多企業(yè)相關(guān)從業(yè)者開始探索基于大數(shù)據(jù)技術(shù)的檔案數(shù)據(jù)挖掘,目的是進一步提升檔案管理信息化進程,解決現(xiàn)有的檔案數(shù)據(jù)挖掘問題,實現(xiàn)企業(yè)檔案管理的長遠發(fā)展。

猜你喜歡
數(shù)據(jù)挖掘檔案管理數(shù)據(jù)庫
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
檔案管理中的電子檔案管理
檔案管理與企業(yè)內(nèi)部控制關(guān)系的思考
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
健康檔案管理的“云”前景

主站蜘蛛池模板: 992tv国产人成在线观看| 在线日韩一区二区| 日韩视频福利| 天天摸夜夜操| 欧美精品色视频| 一级毛片在线播放免费| 日韩a级毛片| 国产亚洲精品资源在线26u| 中国毛片网| 国产最爽的乱婬视频国语对白| 日韩高清在线观看不卡一区二区| 免费无码一区二区| 国产精品第一区在线观看| 国产精品2| 制服丝袜一区二区三区在线| 亚洲天堂网在线视频| 日韩高清欧美| 毛片免费视频| 久久情精品国产品免费| 国产av无码日韩av无码网站| 亚洲精品男人天堂| 亚洲无线国产观看| 国产一在线观看| 国产白浆一区二区三区视频在线| 日韩免费中文字幕| 国产在线97| 国产精品亚洲日韩AⅤ在线观看| 婷婷亚洲视频| 成人亚洲视频| 亚洲色图欧美在线| 香蕉精品在线| 婷婷丁香在线观看| 欧美一级黄片一区2区| 国产精品第5页| 色呦呦手机在线精品| …亚洲 欧洲 另类 春色| 国产中文一区a级毛片视频| 国产区在线观看视频| 精品91视频| 欧美自拍另类欧美综合图区| 亚洲色无码专线精品观看| 国外欧美一区另类中文字幕| 重口调教一区二区视频| 福利一区在线| 欧美日韩在线观看一区二区三区| 999精品色在线观看| 青青草国产一区二区三区| 亚洲天堂在线免费| 国内精品视频在线| 亚洲最大福利视频网| 欧美一级色视频| 国产喷水视频| 波多野结衣无码中文字幕在线观看一区二区| 国产日韩欧美精品区性色| 亚洲一本大道在线| 亚洲成人黄色在线观看| 香蕉久人久人青草青草| 在线无码九区| 亚洲精品国产精品乱码不卞 | 亚洲无码熟妇人妻AV在线| 亚洲系列无码专区偷窥无码| 极品性荡少妇一区二区色欲| 首页亚洲国产丝袜长腿综合| 亚洲欧洲一区二区三区| 亚洲资源在线视频| 久久国产精品77777| 爽爽影院十八禁在线观看| 国产精品伦视频观看免费| 狠狠亚洲婷婷综合色香| 国产精品极品美女自在线网站| 欧美成人免费一区在线播放| 色天天综合| 欧美人与牲动交a欧美精品| 亚洲欧美不卡视频| 国内a级毛片| 欧美精品成人| 国产尤物视频在线| 国产精品亚洲精品爽爽| 婷婷六月天激情| 91网红精品在线观看| 亚洲手机在线| 亚洲清纯自偷自拍另类专区|