999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺析館藏數據庫全庫統計的方法

2010-06-13 09:46:38周曄
檔案與建設 2010年5期
關鍵詞:檔案管理數據庫

□周曄

隨著檔案數字化建設的推進,館藏數據日益增長,以常熟市檔案館為例,根據臺賬統計,目前入庫的案卷目錄有30多萬條,文件級目錄達到500多萬條。常熟市檔案館數據庫設計的基本思想是按全宗建表形成數據。由于全宗數量本來較多,又有變遷的因素,數據表數量本身已經比較多;加之歸檔形式的變化和檔案種類的增加等原因,數據表的結構日趨多樣化,表數量也越來越多。檔案管理軟件在使用過程中,又根據使用目的創建了一些專題數據庫表,如退伍軍人檔案、農民建房檔案、婚姻檔案專題等,這些專題表,有的與庫藏的其它表有重復,也有的是新增唯一的表;加上各種臨時庫表,庫中的數據表近千張。如果要對館藏數字信息總量,以及分類的各種檔案數量進行統計,第一選擇是利用檔案管理軟件提供的統計功能完成。但在統計的過程中會發現,這些眾多的表并非按統計的要求而設計,雖然檔案管理軟件也提供多表查詢的功能,但在進行統計時,由于表數較多、全宗變化等原因,有些分類的跨表統計容易出錯。但如果按表逐一統計,雖可以保證統計的完整準確,但工作量很大。能否找到較為方便的方法,在管理軟件的統計不太方便時,綜觀全庫,使統計工作簡明易做且結果完整準確呢?有一種思路是直接通過數據庫本身提供的連接工具,利用通用的數據庫標準語言SQL語言,在后臺對整個庫進行操作。通過找到統計對象的共同特點,對全庫按特點進行查詢統計,可以保證數據結果的完整準確。思路確定后,在操作過程中會遇到一些問題,例如:SQL語言要求操作的數據表有準確的表名,但對本館的數據庫而言,檔案管理軟件為安全起見,生成的表名全是沒有規律不能直接識別含義的隨機字符串。而這些表,也并非全部是館藏的數據表,例如,有一些是查檔利用的登記表,里面的條目內容并非館藏的內容,檔號在輸入時也比較隨意。這些條目是不能統計在內的。怎樣找到合適的表名對象,如何正確使用SQL語言,直接對整個數據庫進行查詢統計,下面詳細描述采用上述思路完成統計的方法步驟:

一、列出所有有效館藏條目記錄表

通過觀察發現,檔案管理軟件本身使用了一個專門的說明表記錄了所有在管理軟件里正式用到的表名,但這些表中,有一些并非真正保存館藏條目的表,而是一些查檔登記簿或編研統計類表。另外,所有記錄館藏條目的表有一個特征,就是具有“檔號”這個特征字段。所以,我們從說明表中取得一份表名列表,再從全庫中得到有“檔號”字段的表名列表,從這兩份列表中取得交集,再根據說明表的說明,并分析交集外的數據表,對后臺庫中所有表基本有所認識,以此確定合理的所有有效的館藏條目的記錄表,以之作為全部統計的基礎。

上述思路在實現過程中有兩點需要說明,一是求得庫里所有具有“檔號”字段的表名的參考SQL語句如下:

二是和說明表取交集的方法,可以借助EXCEL軟件,先將所有登記表置于一列,再將查詢得到的表名置于一列,借助公式VLOOKUP,得到二者的交集。假設A列存放全部有“檔號”字段的表列集,B列存放說明表中的表列集,C列求得A、B列交集的參考公式如下:

和軟件登記表進行對比分析后,得到有效表名近500個,以這500個表做為以下統計的對象。

二、案卷級數量統計

將第一步得到的所有有效館藏條目的記錄表中不同的檔號取出,多表取得內容的SQL語句可采用聯合的方法,語句格式如下:

省略號部分,可以利用EXCEL表格,自動生成省略號部分的多表語句。其中參數DISTINCT,可以保證結果表中檔號全是唯一不重復的。值得說明的是,采用表聯合的方法,一次最多可查256張表,500張表要分兩次執行,故可以將中間結果分別存入臨時表templ,temp2兩張表中,再合并到一個臨時表中,表名叫ALLDH,此表里集中了全館內所有不同的檔號,也可以說就是館藏案卷級的數量了。即可得到總的文件級目錄總數。

三、檔案文件級目錄數量統計

檔案的文件級目錄數,指的是每個案卷含有多少個文件的數量,在數據庫表里,體現為同一卷檔號相同,但卷內的順序號不同。而不做卷的檔案,一個檔號就是一件。要得到文件級檔案的總條目數,應該分別統計以卷歸檔和以件歸檔的條目數并求和。其中以卷歸檔的檔案,數據庫中表的標志是,含有“卷內順序號”字段,得到不同的檔號及卷內順序號就可以了,方法同得到不同檔號的方法。從多個表中得到不同的卷內順序號的參考SQL語句如下:

a group by檔號,卷內順序號

將所有不同的檔號和卷內順序號放到臨時表tdetail中,得到案卷的文件級目錄條數共計400多萬條。

而對于以件歸檔的檔案,具體表現是其庫表結構中,不會出現“卷內順序號”字段。用EXCEL求差集的方法,求得不含“卷內順序號”的數據表。從這些不含“卷內順序號”字段的數據表中得到所有的不同檔號放入臨時表“無卷內”中,由于不含“卷內順序號”的數據表還包括案卷目錄,所以再排除有“卷內順序號”字段表里出現過的檔號,就是以件歸檔的檔案,一個檔號對應一件檔案。找到有“卷內順序號”字段表里出現過的檔號的SQL語句參考如下:

將以卷歸檔和以件歸檔的檔案分別統計的文件級目錄數量相加,

四、分類統計的方法

統計時,除了要求得到總體的數量,還要求得到不同專題中的案卷和文件級目錄的數量。如2009年底江蘇省檔案局要求統計以下種類檔案專題的館藏數量:明清、民國、婚姻、獨生子女、名人、印章、影音、會計、公證、革命歷史、土地(建房)、知青、保先、退伍軍人檔案。對不同的分類,有的在本館做過專題,可以直接在軟件專題里得到數據;有的檔號具有特點,比如明清檔號,是以K01做為檔號的開始全宗號的,對能找到該類檔號特征的分類,可以很方便地利用前面得到的兩個臨時表ALLDH和tdetail,用SQL查詢語句得到數據。查詢案卷數目的SQL語句為:

SELECT檔號FROM ALLDH WHERE檔號LIKE‘K01%’

而查詢該類文件級檔案數目的SQL語句為:

SELECT檔號FROM TDETAIL WHERE檔號LIKE‘K01%,

綜上所述,結合數據庫后臺直接查詢的方法,加上檔案管理軟件本身的查詢和統計功能,應該就可以較快而準確地完成全庫及分類統計的各項要求了。

猜你喜歡
檔案管理數據庫
如何規范檔案管理
檔案管理中的電子檔案管理
檔案管理與企業內部控制關系的思考
消費導刊(2017年24期)2018-01-31 01:29:20
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
論科研項目檔案管理
西藏科技(2015年12期)2015-09-26 12:13:40
加強工程項目檔案管理的有效途徑
主站蜘蛛池模板: 日本国产精品一区久久久| 亚洲午夜福利在线| 国产精品成人一区二区| www.狠狠| 男女男精品视频| 欧美一区二区三区欧美日韩亚洲 | A级毛片无码久久精品免费| 日本一区二区不卡视频| 一级福利视频| 亚洲无码37.| 91久久青青草原精品国产| 久久久久国产精品嫩草影院| 免费毛片全部不收费的| 91在线播放国产| 高潮毛片免费观看| 成人午夜福利视频| 日本三区视频| 国产黑丝一区| 亚洲欧美成人综合| 啦啦啦网站在线观看a毛片| 亚洲午夜综合网| 久久成人免费| 国产一级精品毛片基地| 一本大道香蕉久中文在线播放 | 久久男人视频| 国产人成在线观看| 日韩在线视频网站| 精品无码人妻一区二区| a级毛片免费网站| 好吊色国产欧美日韩免费观看| 成人看片欧美一区二区| 99精品在线看| 亚洲欧洲自拍拍偷午夜色| 日韩一级毛一欧美一国产| 国产精品免费露脸视频| 国产无码性爱一区二区三区| 久久精品中文字幕少妇| 国产制服丝袜91在线| 亚洲精选无码久久久| 波多野结衣国产精品| 欧美成人精品在线| 国产在线视频二区| 欧美a在线看| 国产又粗又猛又爽视频| 国产美女丝袜高潮| 国产精品美人久久久久久AV| 亚洲愉拍一区二区精品| 狠狠色成人综合首页| 日韩一级二级三级| 亚洲成AV人手机在线观看网站| 国产在线自乱拍播放| 亚洲欧美日韩另类在线一| V一区无码内射国产| 在线精品视频成人网| 免费在线色| 久久精品无码中文字幕| 日韩天堂网| 亚洲区一区| 动漫精品中文字幕无码| 国产精品亚洲专区一区| 99精品高清在线播放| 精品久久人人爽人人玩人人妻| 国产一在线观看| 69综合网| a在线亚洲男人的天堂试看| 免费一级毛片在线观看| 欧美亚洲综合免费精品高清在线观看| 国产人前露出系列视频| 欧美亚洲另类在线观看| 国产精品久久精品| 色久综合在线| 国产va免费精品观看| 亚洲欧美一区二区三区蜜芽| 日韩国产综合精选| 国产96在线 | 国产AV毛片| 一级黄色网站在线免费看| 免费看a毛片| 亚洲 欧美 日韩综合一区| 无码有码中文字幕| 亚洲精品另类| 亚洲日本中文字幕乱码中文 |