□王建冬
信息資源管理理論在中國發展至今,已經形成了相對穩定的理論體系和研究領域。然而由于信息資源管理理論具有政府、企業、圖書情報學界三種不同的學科背景和研究框架[1],學術界對于信息資源管理理論的研究領域的認識存在很多爭議,劃分標準眾多,往往使人無所適從。總體而言,目前關于國外信息資源管理領域與熱點問題的研究較多,且已基本形成較為統一的認識[2-4]。而對于國內信息資源管理研究領域的劃分還處于嘗試階段。例如邱均平等基于文獻計量方法給出的2004-2006年的熱門關鍵詞[5],以及基于1998-2006年信息資源管理領域文獻計量分析給出的研究熱點分析[6]。但這些研究并不是專門為界定信息資源管理領域而開展,且使用的方法主要為單純的按關鍵詞使用頻度排序,據此難以判斷我國信息資源管理的學科領域全貌。
本文擬對近20年來我國核心期刊發表的信息資源管理領域的論文進行較為系統而全面的文獻計量與數據挖掘,在此基礎上形成一個符合目前我國信息資源管理研究現狀的熱點領域劃分體系。
本文僅以維普中文科技期刊數據庫①選擇該數據庫作為研究的數據源,主要是因為該數據庫的主題詞標引相對規范,具體請參見第3節有關論述。為數據源,檢索了該數據庫1989年以來的中文核心期刊相關文獻,檢索式為“題名=信息資源*核心期刊*年=1989-2008”。檢索共得到3850篇文獻,經篩選、去重、比較后最終得到3590篇相關學術論文。筆者提取了每篇文獻的題名、作者、機構、出版項、主題詞等五項信息,并對這些數據進行了必要的整理加工。
從檢索的結果來看,1989年后該領域每年都有文獻發表;從 1996年起,信息資源管理領域的研究論文數開始呈爆炸式增長,2003年以后總數則開始趨緩。圖1顯示了信息資源研究文獻的增長狀況:

圖1 信息資源研究文獻的增長狀況
從文獻發表的作者所在的領域來看,可以把 20年來信息資源研究的文獻作者所在單位背景劃分為圖書館、信息管理院系、檔案學系及檔案管理單位、商學院與管理學院②需要指出的是,由于很多作者在標注自己的單位時沒有寫清楚所在的系科,而國內很多高校的信息管理系都設在管理學院或商學院,因此這部分作者中應該有很多是來自信息管理系,但本文無法加以區分。、計算機與信息學院、研究院所,以及其他企事業單位7大類。其中,圖書館領域的作者發文量最多,占到所有文獻的 25%,但平均每個機構發文數量僅1.4篇,說明圖書館領域的作者分布相對分散,系統化的信息資源管理的研究尚未形成規模。與之相比,科研院所和高校院系等機構的發文量相對集中得多,例如信息管理院系平均每個機構發文量達5.2篇。圖2顯示了幾類機構的發文數量的分布情況:

圖 2 7類機構發文的數量分布
表1顯示了發表研究文獻最多的20家機構的名單,其中信息管理系 9家,管理學院 3家,研究所或研究中心4家,圖書館4家。前20名研究機構中,圖書館占 20%,信息管理系占到近一半之多①吉林大學管理學院、湘潭大學管理學院、河北大學管理學院下均設有信息管理系或信息管理專業,因此這三家機構事實上也可以歸入信息管理大類之中,但為保持本文研究的前后一致性,此處并沒有將其合并。。從這一結果也可以看出,圖書館對于信息資源的研究不如高校院系集中。

表1 發文最多的前 20家機構

16 文化部全國文化信息資源建設管理中心 13 17 浙江師范大學圖書館 13 18 中國人民大學信息資源管理學院 12 19 中山大學資訊管理系 12 20 襄樊學院圖書館 12
表2顯示了發文量最多的20位作者的發文數量和所在單位。從單位的分布情況看,這些作者所在的單位幾乎全部為高校的信息管理系。由此可見,目前國內信息資源管理研究的最核心的作者群是各大高校信息管理院系的研究人員。

表 2 發文量最多的20位作者
通過調研我們發現,維普中文科技期刊數據庫在論文主題詞標引方面做得非常出色,許多原作者沒有標注主題詞或標注不科學的文章,工作人員都手工予以重新標引,由此保障了維普中文科技期刊數據庫所提供主題詞的質量。以下部分,本文將基于所抓取的主題詞,構建一個主題詞的關系網絡,并通過聚類的方法描畫出當前國內學術界對于信息資源研究的幾個主要領域。
通過統計,本文所抓取的3590篇文章共包含17863個主題詞,平均每篇文章包含4.97個主題詞。表3顯示了使用最多的30個主題詞及其頻數:

表3 使用最多的 30個主題詞
本文使用 Java程序實現了上述算法,并去除了介數最高的20條邊。為了方便可視化起見,我們使用Pajek繪制了去除所有權值小于3的邊和點度數小于2的結點(葉子結點),由此得到圖3所示的復雜網絡圖。其中,結點的大小與結點的度數成正比,邊上標注的數字表示該條邊的權值(邊的兩個頂點主題詞共現的頻率)。
從圖3可以看出,當前國內信息資源研究的主體區域有5個,依次是:
(1)信息檢索(主題詞包括“檢索工具”、“信息檢索” 、“資源檢索” 、“索引” 、“搜索引擎”等);
(2)信息組織(主題詞包括“信息組織”、“信息資源組織”、“資源組織”、“網絡信息資源組織”、“元數據” 、“都柏林核心” 、“DC”等);
(3)資源配置(主題詞包括“信息資源配置”、“資源配置”、“網絡信息資源配置”、“資源整合”、“網絡信息資源整合”等);
(4)開發利用(主題詞包括“信息資源開發利用”、“資源開發利用”、“開發利用工作”、“檔案信息資源開發利用”、“信息資源開發”、“文獻信息資源開發”、“檔案信息資源開發”、“模式”等);
(5)機構建設(主題詞包括“高校圖書館”、“文獻信息資源”、“網絡環境”、“文獻信息資源建設”、“信息資源評價”、“網絡信息資源評價”、“信息資源共建共享”等)。
此外,還有一些較為獨立的分支領域,如信息資源規劃、知識產權保護、信息資源數字化、信息資源經濟等。
通過觀察圖3還可以發現,當前信息資源管理領域研究的熱點問題,如信息資源共享、信息服務、數字圖書館等,往往是連接各個主要分支領域的交叉性問題。例如,數字圖書館是連接信息組織與信息資源數字化兩個領域的交叉問題;搜索引擎是連接信息組織與信息檢索的交叉問題;信息服務則是機構建設、信息組織與資源配置三大領域的交叉問題 ,等等 。

圖3 使用邊介數聚類算法得到的主題詞網絡
本小節擬從因子分析的角度,進一步分析國內信息資源管理的主要研究話題。
為方便統計,本文首先選取了頻次最高的100個主題詞,并以每篇文獻為一條記錄,記錄的內容為100個主題詞是否在本文的主題詞列表中出現(出現為1,否則為0)。使用SPSS軟件對所構成的數據表進行因子分析,并設定提取8個公因子,迭代次數小于等于25,使用主成分法提取因子,得到表4所示的因子載荷矩陣。
以下部分,我們將根據各因子的共性,分別為 8個因子命名:
因子1可以命名為圖書館信息資源管理因子,主要包含“圖書館”、“虛擬館藏”、“信息資源建設”、“網絡環境”、“館藏結構”、“館藏建設”、“文獻資源建設”等題項,該因子主要關注圖書館在網絡環境下如何進行文獻信息資源建設,以更好地改進館藏結構等問題。
因子2可以命名為信息資源管理技術因子,主要包含“網絡信息資源”、“信息組織”、“元數據”、“信息檢索” 、“XML” 、“標準化” 、“數字圖書館”等,該因子主要關注信息組織、信息檢索、信息技術標準化、數字圖書館等研究領域對網絡信息資源管理的推動作用。
因子3可以命名為檔案信息資源管理因子,主要包含“檔案信息資源”、“檔案利用”、“檔案工作”、“檔案館”、“檔案管理”、“檔案信息”、“檔案信息資源開發”等,該因子主要關注檔案信息資源管理理論與實踐中的各種具體問題。
因子4可以命名為信息資源管理基礎理論因子,主要包含“信息資源管理”、“知識管理”、“知識經濟”、“電子政務”、“信息管理”、“政府信息資源”、“開發利用”、“共建共享”等題項,該因子主要關注信息資源管理理論中的一些基本問題和基本概念。
因子5可以命名為信息資源建設因子,主要包含“信息共享”、“數據庫建設”、“文獻信息資源”、“知識產權”、“數字信息資源”、“信息安全”、“網絡建設”等,該因子主要關注信息資源建設過程中的一些具體問題,如知識產權、信息安全、信息資源共享等問題。
因子6所包含的內容較為龐雜,包含“利用”、“開發” 、“信息資源” 、“檔案” 、“共享” 、“整合”等 ,這些主題詞或為其他因子所有,或所指過于寬泛,不具有針對性,可能代表了主題詞中標注較為寬泛的那部分。由于其所指難以明確定義,因此我們將其放棄。
因子7可以命名為網絡信息資源管理因子,主要包含“搜索引擎” 、“ 網站” 、“Internet” 、“ 因特網” 、“互聯網” 、“網絡” 、“數據庫” 、“檢索” 、“高校圖書館”等,該因子主要關注網絡信息資源管理的具體工具和實踐中的問題。
因子8可以命名為信息資源開發利用因子,主要包含“信息利用”、“信息開發”、“信息產業”、“企業”、“信息資源開發”、“信息需求”等,該因子主要關注信息資源開發利用及其產業化發展問題。

表4 因子分析結果

信息資源管理-0.041 -0.033 -0.052 0.545 -0.069 -0.103 -0.034 0.007知識管理0.003 0.11 -0.059 0.513 -0.067 0.044 -0.065 -0.047知識經濟0.021 -0.015 0.004 0.297 -0.063 0.118 -0.06 0.007電子政務-0.077 0.023 -0.023 0.288 0.047 0.028 -0.076 -0.078開發利用-0.096 0.056 -0.013 -0.271 -0.118 -0.058 -0.078 -0.052信息技術0.048 -0.103 0.067 0.263 0.022 -0.066 0.103 0.046信息管理信息0.04 0.206 -0.044 0.256 0.07 0.088 0.064 0.075政府信息資源 資源-0.08 0.058 -0.025 0.232 0 -0.034 -0.119 -0.059管理共建共享 基礎-0.043 -0.092 -0.087 -0.206 0.167 -0.06 -0.173 -0.159人才培養 理論0.043 -0.064 -0.041 0.196 0.157 -0.016 -0.048 0.043類型-0.13 0.102 -0.043 -0.144 -0.021 -0.028 -0.033 0.05企業信息化-0.06 -0.064 -0.025 0.123 -0.025 -0.06 -0.014 -0.006網絡資源-0.036 0.011 -0.039 -0.096 -0.07 -0.043 0.068 -0.079模式0.02 -0.046 0.011 0.091 -0.037 -0.032 -0.033 -0.045發展趨勢-0.016 -0.006 -0.033 0.085 0.018 0.001 0.006 -0.009網絡信息-0.03 -0.019 -0.045 0.066 0.006 -0.044 0.027 -0.007信息共享0.005 0.027 0.023 0.028 0.478 -0.056 -0.03 0.019數據庫建設0.144 -0.038 -0.039 -0.041 0.429 -0.018 -0.052 -0.005文獻信息資源0.015 -0.053 -0.053 -0.252 0.409 -0.021 -0.212 -0.162知識產權-0.048 0.04 -0.014 0.015 0.327 0.01 0.065 -0.039中國-0.073 -0.184 0.02 0.092 0.266 -0.025 0.096 0.192數字信息資源信息-0.001 0.142 0.029 0.006 0.265 -0.045 -0.034 0.033資源信息安全 建設-0.062 0.102 0.023 0.157 0.244 0.019 -0.001 -0.025網絡建設0.049 -0.048 -0.045 -0.059 0.163 0.034 -0.05 0.022知識產權保護-0.031 -0.037 -0.044 0.036 0.158 0 0.005 0.011信息資源數字化0.055 0.011 0.017 -0.004 0.138 -0.024 -0.009 -0.022信息化-0.026 -0.077 -0.031 0.097 0.097 -0.002 -0.023 0.014可持續發展0.062 -0.072 -0.008 0.01 -0.082 -0.074 0.006 -0.003利用0.03 0.014 0.054 -0.031 0.005 0.633 0.053 -0.042開發0.031 0.022 0.109 -0.064 0.044 0.616 0.011 0.008信息資源-0.179 -0.247 -0.233 -0.12 -0.104 0.424 0.066 0.219檔案0.006 -0.027 0.086 0.006 -0.067 0.217 -0.015 0.026共享-0.039 -0.048 -0.092 0.017 -0.008 0.171 -0.055 -0.031整合-0.038 -0.017 -0.103 0.014 -0.064 0.162 -0.106 -0.043信息資源配置放棄-0.046 -0.117 -0.036 0.003 -0.067 -0.149 -0.017 -0.003信息化建設-0.019 -0.122 0.087 0.052 0.125 -0.142 0.123 -0.023信息資源利用0.068 -0.057 0.042 0.029 -0.092 -0.141 0.049 0.048管理-0.005 -0.012 -0.029 0.044 -0.041 0.138 -0.022 -0.033信息資源組織0.011 0.045 -0.047 0.047 -0.093 -0.108 -0.038 0.004管理資源共享0.104 -0.098 -0.039 0.097 0.053 -0.107 0.07 -0.094

搜索引擎0.01 0.282 -0.045 -0.089 -0.098 -0.046 0.479 -0.073檢索0.017 -0.026 -0.042 -0.076 -0.064 0.048 0.387 -0.109網站-0.051 -0.026 -0.003 -0.034 0.037 -0.1 0.355 0.033 Internet -0.065 -0.021 -0.074 -0.112 -0.072 0.054 0.327 0.003數據庫0.154 0.066 -0.034 -0.037 0.079 0.024 0.307 0.08因特網-0.025 0.001 -0.065 -0.084 -0.106 0.012 0.267 -0.033互聯網-0.067 -0.074 -0.025 0.064 0.019 -0.046 0.264 0.035高校圖書館0.101 -0.09 -0.154 -0.151 -0.225 -0.06 -0.257 -0.144網絡網絡 信息-0.051 -0.108 -0.041 -0.042 0.056 0.006 0.25 -0.063資源建設 資源-0.072 -0.05 -0.119 -0.118 -0.042 0.03 -0.178 0.037資源共享 管理0.131 -0.033 -0.085 -0.107 0.142 0.058 -0.149 -0.022文獻信息資源建設0.127 -0.062 -0.068 -0.095 -0.12 -0.077 -0.132 -0.121信息0.016 -0.04 -0.02 0.051 -0.022 0.089 0.128 -0.096評價指標-0.02 0.026 -0.02 -0.052 -0.082 -0.086 0.12 -0.044信息資源整合0.016 0.057 0.051 0.078 -0.06 0.013 -0.113 -0.088文化信息資源-0.101 -0.047 -0.039 -0.012 -0.032 -0.046 -0.109 -0.041共享工程教育信息資源0.019 0.006 0.019 0.015 -0.021 -0.01 0.074 -0.023計算機網絡-0.028 -0.021 -0.062 -0.056 -0.015 0.047 0.063 -0.01信息利用-0.042 0.03 -0.044 -0.072 -0.033 -0.032 -0.014 0.638信息開發-0.043 0.044 -0.026 -0.06 0.043 -0.041 -0.012 0.588信息產業0.003 -0.076 -0.075 0.029 0.002 0.056 0.001 0.285企業信息-0.071 -0.061 0.051 0.079 -0.122 -0.055 -0.08 0.223信息資源開發 資源0.094 -0.105 0.104 0.135 -0.086 -0.129 -0.01 0.222信息需求 開發-0.049 0.032 -0.038 -0.058 -0.035 -0.106 -0.099 0.175西部地區 利用0.018 -0.081 0.001 -0.04 0.027 -0.054 -0.04 0.107文獻資源0.074 -0.006 -0.02 -0.03 0.013 0.092 0.039 0.103信息資源開發利用-0.051 -0.056 0.021 -0.025 0.021 -0.08 -0.011 -0.089電子信息資源0.065 0 -0.031 0.006 -0.023 -0.041 0.07 -0.079
上文從兩個不同的角度對信息資源管理的研究領域進行了探討,本小節擬對上述兩種界定方法的結果進行評判,并通過綜合考慮后得出所確定的研究領域。
首先,從上文的論述中可以看出,采用邊介數聚類的方法得到的主題區域內部耦合和外部邊界相對明確。例如,第三節的聚類結果明確區分了信息檢索和信息組織兩大領域的邊界和核心主題,而第四節的因子分析則將上述兩類問題歸并到了因子2(技術因子)之下,同時,因子 7(網絡因子)也包含了一部分信息檢索的內容。我們認為,將因子2和7的內容重新劃分為信息組織和信息檢索兩大類是比較合理的。
再比如,第三節的聚類結果中的“機構建設”領域,實際上包含了第四節因子分析中的因子1(圖書館因子)和因子5(信息資源建設因子)的內容,這反映了當前我國信息資源管理研究領域的一個實際情況,那就是關注信息資源建設的學者其研究視角主要集中在圖書館領域,而對政府和企業等領域的信息資源建設關注較少?;谶@一實際情況,我們認為將“圖書館因子”和“信息資源建設因子”合并為“圖書館建設”是比較符合中國國情的。但出于對目前學術界傳統劃分標準的尊重,本文依然將其區分為兩個因子。
其次,采用第一種聚類方法所得到的結果的不足之處在于,出于使聚類結果可解釋的考慮,本文在簡化網絡時去除了大量低權邊,這樣做的一個直接后果就是使得一些非熱點領域或文獻主題詞關聯不明顯的領域被拋棄掉了。一個最明顯的例子就是第四節的因子分析結果中的因子3(檔案因子)和因子4(基礎理論因子),在第三節的聚類結果中都沒有顯示出來。
基于上述考慮,本文提出了一個對目前國內信息資源管理研究領域的劃分標準,包含以下幾個分支:
(1)基礎理論:包括信息資源管理、知識管理、信息管理等基本概念辨析,以及信息資源管理理論中的一些基本理論問題,比如信息資源開發利用、信息資源共享等的理論闡述。
(2)圖書館信息資源:包括對圖書館在網絡環境下通過虛擬館藏建設與印刷信息資源建設改善館藏結構,推動圖書館的館藏建設的理論問題和實踐環節的闡述。
(3)檔案信息資源:主要包括檔案信息資源的開發、管理、利用等一系列工作環節,以及檔案館等機構在具體工作實踐中存在的問題的闡述。
(4)信息檢索:主要關注網絡信息資源管理以及數字圖書館研究中有關信息檢索的原理與系統應用的一些理論問題。
(5)信息組織:主要關注信息組織與信息資源組織的關系,以及DC元數據等信息組織工具對于網絡環境下的信息資源管理的推動作用。
(6)信息資源開發利用:主要關注信息資源的開發與利用工作實踐中的具體問題,以及通過創造產業化與市場化推動信息資源產業發展的理論與實踐問題。
(7)信息資源建設:主要關注一般意義上的信息資源建設理論與實踐具體環節中的諸多問題,例如信息共享、知識產權、信息安全、網絡建設等。此外,圖書館與檔案館等機構的信息資源建設問題則歸于(2)(3)。
通過對維普科技期刊數據庫中信息資源管理領域相關文獻信息的統計分析,描述了我國信息資源管理研究的發展情況。在此基礎上,分別使用基于主題詞復雜網絡的信息資源研究領域聚類分析以及基于因子分析的信息資源研究核心領域界定兩種方法給出了當前國內信息資源管理研究領域的熱點問題。最后,本文比較了上述兩種分析結果的優劣,并提出了符合我國當前研究現狀的熱點領域劃分方法。希望本文的研究可以為學界更好地界定和劃分信息資源管理研究體系提供有益借鑒。
1 宋恩梅.信息資源管理研究的多重視角及其共同體的形成(Ⅲ)——學科互涉特征與IRM共同體的形成.中國圖書館學報,2008(1):27-32
2 凌云,高凡.1995-2005年國外信息資源管理研究進展.圖書館論壇,2007,27(5):8-12
3 畢強等.國外信息資源管理的主流研究領域及熱點內容分析.中國圖書館學報2004(1):81-84
4 于紅梅.國外信息資源管理理論學派概述.圖書館建設,2005(6):26-28
5 邱均平蘇金燕.國內信息資源管理研究綜述.圖書館論壇,2007,27(6):158-163
6 邱均平等.1998-2006年國內外信息資源管理研究比較分析.見:胡昌平等.信息資源管理研究進展.武漢:武漢大學出版社,2008:217-240
7 Girvan M,Newman M E J.Community structure in social and biological network.Proc Natl Acad Sci,2002(99):7821-7826