陸雪梅
(江蘇理工學院圖書館,江蘇 常州 213001)
在信息全球化的技術大變革時期,信息技術、計算技術、計算機技術等在高速更新,計算機在圖書情報界得到更為廣泛的應用,計算機輔助情報研究方法的不斷應用,促進了圖書館、情報信息機構的信息分析、挖掘與獲取,使信息檢索工作得到不斷發展,為了獲得有效準確的數據信息,我們需要進行一種數據簡化的分析活動。
面向計算機網絡系統的專門性情報研究活動日益興盛,發達國家情報研究工作的一大特色是情報研究工作的自動化程度高,大部分的工作借助于電子計算機完成。除了采用如SPSS、SAS等通用統計分析軟件外,還重視情報研究工作專用軟件的研制和應用。如美國巴特爾紀念研究所及其下屬機構開發了專門分析能源消費以及能源對技術變化影響的INTUM-PC等一系列軟件包;美國陸軍國外科技中心開發了可將文獻分類、組合、比較、合并、匹配、作圖的自動化分析系統——MCICIS;日本花王公司1993年啟動建設功能強大的營銷情報系統。[1]因特網已成為西方國家獲得情報研究素材的重要渠道和分析的重要工具。近年來還出現了所謂“數據分析”專家,他們為用戶提供對來自圖書館、計算機文檔或其它數據庫的信息來源進行分析和評價服務,這類服務比一般的文摘或計算機輸出具有更佳的加工深度。[2]
自20世紀80年代初,我國綜合意義上的計算機輔助情報研究工作即開始起步;1985年已有情報部門利用計算機作實時信息處理,進行統計運算類的情報研究。1988年,國家科委和國際應用系統分析研究所合作,建成了“整體發展決策支持系統——山西省案例研究”[3],成為我國情報決策專家系統的重大成果。
20世紀90年代以后,網絡技術、聲像技術、多媒體技術、數據庫技術逐漸進入情報研究活動過程的各個環節,豐富了情報研究素材的來源,提高了工作效率和自動化水平,提升了成果的傳遞速度。國內也引入了投入產出分析法、層次分析法等定量研究方法,讓計算機來自動處理繁復的數據統計和計算工作,并利用互聯網快速搜集研究素材和發布研究成果。
我國防科工委系統開發使用的“情報研究網絡環境下的協同支撐環境”,作為“世界國防工業科技信息數據庫系統”中“內部工作信息數據庫分系統”的一部分。該系統用戶是國防科技情報行業從事情報研究的廣大情報工作人員。協助用戶進行情報研究過程中的資料管理,實現內部資源共享,并在此基礎上實現信息交流及相應的數據管理與統計。其功能模塊主要包括個人工作平臺、內部資料庫、工作組、工具庫、公告欄,這些模塊實現資源共享和信息交流,供普通情報研究人員使用,但還沒實現協同工作和知識管理功能;稿箱管理和系統管理模塊實現系統設置和資料管理,供各級管理者和數據審查者使用。其工具庫包括了專業詞匯管理及網址管理,這兩個管理工具只是一種電子化的中英對照專業詞典和分類管理的網址庫,并沒有達到智能化搜索、翻譯、加工和分析水平。
中國科技信息研究所也有類似的情報分析平臺,它的功能比國防科工委系統的情報分析平臺多了發布、文獻計量的功能和一般的統計軟件,同樣也未實現協同工作和知識管理功能。
計算機網絡技術的發展直接促動了情報研究方法的革新,當前國內外情報研究方法體系和分析平臺建設的發展趨勢表現為:應用計算機網絡技術,以大型科學技術文獻數據庫為基礎進行知識挖掘方法和軟件工具的研制,以知識管理為目標的情報分析協同工作平臺。
充分利用以計算機網絡技術為核心的現代技術,確立科學的搜集、積累資料與數據的程序,大力引進通用的數據、信息統計分析軟件,積極開發情報研究專用軟件。逐步建立情報研究工作專用的數據型、事實性和全文型數據庫,充分利用各種網絡信息資源和設備,以提高情報研究工作效率。采用各種現代化手段和措施對資料、數據和其他素材進行聚集、整理,讓專業人員把更多的時間和精力用于分析問題,提出新思想、新建議,同時,現代化的手段和措施也能直接輔助專業人員開展分析綜合以“激活知識”,從而提高情報研究成果的層次和精確度。探索應用聲像技術、多媒體技術、網絡技術編制和向用戶傳遞情報研究報告的條件、方法和形式,提高情報研究成果表達的動態性、多維性和感染力,提高情報研究成果傳遞的速度和效率。
在堅持運用分析、綜合、歸納、類比等邏輯思維方法的基礎上,對于現有的從其他學科移植來的各種定量方法進行必要的改造,使它們能更好地體現情報研究工作的特點和要求。對于情報研究工作特有的文獻計量方法和內容分析方法,也要不斷進行優化,以提高其精確性。同時,要積極研究定性方法與定量方法相結合的切入點,積極研究定性、定量方法與計算機技術聯姻的可行性和途徑。
在圖書情報研究領域,世界上一些信息管理軟件公司,幫助組織索引、檢索和分類、評注信息,進行數字圖書館拷貝探測。比如Recommind的應用包括高自動化的搜索引擎,分類法管理、開發應用、個性化和再求補法功能以及智能軟件代理功能。WCopyFind是一個調查文獻文件收藏的規劃。它析取這些文獻的文本部分,并且審核它們在特定的最小長度短語中適合于匹配的詞。當它找出兩個文件在那些短語中共享了足夠的詞時,WCopyFind就生成html文件。這些報告包含著具有被標著下劃線匹配詞的文獻文本??咸厣矫}數字圖書館實驗室開發對于探測和分析非常大的文本集合、適用于內容管理和知識發現的技術。它們聚焦在亞洲人所使用的語言的文獻,特別是漢語和英語文本。Paramedies曾經是歐洲委托投資的文本挖掘研究工程的第一個名稱,而且就設在萊比錫管理學研究生院。這一國際工程的主要目標是使用文本挖掘程序在文本文件中發現經濟相關知識,該工程聚焦分析文獻收藏。[4]
美國芝加哥大學情報學教授Don.R Swanson創立了一種情報學方法——非相關文獻知識發現法,并且設計了相應的人機交互系統Arrowsmith,以幫助使用者更好地發現這種隱含的關聯。Swanson所進行的研究工作應用于醫學領域,隨著Arrowsmith系統功能的不斷改進和增強,它的應用范圍在不斷地拓展,現已應用于醫學領域以外的其它領域。另外,受Swanson研究的影響,美國Gordon教授設計了一個計算機輔助于文獻發現的查詢方法,提出數據庫中的標識頻率和記錄頻率有助于實現文獻的發現;美國Chen進行了“讓文獻互相交談”的計算機模型的創建研究;Cort副教授將Swanson的方法成功應用于發現Wilson人文數據庫文獻中的隱含相似性上。[5]
穆迪研究和分析有限責任公司(Mogee Research&Analysis)在把專利和其他技術數據轉換為有價值的信息方面是領導和創新者。從1985年以來,他們一直在幫助用戶更好地理解復雜的、迅速改進的技術環境。與他們合作的技術公司主要負責開發分析方法,以直接滿足商務需求和運作的方法。最重要的是他們的方法反映了用戶對全球技術前景的商務需要。他們的客戶包括了美國財富500強公司和主要的其他國家公司,也包括美國政府和其國外的代表機構。這項專利分析針對技術許可證,競爭情報,公共政策,研發管理,專利職務管理,以及經濟開發來實施的。
該公司開發的一套分析工具,已經在成熟、顯現和成長技術方面測試了這套工具中的分析方法;而且通過與專家觀點以及其他定量方法的比較,對它進行了驗證。其基于專利的指標有助于衡量技術活動的水平、技術結構、生命周期的某個階段、技術意義、商業潛力,以及技術策略。它能幫助用戶掌握技術、技術活動以及公司和國家的戰略,發明者和技術開發團隊的情報。該工具能分析取得專利的技術廣泛譜線,覆蓋了遍布世界,包括美國、日本、歐洲國家和新興工業化國家的40多個專利權威發布的專利,提供常規的專利統計和專利引文分析,這是用其他方法得不到的獨特分析,比如象國際同族專利分析,同引分析以及技術地圖;還針對研發管理、許可證、技術評估和監測、競爭情報、政策分析以及經濟開發來量身定制專利分析;另外,提供對分析結果的闡釋和對管理的潛在意義。[6]
總之,在大數據時代,不論是圖書館還是其他情報信息服務機構,應該及時應用現代情報分析研究方法,解決廣大用戶對復雜數據的存取,根據用戶的信息檢索系統,按用戶需求定制檢索結果,使更多的用戶能夠在熟悉情報分析方法的基礎上,掌握信息檢索的基本技巧,有效獲取所需的知識信息。
[1]日本花王公司簡介關于消費者意見[EB/OL].[2014-02 -01].http://www.qqyw f.com/view/b_544121.html.
[2]Ulrike Reinhard.未來數據分析專家[EB/OL].[2014-02 -10].http://www.itongji.cn/article/041919E2013.html.
[3]高洪深.決策支持系統(DSS)案例集[M].北京:清華大學出版社,2008.11.
[4]跨學科研究系列調查報告選登之一跨學科研究:理論與實踐的發展[EB/OL].[2014-02-22].http://www.npopss - cn.gov.cn/GB/220182/227704/15318717.html.
[5]Michael D.Gordon,Robert K.Lindsay.Toward Discovery Support Systems:A Replication,Re- Examination,and Extension of Swanson's Work on Literature based Discovery of Connection between Raynaud's and Fish Oil.JASIS,1996,47(2):116 -128.
[6]穆迪投資公司[EB/OL].[2014-02-22].https://www.moodys.com/pages/default_ch.aspx.