盛艾
摘 要:本文首先基于現有的關系搜索產品來對關系搜索的基本理念進行了討論。其次,重點從圖書館檢索服務引入關系搜索后可以產生的良好效果著手,探究了關系搜索引入圖書館檢索服務的可行性,最后基于當前圖書館檢索當中運用關系搜索可能存在的問題,思考了如何引入關系搜索。
關鍵詞:關系搜索;圖書館檢索服務;引入
基金項目:本文系國家社科基金藝術學項目“音樂色彩通感可視化和交互藝術研究”(項目編號:16BF088)研究成果
本文系中國美術學院項目“藝術(設計)學科國際學術文獻資源置備策略與檢索應用引導研究”編號(900036351784/053)研究成果。
書籍是傳承人類知識的重要途徑,在新世紀由于進入數字時代,傳統意義上的圖書館也走向了數字圖書館,圖書館的信息資源服務模式發生了非常巨大的變化,當然也因為數字化造成圖書館的信息檢索服務面臨著巨大的挑戰。海量的藏書乃至海量的數字化圖書如何檢索是一個值得思考的問題。
1 關系搜索
所謂關系搜索是通過搜索引擎關鍵字組合搜索并獲得特定對象間關系的一種搜索方法。比如人立方搜索引擎,這個是典型的關系搜索引擎。只需要在人立方搜索中給出一個關鍵詞,比如姚明,瞬間就可以給出姚明的關系網絡,在這個關系網絡當中甚至有李宇春(因為在網絡上出現過這么一個調侃的網絡語——人都說李宇春是姚明的妹妹)。所以關系搜索也可以叫人肉搜索,大部分關系搜索引擎的最主要功能都是搜人,隨便輸入一個人物,進入搜索,里面就有關于該人物的關系網絡、網頁、咨詢、簡介等等,甚至功能強大的能夠連很多隱私的內容都能展示出來。當然這其中的真假不好評論。因為關系搜索本質還是一種自動的搜索網頁,其信息來源多數都是網站的新聞報道,社區論壇、博客連接等等,只要一個人曾經在網絡上評論過某個名人,就有極大的可能被自動搜索到,不管這個人和某個名人的關系是否是真的。這跟搜索引擎的基礎技術、爬蟲技術有關,爬蟲技術說白了就是一種信息抓取技術,而抓取的信息通常來自互聯網的一些公開的知名網站。當然關系搜索與百度這些不同的地方就在于關系搜索基本都是用來搜索人與人之間的關系的。
以人立方來論相關研究指出該搜索引擎是通過算法自動計算出人名、地名以及一些其他名稱的關系的可能性,并且自動抓取出來,形成一個社會關系圖景,在這一社會關系圖景當中包含有人物、地點、機構等關鍵的信息要素,人立方將人物作為信息檢索的邏輯起點,然后用算法來給抓取到相關信息進行級別分類,組建索引目錄并保存下來,然后在關系圖景當中將搜索對象的相關信息之間的關系展示出來。
關系搜索實際上相當于是一種關聯規則的數據挖掘,用海量的數據來支撐關聯規則,用數學上的概念來論,即非空集合X和非空集合Y不相交,假設X->Y,那么兩個非空集合可以構筑一條關聯規則。在這個規則當中如果明確了置信度、支持度以及提升度,則可以確定有用的數據。
2 圖書館檢索服務應用關系搜索的可行性
圖書館檢索服務應用關聯搜索實際上可行的,而且可以極大地改善圖書館的檢索服務。
首先關聯搜索可以為讀者提供全新的閱讀服務方式。在數字時代,圖書館也已經基本形成了一種關系搜索的形式,但在關系搜索當中主要提供的是書籍作者的一些基本信息,缺少對文字內容的索引,相對來說關系搜索還比較狹隘。而隨著數字圖書館的推進,現在一個圖書館當中的藏書包括數字化的文獻資料是海量的,尤其是數字化資源更是遠遠超過圖書館的館藏。那么為讀者提供更加好的閱讀體驗,將關系搜索引入進來,將眾多文獻的創作者、文獻的部分內容、文獻來源以及關聯的相關信息等等利用起來,可以為讀者提供更加便捷的信息查閱途徑。
其次,關系搜索可以增加讀者閱讀資料時的信息獲取途徑。現在大部分圖書館的信息獲取途徑都可以利用檢索系統來完成,包括書籍文獻資料查閱、借閱以及歸還大部分情況下都可以利用檢索系統來完成。但目前圖書館所使用的檢索系統大部分都是目錄檢索系統,即給予書籍或文獻資料一個文件號,該文件號包含館藏的具體位置信息、借閱信息等。但是大部分資料都是獨立的,讀者只能不斷嘗試使用不同的關鍵詞來進行檢索新的信息,從便捷性上來說要差一些。因此如果可以通過引入關系搜索,想必可以將圖書館的檢索變得更加便捷,可增強用戶體驗。
再次,關系搜索可以為圖書館的檢索服務提供全文識別的便捷途徑,依托圖書館的資源,可以文獻的全部信息進行分析,包括題名、創作者、機構等等,只需要一個關鍵詞就可以知曉幾乎所有與文獻資料有關的信息。這種方式實現的是基于內容的檢索,是對圖書館檢索系統簡單的目錄檢索的一種突破。在關系搜索的幫助下,可以形成以人為邏輯起點的檢索關系圖,在這個關系圖當中所有的信息一目了然。引入關系搜索后,人物關系圖可以讓更多的文獻資料展示出來,比如人物所有的著作,其所在機構的人物在相同研究領域所作出的研究成果,研究所參考的一些文獻資料等等,當文獻被引用到其他相似研究中,關系圖隨之變化。
最后,關系圖的形成非常有助于相似研究圈的形成,圈子這個概念在任何一個領域都是存在的,互聯網上尤其強調圈子。圖書館檢索服務引入關系搜索,可以促進研究圈子的形成,同一個領域的作者會因為關系搜索而匯聚在一個圈子當中,為讀者提供更加多維度,更小力度的研究知識。而圈子當中所形成的研究成果,基本上就可以算是一個領域的知識體系。
3 圖書館檢索服務應用關系搜索需要解決的問題
3.1 去娛樂化
圖書館的檢索主要是建立在館藏上的,用戶如果需要圖書館檢索服務,對信息的準確性有客觀的要求,不管是查閱紙質的資料還是查閱數字資源都要求搜索出來的結果具有真實性,準確性。特別是對于需要數字資源的用戶,一般所需求的搜索結果基本上都是研究成果、文獻資料,在關系搜索中還需要將這些研究成果和文獻資料所引用的相似文獻展示出來,進而讓用戶可以獲得更多的資源。因此在圖書館檢索服務當中引入關系搜索關鍵一點是要去娛樂化。
3.2 信息真實性
對于普通網民而言,其在網絡上所使用的關系搜索具有更強的娛樂性,所搜索得出的人物關系是否真實以及關系的密切度需要考證,對于用戶而言需要自己去考慮和判斷搜索結果的真實性。因為互聯網上的關系搜索以人為節點,信息來源通常都是網絡上的新聞、微博微信等等,它需要分析海量的數據來找出人與人之間的復雜社會關系,但是因為現在技術的局限性,并不能真實的呈現出一個人的關系狀態,特別是人名重復這個問題,現階段如何解決同命不同人這一問題還是比較難的一個問題。
3.3 全文識別難點
目前來說,關系搜索還是一個比較新的理念,在圖書館檢索服務當中要引入關系搜索,關鍵點是要實現全文識別,這樣才能保證關系搜索能夠發揮出應有價值。但是目前要完成館藏資源全文識別,技術、人員、設備等方面都存在很多阻礙需要解決。
上述幾個問題不解決,圖書館檢索服務單純引入關系搜索可能會出現水土不服的現象,所以為了更好地發揮關系搜索的作用,先期可以考慮現在人名和人名關系比較集中的部分來應用關系搜索,比如題名、作者、作者單位、文獻摘要、文獻關鍵詞及參考文獻等,應當可以在初期取得一定的效果。
4 圖書館檢索服務引入關系搜索的思考
按上文給出的應用思路,圖書館在辦理讀書卡時已經掌握了一定讀者的信息,而且每一位辦理了讀書卡的讀者都有一個唯一的身份標識,而這個標識在圖書館檢索服務當中可以作為關系搜索的基礎,只要讀者用身份標識認證登錄圖書館網站,圖書館檢索服務系統就可以根據該身份標識下讀者的閱讀喜好(一般需要讀者長期使用,由系統判定讀者的文獻檢索歷史和閱讀行為進而構建出讀者個人的閱讀信息庫)來推送相應的文獻資料。
在圖書館的服務當中也應當由此進行一定的創新,為讀者提供更為多樣性的服務,構建讀者檔案庫后,圖書館人員可以更加方便地了解讀者的閱讀信息,將這一檔案庫作為原始數據庫,利用數據挖掘、數據分析等歸納某一類讀者的閱讀行為特點,打造一個閱讀圈子,進而提供有針對性的服務。比如說歸納了一類喜好進店閱讀的讀者,那么就根據讀者在圖書館中留下的信息記錄來分析他們的閱讀行為,進而可以有目的地打造經典閱讀室,并結合讀者閱讀時間以及地點來進行針對性服務。
5 結束語
綜上所述,關系搜索以人為邏輯節點,尋找的是人與人之間的社會關系。讀者也是人,利用關系搜索來優化圖書館檢索服務應當具有可行性和必要性。但因為目前關系搜索受技術所限,在圖書館檢索服務當中運用可能會出現水土不服,所以目前還應進一步思考如何去利用關系搜索。
參考文獻
[1]劉忠寶,賈君枝,趙文娟,等.數字圖書館跨媒體檢索技術研究[J].圖書館論壇,2014,(12):94-97,封3.
[2]周佳駿.數字文獻中特殊實體的增強型WEB搜索引擎模型[J].圖書館論壇,2013,33(2):111-115.
[3]封麗,胡曉輝,沈軍威,等.圖書館知識共享模型構建研究[J].情報探索,2015,(12):119-122.
[4]申曉娟,李丹,王秀香,等.略論圖書館資源整合與檢索系統的發展——以國家圖書館“文津”搜索系統為例[J].圖書情報工作,2013,57(18):38-43,60.