黃如花 劉鎏



摘 要:WorldCat標注系統(tǒng)是分眾分類法在書目信息管理方面的代表,適應(yīng)了社會化網(wǎng)絡(luò)下信息組織的發(fā)展趨勢。但是,因其自身在標簽、管理機制、檢索機制等方面存在的不足,一定程度上影響了信息組織的精準度,不利于用戶的實際操作使用。基于這些分析,文章構(gòu)建了一個整體優(yōu)化方案,通過明確標簽含義層次、增加用戶編輯功能、完善用戶社區(qū)聚合功能等具體措施對WorldCat標注系統(tǒng)進行優(yōu)化。
關(guān)鍵詞:WorldCat 標注系統(tǒng) 優(yōu)化方案
中圖分類號: G250.73文獻標識碼: A 文章編號: 1003-6938(2012)05-0016-05
WorldCat標注系統(tǒng)同一般的標注系統(tǒng)一樣,都是由用戶、資源和標簽三個集合構(gòu)成,具有平面化的組織結(jié)構(gòu)、多維度揭示信息資源、自由隨意性、共享性、社會性和動態(tài)自適應(yīng)性[1]。同時WorldCat標注系統(tǒng)進行標引的資源對象都是已經(jīng)經(jīng)過預(yù)先規(guī)范加工處理過的規(guī)范化書目數(shù)據(jù),本身就因為主題、著者等因素關(guān)聯(lián)在一起,是有序存在的。另外,WorldCat標注系統(tǒng)的用戶由成員館用戶和一般用戶組成,前者提供基本書目信息以構(gòu)成WorldCat全球書目信息數(shù)據(jù)庫,具有專業(yè)的信息資源組織管理能力;后者跟一般標注系統(tǒng)的用戶群體類似,根據(jù)自身對資源的理解進行標注,具有差異性和主動性。本文通過對WorldCat標注系統(tǒng)的標簽、管理機制、檢索機制等方面的分析,結(jié)合常規(guī)標注系統(tǒng)的特點,制訂了優(yōu)化方案,方案包括前期準備工作、具體實施內(nèi)容和后期調(diào)整完善三個部分。
1 WorldCat標注系統(tǒng)優(yōu)化的前期準備工作
為了確保針對WorldCat標注系統(tǒng)的優(yōu)化方案能夠最貼合其實際情況和用戶的實際需求,也為了避免優(yōu)化方案在實施過程中過多地影響到WorldCat自身的正常運行提供書目信息服務(wù),方案實施之前的準備工作是必須進行的,并可以從四個方面展開。
1.1 全面了解WorldCat標注系統(tǒng)
主要是針對現(xiàn)在標注系統(tǒng)中的用戶、資源和標簽的數(shù)量、質(zhì)量、關(guān)聯(lián)等方面進行了解,掌握最新的、最為全面的數(shù)據(jù)統(tǒng)計信息,為后面的數(shù)據(jù)分析制定詳細的優(yōu)化方案和實施步驟提供參考。
1.2 詳細調(diào)查WorldCat標注系統(tǒng)用戶
主要是針對用戶對現(xiàn)在標注系統(tǒng)的使用滿意度和修改意見的收集、統(tǒng)計和分析。從而確定需要進行優(yōu)化改進的地方,并且在優(yōu)化方案中體現(xiàn)用戶的使用需求,力圖讓優(yōu)化后的標注系統(tǒng)更加吸引用戶的長期和高頻率使用。
1.3 調(diào)查了解其它標注系統(tǒng)
主要是針對那些跟WorldCat標注系統(tǒng)有相類似特征的標注系統(tǒng),比如專門針對書目信息的LibraryThing和亞馬遜標注系統(tǒng)進行調(diào)查,了解它們的各個集合和服務(wù)模塊的設(shè)置和結(jié)構(gòu),尤其是那些WorldCat標注系統(tǒng)所不具有的功能,應(yīng)當(dāng)重點關(guān)注,考察是否可以借鑒。
1.4 制訂優(yōu)化實施方案
基于以上的調(diào)查數(shù)據(jù),制定一個有具體時間進度、可操作性強的實施方案。需要特別注意的是,該實施方案應(yīng)當(dāng)留有可以在實施過程進行調(diào)整的余地,同時要注意不會對WorldCat的其它功能造成長時間、高程度的影響。
2 WorldCat標注系統(tǒng)優(yōu)化的具體內(nèi)容
2.1 明確標簽的實際含義,構(gòu)建標簽的層次體系結(jié)構(gòu)
標注系統(tǒng)中的標簽都是以平面形式存在的,缺乏上下級之間的類別管理[2],標簽之間的關(guān)聯(lián)性弱,加上標簽來自于自然語言本身就存在著同義和異義等容易造成的歧義,使得信息資源按照標簽的聚合會出現(xiàn)差錯,導(dǎo)致檢全率和檢準率得不到較好的保證[3]。WorldCat的標注系統(tǒng)也不例外,以其首頁上的熱門標簽云中的標簽為例。標簽“nonfiction”和“non-fiction”實際上指的都是非小說類文學(xué)作品,兩個詞是可以通用的。但是在標注系統(tǒng)中,兩個不同的標簽意味著將本來具有相同特征的信息資源劃分到不同的類別之中,割斷了這些資源之間本來的關(guān)聯(lián)性。再如,標簽“fiction”和“historical fiction”,前者指的是小說,后者指的是國家年度最佳的小說名單,后者應(yīng)當(dāng)從屬于前者,是前者的下位類。但是由于標注系統(tǒng)中標簽的平面無等級性,使得這兩個標簽之間不存在任何類別關(guān)聯(lián),也就使得它們分別代表的資源之間沒有建立任何的關(guān)聯(lián)性。
因此,可以在后臺構(gòu)建一個對標簽進行后控的詞匯庫,其內(nèi)容包括基本的同義詞詞表和多義詞詞表,并且這些語詞之間都是相聯(lián)系的。考慮到WorldCat的多語種性,每個語種應(yīng)當(dāng)選定一個最為權(quán)威的成員館來進行關(guān)于該語種的語詞庫建設(shè)。然后由技術(shù)人員進行不同語種之間常用標簽詞匯的關(guān)聯(lián)賦予工作。同時該詞匯庫開放部分的權(quán)限給普通的用戶,用以添加新出現(xiàn)的詞匯和語義以確保該語詞庫能夠與實際的自然語言使用情況保持動態(tài)一致。
WorldCat標注系統(tǒng)的特征之一就是其資源對象是已經(jīng)經(jīng)過處理的書目信息,本身就是按照傳統(tǒng)的信息組織方法進行規(guī)范組織的,具有基本的層次系,按照著者、時間、年份、語種、主題等進行了簡單的歸類組織。基于此,可以將賦予給同一個資源對象的標簽跟隨該資源歸入到同一個大類之中。標簽根據(jù)不同的分面規(guī)則劃歸到不同的類別之中,標簽與標簽之間就不再是一個平面結(jié)構(gòu),而是有了比較明晰的等級層次關(guān)系。
2.2 增加針對標簽本身的瀏覽和檢索界面,優(yōu)化用戶對標簽修改編輯的功能
WorldCat標注系統(tǒng)中對于標簽并沒有比較清晰的管理機制存在。一方面,標注系統(tǒng)中用戶使用過的標簽并沒有按照某種順序排列全部顯示出來也沒有用來查找某個標簽的檢索機制,用戶沒有辦法通過瀏覽或檢索的方式進行標簽的查找;另一方面,用戶在對自己已經(jīng)使用過的標簽進行編輯或者刪除等管理操作時,相對應(yīng)的信息資源的被標注情況并沒有得到改變。例如,先給“Decision-making in the absence of certainty:a study in the context of technology and the construction of 21st century academic libraries”一書添加了“圖書館”這樣一個標簽。然后在“我的標簽”界面中對使用過的“圖書館”標簽進行修改,改成“圖書”。理論上,原來被賦予給資源對象的標簽也應(yīng)該從“圖書館”相應(yīng)地變成“圖書”。事實上,返回到資源對象的界面,發(fā)現(xiàn)筆者對該資源的標注行為變成了兩次,分別賦予了“圖書館”和“圖書”兩個標簽(見圖1)。
WorldCat標注系統(tǒng)需要增加對標簽的管理機制。該管理機制不僅包括前面提到的對標簽語義和層次關(guān)系的后控制,還包括提供瀏覽、檢索機制來方便用戶查找某個具體的標簽和對標簽進行編輯修改。
因此,WorldCat標注系統(tǒng)可以將熱門標簽云中的標簽和所有用戶標注使用的標簽都根據(jù)字順等規(guī)則進行排列,保持實時動態(tài)性,保證用戶新添加的標簽也能夠快速地出現(xiàn)在標簽列表中。標簽的檢索設(shè)置只需要提供簡單的語詞檢索即可,由于標簽之間通過后控實現(xiàn)層級化和關(guān)聯(lián)化,可以在用戶獲取檢索結(jié)構(gòu)的同時顯示與該標簽相關(guān)的其它標簽選擇,實際上擴展了用戶的檢索范圍。同時,需要在WorldCat首頁的熱門標簽云設(shè)置可以方便鏈接到標簽瀏覽和檢索界面的按鈕,確保用戶在熱門標簽云中尋找不到所需要的標簽后能夠快速找到如何進行標簽查找的途徑。此外,WorldCat標注系統(tǒng)需要保證用戶對標簽再編輯的同步性,當(dāng)用戶對標簽進行修改時,系統(tǒng)應(yīng)當(dāng)將這樣的修改同步保存到標簽數(shù)據(jù)庫中和反映在用戶之前使用該標簽進行標注的信息資源的標簽顯示中。
2.3 構(gòu)建專門通過標簽進行信息資源檢索的途徑
用戶通過自由標注來組織信息資源,被賦予了相同標簽的信息資源被聚合在一起。這樣的聚合讓用戶可以通過標簽對信息資源進行檢索。標注系統(tǒng)是WorldCat為了適應(yīng)社會化網(wǎng)絡(luò)環(huán)境和信息組織管理新趨勢而添加進來的。標注系統(tǒng)本身就包含了一定的檢索功能,主要是通過檢索某個標簽來查找它所相關(guān)聯(lián)的信息資源。在目前的WorldCat檢索功能中,無論是簡單檢索(見圖2)還是高級檢索(見圖3)都沒有設(shè)置提供給用戶進行標簽檢索的途徑。在檢索框中輸入任何檢索詞,即便是該檢索詞在標注系統(tǒng)中已經(jīng)是某個信息資源的標簽,WorldCat的檢索系統(tǒng)會自動將其默認為按照傳統(tǒng)題名、關(guān)鍵詞等方式進行檢索。
在WorldCat中唯一能夠進行標簽檢索的方式就是找到這個標簽,通過點擊該標簽進行檢索。但是WorldCat首頁中用來顯示用戶標簽的標簽云中,只是顯示了很少一部分使用頻率較高的標簽,而且WorldCat沒有標簽瀏覽頁面,使得用戶無法找到想要檢索的標簽,也就不能通過標簽的檢索查找到所需要的資源。從這個意義上來看,標注系統(tǒng)利用標簽聚合信息資源以便于用戶快速查找的功能完全沒有發(fā)揮出來。
需要注意的是,雖然WorldCat上原有的檢索方式可以對檢索結(jié)果分別按照“相關(guān)性”、“著者字順”、“題名字順”和“出版時間”等順序進行排序,但是通過標簽進行檢索的時候,檢索結(jié)果并沒有按照一定的規(guī)則進行排序,這樣不利于用戶在眾多的檢索結(jié)果中獲取自己所需要的信息資源。
為了實現(xiàn)標注系統(tǒng)的檢索功能,可以在WorldCat的簡單檢索界面和高級檢索界面添加“標簽”檢索的途徑,也可以在首頁設(shè)置專門的按鈕鏈接到通過標簽進行資源檢索的界面。
WorldCat通用檢索的檢索結(jié)果是可以按照相關(guān)度、著者等因素進行排列的,這樣有利于用戶在眾多的檢索結(jié)果中進行進一步篩選。所以WorldCat標注系統(tǒng)通過標簽對資源對象的檢索,其結(jié)果也可以模仿諸如“著者”、“出版時間”等這樣的條件進行排序。除此之外,還可以在頁面右側(cè)設(shè)置類似的進一步篩選框讓用戶進一步篩選。從而縮短用戶通過標簽檢索并獲取信息資源的所需要的時間(見圖4)。
2.4 構(gòu)建WorldCat用戶的社群,實現(xiàn)用戶之間的交流和資源共享
標注系統(tǒng)的社區(qū)聚合功能能夠很好地將用戶與用戶、用戶與資源用標簽聯(lián)系起來,構(gòu)成了一定規(guī)模的社會網(wǎng)絡(luò),并且利用標注系統(tǒng)的運作原理不斷強化和擴展已經(jīng)形成的社會網(wǎng)絡(luò)。對同一資源對象進行標注或保存的用戶和使用相同或相似標簽的用戶被聚集在一起,形成具有相同興趣點和關(guān)注點的用戶群體。在群體中,用戶之間交流、共享信息資源,并且運用群體的智慧管理和創(chuàng)造
信息資源,體現(xiàn)了社會化網(wǎng)絡(luò)環(huán)境下網(wǎng)絡(luò)用戶之間信息資源的共享和交流。標注系統(tǒng)用戶所具有的交互性從根本上說受到社會化網(wǎng)絡(luò)這個大環(huán)境的影響,同時,用戶的交互性也推動著標注系統(tǒng)的社會化發(fā)展[4]。但是在World
Cat的標注系統(tǒng)中,用戶是松散的。標簽僅僅是將被賦予有同樣標簽的信息資源聚集在一起,而沒有對用戶之間的關(guān)系做出關(guān)聯(lián),使得用戶沒有辦法形成群體社區(qū)。這樣不利于WorldCat標注系統(tǒng)的交互體驗,也不利于其在社會化網(wǎng)絡(luò)環(huán)境下的進一步發(fā)展。
在WorldCat上,用戶與用戶之間唯一的關(guān)聯(lián)是用戶可以關(guān)注另一個用戶自己構(gòu)建的書目列表,不存在用戶之間真正的信息資源共享和交互活動。可以借鑒Flickr上社群(Groups)的構(gòu)建,構(gòu)建用戶之間的社群建設(shè)規(guī)則。這樣用戶既可以參與到其它社群中的活動也可以自己創(chuàng)建新的社群開放給一定的用戶參與進來,并且這些社群可以通過用戶權(quán)限的設(shè)置實現(xiàn)隱私和資源的完全公開、半公開和完全保密。
WorldCat標注系統(tǒng)增加用戶之間的交互可以在一定程度上彌補作為社會化網(wǎng)絡(luò)環(huán)境下的網(wǎng)站對用戶社會性的關(guān)注不足。同時基于WorldCat系統(tǒng)用戶是由成員館和普通用戶構(gòu)成的這一特色,增強用戶之間的交流可以幫助書目信息組織管理的專業(yè)人員與普通用戶進行互動,有利于WorldCat的發(fā)展和服務(wù)質(zhì)量的提升。
2.5 提供WorldCat標注系統(tǒng)檢索API接口,實現(xiàn)與其它標注系統(tǒng)的互操作
WorldCat中的書目信息來自于其各個成員館,尤其是2003年OCLC開始實施的“開放的WorldCat”(Open WorldCat)計劃允許各成員館和普通用戶以Wjkl的方式對書目信息的評論和標簽進行添加之后,其開放和共享性一直就是WorldCat不斷發(fā)展壯大的重要因素之一。但是WorldCat標注系統(tǒng)的開放和共享性較差,既沒有跟其成員館所使用的圖書館標注系統(tǒng)進行對接,也沒有與LibraryThing和亞馬遜這類專門提供書目信息的標注系統(tǒng)關(guān)聯(lián)[5],不利于WorldCat標注系統(tǒng)中標簽資源的共享。
雖然通過常規(guī)的搜索引擎,如谷歌、必應(yīng)或者百度,仍然能夠檢索到標注網(wǎng)站中的信息內(nèi)容,但是由于搜索引擎針對的是整個網(wǎng)絡(luò)信息資源,覆蓋范圍過于廣泛,會降低查找和檢索的檢全率和檢準率。所以WorldCat標注系統(tǒng)可以借鑒元搜索引擎的架構(gòu),構(gòu)建一個跨標注網(wǎng)站的搜索引擎。每個標注網(wǎng)站自身都設(shè)計有通過檢索標簽來查找相對應(yīng)的信息資源的簡單搜索引擎,跨標注網(wǎng)站的搜索引擎可以以此為基礎(chǔ)進行設(shè)計(基本結(jié)構(gòu)見圖5)。
針對標注的跨網(wǎng)站搜索引擎的結(jié)構(gòu)類似于雙層C/S結(jié)構(gòu):用戶向搜索引擎提交檢索請求,搜索引擎根據(jù)這個檢索請求向相連接的多個標注網(wǎng)站自帶的搜索引擎發(fā)出實際的檢索請求,然后多個搜索引擎會將獲得的檢索結(jié)果返回到跨標注網(wǎng)站搜索引擎,經(jīng)過去重、合并、排列后反饋給用戶。
最后,借鑒“一鍵分享”的模式實現(xiàn)標簽和資源的跨系統(tǒng)分享。共享無疑是社會化網(wǎng)絡(luò)環(huán)境最為突出的特征,為了讓標注網(wǎng)站能夠體現(xiàn)并且促進信息的共享,可以借鑒一些視頻和新聞網(wǎng)站的做法,在資源旁邊設(shè)置一些可以將該資源快速分享到社會化服務(wù)網(wǎng)站平臺,比如微博、人人網(wǎng)的按鈕。
只需要用戶擁有分享目標系統(tǒng)的登錄權(quán)限,點擊相應(yīng)的按鈕,資源便可以即時分享,省去了用戶操作上的麻煩,提高了信息資源分享的效率。標注網(wǎng)站可以效仿這樣的做法,在資源旁邊設(shè)置同樣的用來分享該信息資源到其他標注網(wǎng)站的按鈕,通過后臺的插件鏈接,方便用戶將需要的資源、標簽與其他標注網(wǎng)站的用戶共享。
事實上,目前WorldCat的檢索API(Application Programming Interface,應(yīng)用程序編程接口)已經(jīng)免費提供給所有需要的用戶[6]。將這個API放到其它應(yīng)用程序之中,就可以通過它來檢索訪問WorldCat上的書目信息。因此,WorldCat標注系統(tǒng)的檢索功能可以借鑒這個API的開發(fā)方式進行,然后將標注系統(tǒng)的API放置到首頁,提供給需要的用戶。除此之外,WorldCat還可以將標注系統(tǒng)的API主動提供給那些已經(jīng)將其它標注系統(tǒng)用到OPAC中的圖書館,讓兩個標注系統(tǒng)進行鏈接,實現(xiàn)跨標注系統(tǒng)的檢索。如賓夕法尼亞州立大學(xué)(University of Pennsylvania)圖書館自行開發(fā)使用的PennTag系統(tǒng),就是一個比較完善的標注系統(tǒng),該校圖書館同時也是WorldCat成員館之一。WorldCat可以將標注系統(tǒng)的API提供給賓夕法尼亞州立大學(xué)圖書館,將WorldCat標注系統(tǒng)與PennTag系統(tǒng)相關(guān)聯(lián)。用戶可以通過任何一個標注系統(tǒng)的檢索同時獲取兩個系統(tǒng)的信息資源,從而實現(xiàn)標注系統(tǒng)資源的共建共享。
3 WorldCat標注系統(tǒng)優(yōu)化的后期完善
當(dāng)所有具體的優(yōu)化內(nèi)容都穩(wěn)妥實施完成之后,還需要對WorldCat標注系統(tǒng)的運行情況、用戶使用情況進行調(diào)查分析,對優(yōu)化方案的成效進行評估,并且對優(yōu)化后的WorldCat標注系統(tǒng)進行微調(diào)。
3.1 了解優(yōu)化后的WorldCat標注系統(tǒng)
參照準備工作中對WorldCat標注系統(tǒng)進行調(diào)查分析的內(nèi)容,對經(jīng)過優(yōu)化的系統(tǒng)重新進行一次全面的了解。然后把獲得的關(guān)于標注系統(tǒng)中的用戶、資源和標簽的數(shù)量、質(zhì)量、關(guān)聯(lián)等方面的情況與優(yōu)化前的情況一一對比分析。
3.2 調(diào)查用戶對新標注系統(tǒng)的使用情況
對用戶包括系統(tǒng)管理人員使用優(yōu)化后的WorldCat標注系統(tǒng)的情況進行調(diào)查。調(diào)查的內(nèi)容主要包括使用者對整個標注系統(tǒng),尤其是經(jīng)過優(yōu)化處理的模塊的使用體驗、滿意度等。將使用體驗與未進行優(yōu)化時的使用體驗進行比較,為下一步對優(yōu)化方案成效的評估提供數(shù)據(jù)參考。
3.3 評估WorldCat標注系統(tǒng)的優(yōu)化成效
以WorldCat標注系統(tǒng)本身優(yōu)化前后的情況對比和用戶使用情況優(yōu)化前后的對比為主要依據(jù),綜合考慮在實施優(yōu)化的過程中各種人力物力的投入情況,對WorldCat標注系統(tǒng)優(yōu)化方案的成效進行客觀評估。評估的結(jié)果一方面可以作為對優(yōu)化后WorldCat標注系統(tǒng)進行微調(diào)的依據(jù),另一方面可以作為對WorldCat標注系統(tǒng)優(yōu)化方案進行調(diào)整完善的依據(jù)。
3.4 完善WorldCat標注系統(tǒng)的優(yōu)化方案
根據(jù)對WorldCat標注系統(tǒng)自身情況和對用戶使用情況的調(diào)查,參考其他同類標注系統(tǒng),制定針對WorldCat標注系統(tǒng)的優(yōu)化方案。優(yōu)化方案實施后,根據(jù)成效對方案進行評估,再根據(jù)評估結(jié)果對WorldCat標注系統(tǒng)優(yōu)化方案進行調(diào)整。對于會將WorldCat標注系統(tǒng)性能和客戶體驗顯著提升的優(yōu)化措施保留并加強,反之則考慮弱化或剔除。
4 結(jié)語
WorldCat標注系統(tǒng)作為標注系統(tǒng)的一種,有助于用戶在自己理解的基礎(chǔ)上對書目信息進行組織管理,提高書目信息的使用率。針對WorldCat標注系統(tǒng)的不足,制訂有效的優(yōu)化方案并實施,能夠充分發(fā)揮標注系統(tǒng)的共享功能和社區(qū)聚合功能,更好地體現(xiàn)標注系統(tǒng)的平等性、自由性、開放性和交互性。隨著對用戶標注行為和語義網(wǎng)的研究與應(yīng)用的深化與發(fā)展,WorldCat標注系統(tǒng)能夠?qū)⑵鋺?yīng)用到后續(xù)的優(yōu)化之中,充分發(fā)揮分眾分類法的優(yōu)勢,引導(dǎo)和促進用戶對WorldCat中書目信息的使用。
參考文獻:
[1]王英.Folksonomy與傳統(tǒng)分類法的比較分析及其完善研究[J]. 圖書館學(xué)研究,2010,(2): 45-47,74.
[2]Thmas Marliesel, Caudle Dana,Schmitz Cecilia. To tag or not to tag[J]. Library Hi Tech,2009,27(3):411-434.
[3]黃建年,侯漢清.關(guān)于TAG分類及相關(guān)理論問題的研究[J]. 圖書館雜志, 2008, 27(7): 49-52.
[4]易明等.基于社會網(wǎng)絡(luò)分析的社會化標簽網(wǎng)絡(luò)分析與個性化信息服務(wù)研究[J].中國圖書館學(xué)報,2010,36(3):107-114.
[5]姚曉鋒.用戶標簽和圖書館主題分類的比較研究——以Librarything為例[J].圖書館學(xué)研究,2010,(4): 63-66.
[6]WorldCat Search API(Web service)[EB/OL].[2012-7-16].http://www.worldcat.org/affiliate/tools?atype=wcapi.
作者簡介:黃如花(1968—),女,武漢大學(xué)信息資源研究中心教授、博士生導(dǎo)師;劉鎏(1986—),女,武漢大學(xué)圖書館學(xué)碩士研究生,上海浦東圖書館館員。