楊雪莉
《中國圖書館分類法》的SKOS化描述研究*
楊雪莉
文章以《中國圖書館分類法》(第五版)為例,采用SKOS方法構建分類法的本體模型,重點探討分類法本體中概念體系、類間關系、類目注釋、復分組配等問題的SKOS化描述方案。通過研究SKOS在分類法描述和本體轉化中的應用,對實現知識組織系統之間的轉化和復用作了初步探索,為實現語義Web中資源的語義共享和語義互操作提供了一種思路。
中國圖書館分類法 SKOS 語義描述
隨著知識組織在網絡環境中的深入應用,對知識組織系統的研究從理論到應用都有了新的發展。相對于傳統的知識組織系統,網絡環境下的知識組織系統具有網絡化、集成化、可視化、智能化、社會化、多元化和全球化的新特點[1]。知識組織系統相關標準規范的制定,分類法、敘詞表、本體等各種知識組織系統之間的互操作及其在網絡信息組織和知識檢索中的集成應用,成為知識組織領域研究的熱點。其中,分類法與本體之間的轉化、映射和重用,充分結合分類法和本體的優點,能夠清晰地揭示知識的含義,充分表達知識系統之間的語義關系,為語義網環境下的知識組織和語義檢索提供科學有效的途徑。
《中國圖書館分類法》(以下簡稱“《中圖法》”)是一部系統的、完整的、大型的綜合性學科知識分類體系,擁有良好的知識分類基礎和廣泛的用戶基礎。《中圖法》歷經多次修訂,發布了一系列的版本和相關輔助工具,如《中國分類主題詞表》(簡稱《中分表》)。目前《中圖法》已經修訂和出版了第五版,并發布了電子版和Web版。隨著信息環境的變化和信息技術的發展,信息資源的海量、無序化和信息用戶的規模化,各種知識分類系統也在不斷發展創新,以適應新環境下用戶對網絡信息組織不斷增長和變化的需求。白華在研究了Web數據庫技術、Ontology與當代分類法的發展后提出以本體論、語義網為借鑒的分類法改造思路[2]。何琳、侯漢清指出《中圖法》在網絡環境下的改造需要滿足機器可處理化和網絡化的需求,打破傳統的數據存儲方式,采用SKOS(Simple Knowledge Organization System,簡單知識組織系統)等語義網術語編碼技術對分類法的語義關系進行精確描述,使之具有機器可處理和數據交換的能力,以便與本體等其他知識組織系統實現集成、復用和共享[3]。筆者擬在此基礎上對《中圖法》的SKOS化描述展開研究。
語義網環境下分類法本體化改造的關鍵是使用計算機可以理解的語言形式化地表示分類詞表的結構特征和內容特征,構建分類法的本體模型,因此,選擇合適的資源描述語言非常重要[4]。萬維網聯盟(World Wide Web Consortium,W3C)推薦了一系列描述知識組織系統的語言描述標準,常用的基于RDF的本體描述語言有OWL、SKOS等。其中,SKOS是W3C提出的一套編碼語言,是一種表示知識組織系統的標準規范,可將敘詞表、專業分類表、通用分類表、標題表等各種傳統的知識組織系統以RDF方式描述,使之具有“機器可讀”能力,為語義網環境下的知識組織提供描述和轉化機制,解決信息資源的語義互操作問題[5]。SKOS定義了一套核心詞匯集:SKOS Core[6]。SKOS Core是由一系列RDF定義的類和屬性組成,這些類和屬性涵蓋了描述各種傳統知識組織系統所用到的標簽,常用標簽見表1,SKOS還有一些擴展標簽,可以為識別、描述和鏈接詞匯條目提供額外支持[7]。

表1 SKOS Core詞匯表常用標簽與說明
從SKOS相關標準的提出、修訂、完善到實踐中的應用,相關領域的專家學者和機構做了大量研究和實驗。目前,與SKOS相關的研究和應用主要集中在知識組織系統的語義描述和語義建模、SKOS在不同敘詞表之間的映射、敘詞表到本體的轉換以及SKOS在關聯數據中的應用等方面。例如,英國檔案敘詞表UKAT、通用多語言環境敘詞表GEMET、澳大利亞公共事務信息服務主題詞表APAIS等詞表都發布了SKOS版本[8];瑞典國家圖書館聯合目錄系統LIBRIS、美國國會圖書館主題詞表LCSH、杜威十進制圖書分類法DDC等為了實現關聯數據化也相繼部分或全部采用SKOS格式編碼[9-11]。相對于國外一些詞表和分類法已經實現SKOS化應用的現狀,國內則還未形成統一標準,大多研究僅限于分析探討和實驗階段。段榮婷研究了基于SKOS實現《中國檔案主題詞表》語義網絡化應用[12];鮮國建等人采用SKOS對農業科學敘詞表(CAT)中的敘詞及詞間語義關系進行描述,并將其轉化為CAT/SKOS格式[13];劉華梅與劉麗斌等人分別從不同的角度對《中國分類主題詞表》進行SKOS化描述及自動轉換研究[14-15];張士男和宋文設計了利用SKOS描述《科圖法》的技術方案,為其他知識組織系統的SKOS化提供了借鑒[16];曾新紅參考SKOS相關編寫體例與核心內容,以傳統的中文圖書分類法和受控詞表作為主要應用對象,設計了“通用的中文網絡知識組織系統(CNKOS)構建規范”和“《中國分類主題詞表》(Chinese Classified Thesaurus,CCT)語義化描述規范”,為中文知識組織系統的SKOS化提供了本地化擴展規范[17]。
依據《中圖法》第五版的結構和內容[18],采用W3C發布的語義描述規范SKOS,結合其標簽詞匯體系,提取分類法的概念體系、概念、類目之間的語義關系、類目注釋、復分等問題,利用SKOS中的類和屬性標簽分別對其進行語義描述,描述語句采用RDF三元組語法格式。
2.1 概念體系描述
SKOS概念體系是一個或多個概念的集合,概念之間的語義關系也是整個概念體系的一部分。SKOS中描述概念體系的詞匯及其含義有:skos:ConceptScheme用來聲明某個資源或知識組織系統是一個概念表,skos:inScheme用來聲明某個概念屬于某個概念表,skos:hasTopConcept可以聲明一個概念表中有一個或多個頂層概念,skos:topConceptOf則可以聲明某個概念是概念表中的頂層概念。
《中圖法》是一部完整的知識組織體系,是眾多類目及類目之間多種語義關系的集合,對其描述時可與SKOS概念體系對應,將整部分類法看作一個概念表ConceptScheme,用clc-Scheme來表示。將其22個一級類目看作該概念表的頂層概念topConcept,用skos:hasTop-Concept來聲明;二級類目用secondConcept表示,用SKOS的擴展語句skosxl:hasSecondConcept聲明;三級類目用thirdConcept表示,用擴展語句skosxl:hasThirdConcept聲明;三級以下類目用bottomConcept來表示,用擴展語句skosxl:hasBottomConcept聲明;分類法中每一個獨立的類目都可以看作一個抽象的實體或一個概念,SKOS用skos:Concept來聲明一個概念,上述各類概念都是skos:Concept的下位類;每個類目對應的概念都在clc-Scheme表中,用skos:inScheme來聲明。具體設計如表2所示。

表2 clcScheme的概念體系
依據上文的設計,用SKOS語句聲明《中圖法》clcScheme是一個概念表ConceptScheme,前綴clc為《中圖法》命名空間URI的簡寫。《中圖法》概念表clcScheme包含22個一級類目即頂層概念,這些頂層概念都屬于概念范疇,以“藝術”大類為例,概念表與頂層概念的關系的代碼描述如下:

?
同理,《中圖法》中二級類目、三級及三級以下類目對應的概念secondConcept、thirdConcept與bottomConcept也可據此描述。
2.2 類目關系描述
《中圖法》是一種層累制的學科分類體系,其類目按照學科之間的內在聯系進行排列,類目之間的多種語義關系支撐起整部分類法的結構,使其形成一個等級有序的分類體系,其類目之間的語義關系主要有四種,分別是等級關系、并列關系、交替關系和相關關系[19]。SKOS定義了相應的屬性標簽來描述概念之間的語義關系,表3從SKOS詞匯表中選取合適的屬性標簽來描述《中圖法》概念表clcScheme中概念類的語義關系。根據表3中clcScheme的語義關系,截取《中圖法》(第五版)中的類目片段進行編碼,可實現分類法中類目間關系的描述。編碼中用到的skos:notation是SKOS中專門用來標記一串字符的屬性標簽,可以用來表示分類法中的分類號,《中圖法》分類號設置為clcSchemeNotation,分類號的描述語句為:skos:notation“分類號”clc:clcSchemeNotation。

表3 clcScheme的語義關系
2.2.1 等級關系描述
等級關系是分類法類目關系中最為直觀明確的語義關系,又稱上下位類關系,其中上位類能包含下位類的外延,下位類可以延續上位類的屬性。SKOS中有兩對互逆屬性標簽可以描述這種上下位的等級關系。由于《中圖法》各級類目之間并不完全具有傳遞性,不適合使用具有語義傳遞性的skos:broaderTransitive和skos:narrowerTransitive來描述類目概念的等級關系。因此,此處使用skos:broader和skos:narrower標簽來表示概念之間的上位和下位關系。例如:類目“繪畫理論”有上位類“繪畫”,又有下位類“繪畫美學”,描述代碼如下:

?
2.2.2 并列關系描述
分類法中類目的并列關系是指劃分在同一層次上的不同類目的關系,同位類和同級類之間都屬并列關系。如果將《中圖法》中擁有同一個上位類外延又不相交的同位類看作一個概念集合里的組成概念,就可以用SKOS中的skos:member和skos:memberList標簽來描述概念之間的并列關系。例如:《中圖法》(第五版)的二級類目“雕塑”有4個下位類,這4個類目是具有并列關系的同位類,用SKOS描述它們之間的并列關系,代碼如下:

?
2.2.3 交替關系描述
《中圖法》中的類目是按線性等級排列的,一個類目在一個線性序列中占據一個位置,為了保證類目序列的等級和實現學科聚類,可以將一個具有多重隸屬關系的事物人為地劃歸某一個類,同時將該事物在不同的上位類下列出,指定一個為正式類目,其他類目為交替類目,正式類目與交替類目之間形成交替關系。為了區分正式類目與交替類目,準確表達二者之間的交替關系,可采用首選標簽skos:prefLabel和交替標簽skos:altLabel。在SKOS中,首選標簽和交替標簽不能相交,一個概念可以擁有多個語種的首選標簽,但同一語種只能有一個首選標簽,若同一概念在同一語種中的首選標簽與交替標簽同名則出錯。《中圖法》對出現交替關系的概念指定一個正式類目,可用首選標簽定義其類號和類名,類號為英文標記,類名為中文標記,因此該類目指向的概念可包含一個中文首選標簽和一個英文首選標簽。例如“TU-8建筑藝術”有交替類目“J59建筑藝術”,用首選標簽定義該類目的分類號“TU-8”,用交替標簽定義其交替類目的分類號“J59”,兩個標簽都采用英文定義,則“TU-8建筑藝術”的類目交替關系描述如下:

?
2.2.4 相關關系描述
分類法的類目之間在內容上有內在的聯系,但不具有等級、并列和交替關系,則類目之間具有相關關系。SKOS中概念之間的相關關系用標簽skos:related來定義,skos:related具有對稱性但不具有傳遞性,相關屬性與其上下位屬性均不相交,因此可用來描述分類法中的相關關系。如類目“J2繪畫”和類目“K879.4古繪畫”之間的參見關系描述如下:

?
2.3 類目注釋描述
類目注釋是對類目的補充說明,主要揭示類目的內容定義、使用范圍、修訂說明、歷史沿革等信息。SKOS中有對應的概念注釋屬性:skos:note、skos:definition、skos:scope-Note、skos:changeNote、skos:historyNote、skos:editorialNote、skos:example等,可用來對《中圖法》中的類目注釋進行描述。如“P403高空氣象學”下有注釋“研究自由大氣(下界為500-1500米)入此。”,這條注釋是對該條類目的涵義加以說明,可用skos:definition描述。代碼如下:

?
2.4 復分描述
《中圖法》中大量使用復分組配技術,通過制定和依照各種通用復分表和專類復分表,利用分類表中已有的類目號碼,對事物進行交叉組配,形成新的類號來表示某些類表中沒有的專指類目[20]。采用SKOS對《中圖法》的復分表進行描述,目前主要有兩種方法:一是通過自定義skos屬性對復表進行封裝和調用[21];二是引入OWL方法,利用合成或組配屬性對主表和附表進行概念組配和類號組合[22]。前者封裝和調用的過程比較復雜,后者理論上相對容易實現。由于分類法的復分問題比較復雜,SKOS現有的詞匯無法直接表示,現有的研究基本都提到擴展SKOS屬性或引入外來交叉屬性。曾新紅就提出了擴展skos:ConceptScheme的子類,自定義輔助表標簽ckos:Auxiliary,以描述分類法的附表[23]。對《中圖法》附表的處理,可將各個復分表作為《中圖法》概念表clcScheme的頂層概念topConcept,復分表的具體描述方案可參照主表描述形式,8個復分表與22個基本大類之間的語義關系亦可參照clcScheme的語義關系描述;同時,由于復分表類目需要和主表類目組配使用,可通過引入或重新定義組配屬性來連接主表類目和復分表類目,達到主附表類目交叉使用的目的。
本文討論分類法本體化的意義和SKOS語言描述分類法的背景,采用SKOS方法在《中圖法》的基礎上構建了一個分類法的本體模型,用SKOS語言描述了《中圖法》分類本體的概念體系、類間關系、類目注釋等內容,并對其復分類目的組配問題提出處理方案,為實現知識組織系統之間的轉化和復用作出初步探索。筆者只對分類法的結構框架和內容概念進行了語義描述,分類主題詞表的轉化和映射、多語種受控詞表的集成、分類法的關聯數據化等問題仍有待進一步研究。
[1]薛春香,侯漢清.知識組織系統及其描述與評價初探[C]//網絡環境下信息組織的創新與發展——全國第五次情報檢索語言發展方向研討會論文集.北京:國家圖書館出版社,2009:59-60.
[2]白華.Web數據庫技術、ontology與當代分類法的發展[J].圖書情報工作,2007,51(1):39-41.
[3]何琳,侯漢清.《中國圖書館分類法》在網絡環境中的適應性改造研究[J].圖書情報工作,2010,54(19):6-9,128.
[4][22]白華.基于OWL方法的分類法本體語義描述探索[J].情報雜志,2012,31(2):124-129.
[5]W3C.SKOS Simple Knowledge Organization System Primer[EB/OL].[2015-04-15].http://www.w3.org/ TR/2009/NOTE-skos-primer-20090818/.
[6]W3C.SKOS Core Vocabulary Specification[EB/OL]. [2015-04-15].http://www.w3.org/TR/2005/WD-swbp-skos-core-spec-20051102/.
[7]W3C.SKOS Simple Knowledge Organization System Reference[EB/OL].[2015-04-15].http://www.w3. org/TR/2009/REC-skos-reference-20090818/.
[8]王一丁,王軍.網絡知識組織系統表示語言:SKOS[J].大學圖書館學報,2007(4):30-35.
[9]黃永文.關聯數據在圖書館中的應用研究綜述[J].現代圖書情報技術,2010(5):1-7.
[10]Ed Summers,Antoine Isaac,Clay Redding,et al. LCSH,SKOS和關聯數據[J].姚小樂,劉煒,譯.現代圖書情報技術,2009(3):8-14.
[11]賈君枝,趙潔.DDC關聯數據實現研究[J].中國圖書館學報,2014(4):76-82.
[12]段榮婷.基于簡約知識組織系統的《中國檔案主題詞表》語義網絡化應用研究[J].現代圖書情報技術,2010(10):33-42.
[13]鮮國建,趙瑞雪,朱亮,等.農業科學敘詞表的SKOS轉化及其應用研究[J].現代圖書情報技術,2012(10):16-20.
[14]劉華梅.《中國分類主題詞表》主題詞SKOS化描述及自動轉換研究[J].圖書館建設,2014(8):29-32,36.
[15]劉麗斌,張壽華,濮德敏,等.《中國分類主題詞表》的SKOS描述自動轉換研究[J].中國圖書館學報,2009(6):56-60.
[16]張士男,宋文.《科圖法》SKOS描述方案設計[J].現代圖書情報技術,2010(6):7-11.
[17]曾新紅.中文知識組織系統形式化語義描述標準體系研究(一)——擴展SKOS實現傳統受控詞表全描述[J].中國圖書館學報,2012(3):57-68.
[18][19]國家圖書館《中國圖書館分類法》編輯委員會.《中國圖書館分類法》第五版使用手冊[M].北京:國家圖書館出版社,2012.
[20]劉華梅.《中國圖書館分類法》(第五版)類目復分仿分詳解[J].圖書館,2014(5):128-131.
[21]何琳,杜慧平.層累制分類表的SKOS化轉換研究評介[J].現代圖書情報技術,2011(6):79-84.
[23]曾新紅.傳統受控詞表的SKOS描述規范及應用指南[J].數字圖書館論壇,2014(4):9-19.
Study on Semantic Description of Chinese Library Classification Based on SKOS
YANG Xue-li
Taking Chinese Library Classification as the study object,this paper builds a new ontology model of classification based on SKOS,in which concept system,semantic relation,category notes and subdivisions are discussed in depth.By studying SKOS application in classification description and ontology transformation,it makes a preliminary exploration on the achievement of transformation and reuse between different knowledge organization systems.This study provides a new way to fulfill the semantic sharing and interoperability in the semantic web.
Chinese Library Classification;SKOS;semantic description
格式 楊雪莉.《中國圖書館分類法》的SKOS化描述研究[J].圖書館論壇,2015(10):43-48.
楊雪莉(1988-),女,碩士,江蘇師范大學圖書館助理館員。
2015-04-28
*本文系江蘇師范大學人文社會科學研究基金項目“語義網環境下基于SKOS的分類法本體化研究”(項目編號:13XWB18)研究成果之一