999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于《中國分類主題詞表》構(gòu)建圖檔博實體資源主題詞表的研究與思考

2025-05-26 00:00:00呂葉欣鄭思遠(yuǎn)
河北科技圖苑 2025年1期
關(guān)鍵詞:詞匯資源

中圖分類號:G254.2 文獻(xiàn)標(biāo)識碼:ADOI:10.13897/j.cnki. hbkjty.2025. 0005

0 引言

隨著信息時代的飛速發(fā)展,圖書館、檔案館與博物館(以下簡稱“圖檔博”作為文化與知識傳承的三大支柱,其館藏資源的數(shù)字化轉(zhuǎn)型與整合共享已成為信息科學(xué)領(lǐng)域的研究熱點之一[1]。圖檔博實體資源的范疇龐大,不僅涵蓋了傳統(tǒng)意義上的書籍、期刊、報紙等文獻(xiàn)資料,還包含更為廣泛的文化遺產(chǎn)和實物資料,如個人或機(jī)構(gòu)的手寫或打印文件、古代石刻的拓印件、郵票、錢幣、繪畫、雕塑、攝影、書法作品、動植物標(biāo)本、礦物標(biāo)本等。然而,現(xiàn)有的分類體系、主題標(biāo)引及元數(shù)據(jù)描述等方式在面對海量實體資源和多元化的用戶需求時顯示出局限性,諸如資源間缺乏深度關(guān)聯(lián),實體資源整合滯后以及機(jī)構(gòu)間存在專業(yè)壁壘等問題。這些問題限制了資源潛力的發(fā)揮,也阻礙了跨領(lǐng)域、跨時空的知識交流與傳播。

近年來,我國出臺了一系列政策法規(guī)[2-3],強(qiáng)調(diào)了圖檔博資源的整合與融合發(fā)展的重要性。圖書館、檔案館與博物館之間的界限逐漸模糊,三者開始尋求更多的合作機(jī)會以實現(xiàn)資源共享和服務(wù)優(yōu)化。2022年7月中國國家版本館的成立,標(biāo)志著涵蓋多種館藏資源類型的集成化管理邁出了重要一步。同時,跨界合作的聯(lián)合辦展日益增多,如市文博系統(tǒng)與檔案系統(tǒng)首次聯(lián)合舉辦的“的胡同四合院”,以及與民間收藏機(jī)構(gòu)和高校聯(lián)合呈現(xiàn)的“版畫中軸——珍藏版畫典籍展”。這些合作不僅有效結(jié)合了不同機(jī)構(gòu)的資源優(yōu)勢,豐富了展覽內(nèi)容,提高了公眾的文化體驗,還促進(jìn)了不同機(jī)構(gòu)之間的知識交流與資源共享。

在實踐中有效管理和利用跨界資源仍面臨諸多挑戰(zhàn),包括如何實現(xiàn)資源的標(biāo)準(zhǔn)化建設(shè),構(gòu)建支持資源共享的技術(shù)平臺,提高資源檢索效率以及提升利用效果等問題。基于此背景,本研究提出一種新的方法論框架,旨在構(gòu)建一個既能跨越領(lǐng)域界限,又能深度融合圖檔博實體資源的綜合性主題詞表,即基于《中國分類主題詞表》(以下簡稱《中分表》)構(gòu)建圖檔博實體資源主題詞表。這不僅能為圖檔博實體資源整合與知識挖掘提供新的視角,還能成為連接文獻(xiàn)、實物、數(shù)字資源的橋梁,為不同領(lǐng)域?qū)嶓w資源的知識組織提供參考框架與路徑,對機(jī)構(gòu)知識管理、應(yīng)用與研究具有重要的理論與實踐價值。

1 研究背景

1.1圖檔博領(lǐng)域主題詞表構(gòu)建現(xiàn)狀

主題詞表是圖情領(lǐng)域資源建設(shè)的一種知識組織工具,其由詞匯和詞間關(guān)系組成,能夠為多文獻(xiàn)集合提供基于知識關(guān)聯(lián)和知識導(dǎo)航框架,并基于敘詞表進(jìn)行信息擴(kuò)檢、縮檢和關(guān)聯(lián)檢索[4]。在圖檔博領(lǐng)域,主題詞表的建設(shè)已取得一定成就。國際上有美國國會圖書館編纂的《國會圖書館標(biāo)題表》(LCSH)[5],英國文化遺產(chǎn)基金會、國家檔案館和倫敦大學(xué)共同資助的《英國檔案主題詞表》(UKAT)[等,以及美國蓋蒂研究所發(fā)布的一系列針對特定領(lǐng)域或?qū)n}的標(biāo)準(zhǔn)如《藝術(shù)和建筑敘詞表》(AAT)、《文化對象名稱規(guī)范表》(CONA)等[,這些均為全球圖檔博資源的描述與檢索提供了堅實基礎(chǔ)。國內(nèi)以《漢語主題詞表》8《中分表》9最具影響力,另有國家檔案局主持編輯的《中國檔案主題詞表》,我國臺灣地區(qū)推出的《臺灣藝術(shù)與建筑索引典》[°,正在審訂修改階段的《中國文物分類主題詞表》[11]等。此外,如《中國古代樂器文物主題詞表》[12]《敦煌壁畫敘詞表》[13]《中國文物紋飾敘詞表》[14]等細(xì)分領(lǐng)域的敘詞表進(jìn)一步豐富了國內(nèi)圖檔博資源組織的專題體系。盡管如此,面對圖檔博實體資源類型繁多、描述維度復(fù)雜的特點,尚無單一綜合性主題詞表能夠全面覆蓋這一廣闊領(lǐng)域。

1.2 領(lǐng)域主題詞表構(gòu)建方法

隨著人工智能技術(shù)的快速發(fā)展,詞表的構(gòu)建經(jīng)歷了從純手工、計算機(jī)輔助到自動構(gòu)建的發(fā)展歷程,諸多學(xué)者對詞表自動構(gòu)建展開廣泛探索。邵衛(wèi)等[15]提出了基于依存句法分析和詞性特征結(jié)合詞間關(guān)系構(gòu)建科技政策領(lǐng)域主題詞表;王曉雪等[16提出了利用規(guī)則方法和機(jī)器學(xué)習(xí),結(jié)合人工調(diào)整,構(gòu)建多源數(shù)據(jù)融合的公共文化領(lǐng)域主題詞表;陳白雪等[17]提出了基于術(shù)語釋義分析獲取詞間關(guān)系的方法;尹延鑫等[18采用Word2vec訓(xùn)練詞向量模型方法構(gòu)建用戶健康詞表,實現(xiàn)了醫(yī)學(xué)專業(yè)用語與用戶健康用詞之間的映射關(guān)系。盡管這些研究為詞表自動構(gòu)建技術(shù)提供了理論基礎(chǔ)和實踐范例,但在處理圖檔博復(fù)雜實體資源的多元化描述維度和跨數(shù)據(jù)源的標(biāo)準(zhǔn)一致性方面尚存挑戰(zhàn)。

1.3 詞表融合難點

當(dāng)前,圖檔博領(lǐng)域雖已編制出版若干主題詞表,但各詞表的編制體例和基本結(jié)構(gòu)各異,詞表間相對獨立,難以實現(xiàn)直接融合。對于不同時間、地域、語言文字、載體類型維度的各類實體資源的揭示,尚未有一個綜合性主題詞表將其全面涵蓋。構(gòu)建普適于各類實體資源的綜合性主題詞表,對實現(xiàn)各類實體資源的主題揭示的融合與統(tǒng)一具有重要意義。主要難點包括:

(1)圖檔博實體資源融合統(tǒng)一的研究相對匱乏。國內(nèi)外圖檔博領(lǐng)域針對實體資源編制的可借鑒的主題詞表數(shù)量尚少,且這些詞表的編制體例、基本結(jié)構(gòu)存在差異,難以直接將各詞表進(jìn)行融合使用,即自前尚無能夠涵蓋圖檔博領(lǐng)域?qū)嶓w資源的綜合性主題詞表。

(2)圖檔博實體資源現(xiàn)行詞表專表專用,缺乏融合。圖書情報領(lǐng)域《中分表》已廣泛應(yīng)用于文獻(xiàn)的標(biāo)引中;文博領(lǐng)域尚未形成系統(tǒng)性的詞表,其主要參考中華人民共和國文物保護(hù)行業(yè)標(biāo)準(zhǔn)《館藏文物登錄規(guī)范》(WW/T0017—2013)等對文物進(jìn)行著錄,但未能實現(xiàn)對文物主題的揭示;檔案領(lǐng)域雖已有《革命歷史檔案主題詞表》和《中國檔案主題詞表》,但兩者在行業(yè)內(nèi)部并未得到有效應(yīng)用。

(3)圖檔博實體資源種類龐雜。從資源內(nèi)容表達(dá)角度來看,圖檔博實體資源涉及文本、制圖、音頻、視頻、多媒體、數(shù)據(jù)集、靜態(tài)圖像、動態(tài)圖像等多種類型。從資源載體來看,這些資源涉及紙制品(如手稿、印刷品)、石器制品(如碑刻)、棉麻制品(如織物)金屬制品(如錢幣)、電子產(chǎn)品(如磁帶、光盤)、數(shù)字產(chǎn)品(如電子文件)等多種載體類型,資源類型范圍廣泛,資源描述維度眾多,各行業(yè)存在專業(yè)壁壘,主題揭示缺乏融合與統(tǒng)一。

因此,理清實體資源描述維度及描述標(biāo)準(zhǔn),制訂科學(xué)的標(biāo)引規(guī)則,通過科學(xué)分類、分面組配等技術(shù)手段,構(gòu)建一個普適于圖檔博領(lǐng)域?qū)嶓w館藏資源的綜合性主題詞表是本研究亟需解決的核心問題。

2 圖檔博實體資源主題詞表編制思路

2.1當(dāng)前圖檔博領(lǐng)域各主題詞表對比分析

當(dāng)前,圖檔博實體資源面臨類型廣泛、描述維度多樣且缺乏統(tǒng)一標(biāo)準(zhǔn)的問題。現(xiàn)有圖檔博領(lǐng)域具有代表性的主題詞表主要包括《中國檔案主題詞表》《中國文物分類主題詞表》與《中分表》(以下統(tǒng)稱“三類詞表”),三類詞表在描述維度、詞匯選擇等方面各有特色,服務(wù)于不同類型的資源管理和信息檢索需求,如表1所示。

除在編制方法、詞匯規(guī)模等方面的差異外,這三類詞表因服務(wù)于不同類型的資源管理和信息檢索需求,在描述維度、術(shù)語收錄及使用情況上也展現(xiàn)出各自的側(cè)重點與特色。例如,《中國文物分類主題詞表》聚焦于文物的物理性質(zhì)與文化屬性,《中分表》關(guān)注于知識的學(xué)科分類,而《中國檔案主題詞表》則側(cè)重于檔案的行政和歷史特性。在術(shù)語收錄上,三類詞表分別強(qiáng)調(diào)與各自領(lǐng)域相關(guān)的專業(yè)詞匯,服務(wù)于各自領(lǐng)域的特性和信息組織需求。這些不一致性的根源在于各領(lǐng)域知識組織的傳統(tǒng)習(xí)慣、關(guān)注焦點的差異以及跨界統(tǒng)一標(biāo)準(zhǔn)的缺失。

鑒于此,考慮到《中分表》具有全局性、系統(tǒng)性和廣泛適用性等特點,能夠滿足圖檔博實體資源主題詞表規(guī)范、全面可拓展、綜合性強(qiáng)等構(gòu)建目標(biāo),本研究選取《中分表》作為頂層框架,并在保持其核心結(jié)構(gòu)前提下,引入并細(xì)化圖檔博實體資源特定領(lǐng)域的概念。

表1各主題詞表的對比分析

2.2 詞表構(gòu)建策略與方法

圖檔博實體資源主題詞表的構(gòu)建旨在提供一個既遵循《中分表》頂層框架,又能深度適應(yīng)圖檔博實體資源特性的綜合受控詞表。該詞表設(shè)計需滿足語義標(biāo)注的規(guī)范性、內(nèi)容的全面性、高度的可擴(kuò)展性,以及對實體資源的精準(zhǔn)揭示能力。構(gòu)建策略與方法如下:

(1)優(yōu)化擴(kuò)充類目與詞匯體系。在《中分表》的宏觀框架內(nèi),依據(jù)圖檔博實體資源的特性,通過科學(xué)性與適用性分析,融入分面分析法思想,對現(xiàn)有類目進(jìn)行必要的細(xì)化、新增,同時在相應(yīng)類目下細(xì)分并擴(kuò)充詞匯,確保對所有實體資源類型的全面覆蓋。在開展廣泛調(diào)研的基礎(chǔ)上,以《中國檔案主題詞表》《中國文物分類主題詞表》《中國古代可移動文物敘詞表》等專業(yè)詞表為主體,同時利用計算機(jī)和網(wǎng)絡(luò)技術(shù)獲取專業(yè)文獻(xiàn)、網(wǎng)絡(luò)資源中篩選的高頻概念術(shù)語以及百科全書、辭海、詞典等工具書中的專業(yè)術(shù)語作為補充。

(2)深化詞間關(guān)系與增強(qiáng)兼容性。在繼承《中分表》詞間關(guān)系的同時,從其他分類法、百科全書等知識組織系統(tǒng)中全面繼承、發(fā)現(xiàn)和挖掘概念間的關(guān)系,采用機(jī)器學(xué)習(xí)等智能技術(shù),并輔以人工識別與判定,實現(xiàn)對詞間關(guān)系的擴(kuò)充、優(yōu)化和兼容。隨著新詞與詞義的變化,詞表應(yīng)具備動態(tài)更新能力,及時調(diào)整詞間關(guān)系,保證其時效性和兼容性,從而有效應(yīng)對知識的擴(kuò)展與更新。

2.3詞表構(gòu)建流程

綜上所述,圖檔博實體資源主題詞表構(gòu)建流程,如圖1所示:

(1)需求分析。詞表應(yīng)充分滿足可擴(kuò)展性、綜合性、精準(zhǔn)性以及普適性的需求,同時對詞表的應(yīng)用場景、適用對象、詞表規(guī)模、編制體例、概念術(shù)語選擇依據(jù)、非主題詞的比例等展開相關(guān)事前研究。

(2)數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)準(zhǔn)備階段是進(jìn)行主題詞表構(gòu)建的開始和基礎(chǔ),選定詞表需要擴(kuò)充的領(lǐng)域,獲取待補充的數(shù)據(jù),并對其進(jìn)行處理。該階段從《中分表》中獲取的數(shù)據(jù)主要包括:分類號、類名、主題詞、限義詞、層級關(guān)系、參照系統(tǒng)等,同時參考相關(guān)領(lǐng)域?qū)I(yè)主題詞表及網(wǎng)絡(luò)資源,通過清洗、去重、過濾等操作,選定待擴(kuò)充的詞匯。

圖1圖檔博實體資源主題詞表構(gòu)建流程

(3)詞表概念框架獲取及補充。詞表概念框架以《中分表》為基礎(chǔ),選擇主題詞和分類號為核心概念術(shù)語集,以主題詞間的層級結(jié)構(gòu)為主要依據(jù),分類法中的分類號所體現(xiàn)的類目關(guān)系為參考構(gòu)建概念關(guān)系,自頂向下構(gòu)建圖檔博實體資源主題詞表的初步框架。

(4)概念選擇依據(jù)及詞匯補充。對于類型龐雜的圖檔博實體資源,根據(jù)其主題標(biāo)引的揭示角度依內(nèi)容和依形式區(qū)分:對于依內(nèi)容區(qū)分的實體資源,通過擴(kuò)增《中分表》總論復(fù)分表形式類的方式,收錄其下相關(guān)詞匯;對于依形式區(qū)分的實體資源,在分析其主題因素的基礎(chǔ)上,在其相應(yīng)的主表類目下通過分面屬性原則收詞。對于領(lǐng)域概念顆粒度較粗,難以對實體資源進(jìn)行深人揭示的,可考慮從其他專業(yè)知識組織系統(tǒng)補充獲取。

領(lǐng)域概念與術(shù)語的收集根據(jù)詞匯量的大小采用人工或人機(jī)協(xié)同的方式進(jìn)行。在本文的試驗性研究中,通過人工審核與篩選,針對特定領(lǐng)域進(jìn)行深度細(xì)化并補充相關(guān)詞匯。以現(xiàn)有相關(guān)領(lǐng)域詞表為主要來源,權(quán)威工具書(百科全書、詞典、術(shù)語表)、專業(yè)文獻(xiàn)(專著、期刊論文、技術(shù)報告、會議錄、專著、報告等)、大型數(shù)據(jù)庫等為補充來源開展詞匯抽取。

在實際構(gòu)建過程中,人工方法難以滿足對大量詞匯的處理需求,因此可采用人機(jī)協(xié)同的方式實現(xiàn)。首先,采用OCR(文本識別)技術(shù)輔以人工校對,對相關(guān)文獻(xiàn)進(jìn)行處理,構(gòu)建語料庫;然后,采用自然語言處理等技術(shù)對語料庫進(jìn)行機(jī)器分詞和新詞發(fā)現(xiàn);經(jīng)過人工歸類與專家審核,自底向上擴(kuò)充詞表術(shù)語并持續(xù)優(yōu)化詞表結(jié)構(gòu)。在此過程中,同時采用自頂向下和自底向上相結(jié)合的方法進(jìn)行詞表內(nèi)容的擴(kuò)充以及詞表結(jié)構(gòu)的優(yōu)化[13]

(5)詞間關(guān)系處理。基于《中分表》為主要框架的互補融合模式中,首先涉及對新增詞匯與已有詞匯的比對和清洗,以確保其準(zhǔn)確融入現(xiàn)有詞匯體系。概念關(guān)系的處理是詞表構(gòu)建過程中的難點,主要包括新舊詞匯的關(guān)系建立與處理。新增詞匯必然會打亂《中分表》原有的概念體系,因此,需要基于《中分表》的分類法,利用人工智能輔助分析新詞語境,構(gòu)建與舊詞的邏輯關(guān)系實現(xiàn)兼容。通過自然語言處理和人工校驗相結(jié)合的模式,對舊詞關(guān)系微調(diào)優(yōu),保持與新詞體系的一致性,確保整體結(jié)構(gòu)完整。詞表的構(gòu)建不僅要考慮當(dāng)前需求,還要考慮到未來的發(fā)展與變化,包括繼承《中分表》原有的詞間關(guān)系,以及通過語義計算等技術(shù)實現(xiàn)概念的演進(jìn)和發(fā)展。

3基于《中分表》的詞表擴(kuò)充效果驗證

本文提出的圖檔博領(lǐng)域?qū)嶓w資源主題詞表構(gòu)建的理論方法,建立在不同維度的大量的實體資源基礎(chǔ)上,所涉收錄詞匯龐大、例證分析復(fù)雜。因此在本文實證研究中,選取郵票、古代錢幣、全形拓三種實體資源類型,采用人工方式開展不同應(yīng)用場景下的細(xì)分領(lǐng)域詞匯選擇的效果驗證。盡管自動化技術(shù)有助于處理大量詞匯,但在某些情況下,尤其是涉及到特定領(lǐng)域詳細(xì)概念的擴(kuò)充時,仍然需要依賴領(lǐng)域?qū)<业娜斯徍伺c篩選。這種方法能夠確保詞匯補充的準(zhǔn)確性和專業(yè)性,特別是在對特定領(lǐng)域?qū)嶓w資源進(jìn)行深人揭示時尤為重要。

3.1通過擴(kuò)增總論復(fù)分表形式類收詞的效果驗證

郵票作為特種文獻(xiàn),種類繁多,涉及歷史、文化、地方政治、經(jīng)濟(jì)發(fā)展多個領(lǐng)域,具有重要的學(xué)術(shù)研究價值。其作為一種廣泛收藏于圖檔博機(jī)構(gòu)的實體資源類型,能夠較好體現(xiàn)圖檔博資源融合的實踐價值,因此首先以郵票為例進(jìn)行說明。根據(jù)《館藏文物登錄規(guī)范》(WW/T0017一2013)[19],郵品的定名需考慮“年代\"\"發(fā)行單位”“主要內(nèi)容\"“器型\"四個要素。根據(jù)郵票的研究重點,歸納總結(jié)出該類資源的主題揭示應(yīng)從“主要內(nèi)容\"“器形\"“年代\"三個分面展開。其中,“器形\"和“年代”是對“主要內(nèi)容\"的修飾,“主要內(nèi)容”在主題標(biāo)引中應(yīng)作為主體因素,“器形”作為形式復(fù)分。

綜上,郵票的標(biāo)引方法根據(jù)郵票表達(dá)和體現(xiàn)的主題內(nèi)容以及宣傳、反映某一事物的需要,按其題材各人其類,載體形式作為形式復(fù)分。因此,在總論復(fù)分表“一79非書資料、視聽資料\"下增設(shè)“一796郵票\"形式類,同時參照郵政行業(yè)標(biāo)準(zhǔn)《中國郵資票品和集郵品的分類與編碼規(guī)則》。" ,擬將郵票按版式、性質(zhì)、用途、材質(zhì)、題材、志號等進(jìn)行分類,并在此分類原則下按分面分析法收錄對應(yīng)的詞匯,如圖2所示。郵票增詞后的詞間關(guān)系,如圖3所示,其中“一796”作為次要類號標(biāo)識。

圖2擬增設(shè)的總論復(fù)分表類目及詞匯
圖3“郵票\"增詞后的詞間關(guān)系

以館藏紀(jì)念郵票《奔向冬奧》為例對總論復(fù)分表“一796郵票\"的使用進(jìn)行說明。該郵票以內(nèi)容角度進(jìn)行主題揭示,其主標(biāo)目應(yīng)為“冬奧會”,“冬奧會\"在《中分表》中的規(guī)范詞為“冬季奧運會”,且該郵票為“紀(jì)念郵票”,應(yīng)對其進(jìn)行總論復(fù)分,即該郵票的標(biāo)引應(yīng)為:冬季奧運會一紀(jì)念郵票一一2022。前述以郵票示例了以內(nèi)容為主標(biāo)目、載體作為形式復(fù)分的實體資源類型標(biāo)引規(guī)則。此類資源在分類標(biāo)引時各入其類,與總論復(fù)分表中的形式復(fù)分號進(jìn)行組配標(biāo)引。實體資源作為形式復(fù)分存在以下情況,不同情況適用不同的標(biāo)引規(guī)則:(1)總論復(fù)分表中已有的類型概念,可直接使用;(2)《中分表》中尚未涉及的實體類型概念,需在總論復(fù)分表中“一4教育與普及\"“一6參考工具書\"“一79非書資料、視聽資料\"等類下新增其形式類,并在其類下按類型的分面屬性增加相應(yīng)的細(xì)粒度概念;(3)主表類目中已存在的載體類型概念,但不屬于總論復(fù)分表的,需在其款目下,通過增加次要類目的方式進(jìn)行調(diào)整。

3.2在主表類目下通過分面屬性收詞的效果驗證

古代錢幣是重要的歷史文物,展示了古代經(jīng)濟(jì)和社會風(fēng)貌,具有極高學(xué)術(shù)研究價值。其雖主要收藏于博物館之中,但圖書館和檔案館也收藏了相關(guān)研究資料和檔案,為古代錢幣的研究提供了重要支持。因此,選擇古代錢幣作為實例,能夠全面展示圖檔博資源在不同機(jī)構(gòu)中的融合與應(yīng)用價值。根據(jù)文物定名規(guī)則,錢幣應(yīng)從“年代\"“錢名(面值)”“質(zhì)地”“器形”四個方面定名。研究發(fā)現(xiàn),《中分表》中的錢幣名稱已較為豐富,但是從器形方面的收詞幾乎為空白。因此,建議在K875.6錢幣類下增設(shè)器形方面的詞匯,或者歸納提取出適用于不同實體資料類型的器形通用概念,歸人“通用復(fù)分表”的“一82形狀、尺寸\"通用概念類下,不作為檢索詞(“一8通用概念”為《中分表》中通用概念主題詞對應(yīng)類目,但不用于類分文獻(xiàn)),供主表各級類目使用,具體類目名稱及相關(guān)收錄詞匯,如圖4、圖5所示。

圖4擬增設(shè)的中國古代錢幣類目及相關(guān)詞匯

總論復(fù)分表

圖5擬增設(shè)的通用概念中有關(guān)“錢幣器形\"的相關(guān)詞匯

以新莽大泉五十青銅錢為例進(jìn)行古代錢幣的主題標(biāo)引說明。該錢幣的錢名為大泉五十,材質(zhì)為青銅,錢幣器形為圓形方孔,錢幣所處的時代為新葬時代,即該錢幣的標(biāo)引應(yīng)為:大泉五十一青銅一新莽時代一圓形方孔。

上述錢幣詞匯的顆粒度在《中分表》中已經(jīng)達(dá)到主題標(biāo)引的揭示標(biāo)準(zhǔn),但仍有部分實物資源的概念詞在《中分表》語義揭示精細(xì)化程度有所欠缺,可采用兼容互補的方式從其他知識組織系統(tǒng)中獲取。為了進(jìn)一步驗證這一方法的可行性與實用性,筆者將以國家圖書館館藏的大克鼎全形拓為例,探討如何在《中分表》中進(jìn)行更細(xì)致的詞匯補充和主題標(biāo)引。

圖檔博單位具有典藏職能,在實體館藏的基礎(chǔ)上,拓片也逐漸成為代表性館藏類型之一。目前,國家圖書館館藏青銅器全形拓共計800余件,是迄今為止最完整收錄全球青銅器全形拓的收藏單位[21]作為一種特殊的文獻(xiàn)形式,全形拓不僅保留了器物的外觀特征,還精確復(fù)制了其上的銘文和其他裝飾細(xì)節(jié),其在學(xué)術(shù)研究中的價值極高,不僅提供了一種幾乎等同于實物的研究材料,也成為了連接圖檔博單位與學(xué)術(shù)界、公眾之間的重要資源類型。

以國家圖書館館藏大克鼎全形拓為例,這件全形拓記錄了西周中期重要青銅器—一大克鼎的外觀與銘文。研究者可能需要了解的具體形制、紋飾、銘文內(nèi)容等信息,在全形拓中都有體現(xiàn)。因此在對其進(jìn)行主題標(biāo)引時,需使用更細(xì)顆粒度的專業(yè)詞匯,以便研究者能夠快速準(zhǔn)確地獲取所需資料。

目前,《中分表》中并未收錄鼎的相關(guān)規(guī)范詞。鼎既是一種禮器,又是一種食具。根據(jù)其應(yīng)用場景的不同,建議在K875.2生活用具類下通過敘詞法的詞義控制將同一詞形的敘詞“鼎\"按所屬范圍(學(xué)科、專業(yè)、地域、時間等)對其含義加以限定,例如增收“鼎(禮器)\"“鼎(食器)\"等主題詞。根據(jù)大克鼎的銘文內(nèi)容,確定其為禮器,實體類型為鼎(禮器),材質(zhì)為青銅,紋飾同樣根據(jù)詞義控制法確定為竊曲紋(紋飾),形制為立耳三足,所處時代為西周時期,其實物類型為全形拓。在以拓印內(nèi)容為主標(biāo)目,以載體為形式復(fù)分的原則指導(dǎo)下,西周大克鼎全形拓的標(biāo)引應(yīng)為:鼎(禮器)一青銅一竊曲紋(紋飾)一立耳一三足一西周時期一全形拓。

4總結(jié)與展望

本文針對圖檔博領(lǐng)域?qū)嶓w資源的知識組織問題進(jìn)行了深人探討,并提出了一種構(gòu)建綜合性主題詞表的理論方法。以《中分表》作為頂層框架,通過類目增補、擴(kuò)充詞表的方法對顆粒度較粗的概念進(jìn)行補充揭示,并以郵票、古代錢幣、全形拓為例,探討利用增設(shè)總論復(fù)分表中形式復(fù)分類收詞、對主表已有類目運用分面分析法收詞,以及細(xì)化詞表中概念顆粒度等方法的可行性與實用性,初步實現(xiàn)了圖檔博資源的融合統(tǒng)一,為資源的高效利用提供重要基礎(chǔ)。

研究也指出了當(dāng)前工作局限在部分實體資源和分面因素的探索上,未來研究還需擴(kuò)展至更廣泛的實體資源類型,建立系統(tǒng)的分面公式,以保證標(biāo)引的一致性和規(guī)范性。同時,構(gòu)建實際詞表時,應(yīng)在取得相關(guān)版權(quán)方的許可,明確許可范圍、期限后開展相關(guān)詞表增補、刪減等工作,充分保證和尊重相關(guān)責(zé)任方的知識產(chǎn)權(quán)。長遠(yuǎn)展望,未來研究應(yīng)繼續(xù)探索如何更廣泛地集成自然語言處理和機(jī)器學(xué)習(xí)技術(shù),在構(gòu)建大規(guī)模、高精度主題詞表時強(qiáng)化詞表的智能化構(gòu)建技術(shù),同時確保詞表的準(zhǔn)確性和時效性,以適應(yīng)實體資源的快速增長和用戶多元化需求變化,進(jìn)一步推動圖檔博實體資源的知識組織與服務(wù)的現(xiàn)代化進(jìn)程。

參考文獻(xiàn)

[1]郭鵬.國際圖博檔三館融合研究的可視化分析[J].山西檔案,2017(5):24-29.

[2]中華人民共和國中央人民政府.中華人民共和國公共圖書館法[EB/OL]. . https://www.gov.cn/xinwen/2017—11/05/content_5237326.htm.

[3]中華人民共和國文化和旅游部公共服務(wù)司.文化和旅游部關(guān)于印發(fā)《“十四五”公共文化服務(wù)體系建設(shè)規(guī)劃》的通知[EB/OL].[2024-2-20].https://zwgk.mct.gov.cn/zfxxgkml/ggfw/202106/t20210623_925879.html.

[4]吳雯娜.我國敘詞表的編制歷史與發(fā)展模式[J].情報理論與實踐,2018,41(6):39-44.

[5]沈正華.《美國國會圖書館標(biāo)題表》第十版簡介[J].大學(xué)圖書館通訊,1987(6):47—49.

[6]UKAT.UK Archival Thesaurus[EB/OL].[2024-02-20].https://www.ukat. org.uk/.

[7]The Getty Research Institute.GettyvocabularieEB/OL].[2024-05-22].https://www.getty.edu/research/tools/vocabularies/index.html.

[8]賀德方.《漢語主題詞表》的回顧與展望[J].情報理論與實踐,2010,33(2):1-4.

[9]國家圖書館《中國圖書館分類法》編輯委員會.《中國分類主題詞表》概況[EB/OL].[2024—02—21].http://clc.nlc.cn/ztfzfbgk.jsp.

[10]中央研究院數(shù)位文化中心.藝術(shù)與建筑索引典[EBOL].[2024—05-22].https://aat.teldap.tw/.

[11]黃明玉.中國文物分類主題詞表構(gòu)建方法學(xué)芻議[J].圖書館學(xué)與資訊科學(xué),2017,43(1):171—190.

[12」黃明玉,付華,王顯國.試論中國古代樂器文物主題詞表的需求與構(gòu)建方法LJ」.科技大學(xué)學(xué)報(社會科學(xué)版),2023,39(4):457-465.

[13」王曉光,侯西龍,程航航,等.敦煌壁畫敘詞表構(gòu)建與關(guān)聯(lián)數(shù)據(jù)發(fā)布[J].中國圖書館學(xué)報,2020,46(4):69-84.

[14]苗孟蔽,黃明玉,潛偉.中國文物紋飾敘詞表構(gòu)建探索——以獸面紋為例[J].自然與文化遺產(chǎn)研究,2019,4(12):96—101.

[15]邵衛(wèi),化柏林.基于依存句法分析的科技政策領(lǐng)域主題詞表無監(jiān)督構(gòu)建[J].情報工程,2020,6(6):33-44.

[16]王曉雪,化柏林.基于多源數(shù)據(jù)融合的公共文化領(lǐng)域詞表構(gòu)建研究[J].圖書館雜志,2022,41(10):25—34,96.

[17]陳白雪,常春,王劉安.基于術(shù)語釋義分析獲取敘詞表詞間關(guān)系[J].圖書情報工作,2017,61(10):125—130.

[18」尹延鑫,李傳富.基于深度學(xué)習(xí)的用戶健康詞表構(gòu)建方法研究[J].醫(yī)學(xué)信息學(xué)雜志,2020,41(8):29-33.

[19]中華人民共和國國家文物局.館藏文物登錄規(guī)范[EB/OL].[2024-02—23].https://hbba.sacinfo.org.cn/attachment/onlineRead/d89c506e21189f3746c6d5e18c23de50d128f380aa93c7dbe5c58c67d9d2075e.

[20]中國標(biāo)準(zhǔn)化研究院.郵資票品和集郵品的分類與編碼規(guī)則[EB/OL]. .https://www.nssi.org.cn/nssi/front/1244l626.html.

[21]國家圖書館.國家圖書館藏青銅器全形拓集成[M].上海:上海書畫出版社,2019.

作者簡介:呂葉欣,女,館員。研究方向:信息組織。

鄭思遠(yuǎn),女,碩士,館員。研究方向:信息分析。

(收稿日期:2024-08-01責(zé)任編輯:侯鵬娟)

Research and Reflections on Constructing the thesaurus of entity resources in LAM Based on the Chinese Classified Thesaurus

Lv Yexin Zheng Siyuan

Abstract: This paper discusses the construction of comprehensive thesaurus for entity resource theme disclosure in the library,archive,and museum (LAM) field,to promote the integration and unification of the entity resources in LAM,and fully taps into the value of the entity resources. Using the Chinese Classfied Thesaurus as the top-level framework, this research supplements and reveals coarse-grained concepts through category additions and thesaurus expansion, accompanied by case studies. The thesaurus for entity resources in LAM can break down knowledge barriers, integrate LAM resources and effectively organize and deeply associate them. This study can also serve as a reference for the knowledge organization of multiple types and forms of entity resources in different fields.

Keywords:Thesaurus; LAM; Knowledge Organization Systems; Entity Resources

猜你喜歡
詞匯資源
讓有限的“資源”更有效
基礎(chǔ)教育資源展示
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
一樣的資源,不一樣的收獲
本刊可直接用縮寫的常用詞匯
資源回收
一些常用詞匯可直接用縮寫
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
本刊可直接用縮寫的常用詞匯
主站蜘蛛池模板: 热九九精品| 精品视频福利| 欧美日韩动态图| Aⅴ无码专区在线观看| 国产97视频在线观看| 欧美精品一区在线看| 国产噜噜噜视频在线观看| 亚洲精品爱草草视频在线| 婷婷综合色| 91九色国产porny| 国产精品女主播| 日本一本正道综合久久dvd| 高清无码不卡视频| 国产精品偷伦视频免费观看国产 | 天天干天天色综合网| 中文字幕亚洲电影| 欧美国产综合色视频| 亚洲无码不卡网| 欧美福利在线| 中文天堂在线视频| 欧美三级日韩三级| 国产丝袜一区二区三区视频免下载 | 国产成人91精品免费网址在线| 亚洲妓女综合网995久久| 亚洲综合18p| 精品免费在线视频| 亚洲第一区欧美国产综合| 国产国产人在线成免费视频狼人色| 18禁不卡免费网站| 波多野结衣久久高清免费| 天堂网亚洲系列亚洲系列| 亚洲伊人久久精品影院| 香蕉视频在线精品| 久久不卡精品| 久久久亚洲色| 四虎成人精品在永久免费| 成人午夜在线播放| 中文字幕佐山爱一区二区免费| 亚洲精品在线91| 亚洲国产精品成人久久综合影院| 国产在线观看91精品| 精品99在线观看| 国产欧美日韩va| 日本福利视频网站| 91高清在线视频| 热伊人99re久久精品最新地| 无码免费视频| 欧美不卡视频在线观看| 欧美啪啪精品| 欧美国产综合色视频| 亚洲精品你懂的| 国产精品任我爽爆在线播放6080| 久久这里只有精品66| 精品一区二区三区自慰喷水| 欧美无遮挡国产欧美另类| 第九色区aⅴ天堂久久香| 色香蕉影院| 精品视频一区在线观看| 欧美日韩精品一区二区在线线| 在线看AV天堂| 色综合天天综合| 无码专区在线观看| 狠狠色噜噜狠狠狠狠色综合久| 囯产av无码片毛片一级| 亚洲国产中文精品va在线播放| 婷婷午夜影院| 日本亚洲国产一区二区三区| 国产极品粉嫩小泬免费看| 99er这里只有精品| 中文字幕色在线| 54pao国产成人免费视频| 国产黄色免费看| 国产人人射| 国产午夜一级毛片| 亚洲欧美综合在线观看| 日韩毛片免费视频| 97在线观看视频免费| 中国国产A一级毛片| 一本大道无码高清| 国产白浆在线| 人人91人人澡人人妻人人爽| 国产精品99久久久久久董美香|