金家琴,夏翠娟
“本體(Ontology)是對概念體系的明確的、形式化、可共享的規(guī)范說明”,“本體是領(lǐng)域知識規(guī)范的抽象和描述,表達(dá)、共享、重用知識的方法”。本體構(gòu)建的目的是領(lǐng)域知識的共享和重用,標(biāo)準(zhǔn)化和形式化的領(lǐng)域本體,能夠為信息系統(tǒng)之間的高層互操作提供很好的工具[1]。近年來,在跨領(lǐng)域知識共享和重用的需求推動下,本體成為語義網(wǎng)環(huán)境下知識組織和數(shù)據(jù)語義化表達(dá)的關(guān)鍵技術(shù),被廣泛應(yīng)用于關(guān)聯(lián)數(shù)據(jù)(Linked Data)和知識圖譜(Knowledge Graph)技術(shù)中,以實現(xiàn)互聯(lián)網(wǎng)環(huán)境下領(lǐng)域知識的語義互操作。
機構(gòu)(Organization)在管理學(xué)中被定義為“由若干個人或群體所組成的、有共同目標(biāo)和一定邊界的社會實體”。在關(guān)聯(lián)數(shù)據(jù)和知識圖譜中,機構(gòu)被作為一種命名實體(Name Entity),為每一個機構(gòu)賦予URI,用機器可理解的形式化語言來表示機構(gòu)的各種特性和與人、地、時、事等其他命名實體之間的關(guān)系,在數(shù)字人文數(shù)據(jù)基礎(chǔ)設(shè)施構(gòu)建中有著重要的作用。因而,設(shè)計一套靈活可擴(kuò)展的機構(gòu)本體模型和詞表是不可回避的問題。機構(gòu)的名稱、人員、所在地、層級關(guān)系和歷史沿革、變遷等屬性特征以及各機構(gòu)實體間的相互關(guān)系等,包含著復(fù)雜的語義信息。在關(guān)系數(shù)據(jù)庫模型中,實體和實體間的各種聯(lián)系均用二維表表示,一個關(guān)系就是一個二維表,這種單一的數(shù)據(jù)結(jié)構(gòu)在存取數(shù)據(jù)時效率非常高,但同時也丟失了大量的語義信息,無法實現(xiàn)數(shù)據(jù)的語義化表達(dá)。而本體作為一種共享概念模型的明確的形式化描述,為信息提供了語義表示機制?!?br>