胡雪環
(廣東省立中山圖書館,廣東 廣州510110)
對科研機構的屬性特征進行揭示,并實現基于屬性特征關聯的科研機構共現語義網絡構建,是提高未來語義網絡環境下知識檢索、科研評價工作準確率的有效途徑。
目前,不同組織機構根據其應用需求與目的的不同,對機構類型的劃分也各有所異。國家標準《組織機構類型(GB/T 20091—2006)》中按照組織機構的功能和性質,將組織機構的類型確定為:企業、機關、事業單位、社會團體以及其他組織機構五大類[1]。萬方數據公司構建的《中國機構數據庫》中把機構劃分為企業機構、教育機構、科研機構以及信息機構四大類型[1]。
本研究中的科研機構主要是指具有明確研究方向與任務,擁有一定水平的學術帶頭人和一定數量的科學研究人員,并且有持續開展研究工作的基礎條件,能有組織地從事科學研究活動的機構,比如高等院校、科研院所、大型醫療研究機構等。對科研機構的屬性特征進行系統化分析與描述,對于準確定位科研機構信息,查找具有相同屬性的科研機構,揭示科研機構屬性間的關聯關系具有重要的作用。
屬性是對對象的抽象刻畫,具有相同屬性的事物就形成一類。一般而言,機構的屬性信息除了基礎的地址、郵編等常用信息外,還主要包括影響科研評價、知識分析等科研工作的關鍵屬性:類型屬性、學科屬性、地域屬性、水平屬性、行業屬性等。
鑒于科研機構的類型劃分目前并沒有統一的標準,因此,在本研究中,將從實際應用需求的角度出發,以科研機構所從事的重點業務為依據,對科研機構進行劃分,并結合國內科研產出數量的主要機構分布情況將科研機構劃分為:科研院所、高等院校、大型醫療機構、大型企業研發機構以及其他科研機構。
學科是指基于一定的原則,對現實科學體系,按照內在聯系和特征,將具有相同屬性的知識加以歸類,并以合理的邏輯形式表示出來。
對科研機構的學科屬性進行劃分,對于查找某一學科的科研機構群,以及相鄰學科的科研機構等具有重要作用。本研究采取的標準主要是《中華人民共和國學科分類與代碼國家標準》,該標準的實用性原則指出其可直接為科技發展規劃,以及科研經費、科技人才、科技成果統計和管理服務,因此此標準適用于描述各類科研機構的學科屬性。最新的國家標準將學科劃分為5個門類,62個一級學科,748個二級學科以及近6000個三級學科[3]。
地域包括行政區劃和地理區劃兩種,依據《中華人民共和國行政區劃》,目前我國共計被分為34個省級行政區,包括23個省、5個自治區、4個直轄市、2個特別行政區,按照層層劃分的標準,依次又向下劃分若干地級行政區、市級行政區、縣級行政區和鄉級行政區。國家地理區域劃分為華東、華北、華中、華南、西南、西北和東北七大地理分區。
科研機構和其他物理實體一樣,有著固定的地理位置,分布在各個省市區等,開展科研評價時,往往會按照科研單位所在的省、市等行政級別或者所在的地理區劃位置對機構進行統計分析,以方便分析某個省某個市某個地區的學科分布或者行業分布等情況。
為了區別同一類機構的水平或者等級高低,往往會對該類機構按照同一評定標準,制定若干評價指標進行評定劃分,不同科研機構類型對應著不同的水平評定標準。比如,針對高校,目前主要是按照985、211工程高校來衡量其教學水平的高低。而針對醫療機構的水平劃分主要是按《醫院等級劃分標準》,該標準依據醫院功能、技術力量、管理水平、設施等對醫院資質進行評定,三級特等醫院是最高級別的醫院,接下來依次是三級甲、乙、丙等,二級甲、乙、丙等,一級甲、乙、丙等,共計三級十等[5]。
行業是對從事國民經濟中同性質的生產或其他經濟社會的經營單位或者個體的組織結構體系的詳細劃分。行業分類的選取標準主要是依據《國民經濟行業分類》(GB/T 4754—2011),該標準將行業分成三大產業,二十個門類,96個大類[6]。將研發型科研機構按照行業進行分類,對于當地進行產業調整以及行業的宏觀調控等具有參考作用。
科研機構實體之間往往通過特定的屬性特征產生各種類型的關聯關系,對科研機構與其他機構間的關聯關系進行揭示與分析,并理清各類關聯關系之間的邏輯推理規則,對接下來科研機構關聯關系的語義化描述及科研機構語義關系模型的構建實踐具有重要指導作用。
對科研機構的單一屬性進行關聯,可以有效實現查找機構所屬學科的學科層級、相同屬性的科研機構群落等,比如,對機構的學科屬性進行關聯,可以實現查找機構所屬的學科層級,識別相同學科的科研機構群以及近鄰學科等;對機構的水平屬性進行關聯,可以實現查找同一水平的科研機構群落等。
近鄰學科是指具有相同上級學科的同級學科,近鄰學科機構群的查找能幫助識別與某科研機構研究相對緊密的近鄰科研機構,對于促進不同學科之間的交叉融合與合作具有積極的指導作用。
多個不同科研機構間通過兩兩屬性的關聯共現往往能揭示出重要的科研信息,進一步服務于科研評價以及科研網絡布局規劃等實際應用需求。本研究共計確定了八對兩兩屬性關聯關系以及兩對多屬性關聯關系,并對語義模型構建以后所能呈現出的知識發現類型進行說明。具體如下:
(1)行業—地理區劃關聯:揭示某一地區科研機構行業分布情況,或同一行業科研機構的地區分布情況。(2)行業—行政區劃關聯:揭示某一行政區劃內科研機構行業分布情況,或同一行業科研機構的行政區劃分布情況。(3)學科—地理區劃關聯:揭示某一地區科研機構學科分布情況,或相同學科的科研機構的地區分布情況。(4)學科—行政區劃關聯:揭示某一行政區劃科研機構學科分布情況,或相同學科的科研機構的行政區劃分布情況。(5)類型—地理區劃關聯:揭示某一地區科研機構類型分布情況,或同一類型科研機構的地區分布情況。(6)類型—行政區劃關聯:揭示某一行政區劃內科研機構類型分布情況,或同一行業科研機構的行政區劃分布情況。(7)水平—地理區劃關聯:揭示某一地區科研機構不同水平級別的分布情況,或同一級別的科研機構的地區分布情況。(8)水平—行政區劃關聯:揭示某一行政區劃內科研機構類型分布情況,或同一行業科研機構的行政區劃分布情況。(9)地區—水平—學科—類型—行業關聯:揭示某一地區的整體科研網絡布局及科研實力分布等。(10)行政區劃—水平—學科—類型—行業關聯:揭示某一行政區劃的整體科研網絡布局及科研實力分布等。
以上對影響科研評價和知識聚類導航的科研機構關鍵屬性分析和關聯關系揭示,是下一步構建完整的科研機構語義關系模型的重要理論基礎之一。構建全面的科研機構語義關系模型,除了涉及科研機構屬性關系的表達及推理,還涉及科研機構層級關系、科研機構沿革演化以及機構與機構間的合作關系等,這也是接下來本研究要重點探究的內容。