顧復劉 楊圣彥 顧新建



摘要:[目的/意義]科技創新是我國發展的關鍵途徑,需要科技資源的共享和協同創新??萍假Y源共享是一個系統工程,需要建立科技資源的描述模型,在此基礎上進行科技資源集成、評價和分享。[方法/過程]提出科技資源描述模型的結構框架,包括:科技資源分類模型、科技資源元數據模型、科技資源本體模型、科技資源知識元模型、科技資源圖譜模型等。其中,科技資源包括知識、數據、產品、人才、軟件、硬件等資源。本文闡述了科技資源描述模型的特點和作用,并給出科技資源描述模型的建立方法。[結果/結論]本文的主要貢獻是:①通過科技資源描述模型的規范化,有助于不同類型的科技資源的集成分享;②通過科技資源的不同類型的描述模型的集成研究,形成科技資源描述模型的體系架構,為進行科技資源的全面系統描述提供整體解決方案,有助于解決科技資源共享難的問題;③提出科技資源描述模型的建立方法,其特點是利用新一代信息技術依靠大眾共建模型,依靠科技資源描述過程的大數據智能分析技術,建立和優化科技資源描述模型。
關鍵詞:科技資源;科技資源描述模型;模型建立方法;科技資源共享;知識圖譜
分類號:G311
引用格式:顧復, 劉楊圣彥, 顧新建. 科技資源描述模型和建立方法研究 [J/OL]. 知識管理論壇, 2020, 5(2): 69-81[引用日期]. http://www.kmf.ac.cn/p/201/.
1 ?引言
習近平總書記在中國科學院第十九次院士大會、中國工程院第十四次院士大會上的講話中指出:科技體制改革還存在一些有待解決的突出問題,主要是國家創新體系整體效能還不強,科技創新資源分散、重復、低效的問題還沒有從根本上得到解決。
規范、合理、科學的科技資源描述方法是解決科技資源分散、重復、低效問題的有效方法之一。利用科技資源描述方法可從不同角度對科技資源進行規范化,有效支持科技資源的集成、評價和共享。科技資源包括知識、數據、產品、人才、軟件、硬件等不同類型。在這方面已經有不少的研究與應用,但還存在一些不足和進一步的需求:
(1)現有的研究主要集中在對不同類型的科技資源進行各自的描述,但缺乏對不同類型的科技資源進行統一描述,這對不同類型的科技資源的統一搜索和集成不利。例如,對知識圖譜的研究較多[1],而科技資源圖譜包括數據、產品、人才、軟件、硬件等的“圖譜”,這種研究還是比較缺乏。在中國知網中利用“科技資源圖譜”作為主題詞搜索,搜索到的結果為0條,而利用“知識圖譜”作為主題詞搜索,搜索到10 542條結果。
(2)人們已經對一些科技資源的分類模型、元數據模型、本體模型、知識元模型、知識圖譜等進行了分別研究,并且已經有一些國家標準。王志強、楊青海等認為:科技資源開放共享過程中產生了數量龐大、種類繁雜的標準規范,這些標準規范對推動科技資源建設發揮了重要作用,但是也存在著一些問題,如缺乏全局性頂層設計,沒有形成統一的標準化建設體系框架[2]。需要進一步對這些模型進行集成統一研究,并用于科技資源的描述。
(3)在現有的研究中,對知識資源的描述已經有比較系統的方法,需要將這些方法擴展到其它類型的科技資源。
筆者將對這些問題進行研究,這有助于科技資源的描述方法的規范化、以及解決科技資源共享難的問題。
2 ?科技資源描述模型的結構框架
科技資源描述是科技資源的一種“畫像”,是對科技資源的分類,是對科技資源的有序化,能夠幫助用戶快速搜索到所需要的科技資源和了解科技資源的主要內容,促進科技資源相互之間的快速集成,解決數據格式不一致和同一概念描述不一致的問題。圖1為科技資源描述模型的結構框架,圖2為科技資源描述模型間的關系。
科技資源描述模型中的各子模型定義如下:科技資源分類模型——描述科技資源的分類信息,以便找到所需要的科技資源;科技資源元數據模型——描述科技資源的主要數據格式,以便科技資源的快速集成;科技資源本體模型——對科技資源的規范性描述,以便準確、全面地找到所需要的科技資源;科技資源知識元——對科技資源內容進行簡要描述,以便快速了解科技資源的主要內容;科技資源圖譜模型——簡要描述科技資源概念間的關系,以便科技資源的搜索和推理。
在科技創新和其他科技工作中,往往需要多種不同類型的科技資源的集成使用,如某研究任務,需要能勝任的研發人員(從人才資源中選擇)、與研發任務相關的產品資源(參考相似產品,提高研發效率)、知識資源(如產品原理,產品可制造性、可裝配性、可維護性等知識)、數據資源(如相似產品的歷史使用數據、維護數據等)、軟件資源(幫助研發的計算機輔助軟件)、硬件資源(如實驗設備、測試儀器等)。
3 ?科技資源分類模型及建立方法
3.1 ?科技資源分類模型的定義
科技資源分類模型是把具有某種屬性或特征的科技資源信息歸并起來,通過其屬性或特征來區別不同類別的科技資源信息[3]。根據不同的科技資源及需求,科技資源分類模型可以分為以下兩種:
(1)樹狀結構的科技資源分類模型。這是采用數字或字母的形式,按照分類編碼的一般原則與方法,對科技資源進行統一分類和編碼,具有層次性和系統性的特點,可以確定任一科技資源在科技資源體系中的位置與相互關系。樹狀結構的科技資源分類模型又被稱為科技資源分類編碼體系[4]、科技資源分類目錄、科技資源標識體系等。與科技資源分類相近的分類編碼體系有制造業信息化服務平臺服務資源分類編碼[5]、網絡化制造環境下的制造資源分類編碼[6]、企業信息分類編碼[7]等。具體的科技資源的分類編碼標準已經有工藝分類編碼[8]、零件分類編碼[9]等。
樹狀結構的科技資源分類模型首先按照科技資源的性質不同進行基本分類。表1介紹了科技資源現有的一些分類理論,體現了科技資源分類的多樣性。
其中:中國科技資源代號為CSTR;科技資源標識注冊機構代碼為5位碼;科技資源類型代碼為2位碼;內部標識符不定長,由科技資源標識注冊機構分配,確保在同一科技資源標識注冊機構注冊的每個科技資源的內部標識符的唯一性。
該方法的缺點是:對于同一科技資源(如某科技文獻),不同科技資源標識注冊機構給出的科技資源標識符是不同的。但如果不考慮科技資源標識注冊機構,面對如此眾多的科技資源,要建立統一的科技資源標識符是很難的。
(2)關鍵詞結構的科技資源分類模型。采用關鍵詞或者標簽(tag)等方式進行科技資源的屬性或特征的表征和描述。這里的關鍵詞或者標簽往往是大眾編制,所以又稱大眾分類法。這類分類體系比較適合互聯網中的資源分享[18]。表2為兩種科技資源分類模型的比較:
3.2 ?科技資源分類模型的需求
科技資源分類模型的需求主要包括如下幾個方面:
(1)有助于科技資源的統一有效組織管理和共享服務;
(2)通過建立科技資源的分級標準,支持科技資源的開放和共享;
(3)具有規范化和標準化的特性,支持科技資源的供需匹配;
(4)可以快速定位到所需要的科技資源,支持科技資源共享。
3.3 ?科技資源分類模型的建立方法
(1)樹狀結構的科技資源分類模型的建立方法。本文主要關注企業、平臺的科技資源分類模型。因為國際、國家的科技資源分類模型比較寬泛,難以滿足具體企業、平臺的具體需求。
本文參考《中國圖書館分類法》《GB/T 32843-2016科技資源標識》、國際專利分類體系(IPC)等分類體系,在此基礎上進行擴展建立企業或行業平臺的科技資源分類模型?!吨袊鴪D書館分類法》(簡稱《中圖法》)是當今國內圖書館使用最廣泛的分類法體系。目前國際上主要的專利分類體系有國際專利分類體系(IPC)、日本專利分類體系(FI/F-term)、美國專利分類體系(USPC)、歐洲專利分類體系(ECLA/ICO)以及聯合專利分類(CPC)等。在知識資源分類方面可以參考《GB/T 23703.7-2014知識管理 第7部分:知識分類通用要求》。
細分類別的科技資源可以參考一些現有標準,2020年1月29日在國家標準信息查詢平臺(http://www.gov.cn/fuwu/bzxxcx/bzh.htm)輸入“分類”搜索到國家標準620個、行業標準704個、地方標準134個。其中不少具有參考價值。
科技資源的樹結構分類體系由本領域專家編制,將科技資源歸入對應的子類,檢索時可按樹狀結構一層一層地找到所需要的科技資源。科技資源的樹結構分類體系的建立應遵循科學性、系統性、可延性和兼容性的原則,要盡可能請領域專家參與。
科技資源的內容和概念隨時間不斷變化,科技資源分類模型需要與時俱進,不斷維護,或者在編碼搜索系統中建立對應表,實現在不同時期的科技資源分類模型的統一搜索,這樣可以解決傳統的科技資源分類模型修改難、靈活性差等問題。例如,通過構建基于互聯網的科技資源分類模型建立、維護和應用平臺,來提高傳統科技資源分類模型的靈活性和易維護性。
(2)關鍵詞結構的科技資源分類模型的建立方法。主要采用大眾分類法,即關鍵詞或標簽是由大眾自己選擇。①關鍵詞的定義:出現在文獻的標題、摘要以及正文中,能夠表達文獻主題內容、可作為檢索入口的未經過規范化的自然語言詞匯[19]。②標簽的定義:不依賴于固定分類,通過用戶針對內容添加的簡短描述,以方便搜索[20]。
關鍵詞結構的科技資源分類模型最大的問題是隨意性較大、規范性較弱,這顯著增加了搜索或匹配科技資源的難度。但在互聯網環境中,隨著關鍵詞或標簽用戶數的增加,這種隨意性將會顯著減少,因為如果科技資源發布者所采用的關鍵詞或標簽太隨意、不規范,就會使其發布的科技資源難以被人搜索和利用,達不到其發布科技資源的目的;同樣,如果科技資源搜索者所采用的關鍵詞或標簽不規范,就會使其難以搜索到想要的科技資源。最終對于同一科技資源,大家就會趨向于采用同樣的關鍵詞或標簽。這是一種自組織優化的模式,互聯網平臺要為促進關鍵詞或標簽的自組織優化提供良好的環境。例如,當用戶輸入關鍵詞或標簽時,平臺提示該關鍵詞或標簽是否是常用的,并根據科技資源的特點智能推薦常用的關鍵詞或標簽。
關鍵詞或標簽可以采用本體模型進行優化,提高基于關鍵詞或標簽的科技資源的搜準率和搜全率,具體見第5節。
4 ?科技資源元數據模型及建立方法
4.1 ?科技資源元數據模型的定義
科技資源元數據規范了科技資源描述空間的維度,是描述數據的數據(data about data),用于描述科技資源(包括實物資源和信息資源)的內容、覆蓋范圍、質量、管理方式、數據的所有者以及提供方式等有關信息的數據[28]。關于元數據有不同的定義:
(1)關于數據的數據[21]。
(2)定義和描述其他數據的數據[22]。
(3)關于數據或數據元素的數據(可能包括其數據描述),以及關于數據擁有權、存取路徑、訪問權和數據易變性的數據[23]。
(4)描述數據及其環境的數據[24]。
(5)描述物聯網數據及其相關信息的數據[25]。
(6)關于數據的數據,主要是描述數據屬性(property)的信息[26]。
(7)描述科技報告的一種結構化數據,用于實現檢索、管理、使用、保存等功能[27]。
這種元數據定義的多義性說明了建立統一的科技資源元數據的難度。
科技資源的元數據包括:科技資源名稱、類型、發布者、發布時間、存放地點、關鍵詞等[28]。對不同的科技資源(如知識、數據、人才、產品、軟件、硬件等)有相應的元數據模型,有些已經有標準,需要考慮盡可能采用。
4.2 ?科技資源元數據模型的需求
不同的人對科技資源描述空間的維度往往有不同的定義,這就導致了科技資源集成難和搜索難。科技資源元數據通過對科技資源對象進行統一規范描述,有助于對科技資源的組織、集成、檢索、發現和管理[30]。
4.3 ?科技資源元數據模型的建立方法
(1)參考已有的科技資源元數據模型,調查搜集盡可能多的科技資源元數據,建立科技資源元數據參考模型庫。2020年1月29日在國家標準信息查詢平臺(http://www.gov.cn/fuwu/bzxxcx/bzh.htm)輸入“元數據”搜索到國家標準66個、行業標準53個、地方標準24個。例如,目前已經有《GB/T 36478.3-2019 物聯網 信息交換和共享 第3部分:元數據》《GB/T 38154-2019重要產品追溯 核心元數據》《GB/T 37282-2019 產品標簽內容核心元數據》《GB/T 37600-2018 全國主要產品分類 產品類別核心元數據》《GB/T 35430-2017 信息與文獻 期刊描述型元數據元素集》《GB/T 35397-2017 科技人才元數據元素集》《GB/T 30535-2014科技報告元數據規范》《GB/T 30523-2014 科技平臺 資源核心元數據》《GB/T 30522-2014 科技平臺 元數據標準化基本原則與方法》《GB/T 30522-2014 科技平臺 元數據標準化基本原則與方法》《GB/T 26499.3-2011機械 科學數據 第3部分:元數據》《GB/T 25100-2010信息與文獻 都柏林核心元數據元素集》《GB/T 24662-2009 電子商務 產品核心元數據》《GB/T 18391-2009信息技術 元數據注冊系統(MDR)》《GB/T 22373-2008 標準文獻元數據》《GB/T 22373-2008 標準文獻元數據》等。
(2)從科技資源元數據參考模型庫中,根據需要選擇合適的科技資源元數據。如果元數據數量太多,使用不便;元數據數量太少,則描述不完整。需要進行元數據的相關性分析,去掉相關性較大的兩個元數據中的一個;需要進行元數據的重要性評價,把對科技資源描述價值相對較小的元數據去掉;元數據的數量最終要考慮科技資源描述的完整性、特征可識別性、可分類性等;元數據的數量還與科技資源的其他具體描述需求有關;元數據選擇與元數據建立和管理的信息化水平有關,當信息化較高時,元數據的數量可以多些。
(3)科技資源元數據類型可以由專家協商確定,也可以通過大數據分析得到,或者由專家協商和大數據分析共同得到。
(4)協同建立科技資源元數據模型的標準。該標準涉及面廣、用戶多,因此可以采用維基(Wiki)模式,組織廣大用戶參與,協同提出和修改科技資源元數據模型的標準。
科技資源核心元數據的定義是:描述科技資源最基本信息的元數據最小集合(修改自GB/T 30523-2014科技平臺 資源核心元數據),包括:科技資源中文名稱和英文名稱、科技資源發布者、科技資源發布時間(最近提交日期)、科技資源存放地點(信息鏈接地址)、科技資源知識元、科技資源關鍵詞(或標簽)、科技資源標識編碼、科技資源標準本體和關聯本體。
元數據建立方法可以參考《GB/T 30522-2014 科技平臺 元數據標準化基本原則與方法》《GB/T 26499.3-2011機械 科學數據 第3部分:元數據》。
5 ?科技資源本體模型及建立方法
5.1 ?科技資源本體模型的定義
本體沒有統一的定義,以下給出一些不同領域的國家標準對本體的定義:
(1)在大數據語境下,它是一些約束后續各種不同層次邏輯模型的語義模型[19]。
(2)計算機科學領域的一種模型,用于描述用一套對象類型(概念或者說類)、屬性以及關系類型所構成的世界[31]。
(3)被表述為一系列相互關聯的概念與定義,這種表述類似于敘詞表中的術語。但是,本體不是術語標準[32]。
(4)使用計算機能夠處理的語言對論域的描述[33]。
(5)在文化遺產信息資源領域,基于本體的模型用于將異構、分散的文化遺產信息源進行集成、交換,有助于形成通用的、規范的本體模型,給領域專家對信息的編制和關聯檢索提供指南[34,36]。
許多領域需要通過本體構建,實現相關業務的標準化工作;同時,本體也是基于Web應用的互操作問題的關鍵。因此業界正在陸續制定相關的本體標準。
本文對科技資源本體定義是:科技資源本體模型規范了同一科技資源的名稱術語及不同名稱術語間的關系。
5.2 ?科技資源本體模型的需求
不同的人對科技資源往往有不同的名稱術語及名稱術語的關系,這就導致了科技資源集成難和搜索難。面對龐大的科技資源和名稱,主要存在以下問題:
(1)有時同一科技資源有多種名稱術語,一種名稱術語描述多種不同的概念,這對科技資源的集成帶來諸多不便。一方面需要通過標準化、規范化的方法解決這些問題,例如,采用數據字典[35]-[36]等方式;另一方面可以通過本體方法,建立標準本體和關聯本體。標準本體對應描述某一概念的標準術語,關聯本體對應描述這一概念的其他術語。在信息搜索時標準本體與關聯本體一起用于搜索??萍假Y源本體模型通過對科技資源對象進行統一規范的描述,有助于對科技資源的組織、集成、檢索、發現和管理。
(2)有時同一科技資源有多種概念結構,這對科技資源的集成也帶來諸多不便。本體有助于解決同一概念的名稱多樣化問題和概念結構混亂帶來的問題。名稱多樣化問題會進一步導致科技資源共享和利用中出現如下問題:①搜索到的科技資源信息不完整;②搜索到的科技資源信息不準確;③科技資源信息集成難。概念結構混亂會帶來科技資源分類混亂、資源集成難和搜索難的問題。而科技資源本體模型,有利于實現科技資源的共享、集成、服務,例如:
參考文獻:
[1] 黃恒琪, 于娟, 廖曉等. 知識圖譜研究綜述[J]. 計算機系統應用, 2019, 28(6): 1-12.
[2] 王志強, 楊青海.科技資源開放共享標準體系研究[J]. 中國科技資源導刊, 2016, 48(4): 19-23.
[3] 董明濤, 孫研, 王斌.科技資源及其分類體系研究[J]. 合作經濟與科技, 2014(10): 28-30.
[4] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.企業信息分類編碼導則第1部分: 原則與方法:GB/T 20529.1-2006[S]. 北京: 中國標準出版社, 2007.
[5] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.制造業信息化服務平臺服務資源分類規范:GB/T 34045-2017[S]. 北京: 中國標準出版社, 2018.
[6] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.網絡化制造環境下的制造資源分類:GB/T 25111-2010[S]. 北京: 中國標準出版社, 2010.
[7] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會. 企業信息分類編碼導則第2部分: 分類編碼體系: GB/T 20529.2-2010[S]. 北京: 中國標準出版社, 2011.
[8] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.面向裝備制造業產品全生命周期工藝知識第2部分: 通用制造工藝分類編碼規范: GB/T 22124.2-2010[S]. 北京: 中國標準出版社, 2011.
[9] 陜西省市場監督管理局.基于成組技術的零件分類編碼要求:DB61/T 1224-2018[S]. 北京: 中國標準出版社, 2018.
[10] 涂勇, 龔雪媚, 趙輝.科技資源管理標準體系的研究[J]. 中國科技資源導刊, 2012(6): 41-44.
[11] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.科技資源標識:GB/T 32843-2016[S]. 北京: 中國標準出版社, 2016.
[12] 孫凱.科技資源共享可行性分析及對策建議[J]. 西北大學學報(哲學社會科學版), 2005, 35(3): 109-112.
[13] 王雪.區域科技共享平臺服務模式與運行機制研究[D]. 哈爾濱: 哈爾濱理工大學, 2015.
[14] 范菲雅, 倪炎榕, 袁曉舟, 等. 網絡化制造環境下基于語義Web的應用服務資源模型[J]. 計算機集成制造系統, 2009(8): 53-59.
[15] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.科技平臺資源核心元數據:GB/T 30523-2014[S]. 北京: 中國標準出版社, 2015.
[16] 劉玲利.科技資源要素的內涵——分類及特征研究[J]. 情報雜志.2008(8): 125-126.
[17] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.科技資源標識:GB/T 32843-2016[S]. 北京: 中國標準出版社, 2017.
[18] 顧復, 陳芨熙.一種基于標簽的產品和零部件網頁的自組織分類編碼方法[J]. 成組技術與生產現代化, 2007, 24(2): 57-60.
[19] 國家市場監督管理總局, 國家標準化管理委員會.新聞出版知識服務知識資源建設與服務基礎術語:GB/T 38377-2019[S]. 北京: 中國標準出版社, 2020.
[20] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.信息與文獻期刊描述型元數據元素集:GB/T 35430-2017[S]. 北京: 中國標準出版社, 2018.
[21] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.信息技術元數據注冊系統(MDR): GB/T 18391-2009 [S]. 北京: 中國標準出版社, 2010.
[22] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.信息技術詞匯第17部分: 數據庫:GB/T 5271.17-2010[S]. 北京: 中國標準出版社, 2011.
[23] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.物聯網術語:GB/T 33745-2017[S]. 北京: 中國標準出版社, 2018.
[24] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.物聯網信息交換和共享第3部分: 元數據:GB/T 36478.3-2019[S]. 北京: 中國標準出版社, 2020.
[25] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.科技人才元數據元素集:GB/T 35397-2017[S]. 北京: 中國標準出版社, 2018.
[26] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.科技報告元數據規范:GB/T 30535-2014[S]. 北京: 中國標準出版社, 2015.
[27] 劉春燕, 安小米.基于生命周期的科技信息資源共享元數據研究[J]. 情報理論與實踐, 2018, 41(5): 39-43.
[28] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會.科技平臺資源核心元數據:GB/T 30523-2014[S]. 北京: 中國標準出版社, 2015.
[29] 趙啟陽, 張輝, 王志強.科技資源元數據標準研究的現狀分析與新的視角[J]. 標準科學, 2019(3): 12-17
[30] 國家質量監督檢驗檢疫總局, 國家標準化管理委員會信息技術大數據術語:GB/T 35295-2017[S]. 北京: 中國標準出版社, 2018.
[31] 國家市場監督管理總局, 國家標準化管理委員會.信息與文獻文化遺產信息交換的參考本體:GB/T 37965-2019[S]. 北京: 中國標準出版社, 2020.
[32] 國家市場監督管理總局, 國家標準化管理委員會.信息技術互操作性元模型框架(MFI)第3部分: 本體注冊元模型:GB/T 32395-2015[S]. 北京: 中國標準出版社, 2016.
[33] 國家市場監督管理總局, 國家標準化管理委員會.智能運輸系統 數據字典要求:GB/T 20606-2006[S]. 北京: 中國標準出版社, 2007.
[34] 國家市場監督管理總局, 國家標準化管理委員會. 新聞出版 知識服務 知識元描述:GB/T 38381-2019[S]. 北京: 中國標準出版社, 2020.
[35] 國家市場監督管理總局, 國家標準化管理委員會.基礎地理信息要素數據字典 第1部分: 1∶500 1∶1000 1∶2000比例尺:GB/T20258.1-2019[S]. 北京: 中國標準出版社, 2020.
[36] 顧新建, 馬步青, 代風. 基于大數據的知識共享方法研究[J]. 知識管理論壇, 2016(1): 30-38.
[37] 畢經元.基于Web2.0的知識元鏈接網絡系統[D]. 杭州: 浙江大學, 2010.
[38] AMITS. Introducing the knowledge graph[R]. America:Official Blog of Google, 2012.
[39] 杜鵬程, 吳婷 , 王成城.科技人力資源研究領域的知識圖譜分析[J]. 中國科技論壇, 2013(8): 83-89.
[40] 馬亞寧. 上海人工智能公共研發資源圖譜[N]. 新民晚報, 2019-08-30(1).
[41] TANG J, ZHANG J, YAO L, et al. ArnetMiner: extraction and mining of academic social networks[C]//Proceedings of the ACM SIGKDD international conference on knowledge discovery and data mining.New York:Association for Computing Machinery, 2008: 990-998.
[42] ZOU L, ?ZSI M T, CHEN L, et al. gStore: a graph-based SPARQL query engine[J]. The VLDB journal, 2014, 23(4): 565–590.
[43] 畢經元, 顧新建, 呂艷, 等.基于知識元鏈接的汽車零部件知識管理系統[J]. 浙江大學學報(工學版), 2009, 43(12): 2208-2213.
作者貢獻說明:
顧 ?復:標準和其他文獻的分析,論文的寫作;
劉楊圣彥:論文部分內容的寫作,文獻查閱;
顧新建:提出論文的總架構,修改論文。
Description Method of Scientific and Technological Resources
Gu Fu ?Liu Yangshengyan ? Gu Xinjian
School of Mechanical Engineering, Institute of Industrial Engineering, Zhejiang University, Hangzhou 310027
Abstract: [Purpose/significance] Scientific and technological innovation is the key point of development, and scientific and technological resources sharing and collaborative innovation are indispensable. Sharing of scientific and technological resources is a systematic project, and first of all, in order to integrate, evaluate and share scientific and technological resources, we need to establish a description model of scientific and technological resources. [Method/process] The description model of science and technology resources defined in this paper includes classification model of scientific and technological resources, meta data model of science and technology resources, ontology model of science and technology resources, knowledge meta model of science and technology resources, science and technology resource graph model, etc. Scientific and technological resources include knowledge, data, products, talents, software, hardware and other resources. We proposed the method of establishing the model of science and technology resources description, as well as the characteristic and function of it. [Result/conclusion] The main contributions of this paper are as follows: standardizing the description model of science and technology resources is helpful for the integration and sharing of different types of science and technology resources; by the integration research of different types of description models of science and technology resources, we form the system architecture of the description model of science and technology resources, which provides an overall solution for the comprehensive and systematic description of science and technology resources, and helps us to share the science and technology resources; we put forward a method to build a description model of science and technology resources, based on crowd-sourcing theory and big data AI of description process of scientific and technological resources, and we establish and optimize the description model of science and technology resources.
Keywords: science and technology resource ? ?science and technology resource description model ? ?method of modeling ? ?science and technology resource sharing ? ?knowledge graph