,,,,,2
醫學科技評價是醫學科研活動中的重要組成部分,是醫學科技管理工作中的核心內容。好的科技評價方法與體系可以優化科技資源的配置,提高科研人員的積極性,并對推進科技制度創新的完善和發展、營造良好的科研氛圍具有重要的作用。
本體(Ontology)最初是哲學領域概念,是對現實真實存在的客觀描述。20世紀90年代,本體概念被逐步引入人工智能、圖書情報和知識工程等領域,同時也被賦予了新的含義。圖書情報學領域專家張秀蘭通過對國內外各領域本體定義的深入研究,認為本體是通過描述、捕獲領域知識,確定領域內共同認可的概念和概念間的關系,以用于領域內不同主體之間的交流與知識共享的形式化規范說明[1]。
醫學科技評價數據涉及科研機構、項目、科技人才、基金、專利等多項內容,不同概念間關系較為復雜。當前我國科技評價研究中存在科研數據組織系統性欠缺、關系揭示程度差等問題。現存科研本體概念層次體系較為復雜,概念、屬性存在形式各有不同,這對本體的復用造成較大阻礙。構建面向醫學科技評價的科研本體,能夠更好地滿足評價工作的實際需求,進一步完善科技資源的組織方式,展示領域內部的語義關系,從而提高醫學科技評價的效果。
本文擬借鑒現有科研本體相關概念及本體構建方法,在搜集、整合多來源科研信息的基礎上分析科研本體劃分的不同概念層次;通過復用現有科研本體及重構科研信息,構建面向醫學科技評價的科研本體,全方位展示醫學科技評價研究中科技評價對象之間的多種關系;以科研本體為基礎,指導醫學科技評價工作,為建立高級別的醫學科技評價本體提供思路。
當前科學研究工作已經發生變化,大量數據出現并需要管理[2],醫學科技評價研究工作亦是如此。隨著本體技術的日益成熟,科研本體越來越多,但很多本體中同類概念及屬性仍以不同的形式存在和存儲,使本體之間的共享、復用存在較大問題。現有科研本體,如康奈爾大學構建的VIVO(http://vivoweb.org)本體被定義為可語義探索的科研網絡,但VIVO本體的管理、更新、復用較為復雜,關系屬性類目繁多,不適用于科技評價需求,目前沒有解決學科領域本體的建設;BIBO[3]本體對期刊、書目概念做了較好的層級體系劃分,但關系屬性揭示程度不強。
針對科研本體研究現狀及醫學科技評價實際需求,本文在借鑒VIVO、FOAF[4]、EuroCRIS[5]、BIBO、AMiner[6]等相關科研本體或知識圖譜中關于科技評價概念及屬性的同時,根據當前醫學科技評價工作的實際需求,將當前科研領域的關注熱點——學術不端類別和科技創新納入本體模型的基礎上,確定醫學科技評價本體應包含的體系框架(以下簡稱“框架”)(圖1)。

圖1 醫學科技評價體系框架
目前并沒有統一的本體構建方法,應用比較廣泛的本體構建方法主要包括骨架法、METHONTOLOGY法、IDEF5法、TOVE法以及七步法[7]。Protégé具有圖形化的用戶界面,操作簡單,提供詳細的幫助文檔,支持模塊化設計[8]。本文擬結合骨架法和七步法,利用Protégé5.1構建醫學科技評價本體。其流程見圖2。
醫學科技評價本體的相關概念、屬性、關系主要來自文獻調研、國外科研本體以及醫學科技評價領域專家。對國內外醫學領域開展的評價研究進行調研時,可將當前醫學科技評價主體劃分為醫學科技機構評價、人才評價以及成果評價(表1)。
醫學科技評價本體層次體系的構建主要是完善框架所包含大類的子類,分析子類的概念,定義子類的對象屬性及數據屬性。


圖2 醫學科技評價本體構建流程
在醫學科技評價本體中,評價維度是指科研投入、科研產出及學術影響。科技投入反映機構的基礎實力,是開展科技活動的前提和基礎,包括人、財、物等的投入,該維度包括科研平臺和科研項目等方面;科技產出則是衡量科研機構和科研人員創新能力的關鍵,是科技活動所產生的直接成果,該維度包括專利、專著、臨床指南等方面;學術影響是科技成果以及科研人員在學科領域內產生的直接或間接影響[15],反映知識傳播的廣度和深度,該維度包括科研獎項、榮譽稱號、團隊稱號等方面(表2)。

表2 學術影響及下位概念(部分)
本文中科研機構有明確的研究方向和任務,同時具備開展研究工作的基本條件,并組織一定水平的學術帶頭人和一定數量、質量的研究人員長期從事醫學相關研究與開發活動。
科研人員具備一定的生物醫學科學理論知識并從事科學研究工作,以及醫療健康設備開發、生命科學研究、流行病調查研究等。醫學科技評價所涉及的科研機構和科研人員主要按照研究領域進行劃分,因而本文選擇醫學學科中概念外延更加廣泛的學科分類,如“臨床醫學”、“基礎醫學”及“預防醫學及衛生學”等。
學術不端行為也稱“不正當的研究行為”,指學術共同體成員違反學術準則、損害學術公正的行為[16]。近年來有關中國研究學者學術不端的報道屢見報端,國內相關機構、高校陸續出臺學術不端管理方法、學術風氣建設意見。其中《關于加強我國科研誠信建設的意見》《學位論文作假行為處理辦法》《高等學校預防與處理學術不端行為辦法》等多項文件明確定義了學術不端的類型,進一步規范了科研學術生態環境。本文在總結分析國家政策文件、高校及期刊學術不端管理辦法的基礎上,總結了適用于醫學科技評價的學術不端類型(表3)。
根據上述類別概念劃分類的層次體系,在Protégé中進行構建(圖3)。

表3 醫學科技評價本體“學術不端”類別概念及定義

圖3 醫學科技評價本體層次體系的劃分
本體關系屬性的構建是本體具有語義關系的關鍵,關系屬性一般連接兩個實體。本文主要是通過各類實體之間的實際關系和參照各類科研本體及知識圖譜之間的語義關系確定關系屬性。具體確定為21種關系,其中關系“vivo:has_affiliated_organization”、“vivo:has_collaborator”、“vivo:is_predecessor_of”及“ vivo:participates_in”復用于科研本體“VIVO”,關系“affects與affected_by”、“funds與funded_by”以及“teacher_of與student_of”這3對類間關系為互逆(inverse)關系。
在8類語義類型21種關系中,高頻類是“科研機構”與“科研人員”,“科研機構”與除“學術不端”之外的6個類都有語義關系,“科研人員”與除“地理區劃”之外的6個類都有語義關系;中頻類是“科研產出”“學術影響”,“學術影響”與另外5個類產生聯系,“科研產出”與另外3個類產生聯系;低頻類是“科研投入”、“醫學學科”、“地理區劃”以及“學術不端”,“科研投入”與另外3個類產生聯系,“醫學學科”、“地理區劃”以及“學術不端”分別與另外2個類產生聯系。
利用Protégé設置關系屬性,定義屬性的定義域(domain)和值域(range)(表4)。
根據本文目的,邀請中國醫學科學院醫學信息研究所等單位共10余名專家作為咨詢對象。專家遴選的標準如下:對醫學科技評價及相關指標體系具有深入認識及了解,長期從事中國醫院科技量值(Science and Technology Evaluation Metrics)評價研究,具有豐富的實踐經驗。

表4 醫學科技評價本體關系屬性
通過現場展示的方式展示本體模型,收集專家有關本體的意見反饋。專家就本體劃分的維度、語義關系的設置展開了討論,提出以下建議:一是考慮醫學研究的全面性,指標體系中“醫學學科”維度參照教育部學科分類,能夠較全面地揭示當前醫科科研內容,諸如“生物信息學”“互聯網+醫療”等交叉學科研究領域的揭示需深入思考;二是優化科研網絡的揭示效果,傳統指標體系中各指標彼此互不干涉,通過構建各語義類型之間的關系有助于科研網絡的揭示,進一步豐富語義關系類型。
Protégé作為本體建設軟件,能夠進行推理、檢索以及可視化展示。本文在完成本體層次體系構建以及關系屬性定義后,已初步構建完成醫學科技評價本體,但仍需驗證各語義類型之間的關系揭示效果。本文選擇“科研機構”和“科研人員”作為檢索詞進行展示。 在檢索框中輸入“科研機構”和“科研人員”的結果如圖4、圖5所示。分別展開上位類,出現與之相關的各類實體。通過語義關系,證明“科研機構”不僅與各上位類語義類型存在關系,其下位類之間也存在關聯。“科研人員”不僅能夠通過參與科研項目、產出科研成果對學術影響產生積極作用,其本身學術不端行為亦會對“學術影響”造成負面影響。語義關系的揭示是本文研究的重點。通過梳理醫學科技評價相關概念及屬性,構建完成適用于醫學科技評價的本體模型,發現各語義類型之間的相關關聯。圖6展示了8類語義類型及21種語義關系之間的關聯。

圖4 醫學科技評價本體“科研機構”檢索結果
通過可視化可直觀展示了解高頻語義類型及其彼此之間的關系,同時高頻概念的統計能夠為醫學科技評價研究提供新的研究角度。如通過對“學術不端”的分析,發現其對“科研人員”“科研機構”“學術影響”均造成重要影響。
本文從醫學科技評價實際需求入手,建立了醫學科技評價本體,采用模塊化的方法從評價維度和基本信息兩方面構建了包含科研機構、科研人員、學術影響在內的8大類語義類型,每類語義類型可重復使用并易于更新維護。同時完善了科研機構、人員、學術影響之間的語義關系,將學術不端納入本體模塊,從而進一步完善了醫學科技評價體系,明確了醫學科技評價研究領域的研究方向。
但本文仍存在著一定的局限性,如本體語義關系揭示不足、推理效果欠佳等,對于科研評價的信息需求不夠明了,對于科研產出相關信息未明確標準化。下一步應在擴展語義類型及關系的基礎上,創建醫學科技評價實例,完善語義推理規則。