林曉蘭,梁銘標,王 浩,張志輝,江之晗,麻 碩,錢 鵬,谷祥拓,陳秀娟,黃 帥,梁會營*
(1.廣東省人民醫院,廣東省醫學科學院,廣州 510080;2.中國食品藥品檢定研究院醫療器械檢定所光機電室,北京 102629;3.深睿研究院,北京 100089;4.廣州市婦女兒童醫療中心,廣州 510623)
近年來,知識圖譜相關技術迅速發展,知識圖譜在新形勢的推動下逐步拓展出醫學知識圖譜[1]、金融知識圖譜[2]、農業知識圖譜[3]、安全知識圖譜[4]等領域知識圖譜,其中更不乏有風控[5]、營銷[6]等場景化知識圖譜。知識圖譜在技術方面的突破,引發了相關研究者的進一步探索和評估,知識圖譜評測隨即應運而生。知識圖譜評測作為評估知識圖譜技術性能水平的一種手段,能夠為知識圖譜發展提供參考,但同時也面臨著諸多挑戰,如缺乏特定領域內真實場景下的文本數據等知識資源、相關研究匱乏、評測缺乏規范性、評測效力式微、評測數據集偏差、評測指標失真、評測生命期短、評測任務缺乏系統性、評測技術單一、可解釋性較差等[7]。因此,許多評測數據集和評測任務不斷被提出,如通用語言理解評估(general language understanding evaluation,GLUE)[8]、中文語言理解測評(Chinese language understanding evaluation,CLUE)[9]、中文生物醫學語言理解測評(Chinese biomedical language understanding evaluation,CBLUE)[10]、全國知識圖譜與語義計算大會知識圖譜評測(China Conference on Knowledge Graph and Semantic Computing knowledge graph evaluation,CCKS)[11]等,研究者們正在逐步尋求評估知識圖譜技術水平的標準策略。隨著我國醫療領域信息技術的發展和信息化水平的提升,研究面向中文醫學文本的知識圖譜評測被提上日程。
眾所周知,醫學文本中蘊含著大量詳盡而有價值的知識,尤其相較于英文文本,中文醫學文本的處理存在著許多挑戰,例如文本內容口語化、上下語境不豐富、實體關聯困難等[11]。……