于彤 毛郁欣 高宏杰 于琦李敬華 張竹綠
基于移動互聯網的中醫知識推薦方法初探*
于彤①毛郁欣②高宏杰①于琦①李敬華①張竹綠①
中醫藥知識服務領域的一個核心問題是:面對海量的中醫知識資源,如何根據用戶的健康狀況和行為信息,從中自動找出用戶可能關注或感興趣的知識,從而實現中醫知識的主動推薦。移動互聯網因其普及性、便捷性以及強大的個人信息采集和自動感知能力,為解決這一問題提供了理想的平臺。本文介紹個性化知識推薦的概念、背景和技術,闡述基于移動互聯網的中醫知識推薦服務的現狀,提出存在的問題和研究思路。
中醫藥; 知識服務; 知識推薦; 移動互聯網; 移動設備
中醫藥是中華民族優秀文化的一個重要組成部分,它歷史悠久,源遠流長。數千年來,歷代醫家在醫療實踐中積累了豐富的經驗,創立了兼具理論深度和民族特色的中醫藥知識體系,為中華民放的繁衍昌盛作出了杰出的貢獻。隨著我國社會從溫飽到小康的轉型,百姓的生活水平日益提高,開始更加重視生活品質,追求延年益壽,因此對中醫養生保健知識產生了日益強烈的興趣。
近年來,中醫藥領域的信息化建設取得了長足進展,建設了大量的文獻庫和數據庫,形成了相對完整的中醫藥科學數據體系[1]。這些數字化資源中,蘊含著豐富的中醫藥知識。如何將這些知識資源與人民群眾分享,使普通人從中受益,是一個非常重要的問題。基于互聯網的中醫藥知識服務系統能夠整合中醫臨床知識、中醫藥理論知識、中藥方劑知識和中醫疾病知識等中醫藥知識資源,面向網絡用戶提供中醫知識或其他的數字化服務,是在人民群眾中普及中醫藥知識的一種有效手段[2]。
中醫藥知識服務系統一般都實現了知識檢索功能,能幫助用戶從海量的中醫藥文獻和知識資源中迅速找到有關知識[3]。但知識檢索這種服務方式存在固有的局限性。為檢出所需的知識,用戶必須能夠輸入正確的檢索詞。這就要求用戶已關注相關主題,并能用正確的醫學術語將其表述出來。這對于醫學專業人員可能并非難事,但對于普通人往往是一個很大的挑戰。普通人很可能忽視了一些與自身健康有關的知識主題,甚至不清楚在網絡上存在哪些有用的知識檢索服務,因此無法充分獲取在知識庫中已經存在的知識。
為了彌補知識檢索的局限性,可根據用戶的特點向其進行主動的知識推送。不同用戶對中醫藥知識的需求不盡相同,但人們往往對與自身體質和健康狀況相關的中醫藥知識更感興趣。若能根據用戶的特點和偏好,向其提供個性化的知識推薦服務,則可更好地滿足用戶的需要。在下文中,將介紹個性化知識推薦的概念、背景和技術,闡述基于移動互聯網的中醫知識推薦服務的現狀,提出存在的問題和研究思路。
個性化知識推薦,是指根據用戶的特點和偏好,向其提供具有針對性的知識服務。以中醫為例,系統可根據用戶的中醫體質類型,向其推薦與該體質相關的知識;若用戶患有某種疾病,則系統可優先提供該疾病的相關知識。為實現個性化知識推薦服務,需要搜集用戶的個人信息。這些信息可由用戶填寫或設定,也可由用戶使用行為推定。例如,用戶可通過表單填寫(或勾選)其所感興趣的疾病;又如,用戶輸入的檢索詞,可反映出其所關心的主題。系統會為每個注冊用戶構建“用戶模型”,用于描述用戶的特點和偏好,判斷用戶的需求。
當用戶訪問系統時,系統會根據該用戶的模型以及系統自身的推薦邏輯,確定針對該用戶的知識推薦內容。例如,若系統測出用戶屬于氣虛質,則會基于知識庫向用戶推薦氣虛質適宜的飲食(如當季水果等)。個性化知識推薦方法是知識服務系統中的一項核心技術,它一般具有如下特點。
1.1 可定制性 知識服務根據用戶的設定來實現。系統采取“量體裁衣”的策略,向用戶提供和推薦具有針對性和相關性的知識,以滿足用戶的需求。
1.2 主動性 系統不僅被動地響應用戶的知識請求,而且會“猜測”用戶需要什么,并采用推薦、提醒、個性化知識展示界面等方式主動提供知識服務。
1.3 差異化 系統面向各類用戶提供差異化的知識內容,滿足用戶的不同需求。用戶會因自身特點和需求不同,得到不同的用戶體驗。
個性化知識推薦方法能進一步簡化用戶利用中醫知識的方式和途徑,降低中醫知識普及的門檻,促進中醫知識的共享和傳播。
個性化知識推薦服務的后臺需要推薦系統(亦稱推薦引擎或推薦平臺等,Recommender System)的支持。推薦系統能推測用戶對某一信息條目的偏好程度,從大量信息中過濾出用戶想要的信息[4]。近年來,推薦系統在電子書店、視頻網站以及搜索引擎等各種網絡信息系統中得到了極為廣泛的應用,成為一項功能強大、價值巨大的信息服務。
推薦系統的核心是其所使用的推薦方法(或稱推薦算法)。目前,推薦方法主要包括“協同過濾”(Collaborative Filtering)和“基于內容的過濾”(Content-based filtering)兩大類[5]。協同過濾方法是根據某個用戶的行為(對事物的購買、選擇或評價等)以及其他用戶的類似行為建立模型,再使用該模型預測該用戶可能感興趣的事物[6]。基于內容的過濾方法是根據事物的特征判斷事物之間的相似性,從而向用戶推薦更多類似的事物[7]。
很多其他的人工智能方法也可被應用于推薦系統。例如,主題模型(Topic Model)是能夠從大量離散數據集中挖掘出隱含的主題結構的一類統計模型[8]。這里的“主題”是指由一些語義相關的特征構成的、用來描述一個話題的抽象概念。利用主題模型可以識別一份文檔所表達的主題,從而將該文檔推薦給對相關主題感興趣的用戶。又如,社會網絡分析 通過網絡模型體現一類人群中個體之間的多層次交互關系。通過社會網絡分析,可以發現人與人之間的愛好、生活習慣等相似關系,以此為基礎對用戶做相應的個性化推薦[9]。再如,利用關聯規則挖掘(Association Rule Mining)算法,可從海量數據中發現事物之間的關聯關系,然后據此進行相應的推薦[10]。關聯規則是形如X→Y的蘊涵式,具有一定的支持度和信任度。基于關聯規則的推薦是以關聯規則為基礎,若用戶特征滿足規則頭,則將規則體的內容作為推薦對象推薦給用戶。
上述推薦方法都是基于統計的,試圖從海量數據中挖掘用戶的偏好和需求。“基于知識的推薦系統”(knowledge based recommenders)與這些方法不同,它不是基于海量數據分析的結果進行推薦的,而是基于事物分類、用戶偏好、推薦原則等方面的顯性知識的一種推理技術[11]。基于知識的推薦方法因它們所用的“效用知識”(Functional Knowledge)的不同而有明顯區別。效用知識是一種關于一個事物如何滿足某一特定用戶的知識,因此能解釋需要和推薦的關系。效用知識可以是任何能支持推理的知識結構,它可以是用戶已經規范化的查詢,也可以是一個更詳細的用戶需要的表達式。此類方法可以在“協同過濾”和“基于內容的過濾”等方法不適用的領域發揮作用。其優點是不依賴于大量的數據積累,因此容易啟動;其缺點是在定義推薦所需知識的過程中可能遇到知識獲取瓶頸。
既然推薦系統已被成功應用于商業領域的商品關聯推薦,它也就可能被用于中醫知識的個性化推薦。可綜合利用上述方法,研制面向中醫藥領域的個性化知識推薦系統,使之能夠利用用戶個人健康信息、人際網絡信息和健康公共信息,向用戶提供有用的知識和有效的建議,幫助用戶決定應該進行什么有益的飲食規劃、生活活動或疾病治療規劃,達到疾病防治和提高生活質量的效果。一個面向中醫知識的個性化推薦系統將能夠實時利用采集到的數據做出主動推薦,提高用戶的疾病防治能力及其對中醫知識的信賴度。
近年來,智能手機等移動設備迅速普及,移動互聯網取得迅猛發展[12]。移動互聯網因其普及性、便捷性以及強大的個人信息采集和自動感知能力,為個性化知識推薦提供了理想的平臺。首先,智能終端為用戶個人健康信息的采集提供了便捷的手段,可通過規范化的問卷、量表采集用戶個人健康數據并判斷其健康狀況。例如,可以基于中華中醫藥學會發布的《中醫體質分類與判定》等標準,為用戶提供“中醫體質測試”服務;系統會列出一組與用戶近期的體驗和感覺相關的問題,根據用戶的答案判斷出用戶的中醫體質類型。其次,基于智能終端的傳感系統自動采集時間、地域、天氣等用戶相關數據,這種用戶情境感知能力能進一步提升推薦系統的精準性。例如,通過GPS系統,可感知用戶的地理位置,據此推薦當地的美食,而無需推薦在當地不存在的食材及相關食譜。最后,智能終端為個性化中醫知識推薦提供了移動應用程序、萬維網、短信、微信等多種實現途徑。
在中醫藥領域,已出現了過日子、中醫養生、健康養生寶典、365健康養生、中華養生、中醫美容保健、養生美顏聽書等一系列面向社會大眾提供知識服務的移動APP。許多產品會收集用戶行為信息和健康數據,據此向用戶提供知識推薦等個性化服務。例如,“過日子”會提請用戶進行注冊并填寫個人健康信息,并根據用戶“中醫體質測試”的結果判斷用戶的中醫體質,進而針對用戶的體質類型提供個性化的知識推薦服務;“中華養生”以中醫理論為依據,實現了養生提醒功能,適時推薦運動、食療、調神等方面的養生知識,督促用戶從事養生保健活動;“中醫養生鐘(普及版)”根據時辰(時間)與臟器經絡的對應關系為用戶提供養生提醒服務;“體質養生(食療)系統”根據用戶“中醫體質測試”的結果提供個性化知識推薦,幫助用戶在選擇食物時能根據自身體質去分析營養價值,而不僅根據喜好[13]。上述產品有助于用戶獲得日常健康維護、疾病預防和生活指導等方面的中醫知識,指導并督促用戶從事養生保健活動,以達到增強體質、預防疾病、頤養生命之目的。
上述產品已初步實現了個性化中醫知識推薦功能,但尚有改進空間。存在的主要問題是知識權威性和用戶信任度較低[14]。中醫學術界多年來開展了大量的中醫藥信息化工作,組織全國一流專家進行數據庫加工,建設了大量的中醫藥數據庫[1]。通過建立嚴格數據質量評價標準以及數據審校機制,保證了數據質量[15]。這些數據庫具有領域權威性,知識可信度高,為中醫知識推薦服務提供了優質資源。需要研究如何對這些知識資源進行有效組織,并與用戶對中醫知識需求建立關聯,使這些知識資源能更有效地支持推薦服務。
另外,上述產品的推薦機制的合理性尚未得到專家的論證,在推薦技術和方法方面尚有進一步研發和改進的空間。可根據個體化健康狀態,以實時健康風險評估為基礎,研究智能健康信息推薦技術,開發個性化中醫知識推薦系統,即時提供滿足百姓日常健康維護、疾病預防和生活指導方面的中醫知識。其中涉及3項主要的研究內容。
4.1 用戶個人健康信息模型的研究與設計 為實現個性化的知識推薦,首先需要設計符合移動互聯網技術特點且具有中醫特色的用戶個人健康信息模型。需要對基于移動互聯網的用戶個體數據采集手段進行調研,分析現有的個人健康數據的內容、質量和利用價值,對用戶的個體特征進行系統梳理和量化建模,形成一個相對完善的、領域相關的用戶特征模型。
4.2 個性化中醫知識推薦算法研究與實現 首先,可通過文獻調研、專家咨詢、用戶訪談等方法,整理個性化中醫藥知識推薦的案例,明確知識推薦策略。進而,可采用知識表示技術,構建一個面向中醫知識推薦的規則庫,將推薦策略表達為形式化的知識推薦規則,從而建立個人健康信息模型與中醫藥知識資源之間的關聯關系,實現基于規則的中醫知識推薦。最后,可采用“基于知識的推薦”與“協同過濾”相結合的混合型推薦機制,研究和實現專門針對中醫知識的個性化推薦算法。
4.3 中醫知識主動推送網絡服務的研究與實現 在研究和實現推薦算法的基礎之上,需要進一步對該算法進行網絡化封裝,在萬維網(Web)服務器端實現和部署知識推薦的網絡服務(Web Service),使得移動客戶端和其他信息系統都能動態調用知識推薦算法。該服務能夠直接根據用戶特征向移動客戶端推送中醫知識,從而實現基于移動互聯網的個性化知識推薦。
知識推薦與知識檢索是知識服務的兩種基本方式:知識推薦屬于系統主動推送,知識檢索屬于用戶主動提取。這兩種方式相輔相成,相互融合,可以形成相對完整的中醫知識服務技術方案,進一步提升知識服務系統的用戶友好性和針對性。移動互聯網的發展以及智能終端的迅速普及,使具有用戶情境感知能力的個性化推薦系統成為可能。“過日子”等移動應用產品已初步實現了個性化中醫知識推薦功能,可根據用戶的個人健康信息(如性別、年齡、體質、疾病等)以及時節、地域等環境信息,進行個性化的中醫知識推薦,使用戶可以隨時隨地獲得針對自己和家人的養生知識和健康提示。需要基于中醫藥領域現有的優質數據資源,采用移動互聯網技術,設計用戶個人健康信息模型,研制權威的中醫知識庫以及智能化的中醫知識推薦技術,實現中醫知識主動推送網絡服務,幫助普通百姓獲得精準的個性化中醫知識服務,從而提高用戶的疾病防治能力以及對中醫知識的信賴度。
[1] 崔蒙,尹愛寧,范為宇,等.中醫藥科學數據建設研究進展[J].中國中醫藥信息雜志,2006,13(11):104-105.
[2] 高博, 崔蒙, 楊碩,等. 基于數據的中醫藥知識服務研究[J]. 圖書情報工作, 2012, 56(9): 5-9.
[3] 于彤, 蘇大明, 尹仁芳, 等. 中醫藥知識服務平臺構建研究[J]. 中國醫學創新, 2014, 11(15):120-123.
[4] Francesco Ricci, Lior Rokach, Bracha Shapira. Introduction to recommender systems [M]. Handbook, Recommender Systems Handbook, Springer, 2011:1-35.
[5] Hosein Jafarkarimi, Alex Tze Hiang Sim, Robab Saadatdoost. A Na?ve Recommendation Model for Large Databases [J]. International Journal of Information and Education Technology, 2012, 2(3):216-219.
[6] Prem Melville, Vikas Sindhwani. Recommender systems [M]. Encyclopedia of Machine Learning, 2010.
[7] Mooney R J, Roy L. Content-based book recommendation using learning for text categorization [C]. In Workshop Recom. Sys.: Algo. and Evaluation, 1999.
[8] David M Blei. Introduction to probabilistic topic models [J]. Comm. ACM, 2012, 55(4): 77-84.
[9] John P Scott. Social network analysis:a handbook (2nd edition)[M]. Thousand Oaks, CA: Sage Publications, 2000.
[10] Hipp J, Güntzer U, Nakhaeizadeh G. Algorithms for association rule mining - a general survey and comparison [J]. ACM SIGKDD Explorations Newsletter, 2000, 52(2): 58.
[11] Burke R. Knowledge-based recommender systems [J]. Encyclopedia of Library and Information Science, 2000, 69(32):180-200.
[12] 羅軍舟,吳文甲,楊明,等. 移動互聯網:終端、網絡與服務[J].計算機學報,2011,34(11):2029-2051.
[13] 胡奧杰. 基于android的體質養生系統的開發[J]. 電子世界,2014,20(7):112-113.
[14] 朱毓梅. 中醫藥信息需求的調查分析[J]. 國際中醫中藥雜志,2014,36(9):830-832.
[15] 胡雪琴,崔蒙,陳兵,等.中醫藥科學數據的數據質量研究[J].世界科學技術-中醫藥現代化,2009,11(4):589-592.
Preliminary Research on TCM Knowledge Recommendation Via Mobile Internet
YU Tong, MAO Yu-xin,GAO Hong-jie,et al.//Medical Innovation of China,2015,12(36):115-118
A core problem of knowledge services in Traditional Chinese Medicine (TCM) domain is as follows:in the face of massive knowledge resources, how to automatically find out which ones a user may be interested in so as to realize active knowledge recommendation. Mobile Internet, with its popularity, convenience, and ability to collect personal information, provides an ideal platform to solve this problem. This paper introduced the concept and backgroundof personalized knowledge recommendation, analyzed the current status of TCM knowledge recommendation via mobile Internet, and proposed existing problems and research thoughts.
Traditional Chinese Medicine; Knowledge service; Knowledge recommendation; Mobile internet; Mobile device
10.3969/j.issn.1674-4985.2015.36.038
2015-04-07) (本文編輯:蔡元元)
國家自然科學基金項目(61379121);北京市中醫藥科技發展資金項目(JJ2014-61);中國中醫科學院自主選題項目(ZZ080324,ZZ090305)
①中國中醫科學院中醫藥信息研究所 北京 100700
②浙江工商大學
張竹綠
First-author’s address:Information Institute of Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700,China