果彤 夏翃
1.首都醫科大學基礎醫學院;2.首都醫科大學生物工程學院
目前,卒中對我國人民健康造成巨大危害,而遺傳性腦血管病作為隱源性卒中的重要病因之一,隨著基因診斷技術的發展,日益受到學界關注。本文介紹了一種基于Access的遺傳性腦血管病查詢系統,以期借助信息化手段,為科研與臨床工作者的查詢工作提供方便,從而實現對卒中的早期篩查與干預。
卒中是嚴重危害我國人民健康的重大慢性非傳染性疾病,根據最新版全球疾病負擔研究報告,我國卒中終生發病風險高達39.9%,位居全球首位。作為我國成人致死、致殘的首位病因,卒中具有高發病率、高致殘率、高死亡率、高復發率與高經濟負擔五大特點[1]。隨著人口老齡化進程不斷加快,卒中對我國人民健康造成的影響日益顯著。因此,對卒中的早期干預具有重要意義。與其他常見心腦血管疾病類似,卒中的高危因素分為環境因素與遺傳因素兩大類。相關環境因素(如高血壓、高脂血癥等)早已為學界公認并得到廣泛重視。近年來,隨著基因診斷技術的發展,遺傳性腦血管病作為隱源性卒中的重要病因之一,日益受到學界關注[2]。首都醫科大學附屬北京天壇醫院王擁軍團隊出版的《遺傳性腦血管病診斷手冊》一書,為相關診斷與研究提供了重要參考。然而,由于相關基因數量龐大,紙質書籍并不能完全滿足臨床及科研工作者的查詢需求。因此,筆者以王擁軍主編《遺傳性腦血管病診斷手冊》與OMIM相關數據為基礎,建立了一套面向科研與臨床工作者的、基于Access的遺傳性腦血管病查詢系統,以期借助信息化手段,為相關查詢工作提供方便。
作為微軟公司開發的關系數據庫管理系統,Access將圖形用戶界面與軟件開發工具結合起來,具有面向對象、界面友好等特點,適用于中小型數據管理系統的開發與維護[3]。通過Access的數據處理、統計分析與查詢功能,用戶可輕松實現數據的儲存、組織、查看、分析與共享,構建強大、可集成、自定義的數據庫解決方案[4]。
本系統中各遺傳性腦血管病的分類及對應致病基因的數據來自王擁軍主編《遺傳性腦血管病診斷手冊》;疾病與基因的具體介紹來自“在線人類孟德爾遺傳數據庫”(Online Mendelian Inheritance in Man,OMIM)。為了便于用戶進一步了解感興趣的疾病與基因,各項數據均附有OMIM對應疾病與基因的超鏈接網址。
1.3.1 系統功能結構設計
本數據庫系統具有以下特性:(1)“主菜單”窗體是各功能模塊的聯系樞紐,利用宏實現對各界面的調用,操作簡便,界面友好;(2)本系統共設計兩項查詢功能:輸入致病基因查詢其導致的遺傳性腦血管病及病變與輸入疾病名稱查詢對應的致病基因和疾病表現。為了提高查詢效率,在相應查詢窗體分別設置相應的“致病基因一覽”與“疾病一覽”作為索引,用戶可在參考庫中所包含信息后,再進行查詢;(3)本系統共設計三項瀏覽與統計功能:瀏覽遺傳性腦血管病的分類及對應的致病基因、庫中所包含的遺傳性腦血管病與致病基因概況;為了便于用戶進一步了解感興趣的疾病或基因,相應報表提供了每個疾病與基因對應的OMIM號與OMIM超鏈接。
系統總體功能設計如圖1所示,具體包括查詢功能和瀏覽與統計功能兩大模塊,前者包括“致病基因→疾病及病變”與“疾病→致病基因及病變”,后者包括“疾病分類”“庫中疾病概況”與“庫中致病基因概況”。

圖1 本系統功能結構設計Fig.1 The functional structure design of the system
1.3.2 數據庫設計
數據庫設計包括兩方面:結構設計與應用設計,其中前者是數據庫設計的核心,主要涉及數據庫的整體框架結構,具體包括概念結構設計、邏輯結構設計與物理結構設計[5]。以下主要探討本系統的概念結構設計與邏輯結構設計。
概念結構設計是數據庫設計的關鍵,通過對用戶需求的綜合、歸納與抽象,生成獨立于某個具體數據庫管理系統的概念數據模型[6]。本系統中各項數據形成的E-R模型如圖2所示。模型共包含3個實體。其中,疾病與癥狀之間為1對多關系,基因與疾病之間為多對多關系。

圖2 各項數據類E-R模型Fig.2 E-R model of data types
邏輯結構設計將上一階段所得概念模型(E-R模型)轉換為某個具體數據庫管理系統支持的數據模型,并對其進行優化[7]。本數據庫共建立4張數據表,各表具體結構見表1,表間關系見圖3。通過設置主鍵與外鍵,使各表合理聯系,建立了完整的數據模型。

圖3 系統中各表間關系Fig.3 Relationships between tables in the system

表1 系統中各表結構Tab.1 The structure of each table in the system
“主菜單”窗體直接呈現了本系統的兩大功能:查詢功能和瀏覽與統計功能,并利用嵌入式宏實現對各窗體的調用。運行效果見圖4。

圖4 “主菜單”窗體運行效果Fig.4 "Main Menu"form operation effect
查詢功能是本系統的核心,主要通過“查詢1”與“查詢2”兩個窗體實現。利用VBA對象,以DLookup函數為核心,通過在“查詢”按鈕中嵌入“單擊”事件,分別實現了輸入致病基因名稱查詢所致疾病及病變與輸入疾病名稱查詢致病基因及相關介紹的功能。運行效果見圖5、圖6。

圖5 “查詢1”窗體運行效果Fig.5 "Query 1" form operation effect

圖6 “查詢2”窗體運行效果Fig.6 "Query 2" form operation effect
瀏覽與統計功能利用“分類”“基因”與“疾病”三個報表,使用戶從宏觀上把握本系統的主要內容,并可根據自身需要打印出相關內容。其中,“分類”報表按疾病分類進行分組匯總,并附遺傳性腦血管病分類導圖,使用戶可迅速了解遺傳性腦血管病的分類情況。而“基因”與“疾病”報表中每條記錄均提供了相應的OMIM網址,用戶可直接點擊以進一步了解相應基因或疾病。各報表運行效果分別見圖7、圖8與圖9,“分類”報表-“分類一覽”見圖10。

圖1 0 “分類”報表-“分類一覽”運行效果Fig.10 "Classification" report-"Classification list" operation effect

圖7 “分類”報表運行效果Fig.7 "Classification" report operation effect

圖8 “基因”報表運行效果Fig.8 "Gene" report operation effect

圖9 “疾病”報表運行效果Fig.9 "Disease" report operation effect
本文以王擁軍主編《遺傳性腦血管病診斷手冊》及OMIM中相關數據為基礎,整合了常見遺傳性腦血管病、致病基因與病變表現等相關信息,建立了一套基于Access的遺傳性腦血管病查詢系統。用戶只需輸入相關致病基因或疾病名稱,便可了解相應內容,為相關查詢工作提供了方便。但Access在占用空間大小和安全性上的不足阻礙了本系統的推廣。此外,隨著研究的不斷深入,遺傳性腦血管病的種類及致病基因會發生一定變化,此時數據庫內容需要人工更新,降低了系統中內容的時效性。
作為隱源性卒中的重要病因之一,遺傳性腦血管病日益受到關注。由于其大多具有明確的致病基因,可利用相關技術較為方便地篩查與確證,因而在卒中的早期篩查與干預中具有廣闊的前景。未來,在本系統的基礎上,結合大規模流行病學調查所得定量資料、并利用統計學原理和方法進行統計描述與統計推斷,可進一步深化對遺傳性腦血管病的了解與認識,為相關科研與診斷工作提供幫助,從而服務于卒中的早期干預。
引用
[1] 《中國腦卒中防治報告2019》編寫組.《中國腦卒中防治報告2019》概要[J].中國腦血管病雜志,2020(5):272-281.
[2] 王擁軍.遺傳性腦血管病診斷手冊[M].北京:科學出版社,2017.
[3] 劉陟剛.Access在Office各組件中的交叉應用探索[J].價值工程,2014(34):225-226.
[4] 張駿溫,何保鋒譯.(美)Michael Alexander, Dick Kusleika著.中文版Access2019寶典(第9版)[M].北京:清華大學出版社,2019.
[5] 杜菁.數據庫技術與應用新概念教程(第二版)[M].北京:中國鐵道出版社,2016.
[6] GETTA J R,PAN Z.Performance-based quality evaluation of database conceptual schemas[C]//2017 4thInternational Conference on Information Science and Control Engineering.IEEE,2017:538-544.
[7] LIYANAGE N H.Advanced query model design concept to support multi-dimensional data analytics for relational database management systems[C]//2017 International Conference on Big Data Analytics and Computational Intelligence,2017:432-435.