葉韻韶 黃雪歡 韓 棟
1 廣州市衛生信息中心,510080 廣東 廣州;2 東莞市人民醫院,523018 廣東 東莞; 3 南方醫科大學第三附屬醫院,511400 廣東 廣州
Microsoft Excel依靠其友好的操作界面、強大的功能和廣泛的普及性,無論是專業人員還是非專業人員,Excel都是不可或缺的電子制表軟件。熟練使用R語言、STATA或SAS等專業統計軟件的專家一般不將Microsoft Excel作為數據分析的工具,但是在日常工作中輸出正式報表或與非統計專業人員進行數據交流時[1-2], Excel依然是首選的數據交流工具。近年來,隨著循證管理的需要,衛生統計工作中經常需要定期提供各類報表[3-4],無論是直接在Excel中進行匯總計算及調整格式,還是采用統計軟件輸出粗略的數據再調整格式,無疑都是重復地手工勞動。
R語言作為專業的統計分析語言有著開源、自由度高、更新快等優點,已被統計專業人員廣泛使用。R語言中可以操作Excel文件的軟件包有很多,成體系且較容易使用地有xlsx包[5]和openxlsx包[6]。其中xlsx包需要依賴JAVA運行環境及rJAVA包的支持,而openxlsx包的發布擺脫了對JAVA環境的依賴,可以直接操作Excel文件。因此,本文旨在介紹openxlsx軟件包的主要功能,并以復合表頭“三線表”為例闡述其用法。本文所有程序基于R 3.6.1和openxlsx 4.1.3[6]。
openxlsx包擁有非常強大的Excel文件操作功能,主要包括對工作簿、工作表和單元格的操作,以及各項樣式(style)的設置功能。
工作簿(workbook)作為一個對象,主要完成新建、讀取和保存Excel文件的功能;工作表(worksheet)作為工作簿對象中的一個屬性,當工作簿中包含多張工作表時,完成對工作表的命名與排序。……