計培良,林燕芬
(1.湖州師范學院教務處,浙江湖州313000;2.中國美術學院 實驗教學管理部,浙江杭州310024)
基于Excel的高校實驗室信息統計數據處理方法研究與實踐*
計培良1,林燕芬2
(1.湖州師范學院教務處,浙江湖州313000;2.中國美術學院 實驗教學管理部,浙江杭州310024)
文章依托多年實驗室信息統計工作實踐,通過分析高校實驗室信息統計數據處理手段的現狀,總結當前數據統計上報過程中格式轉換、規范性等方面的問題,化繁為簡,提出了基于Excel的數據處理方法。該方法通用性強、操作簡便,能明顯提高實驗室信息統計工作的效率。
高校實驗室信息統計;Excel
高校實驗室信息統計工作是教育部統一部署的高校實驗室管理的一項基礎性工作,對高校實驗室建設意義重大。2006年教育部制定的“高等學校實驗室信息統計”指標體系,增加了報表數量,豐富了上報信息;構建網絡系統簡化上報程序,實現了網上報送[1-2]。在新方法新技術為數據報送帶來便利的同時,也對各高校的數據報送工作提出了新的要求。工作人員必須結合新形勢探索更加高效便捷的方式,設法提高實驗室信息統計工作水平。
根據高校實驗室信息統計工作的網報要求,目前高校普遍面臨的問題主要體現在對基礎數據的收集、規范以及格式化上。
要求開展實驗室信息統計報送工作的單位范圍較廣,包括全國普通本科高等學校、高職高專院校和獨立建制的成人高等學校,內容上涵蓋儀器設備、實驗項目、人員、實驗課程等多個報表,數據量較大。關鍵問題是,報表之間彼此有關聯,內在邏輯關系嚴密,可以說,實驗室信息統計是一項基本涵蓋全校實驗基礎數據、量大面廣較為復雜的工作,在基礎數據收集和對數據做規范處理等環節都離不開高校的信息化建設。
在基礎數據收集環節,重點是要及時準確地收集數據。各高校對此已進行了大量深入的研究,工作人員積極創新,在制度建設、分工協作、人員培訓、網絡化信息管理系統建設等方面都做了研究和實踐,取得了良好的成效。
對數據做規范處理環節,網報系統要求提交適于計算機閱讀的純文本格式,對各字段的位置及長度都做了嚴格的規定,必須要完全符合報表定義,不能有任何偏差,稍有誤差就無法通過統計系統的檢測,難以完成上報。對數據格式做如此嚴格的規定為工作帶來了很大的難度。報送文件格式規定為文本格式(.txt),與電子表格(.xls(或word文檔(.doc(等形式相比,對于工作人員而言,由于文件閱讀性較差,難以手工直接編輯,這也為直觀地查錯糾錯帶來了困難。因此,在數據處理階段,形成滿足網報系統要求的數據格式要求是報送成敗的關鍵,須借助專用軟件進行處理,這對工作人員的軟件應用能力提出了較高的要求。
由于各高校信息化建設發展程度不同,對學校數據信息化的能力水平就有差異。整體而言,各高校信息化建設發展存在不平衡現象。
近年來,雖然各高校對實驗室建設與管理工作的信息化越來越重視,也已取得了較明顯的進展,但各高校實驗室建設與管理信息化程度存在較大差異。許多高校已經使用了專門定制的業務管理系統,集成了較強的信息統計功能,但還有不少學校缺乏專門的業務管理系統,一直沿用著傳統的手工紙面化管理手段。
當前各高校普遍存在一個現象:在實驗室硬件設備管理和實驗教學課程管理兩方面的信息化水平發展不平衡,即與實驗儀器設備相關的資產管理系統得到了較為廣泛的開發和應用,而與實驗課程和實驗項目相關的實驗教學管理系統就明顯缺乏,至于全校性的實驗教學管理信息化平臺就更為稀缺。
與此相應,不同高校在實驗室信息統計工作中采取的技術手段和方法亦有所不同,整體來說,目前主要有以下五種:
1.定制的重量級校級綜合管理平臺
這類平臺借助數字化校園建設成果,消除了信息孤島,切實提高信息化管理水平,是比較理想的。但市場上成熟通用的產品較少,專門針對高校實際情況定制開發,投入較大、開發周期長,且必須依托全校信息化建設程度進行推進,實施難度較大,因此應用這種管理平臺的高校數量較少。
2.定制的輕量級專用軟件
這類軟件只能初步實現對基礎數據的收集、整理和統計,后期還需要投入人力進行數據間的匹配與核對,這樣的半信息化操作模式對改善學校整體信息化管理水平不具有實質性效果。
3.北化軟件
北化軟件是一款專門針對實驗室信息統計設計研發的軟件,利用北化軟件可以實現與教育部實驗室信息統計上報系統的對接,直接完成網報。在統計上報工作新的指標體系正式實施后,北化軟件開發組對軟件做了相應的調整,修改加強了數據輸出和自動調整的功能,以適應新的指標體系。其資產管理軟件具有日常管理功能,其他部分則側重數據收集與統計。
4.Excel
使用傳統的辦公自動化軟件Excel來維護業務數據,然后通過上報系統提供的單機版檢測系統等各類軟件將數據格式進行轉換,從而生成符合上報要求的數據。雖然該方法在操作上費時、費力、易出錯,顯得較為傳統和原始,但對工作人員的計算機操作能力要求較低,不受學校整體信息化水平制約,因此,目前還有很多高校依然在使用這種方法對數據收集、處理和規范化,所要求上報的每張報表都可以用此方法。
5.信息化管理平臺
有些高校擁有國家級和省級實驗教學示范中心,具備良好的信息化管理平臺,但往往這些平臺彼此之間相對獨立,不同的實驗室報送的數據格式或許都不同,這些基礎數據依然需要通過手工操作進行規范處理,經過整合和轉換格式后再統一報送,常見的整合手段往往是利用辦公自動化軟件Excel。
上述五種方法中,由于普遍高校的整體信息化建設發展程度不足,最后兩種方法目前在大多數高校中使用最為普遍。由于Excel是為大部分老師所熟悉且運用較為熟練的辦公軟件,使用非常廣泛,并且也能夠完成現階段的實驗室信息統計報送工作,滿足工作要求。基于多年的工作實踐與經驗積累,筆者對如何在Excel中實現數據的規范化和格式化進行了研究,發現通過使用Excel的LEFTB、LEFT、LENB、LEN、Text等文本函數[12]編寫出恰當的公式,可以實現在Excel中直接生成符合規范的上報數據,進而直接形成滿足要求的報表,結果準確,操作簡單,可大大提高工作效率,緩解工作壓力。利用Excel進行數據處理及上報流程如圖1所示。

圖1 利用Excel進行數據處理及上報流程
根據教育部關于實驗室數據文件的詳細填報要求,通過報表的定義、上報系統的操作要求以及已成功上報的數據文件進行分析后,可以發現符合上報要求的數據文件須滿足以下條件:①上傳到系統中的數據文件格式為文本文件(.txt);②文件的內容是單行或多行文本,行結構由報表的定義決定,單行的長度是各字段長度的總和;③一行文本對應一條記錄。
在記事本中打開“教學科研儀器設備表(基表一)”對應的上報數據文件sj1.txt,顯示如圖2所示。
需要強調的是,每個字段都有固定的長度,例如基表一中“設備名稱”字段的長度要求為30字節,當實際長度不足30字節時,需在后方用空格補足,符合格式規范的txt文件可通過Excel軟件生成。

圖2 在記事本中打開的sj1.txt
1.維護基礎數據
數據維護指的是,嚴格按照統計報表的填報要求(即 “基表說明”),根據報表定義和字段數據類型建立Excel表格并設置其中各單元格的格式,做好基礎數據的輸入、更新等工作。在進行數據轉換之前必須要做好數據維護工作,數據維護是數據轉換的前提。在Excel表中維護原始數據如圖3所示。

圖3 在Excel表中維護原始數據
2.轉換數據格式
數據轉換就是利用Excel公式把不同類型的數據轉換成指定長度的文本數據,具體操作方法是,首先編寫單個單元格的數據轉換公式,然后再把同一行各單元格的轉換公式有序地組合起來,從而得到單行數據的轉換公式。
(1)單元格轉換公式
由于各表中各字段的數據類型和長度(單位:字節)并不完全相同,故不同字段的轉換公式亦不盡相同,本文以“基表一”中“儀器名稱”字段為例來介紹單元格轉換公式。由于按照基表一的填報要求,“儀器名稱”字段是長度為30的字符型數據,所以轉換結果也必須是長度等于30字節的文本。由于字段“儀器名稱”的實際長度不定,且含有中文等雙字節字符,故將其轉換成長度為30字節的文本需要考慮若干種情況,具體算法如下:
a.若“儀器名稱”長度不超過30字節,則保留所有字符,否則
b.若第30、31字節不屬于同一字符,則取前30字節,否則取前29字節
c.a或b的結果與30個空格連接(空格在后),然后取前30字節
與此算法相對應的公式為:


式中D2表示“儀器名稱”所在的單元格。由于單元格中的數據可能含有非打印字符,因此,可以用CLEAN (D2(替換式中的D2,來過濾非打印字符。
對于“單價”等非字符型數據,可以先將其轉換成文本后再轉換其長度,例如:通過公式 “=Text(630.2,”0.00”(”把數值630.2轉換為保留兩位小數的數據。
(2)行轉換公式
“基表一”共14個字段,將同一行中各單元格的轉換公式用“&”運算符連接生成這一行的轉換公式。
3.建立轉換模板
每個報表都可以建立轉換模板。每個模板包含表頭、數據區和公式區,“基表一”的轉換模板如圖4所示。圖4中,“O”列從第3個單元格起是公式區,在“O3”單元格中輸入行轉換公式。

圖4 基表一的轉換模版
拖拉“O3”單元格的右下角填充手柄,即可完成對每一行數據的轉換。
4.轉換文件格式
在數據區輸入統計數據,利用Excel的公式操作可在“O”列得到各行的轉換結果,各行的轉換結果如圖5所示。

圖5 各行轉換結果
為了滿足上報文件的要求,必須將目前的Excel格式轉換txt文件。操作很簡單,新建一個文本文件并打開,復制“O”列公式區內的轉換結果,并粘貼到新建的文本文件中,以“sj1*.txt”為文件名保存該文本文件,“*”為學校代碼,該文件即為滿足格式要求的數據文件。
5.檢測查錯及糾錯
將得到的txt文件導入 “高等學校實驗室信息統計檢測系統”(單機版),對報送數據進行檢測。檢測包括單表檢測和表間檢測,如果單表數據有錯、不規范,或者表間數據的邏輯性不一致,則會彈出錯誤提示,須按照報錯內容做相應的修改。尤其對于表間錯誤,需要特別注意確保表格中相同字段數據的一致性。在數據的規范性上,也要滿足填報需求,通過檢測系統可以進一步查找錯誤。
修改錯誤時,根據報錯提示的行號去檢查Excel表中對應的行數據,更正后重新生成txt文件后,再導入檢測系統中進行檢測,如此反復,直到檢測系統不再提示有錯誤為止。最終經過檢測無誤的txt文件就是滿足要求符合規范的數據文件,可以上報。
6.上傳報送
上報時,打開網址http://www.stats.edu.cn/,輸入學校賬號、密碼登錄后,將經檢測無誤的txt文件逐個上傳,也可將幾個txt文件放入文件夾后,生成壓縮包zip文件進行上傳。上傳成功后,系統會自動生成綜表。
利用Excel轉換數據并生成高校實驗室信息統計報表,具有以下幾個優點:①對工作人員的專業技術水平要求不高,利用Excel公式一次性編寫并成功建立數據轉換模板后,以后只需能夠熟練應用表格模板即可,無需關心代碼編寫,操作極其便利,一勞永逸;②工作流程簡單,數據可讀性強、直觀,錯誤率低,且易查錯、糾錯;③利用Excel公式,還可方便地將往年成功上報的文本數據還原成Excel表,以便于新學年在此基礎上進行數據的更新,進而再生成新一年的新報表。④無需單獨開發專用系統軟件,成本較低。
這種基于Excel的高校實驗室信息統計數據處理方法是多年實際工作的經驗總結,極具有操作性,在工作中也成效顯著。在全國高校推廣和普及此項研究成果,在一定程度上可以緩解由于實驗室建設與教學管理等方面的信息化程度不夠而帶來的實驗室信息統計困難的壓力,對提高信息統計工作效率、解決實際問題具有實際意義。
[1]教高廳函〔2006〕45號.教育部辦公廳關于報送高等學校實驗室信息統計數據的通知[Z].
[2]陸敏峰,李曉林,高惠玲,梁軍.基于B/S結構的高等學校實驗室信息統計系統的設計與實現[J].實驗技術與管理,2011,28(11):304-307.
[3]楊群.EXCEL圖表、函數、公式一本通[M].北京:清華大學出版社,2013:265-285.
(編輯:魯利瑞)
G434
A
1673-8454(2016)16-0072-04
浙江省教育廳2013年高校科研計劃項目“高校實驗室基本信息上報數據處理方法的實踐與研究”(編號:Y201328415);全國教育信息技術研究 “十二五”規劃2014年度課題 “藝術類高校虛擬仿真實驗教學中心建設研究”(編號:146242264)。