鄧志華
(上海市嘉定區統計局,上海 201800)
在第三次全國經濟普查數據產生的過程中,數據審核是提高數據質量的關鍵環節之一。從數據審核方式來看,本次普查采用同方聯網直報平臺來進行,它使我們能在第一時間對全部單位進行統一審核,減少漏審現象,提高工作效率,但同時存在審核時間過長、審核內容不全面等問題,針對這些問題,我們積極研究,開發完成了經普庫外審核應用程序,并投入使用于各街鎮經普辦。
第三次經濟普查數據審核、修改、驗收等工作是通過同方聯網直報平臺來實現的,其單項審核方式簡潔明了,錯誤關系清晰,方便統計人員的查錯和改錯。但在實際使用過程中,同方聯網直報平臺自帶的審核功能并不能完全滿足現有的審核要求,具體表現在:
采用單條審核修改數據的方式,每家企業的平均審核、修改時間約在5分鐘左右。筆者所在轄區有5萬多家單位,此類審核方式非常耗時耗力,影響了統計人員審核報表的積極性,容易產生厭煩情緒,不利于提高審核效率和對數據質量的把控。
同方聯網直報平臺支持進行批量錯誤導出,導出的錯誤列表可將每一條錯誤對應企業名稱或按照統計級別逐一顯示,方便查看和修改。但在實際審核過程中,指標之間的差錯具有較強的關聯性,并且沒有關聯提示,造成在實際查錯中無法前后對比錯誤關系,難以理解。
由于區縣級統計部門無法修改審核公式,導致在審核關系的把控上不夠靈活:一方面經普早期,同方聯網直報平臺并沒
有報表的實際情況完善所有的審核關系;另一方面,審核內容不能根據實際情況來制定審核關系。單位錯誤的修改需要憑借統計人員自身的經驗和判斷進行,而且即使本級統計部門發現了不符合實際情況的審核條件,也無法修改審核關系,只能向上級反映。
同方聯網直報平臺雖然具有數據篩選功能,但在實際使用中,此功能不能完全滿足實際數據處理的需求,具體表現在:①個體數據并不能直觀的顯示出來,統計人員需要點擊企業單位名稱才能查看明細的填報數據和錯誤提示;②無法就具體某項錯誤進行順序排列,也不能針對相同錯誤進行批量修改和填寫說明。
在經普審核過程中,區縣級日益增長的修改需求和國家不斷的更新系統之間存在著矛盾,作為區縣經普數據處理者,筆者制作了一套經普庫外審核應用程序,結合本區自身的情況,針對審核錯誤能在早期進行修改,減少重復工作,通過一段時間的使用,取得了較好的效果:
經普庫外審核應用程序利用平臺自帶的匯總表,導出匯總表:在同方聯網直報平臺中,點擊“采集監管”,進入數據導出頁面,在任務選擇欄中選擇“第三次經濟普查(2013)”,點擊“查詢”,選擇相應的611表,點擊“導出”。在導出界面中,設置導出格式為“CSV”,導出選項選擇“全部”,右邊欄中勾選“全部選定”。點擊“確定”后即下載匯總表。
通過使用同方聯網直報平臺下載的匯總表作為藍本直接在匯總表上編寫函數公式:首先是庫外審核應用程序表能很好的和同方聯網直報平臺數據格式保持協調一致,方便統計人員對經普數據比對,有利于對經普匯總表的管理。其次,統計人員可根據實際情況修改錯誤。對照PDA把所有錯誤顏色的標記逐一進行查錯修改。修改完一條,顏色的標記會自動消失,對查找和修改錯誤帶來了便利,縮短了查錯時間。最后,統計人員依據庫外審核應用程序查找出錯誤,在PDA上進行數據修改、上報至同方聯網直報平臺,確保了數據一致性。
通過使用經普庫外審核應用程序的篩選,上報至同方聯網直報平臺上的差錯比未使用該程序差錯率減少了近50%,為在經普后期的數據反饋查錯階段節省了大量反復查錯時間。
經普庫外審核應用程序利用常用的EXCEL表,通過編寫簡單的函數公式,把筆者需要的審核內容通過編輯函數公式來執行,使經普上報數據能更好的貼合本轄區實際情況進行,審核關系公式程序添加方式如下:
首先選擇一條需添加的審核關系,報表類別選擇“B”類,行業代碼需在1310-4690區間內。其次,輸入審核關系,打開E列(假設報表類別的第一行數據在E3單元格)的條件格式,在公式欄目中輸入:E3=“B”,OR($G3>4690,$G3<1310)。
該命令的含義是:如果報表類別(E3)單元格輸入的數值是B,且在行業代碼(G3)單元格中輸入的數值要超出1310和4690之外,則會觸發E3單元格的條件判定。最后,將條件判定設置為強制性錯誤標記為紅色,核實性錯誤標記為藍色用以區分錯誤級別,本例演示的錯誤為紅色強制性錯誤。
例1:上海日善模具有限公司(化名),普查員在報表類別中填寫B(工業),行業代碼填為4700(房屋建筑業),則行業代碼出錯,行業代碼欄被標記為紅色提醒審核人員存在該條錯誤,如圖1:

圖1
根據企業實際情況,將行業代碼欄中改為3525(模具加工),行業代碼數值在1310-4690之間,則紅色標記消失,如圖2:

圖2
由此可見,使用自編審核關系的庫外審核應用程序,一方面能很好的將指標之間的錯誤關系顯現出來,方便統計人員前后對照查看錯誤;另一方面,審核的數據能按錯誤類型的不同,通過各種顏色顯現出來,便于統計人員直觀地發現問題所在。通過使用經普庫外審核應用程序,每家企業審核錯誤修改完畢需要平均時間為3分鐘左右,比未使用時節省了近50%的時間。
統計人員針對本轄區的實際情況自定義審核關系,設定審核范圍,庫外審核應用程序可同時使用多個審核關系。
例2:在例1已有的審核關系基礎上新增一條審核關系,報表類別選擇“A”類,行業代碼需在0111-0540區間內。利用and和or函數做一層嵌套即可。在條件格式中的公式作如下編輯: =OR(AND(E3=“A”,OR(G3>0540,G3<0111)),AND(E3=“B”,OR($G3>4690,$G3<1310)))。該函數的作用是在報表類別里輸入的數值要同時滿足例1和例2新增審核關系,否則觸發報表類別(E3)的條件判定。
此外,設定審核范圍,針對多家企業進行批量審核。以上題為例:在審核公式的單元格范圍設定為G3∶G20000。把E3單元格和G3單元格之間的審核關系延伸20000行,即最大擴展延伸到E20000和G20000之間,用戶也可以根據自己的實際需要來進行設定,如圖3:

圖3
采用自定義的審核內容,能很好地結合本轄區實際情況來定制審核關系,同時,統計人員在實際工作中一旦發現某條審核關系不符合實際情況,可立即修改關系,從而提高工作的效率,在把控數據質量上取得良好的效果。
在編輯完庫外審核程序后,適當的對表格做若干界面優化操作,能夠使審核人員操作起來更加方便,簡單易學,具體操作過程如下:
(1)關于空白數據報錯:在每一條函數開頭部分添加一個判定函數,如果組織機構代碼不填,那么本次判定結束,從而提高界面的友善度,函數內容如圖4:

圖4
該命令可以很好的避免空白數據被誤報錯誤,使整個庫外審核程序應用程序表更為簡潔、明了。
(2)關于數據轉換:同方聯網直報平臺下載匯總表內的數據有時會改變指標間的前后順序,所以新導出的匯總表事先要根據庫外審核應用程序結構做對比,如前后順序不同,需通過剪切、插入列的方式將審核表和新匯總表之間的列關系做匹配。其次,刪除數據,需使用鼠標右鍵的“清除內容”,確保判定關系不被刪除。如要復制判定關系,使用格式刷工具或者設定應用行范圍。確保了數據轉換的有效性,方便統計人員審核查錯工作。
通過經普庫外審核應用程序,為普查員在經普前期核實數據和改正錯誤提供了更多的時間,在經普審核后期,解決了很多在填表和人工審核時不易發現的問題,有利于提高普查數據準確性和提升普查服務優質化,為今后各項普查的數據處理工作奠定了基礎。