文/劉國勇 黃金 李必鑫
?
淺析基于S-G組合思想的軍隊油料自然損耗數據質量控制問題
文/劉國勇黃金李必鑫
摘 要:本文提出了基于階段管理思想(Stage Management)的油料自然損耗數據質量控制方法,從非技術層面探討了軍隊油料自然損耗數據質量的階段管理、監控,并在此基礎上與改進格拉布斯算法(Grubbs method)組合使用,有效提高油料自然損耗樣本數據的可靠性、準確性,為科學、合理地制定油料自然損耗標準,健全和完善油料供應管理標準體系奠定了堅實的數據基礎。
關鍵詞:軍隊油料;自然損耗;質量控制
軍隊信息化建設的飛速發展,為軍隊油料供應管理部門更加全面、準確地把握油料自然損耗情況創造了必要條件。在對油料自然損耗標準進行修訂的過程中,要求標準研究人員及時、準確、全面地獲取所需油料的自然損耗數據,此外還需嚴格、精細地控制所掌握的自然損耗數據的質量狀況。信息化條件下油料統計數據流、信息流急劇膨脹,海量數據中真假數據并存,重要數據缺失以及大量冗余數據等數據質量問題,嚴重阻礙了油料自然損耗數據的分析、計算工作,給油料自然損耗標準的制定帶來了很大困難。油料自然損耗數據的真實性是標準工作的“生命”。數據不準,情況不明,將會影響統計人員的判斷,導致對標準預測不準確,甚至做出錯誤決策推斷。提高油料自然損耗統計數據的質量,無論是對各級油料部門摸清供應規律,改進業務工作,實施科學管理,還是對部隊按標準核銷油料自然損耗,推進油庫(站)設施設備改造,加快油庫(站)工作正規化建設,都起著至關重要的推動作用。為消除油料自然損耗數據差錯,必須對油料自然損耗數據質量進行嚴格有效地控制。因此,對油料自然損耗數據質量做出科學評估、研究和探討油料自然損耗數據質量控制的技術和方法,具有重要的現實意義和較高的實用價值。
油料統計工作貫穿平戰時油料供應管理工作全過程。油料自然損耗數據質量問題可能發生于統計調查工作的各階段。常見的油料自然損耗數據質量問題包括數據虛假、數據片面、數據拼湊、統計指標數值偏離指標原意、數據邏輯性錯誤、數據非同一性、數據缺損、計算錯誤、筆誤等。這些油料自然損耗數據質量問題,既可能源于油料統計設計階段,如油料自然損耗數據非同一性問題、油料統計指標數值偏離指標原意問題等,也可能來自油料自然損耗抽樣調查階段和油料自然損耗處理階段。這就要求在油料統計的不同階段采取適當的手段,對油料自然損耗數據質量加以控制,以高度負責的態度,強化非技術層面的油料自然損耗數據質量控制,做到客觀求實、全面超前、細致反復,嚴把數據質量關。
油料自然損耗數據質量的好壞,是否能夠滿足油料統計人員的使用要求,首先取決于油料統計設計過程,油料統計設計階段的質量控制是提高油料自然損耗數據質量的前提。若油料統計設計階段工作沒有做好,就可能為油料自然損耗數據質量帶來許多后遺癥,“先天不足”必將導致“后患無窮”。油料統計設計階段的質量控制需要著重從以下幾個方面進行。
1.1正確規定油料自然損耗數據質量標準
油料自然損耗數據質量標準,是指油料統計人員提出的油料自然損耗數據精度要求。滿足精度要求的油料自然損耗數據才是準確、高質量的油料自然損耗數據。首先,要開展充足的統計調查,系統了解部隊和油料供應保障人員使用油料自然損耗相關數據的實際效果;其次,應歸納和總結油料自然損耗歷史數據出現過的主要質量問題,預先確定油料自然損耗數據質量控制的主要方向;最后,需反復論證,考慮數據質量標準在油料統計工作中能否實現,是否符合油料供應保障實際水平。
1.2合理設計油料自然損耗調查方案
油料自然損耗調查方案,是對油料自然損耗調查工作所有內容與全部過程做出的通盤考慮和安排。科學的油料自然損耗調查必須制定詳細而周密的調查方案。在油料自然損耗調查方案中,不僅要合理地規劃油料自然損耗調查過程,還要選擇適當的調查方式和方法。因此油料自然損耗調查方案是否科學、可行,直接關系到油料自然損耗數據質量的高低。合理的油料自然損耗調查方案,應著眼于實際應用,詳細說明油料自然損耗調查項目的內涵、外延及計算方法,使之切合部隊實際。
1.3周密制定油料自然損耗調查組織實施計劃
制定周密的油料自然損耗調查組織實施計劃并認真執行,是油料自然損耗調查工作順利進行和獲取高質量油料自然損耗數據的重要保證。油料自然損耗調查組織實施計劃內容,應包括調查領導的任命、調查機構的設置、調查人員的選擇、相關業務的培訓、調查經費的確定等內容。
1.4對油料自然損耗調查方案進行可行性研究
通過部隊試點,廣泛聽取各方意見,歸納匯總油料勤務領域專家、調查研究人員、數據統計人員、部隊油料業務人員提出的意見,采納并吸收合理建議,找出油料自然損耗調查方案存在的問題,提出修改完善的方案。同時,在實踐基礎上對油料自然損耗調查方案進行進一步驗證,為減小正式調查中的誤差提供經驗。
統計調查階段是油料自然損耗數據質量問題產生和形成的直接過程。通過油料自然損耗設計制定科學的油料統計調查方案,為獲取優質的油料自然損耗數據奠定了基礎,但能否達到方案規定的質量標準,得到高質量的油料自然損耗數據,最終還得取決于油料自然損耗調查過程的工作質量。加強油料自然損耗調查階段的質量控制,是保證和提高油料自然損耗數據質量的關鍵,是油料自然損耗數據質量控制的“中心環節”。在油料自然損耗調查階段提高油料自然損耗數據質量,主要應從以下幾個方面入手。
2.1油料自然損耗調查的前期準備
油料自然損耗調查前期準備工作,包括建立健全油料計量工作制度,優化油料自然損耗資料源頭,完善油料自然損耗數據原始記錄,搜集油料自然損耗調查背景資料,選擇和培訓油料統計人員,準備調查工具等,這些都是減小油料自然損耗調查誤差的有效措施。
2.2油料自然損耗調查中的數據質量控制
①根據確定的油料自然損耗調查方式,采取相應的油料自然損耗數據質量控制措施。使用間接調查法獲取油料自然損耗數據時,需要考慮油料自然損耗數據的可靠性與適用性。應分析油料自然損耗數據調查的歷史背景、所采用的調查方法,并與相關油料自然損耗數據進行對比分析,鑒別所獲油料自然損耗數據的可靠性,同時對其是否適用于當前做出評價。在油料自然損耗調查中,要重視調查人員的道德修養和業務素質,做好被調查單位和人員的工作,讓被調查單位和人員積極配合調查,以保證調查結果的真實性、準確性。運用抽樣調查方法獲取油料自然損耗數據時,要確保遵循隨機抽取原則,盡可能避免抽樣過程中的主觀性與系統性誤差,通過增減油庫(站)樣本容量、改善抽樣調查的組織形式、選擇適當的抽樣方法等控制抽樣誤差。通過油料自然損耗報表獲取所需資料時,要用統一的標準衡量油料自然損耗報表的各類數據,對油料自然損耗報表填制、匯總過程實行全面質量管理,確保所獲油料自然損耗數據質量可靠。
②在油料自然損耗調查過程中,調查人員還要對油料自然損耗數據采取多種方式反復審查,以發現問題并及時予以糾正。
③加強對統計調查人員的思想教育和油料自然損耗調查工作培訓,提高油料自然損耗調查人員的業務素質,杜絕油料自然損耗調查中因弄虛作假而造成的數據失實,減少因疏忽大意或業務不精熟而造成的登統計錯誤。
2.3認真做好油料自然損耗數據質量的驗收工作
油料自然損耗調查結束后,要組織專門的人員對油料自然損耗數據質量進行驗收,研究人員要認真評價油料統計調查質量是否合格,一旦發現油料自然損耗數據存在質量問題,要及時采取恰當措施加以補救,并對該單位進行重新調查,以免存在質量問題的油料自然損耗數據進入統計處理階段。
油料自然損耗調查數據是油料自然損耗調查工作的成果。從獲取油料自然損耗數據開始到進行分析應用,還必須經過油料自然損耗調查數據處理階段。油料自然損耗數據處理的質量,直接影響到油料自然損耗數據分析質量。油料自然損耗數據在統計處理過程中出現的錯誤,是導致油料自然損耗數據存在質量問題的重要原因。油料自然損耗數據的統計處理,包括手工處理和計算機處理,其流程如圖1所示:
首先從油料自然損耗數據源開始,經過手工錄入處理匯集于油料自然損耗樣本數據庫,樣本數據庫的庫存數據經三種方式流向統計分析部門,一是經本級匯總向統計分析部門報送;二是經本級運算形成相應的油料報表向統計分析部門報送;三是經本級運算生成油料統計總體數據,直接用于統計分析,再將生成的綜合分析報告上報統計分析部門。手工錄入油料自然損耗數據時,要增強統計人員的責任意識,依據標準化、規范化工作程序和要求進行處理,耐心細致地進行數據錄入,并展開自查與交叉檢查。采用計算機處理油料自然損耗數據,功能全、速度快、效果好,但也需要重視數據處理程序的設置,避免參數選取錯誤和誤操作,提高錄入數據的可靠性。
為了配合油料自然損耗數據的核查工作,樣本數據庫中油料自然損耗原始數據、匯總數據以及相關油料憑證、油料賬簿、油料報表、油料自然損耗調查表、油料自然損耗數據分析報告等統計資料均需按照油料統計資料所規定的時限保存,以便對油料自然損耗處理數據進行檢查或在今后修訂標準時予以借鑒。

圖1 油料自然損耗數據統計處理流程
在采用已通過數據質量檢驗的油料自然損耗數據作為統計樣本進行分析、計算前,還需結合油料供應管理經驗,依據應用數學模型對油料自然損耗數據作進一步篩查,以得到符合分析計算要求的油料自然損耗數據。
實際經驗通過現有標準(GJB1178-91),對各類型損耗標準率的規定(采用標準最大值)與采集油料自然損耗數據對比分析,可以認為:高于現有標準最大值兩倍(含)以上(損耗率高于6‰)數據都設為無效數據,在分析計算前均加以排除。
無效數據有別于存在質量問題的數據。質量問題數據主要是指由于抽樣調查技術、數據采集設備不完善,數據錄入及傳輸錯誤、測量單位混亂、虛報瞞報等原因使統計數據失真、數據丟失等因素形成的異常數據。而無效數據則不同,這些數據經過全過程的質量控制,數據質量不存在任何問題。無效數據主要是在一些特殊作業條件下形成的,例如罐底排污、儲油設備老化、呼吸閥打開等情況。如果對無效數據不加篩除,同樣會導致油料自然損耗數據統計分析失實,如參數估計、假設檢驗、方差分析、相關分析、回歸分析、聚類分析等分析結果都可能發生顯著變異,從而使獲得的數據樣本對總體的推斷、分析、檢驗不準確,甚至出現誤判。因此,數據采集之后對無效數據的識別和剔除,也具有十分重要的意義。
對于多次重復測定的數據,無效數據常用的統計識別法有拉依達準則(3σ準則)法、肖維勒(Chauvenet)準則法、狄克遜(Dixon)準則法、羅馬諾夫斯基(t檢驗)準則法、格拉布斯(Grubbs)準則法。拉依達準則法簡單,無需查表,用起來方便,測量次數較多或要求不高時用,當測量次數小于或等于10時,拉依達準則法失效。肖維勒準則是經典方法,改善了拉依達準則,過去應用較多,但它沒有固定的概率意義,特別是當測量數據n無窮大時,該準則失效。狄克遜準則法對數據中只存在一個無效數據時,效果良好,但當數據中無效數據的個數不止一個且出現在同側時,該方法的檢驗效果不好,尤其同側的無效數據很接近時效果更差,易遭受到屏蔽效應。羅馬諾夫斯基準則法計算較為復雜。其中,格拉布斯準則和狄克遜準則能夠給出了嚴格的結果,但狄克遜準則法的缺陷無法解決。
根據研究過程中所采集的樣本數據進行初步分析,筆者發現油庫(站)自然損耗數據基本符合正態分布,但存在部分數據大大超過實際經驗損耗率,且偏移在同側的情況,如果采用平均值來進行計算,會導致出現同側異常數據的屏蔽效應。因此筆者選取格拉布斯算法并對算法進行一定改進,將采集數據的中位數替換平均數進行計算,該方法對數據的處理更為穩健,有效地消除同側異常數據的屏蔽效應。
基于S-G組合思想的軍隊油料自然損耗數據質量控制工作,對軍隊油料自然損耗標準制定的全過程可進行科學、有效的數據質量監控,提高了樣本數據的可靠性、準確性,為制定軍隊油料供應管理標準制度奠定了堅實的基礎,是一種行之有效的數據質量控制方法。
(作者單位:總后勤部武漢后方基地油料技術監督室/解放軍后勤工程學院)
參考文獻:的編排格式如下:[序號]主要責任者.文獻題名.刊名或出版地,起止頁碼。
[1]楊志勇.政府統計數據博弈與管理對策研究[D].碩士學位論文.蘭州:西北師范大學,2009.
[2]黃利鋒.政府統計數據質量的管理研究[D].碩士學位論文.呼和浩特:內蒙古大學,2011.
[3]王穎.企業統計數據質量影響因素研究[D].碩士學位論文.杭州:浙江大學,2006.
[4]瞿春玲.政府統計數據質量控制技術的推進[D].碩士學位論文.蘭州:蘭州商學院,2008.
[5]王彥茹.統計體制視角下的我國統計數據質量研究[D].碩士學位論文.大連:東北財經大學,2006.
《中國儲運》創刊于1990年,經國家新聞出版署批準出版,面向海內外公開發行,國內統一刊號CN12-1204/F,郵發代號6-151。國際16開銅版彩印,月刊,國際標準刊號ISSN1005-0434,國外發行代號BM1821。
《中國儲運》學術欄目強調理論性與實踐性相結合,及時傳播物流發展理念,關注物流實踐熱點,旨在為物流從業者、科研院所及大專院校教學人員提供一個交流經驗、獲取信息、展現成果的有效平臺。多年來,《中國儲運》學術欄目秉持熱忱服務的宗旨,努力為廣大作者排憂解難,頗獲業界口碑。
《中國儲運》由《中國學術期刊(光盤版)》、《中國期刊網》(《知網》)、中國期刊全文數據庫、CEPS中文電子期刊數據庫、中國核心期刊(遴選)數據庫全文收錄。
《中國儲運》用稿要求:
根據檢索與評價數據規范的要求,有如下規定:
1.來稿,字數以4000字/2版(含圖表)為宜,來稿以 word格式發送電子郵件。論文初審時間一般不超過五個工作日,請作者注意查看電子郵件,按編輯要求辦理。
2.作者姓名、論文署名的單位(全稱)、及單位所在省、市、郵編。
3.稿件要求:摘要200字左右;關鍵詞(3~6個)。
5.樣刊郵寄地址(區、街道號)、郵政編碼、電子信箱、手機號碼(非常重要)。如需開具發票,請提供發票抬頭。
6.來稿中的注釋與參考文獻統一排在文末。按在正文中使用的先后順序用數字加方括號標出(正文),同一參考文獻如果多次引用,用同一序號標出。
7.來稿如屬基金項目成果,請按有關部門規定標注項目正式名稱和編號。
8.發稿周期一般為2~3個月,特殊情況另行商定。
投稿信箱:zgcyzzs@163.com 并注明論文投稿
聯系電話:022-24228078 13622017587
聯系人:《中國儲運》編輯部 王乃超
地 址:天津市河東區八經路方達大廈5F
郵 編:300012.
4.作者簡介:姓名、出生年、性別、民族、籍貫、工作單位、職務或職稱、學位、研究方向。