孫躍
大數據與傳統的安全統計數據相比較,首先在理論知識方面具有極大的不同,傳統的安全統計數據維數是單維的;數據收集重點是非場景化數據;數據之間具有因果關系的模型,采用描述性的數據使用方式;數據組織和存儲方式是關系型數據庫;面向對象的數據結構;SQL數據庫數據存儲管理方法;數據生命周期隨研究過程的結束而終結。但是大數據具有多維的數據維數;數據收集重點是場景化數據;數據之間具有相關關系的模型,采用預測性的數據使用方式;數據組織和存儲方式采用關系型數據庫;面向主題的數據結構;NOSQL數據庫數據存儲管理方法;數據生命周期不隨研究過程的結束而終結。
在處理事故方面,通過在安全統計的過程中使用大數據的技術,對于不同的數據進行分析,得出安全事故發生的一些規律性的結論,可以有效地更有針對性的對于相關的事故進行防范,安全科學領域使用大數據技術,如對安全科學數據存儲和分析,找出事故發生的規律和特點,可以看到所有的數據將被忽略,捕獲潛在風險信息之間的關系,控制情況,提前對于相關的事故進行排查和預防,降低安全事故的發生率,在事故的處理過程中,利用大數據可以實時地統計到安全事故的發生情況,對于發生的原因,解決的方法,采用不同的方法可以達到的效果均可以通過仿真得到結果,使得工作人員更容易從不同的解決方案中通過智能化的算法得到最優的解決方案。
海量數據的出現給傳統的安全統計工作帶來了沖擊。采用先進的信息技術對數據進行錄入,既可以避免人為數據記錄的缺陷,又可以提高數據統計的價值。傳統的安全統計分析思路是從“假設”到“驗證”,在大數據背景下,分析思維從“探究”轉變為“總結”。它可以直接從數據中探索規則,不受任何假設限制,然后進行歸納總結,得出結論。這些變化極大地拓寬和豐富了統計分析的理論和思路。
在安全統計學的學習過程中應該加強相關軟件的學習,EXCEL、Eviews、SPSS等是目前統計學課程使用的主要教學軟件。除了要求學生掌握基本的統計軟件操作外,學生還應考慮先選修與大數據分析相關的計算機專業課,如數據庫開發設計、Hadoop、Hive等計算工具,以處理大規模的多源異型數據和腳本語言Python。
數據的采集向著更加智能化的方向發展,傳統的安全統計數據是通過簡單的調查報告,單純的訪問和了解而獲得的比較片面的統計結果,結果中有很多數據不具有代表性,所以在安全事故的防護過程中不能很好的完成任務,但是后期對于結果的處理將會花費更多的人力和物力,此時大數據的智能算法就體現出來了他的優勢,能夠在信息的收集階段就排除被采訪者答案主觀性的影響。
對于傳統的安全統計數據發布進行完善,工作人員的工作方式在這個過程中起著舉足輕重的作用,對于統計數據的公開必須經過工作人員提前的審核,確保統計數據的正確性和對于行業趨勢的引導作用,提升用戶對于公開數據使用的滿意度,爭取獲得用戶的廣泛好評,滿足用戶的各種要求,從而成為用到這些數據的工作人員工作過程中的得力助手,工作人員在工作的過程中也可以利用大數據的軟件,捕獲準確的最新的數據,將這些數據及時提供給相關的部門,提升安全統計部門的信息及時性和準確性。
當然,大數據時代并不意味著傳統的安全統計方法不重要。從必要性、安全性和經濟性的角度來看,并不是所有的數據都可以或者需要從大數據中獲取。即使是大數據,也必須輔以傳統統計分析才能得出相應的結論。