劉雨蓉
(寧波工程學院,浙江 寧波 315211)
在數據分析上,傳統統計學理論是利用概率論、數理分析工具來挖掘數據規律,以構建數學模型,大數據分析是通過計算機技術來整合、分析龐大數據庫,挖掘數據本質規律,以發揮出對生產的指導作用。相較于以往的統計學分析理論,大數據分析技術更為完善,統計學分析會受到各類人為因素的影響,抽樣調查也可能會遺漏數據,應用大數據分析,可以從根本上解決上述問題,提高數據分析的準確性。
在傳統統計分析與大數據分析上,分析對象均為定量數據,并非抽象事物,因此,在獲取數據時,需要通過有效渠道來轉化原始信息,形成良好數據形式,因此,從本質來看,傳統統計學分析、大數據分析在數據形式上是相同的。
大數據的應用符合社會發展趨勢,在海量數據中,應用大數據技術,可以做出精準預測,目前,大數據分析已經在各個行業中得到了廣泛應用,統計工具也在不斷升級、轉型,統計學理論與大數據分析的結合也成為大勢所趨,針對此來看,統計學理論在大數據時代的應用會表現出幾個趨勢:
應用傳統統計抽樣方式,無法對龐雜數據來進行分析、處理,也難以展現出大數據的知識密度,獲取的分析結果自然不夠精確,這無疑會影響數據的挖掘、使用成效。將數據分析、統計學理論之間結合,能夠打破傳統數據分析模式的限制,充分發揮出大數據的價值。大數據內容多元、混亂,對數據形式準確性要求不高,可以利用統計學分析方式來對比數據變化,同時,大數據對數據精度的要求并不是很高,而是“以量取勝”,更加側重于整體研究,通過數據分析、統計學理論之間的結合融合了兩者優勢。
大數據具有價值、多樣、高速、大量4個方面的特點。基于大數據分析的特點,既往相關專家總結出了如下公式,即:大數據=高頻海量數據+復雜類型的數據。在大數據時代下,數據分析工作便是對海量數據的分析、歸納、統計、總結,挖掘出其中具有價值的信息和內容,進行對比,以得出具有價值的信息。在數據收集、處理環節中,需要進一步創新數據分析渠道,擴充數據來源,對于相關人員而言,要具備數據積累、處理的意識。大數據具有一定的流動性,在時間的流逝下,數據信息數量會繼續增加,因此,相關人員要具備創新化的數據分析理念,讓數據真正實現增值,以幫助人們更好地解決問題。
在信息技術的發展與完善下,對大數據分析技術的應用也提出了更高要求,在具體操作上,需要基于傳統數據分析方式來對各類現象進行預測、解釋,發揮出大數據在數據分析中的作用,應用多元化的數據分析方式,與實際情況結合,在確保數據分析準確的基礎上,優化統計質量管理模式,進一步挖掘大數據的價值,為行業發展注入全新活力。統計學理論在大數據時代的應用主要包括幾種方法:
統計學方法:統計學理論主要研究的是概率分布指數族,其內容包括圖表指數族、羅協變量信息效應等,應用十分廣泛,在統計學理論中,指數族發揮著重要作用,在大數據時代的應用上,也要高度重視該種方法的應用。
大數據建模:基于云計算、大數據支持,快速線上算法也得到了廣泛應用,在數據體量較大的情況下,傳統的挑選、調取技術無法滿足實際需求,此時,即可應用快速線上算法來解決問題。
巨型分布系統建模:在社會經濟的發展下,每天都會產生海量數據,對于數據的存儲、運行平臺提出了更高要求,此時,可借助億億兆系統來處理,應用分布式綜合大型科學數據庫建模,再通過空間降維技術來得出多種算法。
不同類型、形式的大數據思維,其應用領域、重點也各有差異,在具體應用中,需要做到因地制宜,根據數據分析要求來探索有效的解決方法,積極改革傳統統計工作,為統計分析的正常運行打下基礎。
統計學理論在大數據時代的應用需要從多個角度著手,充分結合統計學理論與大數據分析的優勢,促進兩者的深度融合,做到趨利避害,明確分析目標,排除冗余特殊值,提取出海量信息的規律,繼而更好地為實踐活動提供指導。