寇鑫
摘要:新時期社會發展下,推動了大數據時代的到來,大數據技術逐漸滲透到金融、醫療、生活、基層服務等各個領域,統計學在大數據中的應用創造了更廣闊的發展空間。下面文章就對統計學在大數據領域的應用與發展進行探討。
關鍵詞:統計學;大數據;數據統計;金融
數據技術是通過對數據的廣泛收集和算法分析,以得到有價值參考信息的過程。其數據的方式存在模糊性的特點,處理的數據越全面得出的結論會越準確。而傳統的統計學分析,對數據的樣本有著明確的要求,對有限的數據樣本進行匯總,最終通過人的分析得出一些可靠結論。傳統統計學和大數據技術在現代發展過程中,都存在局限性和短板。對此在數據分析的過程總,就可以利用兩者的特點取長補短,以促進數據分析能力和價值的提高。
一、大數據的特點
大數據,指的是不同于之前傳統的數據處理庫,而是數據含量大、數據分析難度大、規模巨大的數據集合,需要新型的數據分析處理方式才能發揮作用的信息資產。大數據本身具有很大的技術優勢和鮮明的技術特點,首要特點便是巨大的數據量。隨著我國網絡信息技術的發展,傳統數據不能適應于時代的發展,現代急需大量的數據分析處理,加之互聯網的興起,網絡數據更能快速的運輸數據,將數據進行匯總。所以從傳統數據單位的NM、GB、TB到大數據的PB、EB、ZB。大數據時代已將傳統數據所替代并將繼續發展。其次,便是傳播速度的高效性。伴隨著互聯網技術的發展,數據信息的產生與傳播遠遠不是我們可以想象的,傳播速度極快,傳播通道較多。因此,數據的產生和處理速度是火箭式的、飛躍式的,導致數據與時間相掛鉤,形成特有的時效性。因此數據分析與處理的高速度、高精準成為大數據分析模式的一大要求和特點。
二、統計學在大數據領域發展
(一)統計學在金融投資風險管理中的應用
金融投資和股票基金的投資管理都存在著一定的風險。而統計學方法在金融領域中的應用就可以在極大程度上使得股民和基金購買者在金融投資中規避風險,同時獲得一定的收益。例如,通過對金融領域中的指標選取,建立市場走勢風向標,利用諸如統計學中的馬柯威茨組合理論等分析投資理財中的損失概率分布、可能獲得收益和與其收益的偏離程度等具有指導價值的信息,從而得出以何種分散化的投資方法來規避金融投資風險的風險管理理論。
(二)統計學在人口大數據中的應用
一個國家的核心是人民,歷年的人口普查是國家必不可少的工作,而對于人口的統計,自然離不開統計學的作用。我國國土遼闊,人口眾多,統計起來并不方便,不利用有效的方式很難完成這項工作。利用應用統計學能推斷出當前社會人口的總體情況,并對未來人口的趨勢做出推斷,然后制定出相應的有利于人口發展的計劃,實現人口的可持續發展。另外,應用統計學還能制定出青少年、老年人以及兒童群眾的統計圖,隨著國家二胎政策的開放,幼兒的數量會不斷增多,這時候就需要國家通過統計來找出推動社會全面發展的方法,而在勞動力方面的問題,也需要進一步整改。這些國家存在的隱患,都需要利用到統計學。由于統計學本身是具有嚴肅性和科學性的,并且使用起來效果顯著,因此被廣泛地應用到人們日常生活的各個方面。
(三)統計學在醫學預防中的應用
統計學在醫學預防中的應用,主要是針對某種疾病發生的高危因素的挖掘,從而實現對這些致病高危因素行為的規避,以及對具有高危因素群體的疾病篩查、診斷具有提示作用。例如,研究心臟病的危險因素,選擇指標有年齡、性別、體重、最大攝氧量,自變量為患病與否,可先進行這些單因素與因變量之間的t檢驗或者卡方檢驗,從而篩掉一些無意義的指標,再將這些納入的指標進行二分類Logistic回歸分析。最終回歸方程中納入的具有統計學意義的指標即為與疾病發生相關的指標,連續變量的OR值意味著自變量每增加一個單位,疾病發生風險的增加值,分類變量的OR值則意味著賦值高的指標是賦值低的多少倍。
(四)其他學科中應用
統計學大數據時代,大數據給社會各領域產生了巨大影響。在此背景下,社會各行業為實現進一步發展目標,均加強數據分析和利用。隨著科技的發展,人們在出行之前,通常會習慣性的查詢交通、天氣等狀況。基于本質角度而言,人們日常生活中常用的天氣、交通等軟件都與統計學、大數據密切相關。以交通軟件為例,交通軟件當中查詢到的交通狀況,主要通過實時監測路況,如人流量、車流量等,得出一系列數據之后,運用統計學方法進行分析,最終得到具體的交通狀況,并以直觀的圖表方式呈現給交通信息使用者。再比如,翻譯軟件,日常學習中通常會運用一些翻譯軟件,基于本質角度而言,其與大數據和統計學也是密切相關,翻譯軟件中存儲了豐富的詞匯量,當人們使用翻譯功能時,即可按照檢索需求呈現出來,為人們提供了巨大的便利。
三、大數據背景下應用統計學的創新
大數據時代背景下數據的海量性以及多樣性都是應用統計學分析的重點,和之前不同的是,以往的大數據都由于存在滯后性使得得出的結論并不準確,這就為應用統計學帶來了機遇,且要及時抓住機遇進行創新。大數據的分析和研究主要依賴于云計算,這為我們的應用統計學創新帶來了靈感,同樣可以將云計算技術應用到統計學當中,在技術層面上進行革新。另外,傳統的應用統計學還也特別注意在計算機統計學當中的應用,沒有計算機作為支持,就沒有相應的軟件,這就會很大程度地限制應用統計學的發展。從計算機科學的層面上講,我們可以肯定大數據并不是簡單的計算機技術上的概念,關于大數據方面的論文十分稀少,甚至是沒有,所以我們可以得出結論,大數據并不僅僅是計算機技術,而傳統的應用統計學則需要依賴于計算機在大數據時代的背景下高速發展。
四、結語
總之,大數據時代,統計學的發展面臨一系列挑戰和機遇,如何實現大數據與統計學的融合是亟待思考的一個問題。因此,統計學領域的專家有必要加強大數據時代下的統計學應用研究,緊緊把握大數據時代給統計學發展帶來的機遇,充分發揮大數據時代統計學的優勢,更好的為人們生活和經濟發展提供依據,能夠實現更加和諧的社會環境。
參考文獻:
[1]曹彥林.應用統計學在大數據背景下的應用與創新探討[J].納稅, 2018(4):232.
[2]高文濱,楊映瑤.應用統計學在大數據背景下的應用與創新[J].江蘇科技信息,2019,36(19):68-70.
[3]張政.應用統計學在大數據背景下的應用與創新[J].山西青年,2017(1):286.