張海波



【摘 要】隨著互聯網+時代的到來,人們日常生產生活產生了更加龐大的數據集合。這些數據的誕生也產生了一些新的高新技術——這也是當下最炙手可熱的大數據技術;而在社區管理中應用大數據技術,更能精準、高效的滿足當下諸如老年、殘障人士的康復需求以及減少社區工作者的一些繁瑣工作。本文將以此為論述背景,以一些具體的實例來闡述大數據技術在社區管理中的應用。
【關鍵詞】大數據技術;社區管理;多元線性回歸;數據可視化
一、大數據技術的概念
大數據技術是指那些超過傳統數據庫系統處理能力的數據。它對于數據的整體數量和轉輸的速度要求比較嚴格,或者其結構不適合原本的數據庫系統。
對于社區工作者和相關企業來說,大數據的價值體現在兩個方面:分析使用和二次開發。對大數據進行分析能揭示隱藏其中的信息。并通過提取的這些信息來制定出未來的一些規劃安排。
二、大數據技術在社區管理中的應用
首先通過有關人員在社區中進行走訪記錄所需要的數據,回訪結束后第一時間將數據錄入數據庫中進行保存。之后便進行對數據的初步清洗,剔除無關或是缺失數據。然后再將清洗之后的數據進行一個初步的整理分析,最后通過相應的可視化軟件將最后的數據分析結果通過圖像直觀的展現出來,便于后續的分析當前的一些數據結果以及預測未來的變化。
三、具體應用案例(某區域所有老年人主要支出的數據預測)
通過選取了某社區內近一年小區老人主要開支的幾個項目如疾病支出、護工支出、保健品支出、日常生活支出、其他支出這五項,通過建立合理的數學模型來預測出未來一段時間該社區老年人主要支出的一個大的方向來針對于老年人群體制定一個合理的計劃來減小老年人的不必要開支,減輕老年人的生活負擔。
如下表某區域內社區老人近一年的開支(節選):
四、分析的步驟及結果
通過分析F值,分析其是否可以顯著地拒絕總體回歸系數為0的原假設(p<0.01或者0.05),若呈顯著性,表明之間存在著線性關系,至于線性關系的強弱,需要進一步進行分析
通過R?值分析模型擬合情況,同時對VIF值進行分析,若模型呈現共線性(VIF小于10或者5,嚴格為10),建議使用嶺回歸或者逐步回歸。
分析X的顯著性;如果呈現出顯著性(p值小于0.05,嚴格則需小于0.01);用于探究X對Y的影響關系結合回歸系數B值對比分析X對Y的影響程度確定得到模型公式。
回歸效果如下表格:
上表格展示了本次模型的分析結果,包括模型的標準化系數、t值、VIF值、R?、調整R?等,用于模型的檢驗,并分析模型的公式。
1.線性回歸模型要求總體回歸系數不為0,即變量之間存在回歸關系。根據F檢驗結果對模型進行檢驗
2.R?代表曲線回歸的擬合程度,越接近1效果越好
3.VIF值代表多重共線性嚴重程度,用于檢驗模型是否呈現共線性,即解釋變量間存在高度相關的關系(VIF應小于10或者5,嚴格為5)
從F檢驗的結果分析可以得到,顯著性P值為0.000***,水平上呈現顯著性,拒絕了回歸系數為0的原假設,同時模型的擬合優度R?為0.926,模型表現比較優秀,因此模型基本滿足要求。對于變量共線性表現,VIF全部小于10,因此模型沒有多重共線性問題,模型構建良好。
模型的公式如下:
y=-900559.158+22.016 * 疾病支出+132151.431 * 保健品支出+17.080 * 日常支出-263.564 * 其他-176707.479 * 護工支出
從這個模型的公式中我們不難發現在老年人支出費用中占比最大的是護工和保健品的支出。
針對于上述為了更直觀的看到模型的效果,需要對模型進行擬合,擬合最終效果如下圖:
從上圖我們能很直觀的看出所建立模型的預測值與真實值相差不大,這也從側面的反映出我們模型建立的合理性。
通過上述模型公式我們不難推斷出未來一段時間內社區老人的主要開支情況,并及時的制定相關計劃對社區內的老人進行幫扶。
五、前景展望
社區管理面對的是是一個龐大的居民群體,其中不乏一些特殊群體諸如老年、殘障群體,這一部分群體的生產生活的需求往往可能被人們所忽視,但通過大數據技術,我們能更好地搜集分析并制定相應的方案,來滿足這一群體的需求從而構建一個和諧美好的社區。
機遇和優勢往往遠大于我們所要面臨的問題,通過此技術我們能擺脫傳統上一些比較落后的社區管理手段,對于一些社區問題我們能用更科學、高效的手段進行解決,同時,通過大數據技術我們能更清楚地了解社區的實時動向,并及時的根據所轄社區內的一些數據動向制定合理的方案來滿足居民所需。
參考文獻:
[1]郭強,郭耀煌,向必燈. 我國社區管理模式適應性研究[J]. 軟科學,2006(01):65-68.
[2]張鋒軍. 大數據技術研究綜述[J]. 通信技術,2014(11):1240-1248.
(作者單位:西南科技大學城市學院)