崔慧 于曉康
摘要:本文從大數據的發展現狀分析入手,討論了大數據的支票儲蓄在貸款審查過程中的數據分析,分析了大數據經濟學在貸款審查過程中的數據分析與研究,最后對貸款審查過程進行了展望。大數據,不僅將理論、實驗、復雜現象統一在一起,而且將將理論與應用完美的統一在一起,本文利用大量的數據分析,闡釋了微觀變量對貸款審查過程中時的影響。進一步的將宏觀經濟變量納入研究范圍。一方面,可以研究宏觀變量和微觀變量如何共同決定住貸款審查過程中的問題;另一方面,可以研究在不同的宏觀經濟形勢下,貸款審查過程中的決定因素和銀行審查決定因素的規律和變化情況,從而為銀行在不同經濟形態結合大數據的特征,在分析研宄傳統數據挖掘的基礎上,將聚類算法與基于基層的聚類算法相融合,并且提出一種混合型聚類算法。該算法能夠避免其他算法中心的問題,對處理后的數據進行從下而上的分,最后使用R語言工具對算法進行仿真,證實了算法的合理性與有效性。
關鍵詞:大數據 支票儲蓄 貸款審查
中圖分類號:F832 文獻標識碼:A 文章編號:1007-9416(2016)08-0134-01
1 大數據給帶來的影響
由于搜集數據的條件所限,大數據研究對象在總體傳統經濟學研究中,人們對數據進行抽樣,再用少量樣本來進行研究,這一傳統一直延續至今,并且成為經濟學研究中的主流做法.但是抽樣的質量非常不穩定,異常情況較多。在大數據時代,很多場合下已經直接將總體作為研究對象,從而改變了數據來源方式,對數據的處理也產生了深遠的影響。
1.1 大數據不需要基于假設檢驗的研究
在大數據時代,可以采用人工智能來得到的結論。大數據時代重在對數據處理的樣化結果進行分析。此外,由于變量的完備性要求比較嚴苛,需要考慮的不僅僅是研發投入,還要考慮資本結構、競爭、人員、行業等諸多因素從而使研究重心不容易掌握。
1.2 大數據使得因果關系變得不太重要
傳統經濟學重在對經濟現象進行解釋,但在大數據時代,這樣是不夠的。大數據甚至可以發現事物發展潛在的規律,具有一定的“智能性”,超越了經濟學研究關系。大數據并沒有改變因果關系,而是使因果關系變得不太重要。比如經濟學家在預測房價時,根據住房價格變化的因素來進行分析。但谷歌預測房價時,根據住房搜索查詢量變化進行預測,結果比經濟學家的預測更為準確及時。
1.3 傳統的因果關系有時無法驗證
弄清事物之間的內在聯系,一直是傳統經濟學研究的重要范疇。便宜購買舊產品,短期內會造成舊產品供不應求,反而導致舊產品漲價。是漲是跌,要采用傳統經濟學研究方法,這樣是難以驗證這兩種效應的,只能驗證兩種效應作用的綜合結果。
1.4 傳統經濟學研究具有滯后性
傳統經濟學對于新生事物有不敏感的特性,須等事情發生到一定規模以后,才能搜集到足夠數據再進行相關研究。在大數據時代,可以通過海量數據對經濟行為進行分析,一旦有新情況、便立即予以關注,從而實現對新生事物的早期干預和分析,具有前瞻性。
2 支票儲蓄賬戶現存問題
2.1 人們心理上的因素
在我國消費市場上,人們長期習慣于單一的現金結算,而個人儲蓄支票的不斷拓展使用,改變了傳統的支付方式。這會在人們思想上產生多重顧慮,擔心一旦出現空頭支票、假支票等情況,會在銀行企業、消費者三方之間引起經濟糾葛。人們的這種心理因素是制約儲蓄支票業務發展的主要障礙。
2.2 章則制度上的因素
現行個人支票的章則制度和管理辦法是完全照搬對公存款的辦法,由于對象不同,這種生搬硬套必然造成管理過死。
2.3 支票設計技術上的因素
目前,個人儲蓄支票在設計技術上存在一些問題如支票上沒有開戶銀行的地址及電話號碼,企業不易查詢、核對另外,支票背面也未寫明使用要點,這些極容易使接受單位產生重重顧慮,擔心是否空頭支票。
3 審查過程數據分析與研究
3.1 數據挖掘算法的選擇
數據挖掘算法的選擇由于數據挖掘算法涉及的學科以及技術有很多,所以對數據挖掘算法的分類有多種不同的描述。根據挖掘任務的不同,可以將數據挖掘算法分為分類、預測、聚類、關聯規則、異常和趨勢發現等類型。
3.2 基于層次的聚類算法的研究
3.2.1 基于層次的聚類算法
基于層次的聚類算法是一種將原始的數據集合按照層次不停地分解的一種方法,基于層次的聚類算法又可以分為自下而上的凝聚的聚類方法和自上而下的分裂的聚類方法。分裂的聚類算法跟凝聚的聚類算法相反,在層次遍歷開始前將所有的數據都歸結于一個聚類當中,然后按照事先設定的分裂規則進行聚類的分裂,_所有數據都單獨成為一個聚類或者滿足終止條件為止。
3.2.2 基于層次的聚類算法的優劣
基于層次的聚類算法跟上文中介紹的基于劃分的聚類算法有所不同,它起初是將每個數據結點都當作一個初始聚類,然后根據聚類間的距離依次進行合并,這樣的好處是不用隨機選取初始聚類中心,能夠減少一定的聚類誤差,但是合并之后的聚類將無法再分離,這樣會降低聚類的靈活性,并且將在一定程度上大大增加程序的運行時間。
4 結語
大數據將是21世紀經濟學的重大進展之一。它是隨著大數據在人類經濟社會中的應用而產生的,目前尚處于萌芽階段,其實踐遠遠超越理論,可以預見的是,不久的將來是大數據經濟學的理論建構和高速發展期,大數據經濟學理論可以隨時得到檢驗和修正。目前,整個平臺的任務流水線水平還有待提高,進一步提升平臺的智能化與自動化。隨著業務量與數據量的加大,普通的數據存儲模式急需改變,引入相應的數據存儲與替換規則都是需要進一步研究與實踐的。目前,移動互聯網還處于高速發展階段,很多與移動互聯網相關的技術還處于發展與探索階段,而且隨著移動互聯網的繼續發展,開展的業務必定會更加復雜,更加廣泛,移動數據也將更加海量,更加多樣。
參考文獻
[1]庫波,晁學鵬.一種用于網站用戶行為分析數據的可擴展協同聚類算法[J].科技通報,2013,29(2):67-69.
[2]葉猛,胡凱.基于TD-SCDMA/WCDMA網絡的用戶行為分析系統[J].移動通信,2010(2): 80-83.