◎汪涌泉
以Page Rank模型分析數據挖掘在金融領域的應用
◎汪涌泉
數據是金融部門的工作人員每天都要接觸到的工作,金融部門的業務都會產生大量的數據,隨著技術的不斷的發展,利用數據庫系統的管理可以有效的對產生的數據進行管理,但是卻無法察覺到數據之間額關系以及規則,無法根據現在所存在的數據去推測未來的發展,更有可能會導致數據爆炸問題的出現,本文將通過對數據挖掘的簡單介紹,簡述數據挖掘技術在金融領域中的應用。
在金融領域當中,金融機構的運作存在著必然的金融風險。風險管理對于每一個金融機構而言都是一項必不可少的重要工作。一般的金融管理手段缺乏一些數據挖掘所隱藏的知識手段。在金融行業當中,有效的利益數據挖掘技術不但可以發現大量數據中所隱藏的一些必然關系,還可以很好的將金融風險降到最低。
數據挖掘的定義。近幾年來,數據挖掘引起了信息產業的高度關注,這其中最主要的原因是其存在著大量的數據,可以被廣泛的應用,并且還可以通過需求將這些數據轉化為有用的信息和數據,獲取到的信息和數據可以被廣泛的應用的到各個領域。
數據挖掘主要是指從大量的數據中通過一定的算法查看到數據中所隱藏的信息的一個過程。數據挖掘技術主要包含統計技術、計算技術以及人工智能技術。可以把數據挖掘看作是統計技術的一個延伸。對于大多數的統計技術而言,基本上都是基于數學理論和技巧,它的預測度所達到的準確率可以在一定的程度上滿足人們的需求,但是,這種技術對使用者具有較高的知識要求。但是,隨著計算機技術的不斷發展,數據挖掘技術可以通過相對簡單的方法和技術來實現同樣的功能。獲得更好的分析效果和消息。
數據挖掘的方法。從數據挖掘技術角度來看,主要的方法包括:
決策樹法:顧名思義,主要是利用樹形結構進行決策的集合,這些決策的集合是通過對數據的分析而得來的規則。出現在國際上最早也是最具有影響力的是ID3方法,后來才發展的其他的方法。
規則歸納法:通過統計的手段對數據進行歸納,從中提取出有效的規則。規則歸納技術在挖掘技術的領域中被廣泛的使用,使用最多的是關聯規則法。
神經網絡法:以模仿生物的神經網絡為結構,構建三種神經網絡的模型,這種方法可以完成多種類型的數據挖掘任務,例如分類挖掘、特性挖掘等任務。
遺傳法:主要是通過模擬動物的進化過程而演變出來的算法,主要有三個基本的算法組成。為了更好的使用遺傳算法,需要將數據挖掘的任務的表達進行轉換,形成一種搜索的問題,從而發揮出遺傳算法的優化搜索能力。
可視化技術:將信息模式、數據的關聯或者趨勢等通過直觀的圖形方式來進行相關的表達,使用者就可以通過對可視化技術的交互來對數據進行分析。可視化技術的使用,使得用戶可以更清楚的對數據進行解析。
到目前為止,在很多的領域,數據挖掘是一項比較新鮮的技術,尤其是在銀行、電信、保險甚至交通等商業領域當中。數據挖掘技術的使用可以很好地且有效的解決一些比較典型的商業問題。例如:客戶群的劃分、數據的營銷、交叉銷售等一系列的商業問題以及市場分析行為。
數據挖掘在銀行行業的應用。銀行在一天中就會產生大量的數據,銀行業可以看作為是一個負債經營的商業產業,在獲得大量的利益的同時,風險程度也會隨之加大,兩者是并存的。如何降低一個銀行所存在的風險,就需要對賬戶的信用進行有效的分析。利用數據挖掘技術進行的信用評估最終的目的就是降低風險,提高收益。
以PageRank模型在銀行的應用為例,PageRank對網頁的排序具有三大優點:排序和特定的搜索關鍵的詞沒有關系;網頁的排序和網頁中的所呈現的具體內容沒有關系;只需要知道網頁所對應的圖結構。例如在銀行的匯入金額的排序問題中,我們不難發現隨機沖浪的模型可以在一定的程度上有效的客服數據缺損等方面的困難。
類別PageRank算法,我們可以在綜合方面考慮每項業務的等級劃分,然后再根據等級劃分來確定最后的排序問題。可能表中會包含非常大的數據量,從不同的層次進行最后的排序和分析,我們會發現在最后所建立的隨機沖浪模型會很好的分析出數據中參數的穩定性是否良好。
數據挖掘在保險行業的應用。保險行業涉及到數據挖掘技術的主要是兩方面:業務中保險金的確定和險種之間的關聯關系的分析。
保險對每一個受險的人員的分類可以有效的確定保險的金額度。通過數據挖掘技術,業務員可以了解到對不同的行業、不同年齡、不同工作層次的人員的保險金的額度,從而更加方便的工作,提高工作的質量。
對于險種的關聯關系分析而言,數據挖掘技術可以對已經購買過保險的人員進行分析,查看其是否還可以與此同時可以同時購買其他類的保險。
數據挖掘在證券行業的應用。證券行業中對數據挖掘的使用主要表現在分析客戶、管理客戶、分析交易數據以及分析交易風險等方面。
從證券營銷的角度分析的話,證券主要是為了滿足客戶的需求而做出的一系列的金融活動,營銷的戰略會貫通到整個證券交易的過程中,而對客戶關系的分析以及管理是國內的證券行業所比較關注的問題以及技術,數據挖掘技術在這其中占有核心的地位,業務人員是否真正的了解客戶,是否能夠準確的判斷出此次的交易是否可以帶來利益等等諸多的此類問題,都可以通過數據挖掘技術得到想要的答案。數據挖掘在改變看待客戶的角度的同時,還為業務人員以及整個的營銷部提供著可靠的依據。
信息技術的飛速發展,金融行業越發的繁重,作為一項先進的數據挖掘技術在金融行業的應用,促進金融行業發展的腳步,降低金融行業所存在的風險,對金融行業的發展起到保駕護航的作用,占有著不可忽視的核心地位。
(作者單位:天津水運工程勘察設計院)