劉 錦(天津大學管理與經濟學部,天津,300072)
基于數據挖掘技術的證券客戶分析系統
劉 錦
(天津大學管理與經濟學部,天津,300072)
數據挖掘技術作為一門多學科交叉融合的產物,在當前信息化時代的發展中具有重要的地位,依賴數據挖掘技術進行信息分析,目前在多領域都有著良好的運用。在證券行業,隨著競爭的加劇,相關證券服務商為了提升自己的市場份額,必須要做好客戶維護與挖掘,因此,對于高質量的客戶分析系統的需求較大,本文基于此種現實情況,對基于數據挖掘技術的證券客戶分析系統進行了簡單的介紹,并對系統工作的流程和原理進行簡要的論述,希望能引起相關人員的重視。
數據挖掘;技術;證券客戶;分析系統
在信息化技術飛速發展的今天,迫切需要用現代的信息化技術來完善相關客戶服務體系,基于數據分析和挖據技術的證券客戶分析系統能夠起到這樣的作用。對于證券公司而言,數據分析與挖掘技術的應用,能夠提升客戶服務,增強資產的競爭力,降低公司的生產成本。利用數據挖據技術研制而成的證券客戶分析系統能夠利用現有的相關數據,進行自動的深入分析,對相關客戶進行有效的劃分,從而將那些最有價值的客戶的相關信息提供給客戶服務部門,甚至提交給業務部門,提升他們工作的針對性和有效性,進而提升公司的業績水平。
1.1數據挖掘的定義
對于數據挖掘技術,簡單通俗的理解就是從大量的、模糊的、干擾嚴重的、不完全的和隨機的數據中,提取出相關的隱含的人們事先不知道的,但是又是有效的和潛在有用的相關信息和知識數據的過程。被挖掘的技術可以是數據庫存在的一類結構化的數據,也可以是像文本、圖像或者是圖形之類的半結構化的數據,當然,對于存在于網絡上的異構性數據也是能夠接受的。對于相關信息中知識的提取與分析,可以是采取演繹的辦法,也可以采取歸納的方法。對于發掘出來的信息和知識,可以用作信息管理、信息查詢、決策支持和過程控制等,還能夠進行數據的自身維護。數據挖掘技術是在經過多年發展成熟的數理統計技術和人工智能技術以及知識工程等領域的研究成果構建而成的一套完善的理論體系,是一種交叉學科融合而產生的新型實用技術,這種技術集成了數據庫、人工智能、數理統計技術、可視化技術和并行計算等技術。
1.2數據挖掘過程和要點
對于數據挖掘技術,主要目的是為了從大量的數據中。發現相關隱藏的信息規律、數據間的關系。提取出我們需要的信息服務于決策。因此,數據挖掘主要有如下幾個步驟:數據的收集、整理、挖掘、對挖掘的數據進行信息分析、分析結果的評估以及最終的決策。數據挖掘的過程往往具有多次重復性,需要進行數次的循環往復過程,才能達到理想的效果。
當前,隨著時代的發展,數據挖掘技術在各領域已經被廣泛的重視,并在部分領域進行了應用。對于證券行業而言,已經專門研制出基于數據挖掘技術的證券客戶數據分析系統,如下,將對其工作的過程和原理、方法等做一個分析,以便提升相關人士對此系統的熟悉。
2.1.1準備客戶數據并計算
結合相關信息的數據庫,對客戶在某段時間的持倉比、換手率等其他相關證券投資信息進行匯總和查詢,主要的步驟可以如下:
(1)對發生在2014年11月1 日至2014年11月30日之間所有的證券交易流水進行查詢。如: select * from jz27base. zjls where hbdm =’0’ and qsrq>=’20141101’ and qsrq<=’20141130’ and (zydm=‘1401’ or zydm=‘1402’)
說明:zjls表示“資金流水表”;hbdm表示“貨幣代碼”。“0”表示“人民幣”,1401表示“買入成交”、1402表示“賣出成交”。
(2)對相關證券用戶證券投資的成交總金額、交易的手續費和相關統計圖形的建立。
(3)對用戶資金的情況進行分析,計算相關用戶資金的可用數值,提取客戶的證券市值、資產情況和持倉比等與證券投資交易相關的信息。
(4)計算用戶的換手率。
(5)將計算的結果分類列好,然后按照編程語言要求,將結果引入中間表hsl中,例如,對于證券市值,應導入表中字段為zqsz(證券市值)的那一欄。
(6)計算客戶的盈虧率。對于盈虧率的計算是一個復雜過程,涉及到的知識很多,由于本文對數據處理不做詳細論述,在此省略。
(7)最終結果匯總。將計算出來的各種信息,按照最終結果表的要求,導入結果表中對應的專欄。表中應主要包括:資金賬戶、證券市值、資金可用數、換手率、總成交金額、盈虧率等。

圖一 客戶初始信息準備
在基于數據挖掘技術的證券客戶分析系統中,核心的部分進行利用數據挖掘技術按照數據分析的結果,判定客戶的各種屬性和價值度,然后進行分類,建立起一套客戶價值度的評價模型,對客戶價值度大小進行評價,得到結果。主要的步驟如下:
2.2.1建立客戶主題數據集市
如可以按照下圖一所示表格進行客戶初始信息的準備。
2.2.2建立相關屬性集
按照前述客戶初始信息的準備表格,然后采取隨機抽取的方式,將相關信息組成訓練數據集,然后按照相關屬性價值度評價標準,建立相關的屬性集。
2.2.3建立模型
對于客戶分類模型,其建立過程主要如下圖二所示。

圖二 模型的建立過程
其中:客戶分類法主要采取K平均值算法。首先,對于相關實驗中所得的實驗數據,進行針對模型的換手率、持倉比和盈虧率等來做K平均值的聚類分析。按照5種不同類別的K平均聚類分析后,得到聚類分布結果如圖三。

圖三 客戶聚類分布結果
依據上述結果圖進行客戶價值的評價:具體而言,對于chister-4,交易過程較少,而且交易的數量不多,存在較大虧損的客戶,基本可認定為無價值客戶;chister-2,存在大量的交易記錄,但是成交量較少,具備較高盈利能力的一般價值的客戶;chister-3,有一定交易而且有一定的成交量,但是虧損較多,是普通的客戶;chister-1,有大量的交易過程,成交的量也比較大,是一種盈利能力較強的客戶,具有一定價值;chister-5,交易次數品頻繁,交易量巨大,而且盈利水平十分高,是最有價值的客戶。
2.2.4客戶價值大小排列并選定
依據分類模型及分類依據,對相關客戶信息導入分析模型,由系統自動得到客戶的價值排序表格,然后相關人員按照分析的結果,提取出最有價值和有價值的客戶的信息,進行專門的證券客戶服務操作進行客戶的跟蹤與挖掘,進而提升公司的市場份額,促進公司盈利。
對于依靠數據挖掘技術研發而成的證券客戶分析系統,目前在少數的證券公司中進行了應用,從相關公司的應用情況分析,取得了較好的應用效果。由于本系統還處于初期發展階段,從相關的比對測試分析中,系統的準確度還有一定的提升空間,需要不斷的完善。因此,希望相關的研究人員能進一步研究,改進系統中存在的不足,提升系統的準確度,為證券商提供高質量的客戶分析數據。
[1] 張效嚴,齊春瑩.基于數據挖掘技術的證券客戶分析系統[J].計算機應用,2008,S1:369-371+375.
[2] 段玲.基于數據挖掘的銀行客戶分析系統設計與實現[D].電子科技大學,2013.
劉錦,男, 1981-08, 湖北咸寧,碩士研究生,研究方向:資產證券化
The securities customer analysis system based on data mining technology
Liu Jin
(Tianjin university of management and economic department of,tianjin,300072)
Data mining techniques as a product of multidisciplinary cross fusion,in the current plays an important role in the development of information age,dependent on data mining technology for information analysis,currently has a good use in many fields.In the securities industry,with the intensification of competition,the relevant securities service providers in order to improve their market share,must want to make customer maintenance and mining,therefore,demand for high quality customer analysis system,this article is based on this reality,the securities customer analysis system based on data mining technology is briefly introduced,and the system working process and principle are briefly discussed,hope to be able to cause the attention of related personnel.
data mining;Technology;Securities customer;Analysis system
2015—8-12