盛瀚



DOI:10.16660/j.cnki.1674-098X.2017.25.117
摘 要:本文從對大數據產業發展進行分析,介紹大數據金融的相關應用及場景案例,并闡述了大數據金融存在的挑戰。
關鍵詞:大數據 金融行業 應用
中圖分類號:TP311 文獻標識碼:A 文章編號:1674-098X(2017)09(a)-0117-06
1 大數據概述
1.1 什么是大數據
大數據(Big Data)是一個寬泛的概念,業界沒有統一的定義,大數據概念的興起可以追溯到2000年前后,最初理解為一類海量數據的集合。2011年,美國麥肯錫在研究報告《大數據的下一個前沿:創新、競爭和生產力》中給出了大數據的定義:大數據是指大小超出典型數據庫軟件工具收集、存儲、管理和分析能力的數據集。根據Gartner的定義,大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
大數據在通信、金融、教育等各個領域存在已有時日,近年來隨著互聯網和信息行業的發展進入了快速推廣階段。
1.2 大數據的特征
大數據不僅有傳統數據定義的“三個V”,即數量(Volume)、速度(Velocity)和種類(Variety),還包含了更重要的第四個V,價值(Value)。
阿姆斯特丹大學提出了大數據體系架構框架的5V特征,在原有4V基礎上增加了真實性(Veracity)特征,包括數據可信性、真偽性、來源和信譽、有效性和可審計性等特性,如圖1所示。
1.3 大數據的發展趨勢
隨著大數據產業的不斷發展,各行業的應用解決方案不斷成熟,大數據產業迎來了井噴式發展。Wikibon數據顯示,2014年全球大數據市場規模達到285億美元,同比增長53.2%。大數據成為全球IT支出新的增長點,如圖2所示。Gartner數據顯示,2014年數據中心系統支出達1430億美元,比2013年增長2.3%。大數據對全球IT開支的直接或間接推動將達2320億美元,預計到2018年這一數據將增長3倍。
全球大數據市場結構從壟斷競爭向完全競爭格局演化。企業數量迅速增多,產品和服務的差異增大,技術門檻逐步降低,市場競爭越發激烈。全球大數據市場中,行業解決方案、計算分析服務、存儲服務、數據庫服務和大數據應用為市場份額排名最靠前的細分市場,如圖3所示。
2 大數據金融
隨著大數據技術的應用,越來越多的金融企業也開始投身到大數據應用實踐中。麥肯錫的一份研究顯示,金融業在大數據價值潛力指數中排名第一。以銀行業為例,中國銀聯涉及43億張銀行卡,超過9億持卡人,超過1000萬商戶,每天近7000萬條交易數據,核心交易數據都超過了TB級。
一直以來,金融企業對數據的重視程度非常高。隨著移動互聯網發展各種務和服多樣化市場整體規模擴大。對于數據分析帶來的主要業務價值,大量參加調研的金融企業表示,大數據分析的價值是可以根據商業分析實現更加智能的業務決策,讓企業戰略制定更加理性化。依靠有前瞻性的決策,實現生產過程中資源更優化的分配,能夠根據市場變化迅速做出調整,提高用戶體驗以及資金周轉率,降低庫存積壓的風險,從而獲取更高的利潤。
2.1 金融數據的類型
金融數據從數據類型上進行劃分,大致可以分為結構化數據、半結構化數據與非結構化數據三大類。
(1)結構化數據。結構化的數據來源于金融企業運營數據倉儲(ODS)和數據倉庫(EDW)。EDW為企業提供分析決策服務,ODS主要實現企業數據整合、共享和準實時運營監控等功能。而通過Hadoop等組件的應用可以將數月前甚至幾年前的歷史數據進行遷移保存。在分布式存儲結構下,結構化數據的存儲計算可以得到巨大的改善,可對海量離線數據進行離線分析,將離線數據優勢最大化,為金融企業用戶打造立體用戶畫像提供最全面的數據支撐。
(2)半結構化數據。半結構化數據的整合在數據整合中是最為復雜的。金融企業可對接來源于外部單位所提供的不同類型數據庫或Excel等的數據。“打通”多源異構的數據是項目中遇到的最困難的部分,數據整合完畢可快速進行建模分析。
(3)非結構化數據。金融行業對于非結構化的處理的方法還是比較原始的。非結構化數據涵蓋的范圍比較廣泛,有新聞、視頻、圖片以及社交網絡等數據。
2.2 大數據金融的技術實現
金融數據一般具有“流數據”的特征,需要在短時間內快速處理。與其他行業相比,金融具有邏輯關系緊密、處理實時性要求高、可展示性需求強等特征,通常需要以下幾類關鍵技術。
(1)數據分析技術。包括數據挖掘、機器學習等人工智能技術,主要應用在用戶信用分析、用戶聚類分析、用戶特征分析、產品關聯分析、營銷分析等方面。金融系統安全性、穩定性和實時性要求比較高,對大數據計算處理能力也要求非常高。
(2)數據管理技術。包括關系型和非關系型數據管理技術、數據融合和集成技術、數據抽取技術、數據清洗和轉換等技術。金融行業對數據的實時處理能力要求非常高,需要靈活地進行數據轉換配置和任務配置。
(3)數據處理技術。包括分布式計算、內存計算技術、流處理技術等。通過新型數據處理技術更有效地利用軟硬件資源,在降低IT投入、維護成本和物理能耗的同時,提供更為穩定、強大的數據處理能力。
(4)數據展現技術。包括可視化技術、歷史流展示技術、空間信息流展示技術等。主要用于金融產品健康度監視、產品發展趨勢監視、客戶價值監視、反洗錢反欺預警等方面。
2.3 大數據金融的場景應用
任何技術的應用都是基于需求產生的,大數據金融的應用也是由金融行業的業務驅動而衍生出來的。具體的應用分類也沒有統一的標準。以金融行業最具代表性的銀行為例,根據業務驅動應用場景大致可分為精準營銷、風險控制、改善經營、服務創新和產品創新等5個方面,如圖4所示。endprint
(1)精準營銷:互聯網時代的銀行在互聯網的沖擊下,迫切地需要掌握更多用戶信息,繼而構建用戶360度立體畫像,即可對細分的客戶進行精準營銷、實時營銷等個性化智慧營銷。
(2)風險控制:應用大數據技術,可以統一管理金融企業內部多源異構數據與外部征信數據,可以更好地完善風控體系。內部可保障數據的完整性與安全性,外部可控制用戶風險。
(3)改善經營:通過大數據分析方法改善經營決策,為管理層提供可靠的數據支撐,使經營決策更加高效、敏捷,精確性更高。
(4)服務創新:通過對大數據的應用,改善與客戶之間的交互、增加用戶粘性,為個人與政府提供增值服務,不斷增強金融企業業務核心競爭力。
(5)產品創新:通過高端數據分析和綜合化數據分享,有效對接銀行、保險、信托、基金等各類金融產品,使金融企業能夠從其他領域借鑒并創造出新的金融產品。
2.4 場景實例
2.4.1 客戶全景畫像
客戶畫像應用主要分為個人客戶畫像和企業客戶畫像。其中個人客戶畫像包括人口統計學特征、消費能力數據、興趣數據、風險偏好等。以銀行為例,銀行擁有的客戶信息并不全面,基于銀行自身擁有的數據有時候難以得出理想的結果甚至可能得出錯誤的結論,所以還需要引入外部數據源,包括:運營商數據、主流電商網站數據、上網痕跡數據、SNS軟件、生活圈子、網絡應用等,從而豐富用戶標簽,構建一起全面的客戶畫像,如圖5所示。
2.4.2 客戶服務優化
通過大數據,金融企業可監控各種市場推廣運作情況,將客戶行為轉化為咨詢流,從中分析客戶的個性特征、風險偏好,了解客戶的金融往來習慣及使用行為,進一步分析及預測客戶潛在的需求,將精準行銷擴展至服務的創新與優化。
以銀行為例,通過大數據資料庫,可對下轄分子機構服務柜臺及擺設、理財區裝飾,甚至座位的設計,依照資料庫中機構所在地的人口特征、年齡及交易量復雜度等數據,以及客戶在網站、手機銀行、微信銀行等軟件的使用習慣進行分析,為客戶提供個性化的服務。具體體現在以下幾方面。
(1)針對高齡客戶比例偏高的機構,即考慮新增矮柜服務窗口并提供大屏幕顯示器提醒。
(2)面對顧客對網銀、手機銀行的使用習慣,將瀏覽率高的欄目與瀏覽率低的欄目進行重新排版設計,以提升客戶使用率及忠誠度的目的。
(3)根據不同人群在網絡、手機APP訪問的記錄行為,分析其關注資訊的不同(頁面瀏覽時間、次數、頻率等),提供不同需求的咨詢和服務。
2.4.3 征信數據分析
大數據的分析對于風險控制有著重要意義,金融機構可通過對工商、稅務、司法、公安、行政、運營商、航旅、教育、銀聯、第三方等多方機構信息進行數據分析,加工碎片數據,形成整合視圖,進行風險分析,量化企業的信用額度,更有效地開展金融業務。
同時,在交易欺詐防控中,可以利用銀行持卡人基本信息、卡基本信息、交易歷史、客戶歷史行為模式、正在發生行為模式(如轉賬)等,結合智能規則引擎(如從一個不經常出現的國家為一個特有用戶轉賬或從一個不熟悉的位置進行在線交易)進行實時的交易反欺詐分析,如圖8所示。
通過使用各類數據項,進行機器學習和集成學習,從而產生信用評分。
3 大數據金融存在的挑戰
3.1 數據的幾何級增長,整合困難
目前,全球各行業數據量的增長速度驚人,在我國尤其集中在金融、交通、電信、制造業等重點行業和醫保、社保、海關等重要領域,信息化的不斷深入正在進一步催生更多新的海量數據。據統計,2015年中國的數據總量達到1700EB以上,同比增長90%,預計到2020年這一數值將超過8000EB。以銀行業為例,每創收100萬元,銀行業平均產生130GB的數據,數據強度高踞各行業之首。但在金融企業內部數據處于割裂狀態,業務條線、職能部門、渠道部門、風險部門等各個分支機構往往是數據的真正擁有者,缺乏順暢的共享機制,導致海量數據往往處于分散和“睡眠”狀態,雖然金融行業擁有的數據量“富可敵國”,但真正利用時卻“捉襟見肘”。
3.2 數據安全的保障
安全與隱私問題是大數據發展過程中的一個關鍵問題,多項實際案例表明,即使無害的數據被大量收集后,也會暴露個人隱私。實際上,大數據安全含義更為廣泛,人們面臨的威脅并不僅限于個人隱私泄露,保護對象不僅包括大數據自身,也包含通過大數據分析得到的知識。
與當前的其他信息一樣,大數據在存儲、處理、傳輸等過程中面臨安全風險,主要包括數據管理風險和數據運營風險。這里一方面需要技術手段的保護,同時需相關法律法規的完善和金融企業自身的自律。
3.3 大數據標準規范的制定
要實現數據的互聯互通,必須包含兩個條件,其中互聯是技術體系標準,互通是數據體系標準。實現互聯可以要求系統使用標準化接口,而實現互通則需要圍繞產業鏈建立跨行業的數據標準結構。目前,各行業的發展長期各施其政,行業間存在較高的壁壘,即使金融行業內部,如銀行、證券、保險等行業也采用了不同的標準,遵守不同的行業規范。如何加快元數據、數據交換、數據交易、數據質量、安全保密等重點共性標準的制定是大數據建設的關鍵。
3.4 人才梯隊的培養
與信息技術其他細分領域人才相比,大數據發展對人才的復合型能力要求更高,需要掌握計算機軟件技術,并具備數學、統計學等方面知識以及應用領域的專業知識。目前金融行業在可承擔分析和挖掘的復合型人才、高端數據科學家以及管理人才方面都存在很大缺口。
4 結語
黨的十八屆五中全會“十三五”規劃建議提出:“實施國家大數據戰略,推進數據資源開放共享”。2015年12月16日在第二屆世界互聯網大會開幕式上,習近平總書記提出:“十三五”時期,中國將大力實施網絡強國戰略、國家大數據戰略、“互聯網+”行動計劃。大數據已成為驅動經濟發展的新引擎,大數據應用范圍和應用水平將加速我國經濟結構調整、深度改變我們的生產生活方式,大數據金融應用正是改變金融業態,引發金融行業經營模式創新的催化劑和助推器。
參考文獻
[1] 陳利強,梁如見,張新宇.金融大數據:戰略規劃與實踐指 南[M].北京:電子工業出版社,2015.
[2] 陳云.金融大數據[M].上海:上海科學技術出版社,2015.
[3] 中國電子信息產業發展研究院.工業和信息化部賽迪智庫 [Z].大數據發展白皮書,2015.endprint