999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

企業股權關系數據價值挖掘的研究報告

2021-11-20 02:18:28陳力交通銀行股份有限公司
環球市場 2021年30期
關鍵詞:數據庫分析

陳力 交通銀行股份有限公司

企業股權數據中蘊含著巨大的業務價值,而充分利用該部分數據價值不僅需要合理的數據分析步驟,還需要相應的技術手段。從數據清洗、圖譜構造到最后的數據價值分析,一步步環環相扣,我們結合圖數據庫找到了一條挖掘企業股權數據價值的可行路徑,并以實際案例進行有效的實踐。

一、數據研究及方案制定

一般對于股權信息最基本的要求是有公司信息、股東信息以及股東持股比例,其中公司信息和股東信息包含的最小要素為企業名稱和組織機構代碼(或統一社會征信碼)。

股權關系我們可以看作是公司主體作為實體的關系信息,即我們如果把股權關系進行抽象,可以獲取的是代表公司主體的點,以及代表股權關系的邊。而這些點和邊最終組成了圖,也就形成了我們最終數據需要存儲的形式和展現的形式。

在此我們利用圖數據庫進行相關關系的分析與解析,并制定出數據實施方案,見圖1:

圖1

數據清洗旨在從原始的股權關系數據中提取中構造圖譜的關鍵信息;圖譜構造則是通過提取出的關鍵信息,抽象成點和邊的形式,以圖的方式存儲這些關鍵信息;價值分析,則基于構建的圖譜實現業務價值的提取分析。

二、數據清洗

(一)股東代碼空值填充

有部分股東代碼數值為空,因此我們需要補充這部分股東代碼,鑒于股東代碼在實際應用中僅起到區分不同股東的作用,因此我們采用簡易的編碼規則,即GD+5位序號的方式進行編碼,實際生產應用時可根據相應使用場景進行調整。

(二)最新數據切片構造

實際應用股權關系數據時,我們最為關心的是當前各家企業的股權關系,因此其中需要有效過濾掉歷史數據,而對于歷史數據的判斷,可通過以下兩步實施:

第一步,歷史數據的篩選,即同一公司代碼+股東代碼的組合,獲取最新更新日期更大、出資時間更晚的數據,最后一個公司代碼+股東代碼只保留一條數據記錄。

第二步,股權變更流程回溯,基于以下2個字段:最新更新日期、出資時間。將上述字段分別按照倒序排列,即優先排列最新更新日期最大的數據,然后優先排列出資時間更晚的數據,排除掉多余的數據直至該公司所有的股權持有比例之和不超過100%。

最后需要達到的數據目標為:1.一組公司代碼+股東代碼的組合對應一條數據記錄;2.每一個公司所有的股東持股比例不超過100%。

(三)持股比例空值填充

填充持股比例為空值的數據,思路如下:對于某一家公司,將已知的股東信息相加,而后將剩余的持股比例由未知持股比例的股東平均瓜分。

例如某公司的持股比例空值應當為100%去除已知持股比例數37.98%,若其有2家持股比例未知的公司,則另兩家持股比例為(100%-37.98%)/2=31.01%。

三、圖譜構造

在完成數據清洗之后,我們獲取了一份表格形式存儲的企業股權關系數據。但是以表為形式存儲對于股權關系分析的應用有以下局限:

1.數據可視化制作困難,無法完整地呈現某一家企業的上下游關聯關系,對于股權層層穿透的情況分析效率較低;

2.對于圖譜深度解析的需求,分析程序編寫困難,執行效率不足,該情況主要出現在企業風險傳播分析、高風險股權結構分析、高風險擔保結構分析的應用場景中。

在該背景下,我們引入圖數據庫,將傳統關系型數據庫中的數據,裝載到圖數據庫中,來提高我們數據分析過程中提到的上述瓶頸。

(一)圖數據庫介紹

圖數據庫中的“圖”,并不是指圖片,而是以圖這種數據結構存儲和查詢數據。

而市面上的圖數據庫有兩種,一種是原生圖數據庫,即數據存儲在自己本身的圖數據庫體系內;另一種是非原生圖數據庫,數據本身不存儲在圖數據庫的框架體系內,而是存儲在別的數據庫中(一般為關系型數據庫);而經過比較前者的效率更高[1]。

圖數據庫的性能評估包含兩個重要的因素,一個是圖存儲,還有一個是圖處理引擎。圖的存儲方式與傳統的關系型數據庫區別非常大,他是專門為存儲和管理圖而設計的,而圖處理引擎更是關系型數據庫所不具備的,這也是為什么圖數據庫在處理圖譜數據時效率更高的原因[2]。

(二)裝載方案

圖數據庫顧名思義就是將數據以“圖”的形式存儲在計算機中,而圖具有的最基本的要素就是邊和點,因此我們要將我們上一節清洗完的數據抽象成邊和點。

我們使用到的數據中“公司”和“股東”都可以歸類為標簽為“公司”的節點,由于是股權關系表,關系可以歸類為“股權”關系。“公司名稱”是節點的屬性,持股比例是“股權”關系的屬性。

(三)方案實施

將表格數據裝載入圖數據庫是一個比較關鍵的步驟,在裝載是需要制定合理的方案,保證數據裝載穩定且高效。因此我們使用批量加載的方法,同時用下列步驟進行數據導入:

第一步導入節點;

導入節點分批量導入和非批量導入,我們可以看一下兩者的區別:

非批量導入過程為,將一條數據寫入內存,然后將內存中的數據寫入磁盤,周而復始;批量導入的過程為,將多條數據寫入內存,而后批量將數據寫入磁盤。我們發現批量導入大大降低了磁盤讀寫的次數,因此會有效地提升數據加載效率。

而實際的過程中我們會將所有數據分成若干個小批次進行操作,這樣既可以減少磁盤讀寫的次數,同時也可以避免內存使用比例過高導致的性能下降。

第二步為關系關聯屬性(公司代碼)加上索引;

加入索引的重要原因是提升數據庫讀取效率,經過性能測試,在關聯屬性上建立索引和不建立索引,前者的效率比后者有極大的提升。

第三步導入關系數據;導入關系數據,我們同樣使用分小批次導入的方法來實現,來保證數據導入的效率。

四、數據價值分析

圖數據庫之于圖譜分析,其優勢除了在數據可視化上,還能充分挖掘企業間關系的業務價值。我們以以下兩個場景進行舉例:

(一)股權穿透分析

我們以某上市公司為例,下簡稱“A公司”,分析該主體如果發生負面事件,波及的范圍。以該節點為出發點,向下穿透5層,可獲得如圖2:

圖2

大圈中的“A公司”對外的股權非常復雜,牽涉的企業面積非常廣。所有涉及的企業都會或多或少因該企業的風險事件而受到負面影響。

傳統的關系型數據庫在搜索多層關系時,需要多次訪問數據庫表,為提升執行效率并且降低程序以外執行失敗的概率,會以數據庫事務的形式編寫,代碼編寫復雜度較高。圖數據庫的可視化功能也要比關系型數據庫更強,而在圖處理的能力上也較關系型數據庫更強。

(二)企業股權關聯分析

在進行業務分析時,我們經常會發現,兩家看似毫無關聯的企業,卻有著千絲萬縷的聯系。例如圖3左大圈中的“A公司”與右大圈中的“B公司”,這兩家公司,從名字上分析除了可以得出兩家公司都涉及相同的行業,似乎毫無關聯信息。但我們查詢一下這兩家企業的關聯關系,我們會發現,兩家企業有著一定的關聯,其股權關聯如圖3:

圖3

同時,可以根據股權關系中的持有份額比例,通過各條路徑的乘積之和來計算“A公司”對“B公司”的實際控制份額。

實現上述功能,通過關系型數據庫,我們不僅要多次訪問數據庫,同時還要使用遞歸,代碼實現難度比較大,而圖數據庫只需要執行指令,匹配起始節點與重點,即可自動搜索出所有的路徑,大大降低了程序編寫的難度,并且提升了執行效率。

圖3展示了圖據庫以表格結合數組的形式展示開始節點到結束節點的所有路徑,將這路徑中的權重值相乘最后再相加,我們即可獲得最后開始節點對結束節點的實際控制份額。

圖3我們能找到5條從A公司出發,B公司結束的路徑。

路徑1:

[{"percentage":50.0},{"percentage":40.0}]

路徑2:

[{"percentage":47.12},{"percentage":100.0},{"percentage":96.875},{"percentage":11.0}]

路徑3:

[{"percentage":47.12},{"percentage":50.0},{"percentage":40.0}]

路徑4:

[{"percentage":100.0},{"percentage":5.53},{"percentage":100.0},{"percentage":96.875},{"percentage":11.0}]

路徑5:

[{"percentage":100.0},{"percentage":5.53},{"percentage":50.0},{"percentage":40.0}]

最后我們根據計算各條路徑中持股比例的乘積,最后加總得知A公司對B公司的實際控制份額為36.14%。

五、總結

企業股權數據中蘊含著巨大的業務價值,而充分利用該部分數據價值不僅需要合理的數據分析步驟,還需要相應的技術手段。而圖數據庫在圖譜分析的過程中提升了效率,簡化了代碼,通過業務實施步驟的合理規劃,以及技術流水線的合理部署,提升數據分析能力,真正做到為業務賦能。

猜你喜歡
數據庫分析
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
電力系統及其自動化發展趨勢分析
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 国禁国产you女视频网站| 亚洲美女一级毛片| 欧美午夜网| 99偷拍视频精品一区二区| 精品国产aⅴ一区二区三区| 国产精品浪潮Av| 四虎永久在线| 在线a视频免费观看| 国产丝袜91| 人妻一本久道久久综合久久鬼色| 一级全黄毛片| 亚洲欧洲一区二区三区| 亚洲成年网站在线观看| 欧美日韩导航| 亚瑟天堂久久一区二区影院| 又爽又黄又无遮挡网站| 国产国产人成免费视频77777| 日韩午夜片| 97青草最新免费精品视频| 香蕉eeww99国产精选播放| 亚洲精品制服丝袜二区| 久久亚洲美女精品国产精品| 国产乱子伦视频在线播放| 国产精品永久久久久| 日韩中文无码av超清| 大陆精大陆国产国语精品1024| 欧美日韩国产在线人成app| 日本五区在线不卡精品| 91黄视频在线观看| av大片在线无码免费| 四虎国产精品永久在线网址| 久久久久九九精品影院| AⅤ色综合久久天堂AV色综合| 国产视频你懂得| 国产人成在线观看| 18禁黄无遮挡网站| 永久免费无码成人网站| 亚洲国产中文精品va在线播放| 高清不卡毛片| 亚洲天堂网站在线| 欧美三级自拍| 免费一级毛片在线播放傲雪网| 欧美性色综合网| 欧美成人h精品网站| jizz国产视频| 国产特级毛片aaaaaa| 国产成人亚洲综合A∨在线播放| 国产精品99一区不卡| 韩日午夜在线资源一区二区| 18禁黄无遮挡免费动漫网站| 久久人人97超碰人人澡爱香蕉 | 手机在线看片不卡中文字幕| 国产91精选在线观看| 亚洲精品片911| 欧美激情第一欧美在线| 欧美精品成人一区二区视频一| 亚洲精品福利视频| 天堂av综合网| 精品无码视频在线观看| 免费国产高清精品一区在线| 中文字幕在线日本| 色综合天天综合中文网| 国产无遮挡猛进猛出免费软件| 有专无码视频| 亚洲AV人人澡人人双人| 欧美在线三级| 中文精品久久久久国产网址 | 色偷偷综合网| 欧美成人日韩| 国产一区二区丝袜高跟鞋| 第一区免费在线观看| 国产青榴视频| 亚洲精品动漫| 久久综合五月婷婷| 色综合热无码热国产| 久久精品91麻豆| 国模沟沟一区二区三区| 国产精品手机在线观看你懂的| 成人欧美日韩| 一本大道在线一本久道| 国产高清无码第一十页在线观看| 在线欧美日韩|