999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于網絡論壇數據挖掘的投資者關注度與銀行股票波動率的研究

2019-12-09 02:06:28王佳歡
智富時代 2019年10期
關鍵詞:數據挖掘

王佳歡

【摘 要】行為金融學認為投資者心理活動會影響資產價格,投資者由于精力和注意力有限,無法注意并吸收市場上全部的信息,從而導致對資產價格認知的偏差。通過對投資者關注度變化的研究,有助于我們理解與預測市場的波動性。本文基于淘股吧論壇,運用爬蟲程序爬取用戶12年1月至18年8月的留言數據,以含有“銀行”關鍵字的留言數在當日總留言數中的占比為投資者關注度代理指標,研究關注度變化對銀行股票下一交易日漲跌幅的影響。結果表明,銀行股出現大幅度波動的概率與關注度與水平成正相關,且高關注度水平在一周的交易日內的分布具有不均勻性。

【關鍵詞】投資者關注度;銀行股票;數據挖掘

一、研究背景

由于投資者的精力和注意力有限,金融市場上的投資者無法注意并理解市場上的所有信息(Barberis & Thaler,2003)從而導致對信息理解的不全面和對資產價值預測的偏差。投資者對于市場信息的認識和理解會直接影響到他們的投資決策和交易行為,從而對金融市場產生影響。

通過對投資者關注度變化的研究,有助于我們理解與預測市場的波動性。

二、意義及創新點

股吧是投資者交流意見和獲取信息的重要途徑,投資者在股吧中瀏覽他人的觀點,并留下自己的判斷,在交流的過程留下的瀏覽記錄以及發言記錄無疑都是投資者個體內心的寫照,通過分析其留言中是否含有‘銀行關鍵字,可以判斷該投資者是否關注到了銀行股,因此本文使用涉及關鍵字‘銀行的留言在總留言數中的占比作為投資者對銀行股的關注度代理指標。將下一交易日,標的漲跌幅度作為因變量,研究關注度的變化對下一交易日的影響。

根據數據來源的不同,傳統的投資者關注的度量方式可以分為以下兩種:第一種方式是利用金融資產的交易特點度量投資者關注度。通常的做法是使用交易量、換手率、成交量等變量測度股票是否受到了投資者關注(Chemmanur & Yan, 2009; Hou et al, 2009; Loh, 2010)。第二種方式是基于財務報表和公告數據測度投資者關注。

傳統數據(交易數據及公司報表、公告等)能在一定程度上度量投資者關注和投資者情緒,但這些數據仍存在以下弊端:第一,傳統數據缺乏對投資者關注和情緒的直接度量。第二,傳統數據種類單一,缺乏以投資者為對象的數據,為深入研究投資者行為和心理帶來了阻礙。第三,大多傳統數據數量較少,計量誤差較大。

相較傳統交易數據或財務報表數據,股吧數據具有規模性、多樣性、高速性的特點。

本文以淘股吧作為數據來源,新增了一個分析投資者關注度及其情緒的數據來源,并以涉及關鍵字的留言占比作為投資者關注度的代理指標,新增了一種投資者關注度的代理指標。

三、數據來源

(1)淘股吧介紹

淘股吧論壇成立于09年,發展至12年后論壇基本成熟,用戶活躍度及數量都保持在一個較高水平,根據淘股吧內的帖子來看,淘股吧用戶股票操作風格大多激進,其用戶層面比之東方財富較窄,少有中長線價值投資者,多為快進快出的短線投機客,本文正是基于對短線投機客對于銀行股關注度的變化來研究其對后一交易日銀行股整體情況的影響。

(2)樣本選取

本文選取的是12年1月1日至18年8月31日的共2435日近150萬帖子數據。通過python軟件爬取了淘股吧論壇的所有帖子,將帖子的標題、內容、發帖人、發帖時間,以及所有跟帖的內容、跟帖時間、跟帖人保存在mongodb數據庫中。共得到426761條有關銀行的留言。

(3)對應標的選取

因為是以‘銀行為關鍵字進行檢索,所以選取銀行板塊指數作為對應標的進行對銀行板塊整體情況的研究,該指數包含了A股所有的銀行股,能較好的反應銀行股的整體情況。

四、數據處理

在數據庫中以日為單位對當日數據進行統計,記錄下當日留言的總條數以及包含‘銀行關鍵字的留言條數,生成當日談及銀行的留言在總留言數中的占比。

以日為單位,在excel中生成日期、星期、關鍵字留言數、總留言數、占比、下一交易日漲跌幅項目。

五、數據分析

刪除一些無效數據后得到共2399日數據,將數據按照關注度水平進行降序排列,取前2.5%數據(60個)作為高關注度組,取后2.5%數據(60個)作為低關注度組,對比研究與總體的差異。

分別對總體、高關注度組以及低關注度的下一交易日漲跌幅進行描述統計。(表2、表3、表4)

研究發現:

(一)下一交易日出現大幅波動的概率與關注度水平成正相關

與總體相比,高關注度水平下,方差顯著變大(從2.48增大至5.40),表示下一個交易日出現大幅度波動的可能性顯著增大。

與總體相比,低關注度水平下,方差顯著減小(從2.48減小至1.19),表示下一個交易日出現大幅度波動的可能性顯著減小。

以漲跌幅超過3%作為大幅度波動,從歷史數據來看,我們也可以驗證這一點。以本文選用的2012年1月1日至2018年8月31日之間的1622個交易日數據來看,共有92個交易日漲跌幅超過3%,出現大幅度波動的概率為5.67%。

在高關注度組,60個樣本中共有7次下一日漲跌幅超過3%(且指向的下一交易日非重復),出現大幅度波動的概率為11.67%。

在低關注度組,60個樣本中共有2次下一日漲跌幅超過3%,由于這兩次指向的下一交易日正好重疊,所以記為一次,所以出現大幅度波動的概率為1.67%。

可見,關注度水平確實影響出現大幅波動的概率。

(二)高關注度出現在一周內頻率并不相同,交易日間的風險不同

高關注度出現在周六周日周一的頻率顯著最大(周日頻率最高),意味著周一、周二出現大幅度波動的可能性最大。

可見,周一的風險明顯大于其他4個交易日,周二其次。

六、結論

本文通過對淘股吧內投資者對銀行股的關注度水平建立代理指標,研究銀行股關注度水平與其對應標的(板塊指數)之間的關系,研究發現:

(一)關注度水平與下一交易日的出現較大的漲跌幅的概率成正相關。

(二)高關注度水平在每周交易日的不平均分布(周六、周日、周一顯著較高)可能是導致周一出現大幅波動的原因。

七、不足與展望

一、本文只從關注度角度出發,得出了高關注度導致銀行股出現大幅度波動的概率增大,但是無法從關注度角度得出變化的方向,下一步將希望通過語義分析分類等方法分析投資者的情緒,研究關注度與情緒結合起來對資產價格的影響。

二、對于結論二,只是發現銀行股高關注度分布的不均勻性(在周六、周日及周一顯著高于其他),以及從歷史數據得出的出現大幅波動的概率在周一最高、周二其次的現象,而并沒有準確地分析這兩個現象之間的因果關系,下一步將尋找一些模型和方法來準確論證其中的因果關系。

【參考文獻】

[1]Barberis, Nicholas. & Richard Thaler (2003) A Survey of Behavioral Finance. In: George M. Constantinides, Milton Harris, and RenéM. Stulz, eds. Handbook of the Economics of Finance: Volume 1B, Financial Markets and Asset Pricing. Elsevier North Holland, Chapter 18:1053~1128.

[2]Chemmanur, T. & A. Yan (2009). Product market advertising and new equity issues. Journal of Financial Economics, 92(1):40-65.

[3]Hou, K.et al. (2009). A tale of two anomalies: The implication of investor attention for price and earnings momentum. Social Science Electronic Publishing, 45:416-418.

[4]Loh, R.K. (2010). Investor inattention and the underreaction to stock recommendations. Financial Management, 39(3):1223-1252.

[5]Grullon, G.et al. (2004). Advertising, breadth of ownership, and liquidity. Review of Financial Studies, 17(2):439-461.

[6]Solomon, D. H.et al. (2014). Winners in the spotlight: Media coverage of fund holdings as a driver of flows. Journal of Financial Economics, 113(1):53-72.

[7]Kaniel, R. & R. Parham. (2017). WSJ Category Kings: The impact of media attention on consumer and mutual fund investment decisions. Journal of Financial Economics, 123(2):337-356.

[8]許柳英, 陳啟歡. 公眾注意力影響買入行為嗎?——基于投資者行為的分析[J].上海管理科學,2005.27(4):39-41.

[9]譚偉強, 我國股市盈余公告的“周歷效應”與“集中公告效應”研究[J].金融研究,2008.2:39-41.

[10]楊曉蘭我國股票市場的網絡關注度效應——一個基于和訊關注度的實證檢驗[R].工作論文,2010.

[11]饒育蕾, 彭疊峰, 周相宜. 基于有限注意的排行榜效應研究[C].第六屆中國金融學年會論文,2009.

[12]饒育蕾, 王攀. 媒體關注度對新股表現的影響——來自中國股票市場的證據[J].財務與金融,2010.3:1-7.

[13]于李勝, 王艷艷. 信息競爭性披露、投資者注意力與信息傳播效率[J].金融研究,2010.8:112-135.

[14]周嘉南, 黃登仕. 投資者有限注意力與上市公司年報公布時間選擇[J].證券市場導報,2011.5:53-60.

[15]張雅慧, 萬迪防, 付雷鳴. 股票收益的媒體效應:風險補償還是過度關注弱勢[J].金融研究, 2011.8:143-156.

[16]李冬昕, 李心丹, 張兵. 分析師的盈利預測偏差與本地優勢[J].財經科學, 2011.3:26-33.

[17]董大勇, 肖作平. 交易市場與網絡論壇間存在信息傳遞嗎[J].管理評論, 2011,11:3-11.

[18]張永杰, 張維, 金曦等. 互聯網知道的更多么?——網絡開源信息對資產定價影響[J].系統工程理論與實踐, 2011.4:577-586.

[19]俞慶進, 張兵. 投資者有限關注與股票收益——以百度指數作為關注度的一項實證研究[J],金融研究, 2012.8:152-165.

[20]謝世宏. 基于互聯網搜索的有限注意與我國股票市場的關系研究[D].南京大學,2012.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 成色7777精品在线| 91在线国内在线播放老师| 手机永久AV在线播放| 国产在线观看精品| аv天堂最新中文在线| 最新国产精品第1页| 又爽又黄又无遮挡网站| 免费无码网站| 91丝袜乱伦| 欧美啪啪精品| 国产精品午夜福利麻豆| 久久久精品国产亚洲AV日韩| 成人欧美在线观看| 日韩国产无码一区| 91美女视频在线| 免费看美女自慰的网站| 一区二区三区国产精品视频| 欧美日韩福利| 国产成人综合网在线观看| 欧美不卡视频一区发布| 久久精品无码国产一区二区三区 | 婷婷中文在线| 久久国产高清视频| 69视频国产| 欧美精品在线免费| 亚洲天堂.com| 国产亚洲精久久久久久无码AV| 国产一二三区视频| 538国产在线| 日本a∨在线观看| 波多野结衣中文字幕一区二区| 日韩 欧美 小说 综合网 另类| 一本大道无码高清| 亚洲精品麻豆| 久久国产乱子| 性喷潮久久久久久久久| 亚洲无码91视频| 91亚洲精品第一| 爆乳熟妇一区二区三区| 无码aⅴ精品一区二区三区| 99久久性生片| 精品国产一区二区三区在线观看 | 亚洲视频无码| 精品三级在线| 尤物精品国产福利网站| 国产精品乱偷免费视频| 亚洲国产第一区二区香蕉| 日本国产精品一区久久久| 婷婷伊人五月| 国产极品嫩模在线观看91| 18禁不卡免费网站| 久久a级片| 亚洲欧洲日韩久久狠狠爱| 九九九久久国产精品| 国产三级国产精品国产普男人| 国产无码高清视频不卡| 成人夜夜嗨| 最新国产高清在线| 久久久91人妻无码精品蜜桃HD| 五月婷婷导航| 67194在线午夜亚洲| 911亚洲精品| 日韩精品专区免费无码aⅴ| 亚洲国产av无码综合原创国产| 欧美成人免费一区在线播放| 亚洲伊人天堂| 欧美自慰一级看片免费| 凹凸精品免费精品视频| 真实国产乱子伦视频| 国产成人综合亚洲欧洲色就色| 国产区福利小视频在线观看尤物| 国产激爽大片高清在线观看| 国产午夜精品鲁丝片| 人妻丰满熟妇AV无码区| 亚洲高清在线播放| 狠狠色噜噜狠狠狠狠色综合久| 欧美激情首页| 18禁黄无遮挡网站| 免费看美女毛片| 好吊日免费视频| 精品日韩亚洲欧美高清a| 爱爱影院18禁免费|