◆王家箴 何美會(huì) 李美暄 于 娜 錢 程
網(wǎng)絡(luò)論壇用戶的行為分析研究——以股吧為例
◆王家箴 何美會(huì) 李美暄 于 娜 錢 程
(河北師范大學(xué)(石家莊)計(jì)算機(jī)與網(wǎng)絡(luò)空間安全學(xué)院 河北 050024)
在過去幾十年中,股票一直是金融領(lǐng)域的熱門話題,股票漲落可以影響投資者的心理,同時(shí),股市行情也可以由市場(chǎng)參與者的行為驅(qū)動(dòng)。投資者會(huì)利用互聯(lián)網(wǎng)分析股票走勢(shì),并且根據(jù)經(jīng)濟(jì)形勢(shì)在相關(guān)論壇上發(fā)帖,而發(fā)帖內(nèi)容又會(huì)影響股民的決策,股票走勢(shì)與發(fā)帖行為之間的交互作用加強(qiáng)。本文從統(tǒng)計(jì)學(xué)的角度,試圖探究股票走勢(shì)對(duì)股吧論壇留言者的影響。實(shí)驗(yàn)的股票走勢(shì)參考東方財(cái)富網(wǎng)的上證指數(shù),爬取股吧論壇數(shù)據(jù),該樣本包括2007年11月至2019年3月淘股吧發(fā)布的180多萬(wàn)條帖子和其發(fā)布時(shí)間,研究發(fā)現(xiàn),論壇發(fā)帖量服從冪率分布,按月統(tǒng)計(jì)后,發(fā)現(xiàn)在股市波動(dòng)和平靜時(shí)期冪指數(shù)分別為1.35和2.5。且發(fā)帖行為受股市波動(dòng)具有時(shí)滯性,經(jīng)計(jì)算,周發(fā)帖量和上證指數(shù)的相關(guān)系數(shù)可達(dá)0.84。
股票;淘股吧論壇;發(fā)帖行為;冪律分布
股市是一個(gè)國(guó)家經(jīng)濟(jì)發(fā)展的晴雨表,能夠提前反映一個(gè)國(guó)家的經(jīng)濟(jì)發(fā)展?fàn)顩r,中國(guó)屬于“政策市”[1],隨著改革開放和社會(huì)經(jīng)濟(jì)的飛速發(fā)展,中國(guó)股市在這20多年發(fā)展很快,雖然它還很年輕,但也存在其自身弱點(diǎn),通常是牛市較短熊市較長(zhǎng),伴隨著日常小幅波動(dòng)和兩次大幅漲落。
根據(jù)MobData發(fā)布的《2018中國(guó)股民圖鑒》顯示,男性股民的數(shù)量高達(dá)69.6%,北上廣深的股民最多,蘇浙滬地區(qū)炒股比例最高。《全國(guó)股票市場(chǎng)投資者狀況調(diào)查報(bào)告(2018年度)》報(bào)告指出,截至8月底,全國(guó)股票投資者數(shù)量達(dá)1.42億。從20世紀(jì)90年代起,中國(guó)股市的大部分散戶一直處于虧損的狀態(tài),超過一半股民在2018年虧損20%以上,盈利股民不到12%,是繼2008年以來(lái)跌幅最大的一年,這也是大部分股民日常的真實(shí)寫照。
互聯(lián)網(wǎng)媒體是金融界傳播消息交流互動(dòng)的首要平臺(tái),根據(jù)第43次《中國(guó)互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》統(tǒng)計(jì)顯示,截至2018年12月,我國(guó)網(wǎng)民規(guī)模達(dá)8.29億,網(wǎng)絡(luò)用戶群體龐大,投資者由互聯(lián)網(wǎng)得到經(jīng)濟(jì)新聞和企業(yè)政策,而后又通過網(wǎng)絡(luò)論壇傳遞對(duì)金融市場(chǎng)波動(dòng)的觀點(diǎn)[2],中國(guó)的股市需要科學(xué)的政策和必要的情緒引導(dǎo)來(lái)為金融市場(chǎng)的發(fā)展提供保障,因此,探究股市波動(dòng)對(duì)網(wǎng)民發(fā)帖行為的影響非常重要。
股票領(lǐng)域中存在的理論大致有三種:隨機(jī)漫步理論、有效市場(chǎng)假說(shuō)和行為金融學(xué)[3]。探索人類的發(fā)帖行為,是人們自我認(rèn)知的一個(gè)重要方面,也是避免資金不必要流失的基礎(chǔ)。相關(guān)研究表明,如果一個(gè)股票的價(jià)格波動(dòng)越大,則發(fā)帖量越大,而發(fā)帖越大,會(huì)導(dǎo)致成交量越大,F(xiàn)isher K L等人的研究指出,股票市場(chǎng)的波動(dòng)和投資者的評(píng)論行為具有相關(guān)關(guān)系[3],Das等人在研究新聞和評(píng)論數(shù)量中發(fā)現(xiàn),投資者的情感受股市波動(dòng)影響具有時(shí)滯性,他們更傾向于解釋對(duì)過去股市狀況的表現(xiàn)[4]。早在2005年Barabási揭示了人類行為在時(shí)間上對(duì)泊松過程的偏離,成為人類對(duì)時(shí)空復(fù)雜性研究的轉(zhuǎn)折點(diǎn)[5]。而后來(lái),越來(lái)越多的實(shí)證表明行為的時(shí)間統(tǒng)計(jì)特性可以用冪函數(shù)率來(lái)真正反映[6]。網(wǎng)絡(luò)論壇是自組織臨界系統(tǒng),網(wǎng)絡(luò)論壇發(fā)帖量滿足冪律分布和自相似性等特征[6],本實(shí)驗(yàn)是按不同時(shí)間段采用冪函數(shù)率進(jìn)行的股民行為分析。
為了研究群體層面的人類行為,需要一個(gè)通用的、權(quán)威的數(shù)據(jù)集。淘股吧是中國(guó)大陸知名的財(cái)經(jīng)SNS垂直網(wǎng)站。本文的數(shù)據(jù)來(lái)源是國(guó)內(nèi)淘股吧論壇的用戶訪問時(shí)間記錄,從2007年11月至2019年3月,按月進(jìn)行統(tǒng)計(jì)存儲(chǔ)。
首先,將所有用戶看成一個(gè)整體,登錄淘股吧網(wǎng)站爬取每月的群體用戶發(fā)帖時(shí)間,選取最近一個(gè)月數(shù)據(jù),如圖1所示,今年2月份時(shí)間間隔和頻率服從冪率分布且?guī)в蟹逝值奈膊俊?/p>

圖1 普通坐標(biāo)系下用戶在淘股吧發(fā)帖的時(shí)間間隔分布
注:圖1是2019年2月群體用戶時(shí)間間隔的群體數(shù)據(jù)集,其中時(shí)間分辨率為秒。


圖2 雙對(duì)數(shù)坐標(biāo)系下用戶在淘股吧發(fā)帖的時(shí)間間隔分布
注:圖2是2019年2月群體用戶時(shí)間間隔的群體數(shù)據(jù)集,擬合出一條斜率約為-2.4的直線。冪率分布圖像呈現(xiàn)肥尾效應(yīng)。
將東方財(cái)富網(wǎng)中k線的每月收盤價(jià)存入csv文件,如表1所示,展示2014年5月到2016年2月的月收盤價(jià)。觀察發(fā)現(xiàn),上證指數(shù)在2015年中經(jīng)歷了一次大幅漲落。2014年1月到6月,月收盤價(jià)走勢(shì)平穩(wěn),7、8月份開始增長(zhǎng)到2200多,9月份開始快速逐月遞增,在2015年5月12日達(dá)到峰值5166.35,之后開始遞減,在2016年2月收盤價(jià)降到谷底。東方財(cái)富網(wǎng)的k線走勢(shì)圖如圖3所示,可以看到分別在2007年和2015年,這兩年經(jīng)歷了巨大變化。

表1 每月收盤價(jià)

圖3 東方財(cái)富網(wǎng)月k走勢(shì)圖
在時(shí)間上,發(fā)帖量隨著時(shí)間螺旋遞增。2015年股市變化較大,并且由圖4可知2015年的發(fā)帖量走勢(shì)延遲一段時(shí)間后和上證指數(shù)大致相符。

圖4 發(fā)帖數(shù)量和收盤價(jià)走勢(shì)對(duì)比圖
注:圖4橫軸為時(shí)間,分辨率為月,縱軸是發(fā)帖量。
為了量化發(fā)帖量和收盤價(jià)之間的關(guān)系,采用皮爾遜相關(guān)系數(shù)來(lái)衡量?jī)山M數(shù)據(jù)的相關(guān)性,如下公式所示,用兩個(gè)變量的協(xié)方差除以它們各自的標(biāo)準(zhǔn)差:

實(shí)驗(yàn)將A股峰值兩側(cè)一段時(shí)間內(nèi)的收盤價(jià)和發(fā)帖量進(jìn)行了統(tǒng)計(jì),如表2所示,分別以2015年6月12日收盤價(jià)達(dá)到最高點(diǎn)和7月7日發(fā)帖量達(dá)到最高點(diǎn)進(jìn)行統(tǒng)計(jì),相關(guān)行的計(jì)算結(jié)果均在中度相關(guān)以上。其中,在下降時(shí)期周的相關(guān)性最大,=0.84。

表2 上證指數(shù)和收盤價(jià)的相關(guān)性計(jì)算
收盤價(jià)往往影響著股民的情緒,造成發(fā)帖行為的差異,使得冪指數(shù)也發(fā)生變化。如表3所示,表中給出了從2014年10月到2016年7月,股市漲落時(shí)的k線大幅漲跌時(shí),冪指數(shù)在1.35左右;股市沒有太大變化。k線相對(duì)平和時(shí),冪指數(shù)在2.5左右。由此可見,股市的變化影響著股民在論壇的發(fā)帖行為。

表3 月指數(shù)統(tǒng)計(jì)
將不同的月份的斜率進(jìn)行觀察比較,冪指數(shù)在平時(shí)和股票漲跌時(shí)期是有明顯區(qū)別的。雙對(duì)數(shù)坐標(biāo)如圖5所示,通過線性回歸擬合出圖像的斜率,接下來(lái)取出k線波動(dòng)和平靜兩種時(shí)期來(lái)進(jìn)行比較,對(duì)比可知,股市波動(dòng)時(shí)期冪指數(shù)較低,主要是由于用戶發(fā)帖時(shí)間造成的,股票市場(chǎng)大幅漲跌時(shí)k線波動(dòng),群體用戶發(fā)帖的時(shí)間間隔大的個(gè)數(shù)增加,造成了肥尾龐大,冪指數(shù)降低。

圖5 雙對(duì)數(shù)坐標(biāo)系下用戶在淘股吧發(fā)帖的時(shí)間間隔分布
注:圖5是2015,2016和2019年各一個(gè)月群體用戶時(shí)間間隔的群體數(shù)據(jù)集,其中時(shí)間分辨率為秒。
本文研究發(fā)現(xiàn),論壇發(fā)帖量服從冪率分布,按月統(tǒng)計(jì)后,發(fā)現(xiàn)在股市波動(dòng)和平靜時(shí)期冪指數(shù)分別為1.35和2.5。且發(fā)帖行為受股市波動(dòng)具有時(shí)滯性,經(jīng)計(jì)算,周發(fā)帖量和上證指數(shù)的相關(guān)系數(shù)可達(dá)0.84。
[1]池麗旭,莊新田.投資者情緒與股票收益波動(dòng)溢出效應(yīng)[J].系統(tǒng)管理學(xué)報(bào),2009(04):367-372
[2]Fishier K L,Statman M. A behavioral framework for time diversification[J]. Financial Analysts Journal,1999:88-97
[3]Bandpadhyaya A,Jones A L.Measure Of Investor Sentiment:A Comparative Analysis Put-Call Ratio Vs. Volatility Index[J]. Journal of Business & Economics Research(JBER),2011.6(8).
[4]Han X P ,Zhou T,Wang BH.Modeling human dynamics with adaptive interest [J] .New Journal of Physics ,2008,10(7): 073010.
[5]周濤,韓筱璞,閆小勇,楊紫陌,趙志丹,汪秉宏.人類行為時(shí)空特性的統(tǒng)計(jì)力學(xué)[J].電子科技大學(xué)學(xué)報(bào),2013(04).
[6]程薇,鐘華,孫嬌華.網(wǎng)絡(luò)論壇中發(fā)帖行為的復(fù)雜性研究[J].系統(tǒng)工程學(xué)報(bào),2009(04).