石 勇 唐 靜 郭 琨
傳統的股票市場分析預測研究多是基于歷史數據、財務指標等結構化數據(盧琦澤等,2010[1])。隨著互聯網技術的普遍應用,尤其是大數據信息的誕生,投資者獲取股票市場信息的渠道更加廣泛、表達觀點的平臺也更加多樣。隨著越來越多的投資者在互聯網社交媒體上獲取信息和發表觀點,財經新聞、股吧評論等來源于互聯網的非結構化數據也被納入股票市場的分析當中,為股市分析和預測提供了新的視角(Fung 等,2002[2])。
互聯網社交媒體數據能夠更直接地反映投資者的關注度和情緒。例如個人投資者在股吧論壇中發表的對某只股票的看法可以看作此人對該股票投資機會的關注,因此這只股票股吧評論關注的集合就代表了個人投資者群體對此股票的關注度。再如一個機構投資者在新聞上發表的對某只股票的看法反映了其對此股票的看漲或看跌情緒,那么所有新聞情緒的集合就反映了專業投資者群體對股票的情感傾向。基于此,以群體的方式去研究這些與股市相關的評論或者新聞,提取其中的關注度、情感傾向等信息,就可以得到一個可量化的反映投資者群體關注度或者情緒的指標,這個指標對股市預測具有非常重要的參考價值。
傳統度量投資者關注度的間接指標主要有交易量、換手率和廣告支出。Lou(2010)[3]用廣告費用衡量投資者關注度,實驗發現上市公司增加廣告費用不僅可以增加股票買入,同時可以提高投資回報率。……