劉 惠 趙海清
(嶺南師范學院 數(shù)學與統(tǒng)計學院,廣東湛江 524048)
近年來,中國電影產(chǎn)業(yè)高速發(fā)展。數(shù)據(jù)顯示,2010年起,中國電影總票房突破百億元,2013年中國電影總票房達到217億元,2015年增長到440億元,2017年突破500億元,達559億元,2018年,電影市場票房突破1億元的有82部電影,其中突破10億元的有16部,取得609.76億元的票房成績。2019年中國電影票房刷新642.66億的紀錄,較2018年同比增長5.4%,其中四大檔期吸引觀影人次占全年的49.8%,尤其是國慶檔觀影人次翻倍,拉動了2019年檔期觀影人次的增長。電影逐漸成為人們娛樂生活的一個重要方式。與此同時,社交網(wǎng)絡的快速發(fā)展使得越來越多的用戶選擇在公眾平臺上表達自己的意見、態(tài)度、看法和情感。電影領域的公眾平臺也隨著電影產(chǎn)業(yè)的發(fā)展應運而生。觀看一部電影后,電影愛好者可以在影評網(wǎng)站對電影進行評價和打分。對于消費者而言,在決定是否觀看一部電影之前也會通過影評網(wǎng)站上相關電影的評論內(nèi)容和打分情況來選擇。評論內(nèi)容主要是不規(guī)則的文本信息,但這些信息中包含了評論者對這部電影的情感態(tài)度。然而,一千個讀者會有一千個哈姆雷特,如果只是根據(jù)幾條影評或者得分而決定是否去看,顯然過于片面。所以,有必要從大量的評論內(nèi)容中挖掘出影評的更多情感特征,以幫助消費者做出更為全面的決定,同時還能幫助電影制作者了解消費者的消費意向和正負評價,從而為電影的發(fā)展提供一定的借鑒。
關于文本情感分析的研究,薛征(2009)利用改進后的TF-IDF算法對網(wǎng)絡新聞中的關鍵詞進行提取并聚類,使用戶快速發(fā)現(xiàn)海量電子文本中的熱點信息。……