程 純
(安徽大學(xué)經(jīng)濟學(xué)院,安徽合肥 230601)
近年來,華語電影市場越發(fā)呈現(xiàn)出百花齊放的盛態(tài)。得益于各種觀影渠道的興盛和視頻播放技術(shù)的升級,人們在日常觀影時也有了更大的選擇空間,此時電影評分成為了大多數(shù)人選片時考慮的重要指標(biāo)之一。出于各種需求,國內(nèi)出現(xiàn)了眾多電影評分平臺,例如豆瓣、貓眼、時光網(wǎng)等。其中豆瓣作為起步最早、用戶粘性最大的平臺,其電影評分一度成為大家評價電影質(zhì)量的標(biāo)桿。豆瓣評分機制將用戶總體評分除以評分人數(shù),得到樣本評分均值作為總體均值的估計量,具有較好的統(tǒng)計性質(zhì)。因此有理由認(rèn)為豆瓣電影評分反映了電影品質(zhì)的真實情況,這也是本文選擇豆瓣電影評分的基礎(chǔ)。
學(xué)術(shù)界對于電影相關(guān)預(yù)測的研究主要集中在電影票房預(yù)測、觀影人數(shù)預(yù)測、評分預(yù)測等。其中大多數(shù)研究集中在電影票房預(yù)測,其開始時間早,因此取得了很多不錯的研究成果。目前針對電影評分的研究較少,但已經(jīng)有部分研究者將票房預(yù)測的研究方法應(yīng)用于評分預(yù)測中。Matthew Rodrigue(2010)對比了邏輯回歸模型和多項式模型在26個變量上的選擇效果,實驗結(jié)果表明前者的預(yù)測準(zhǔn)確性更高。Karl Persson(2015)收集了IMDb網(wǎng)站上好萊塢電影的屬性特征信息,包括電影類型、預(yù)算、制片人和導(dǎo)演、明星影響力等特征,隨后使用隨機森林回歸模型和支持向量回歸機模型對特征信息進(jìn)行建模,得到電影評分的預(yù)測模型,結(jié)果表明前者的性能優(yōu)于后者。……