劉嘉琪 齊佳音



〔摘 要〕[目的/意義]致力于更好地挖掘和利用企業微博中的信息,利用信號分析方法構建了基于企業微博的信號指標框架,為有效地預測企業短期績效提供了新思路。[方法/過程]將該預測體系應用于典型的經驗品—電影行業,經過線上收集信息、辨識信號、解讀信號,最終借助BP神經網絡模型輸出線下首周電影票房的預測結果。[結果/結論]企業微博具有很高的探索價值,企業發布的信息性內容特征量和企業關注者的結論化反饋程度等因素對預測結果的影響較大,并且包含企業微博信號的模型預測能力得到了顯著地提升。
〔關鍵詞〕信號分析;企業微博;BP神經網絡;電影票房
DOI:10.3969/j.issn.1008-0821.2018.08.010
〔中圖分類號〕F062.5 〔文獻標識碼〕A 〔文章編號〕1008-0821(2018)08-0073-10
〔Abstract〕[Purpose/Significance]In order to discover and utilize the information in enterprise micro-blog better,this paper constructs a signal index framework based on enterprise micro-blog by means of signal analysis,providing a new way to effectively predict enterprise short-term performance.[Method/Process]Applying the prediction system to typical experience good (i.e.film) industry,the study collects information,identifies signals and interprets signal online,and finally uses BP neural network algorithm to output the prediction results of the first week movie box office revenue.[Result/Conclusion]Enterprise micro-blog has a high value for exploration,and informative content released by enterprise and followers conclusive feedbacks are proved to influence box office.Combined with the signals of enterprise micro-blog,the prediction model achieves much higher accuracy.
〔Key words〕signal analysis;enterprise micro-blog;BP neural network;box office
信息不對稱是信息情報研究領域中學者們經常關注的熱點。由于互動雙方無法做到信息情報內容的完全共享,持有更多或更重要的私人情報的一方往往占據信息優勢[1]。而信息劣勢方通常會從各個方面不斷地搜尋相關信息,以便于更準確地制定決策。相應地,信息優勢方熱衷于傳遞更多信息來獲取劣勢方的青睞,從而影響其決策行為,并從中獲益[2]。隨著信息時代的發展,學者們逐漸發現社交媒體中蘊含著豐富的信息資源,尤其是在用戶規模最龐大的微博平臺。通過對微博特征的有效捕捉可以折射出客觀事物的狀態和變化趨勢[3],因此它成為劣勢方獲取信息和優勢方傳播信息的重要平臺。
在微博信息分析研究興起初期,Java、Asur和Bollen等學者曾利用Twitter信息進行探索性嘗試,在社區結構分析、電影票房預測和股市預測方面取得了一定的成果[4-6]。雖然早期研究常集中于新聞學、傳播學等領域,但隨著情報學領域的信息分析方法的不斷進步,從情報學角度對微博進行的研究日益增多。例如,張洋等人采用信號分析方法設計了微博信息分析系統[3],王晰巍等利用話題分析技術刻畫了突發事件網絡輿情態勢[7],余波從競爭情報價值等方面探討了微博信息傳播意義[8]。雖然情報學領域中存在許多成熟的信息分析方法,如特爾菲法、決策樹法、時間序列分析法等。但利用這些方法進行信息分析,需要大量可靠數據以做出確切判斷,而微博消息則具有字符有限、碎片化的特征,這為信息分析帶來了困難。不過,信號分析(Signal Analysis)恰好是一種立足于這種不完全信息條件下,針對信息不對稱情景的情報分析方法。它擅長從支離破碎的“信息碎片”中去粗取精、去偽存真,抓取出對揭示客觀規律有益的信號[9],因此更適合微博信息分析研究。
通過文獻梳理,我們發現信號分析作為新興領域,學者們通常將其作為分析競爭對手、規避風險、監測市場動態的工具,鮮少將其與企業市場價值相關聯。同時,相關研究尚處于起步階段,微博中蘊含的海量信息還未得到充分的開發和利用。尤其在經驗品交易情景下,雖然掌握更多產品細節的企業顯然是信息優勢方,但學者們大多都忽略了對企業社交媒體信息和信號的分析。然而,利用情報技術,科學地遴選出關鍵的企業微博信號并加以有效利用,對于消費者預判產品價值和企業提升市場競爭力而言均十分有益。
因此,本研究以信號分析方法為基本手段,選取典型的經驗品—電影產品為研究對象,針對企業微博的特點,以短期企業績效預測為目標,借助BP神經網絡算法構建首周電影票房預測模型。選擇電影行業的原因在于:1)電影產品具有經驗品消費特征,其質量具備高度不確定性和不可觀測性。觀眾必須要在短時間內依賴外部信息制定觀影決策,在此過程中有效的信號對于票房收入至關重要[10];2)電影票房數據是周期性較強的專業數據,跟蹤時間較短(大約為6周[11]);3)通常企業績效數據不夠透明,普通公眾和媒體很難通過大眾渠道來獲取。而相較之下,每個影院的電影票房數據恰好可以作為企業產品績效的代理變量,有利于降低數據收集難度。
1 相關研究
“信號”在電子通訊、經濟研究領域具有廣泛應用,情報學學者對它也有著獨特的理解。Fahey認為信號是個體在某種具體的環境下,對研究對象過去、當前或未來狀態和行為的數據和信息進行分析而得出的結論,是信息加工后的結果[12]。沈固朝視信號分析為對事件出現的各種跡象進行解釋、質疑、假設、數據補充、驗證和評價的過程[13]。而劉千里等人進一步強調了信號的情報內涵,認為它本身意味著一定的不確定性,對它進行邏輯推理直至得出滿足決策需要的情報為信號分析的核心[14]。許鑫等學者則將信號分析方法應用于突發事件的網絡預警研究、金融風險預警研究和企業盈余預測研究中,擴展了信號分析的應用范圍,為預測性研究提供了新思路[9,15-16]。
在信號搜集方面,針對電影票房預測研究場景,本文發現在早期的研究中,學者們普遍將影片自身屬性視為重要的預測信號,并重點聚焦于電影產業鏈中的制作(如預算、導演、演員、續集、電影類型、IP版權、制片國等)、發行(如發行商資歷、發行模式、發行公司的宣傳支出等)和上映(如上映時長、節日假期、檔期、屏幕數量、市場競爭、市場集中度等)3個階段。數據集大多來源于早期歷史數據或市場中其他類似產品的數據,然而由于產品屬性和宣傳策略等多方面因素存在差異,預測結果的準確度并不穩定。并且,影片在上映前并不存在票房數據,因此,首周票房預測仍是一個挑戰。隨著Web2.0時代的到來,與社交媒體平臺信號相結合的研究逐漸成為學術熱點。學者們開始利用社交網站中呈現出的用戶情感傾向[5]、觀影意愿[17]、影片關注程度、搜索情況[18]、口碑評價[19]、股價波動[20]等信號指標來預測電影票房。相較之下,企業微博作為低成本、實時性的企業社交媒體廣告,它的內容特征為產品銷售帶來的貢獻幾乎被大多數學者們忽略了。同時,目前仍缺乏對用戶線上響應行為與企業線下商業價值關系的考量。
在信號解讀方面,一些學者擅長利用計量經濟學模型來揭示和判斷信號與電影票房間的因果關系,常見模型包括對數線性模型[21]、GMM模型[22]、Logit模型[23]、動態聯立方程模型[24]、固定效應模型[25]等。然而,由于票房影響因素過于眾多紛雜,依賴于事先提假設的實證研究模型的預測能力受到了很大的局限,擬合度仍有很大的提升空間[26]。同時,基于數據挖掘技術的預測研究正逐漸興起。另一些學者們開始利用由數據驅動的自適應方法從龐大的數據中挖掘出有潛在價值信息,取代了傳統計量模型事先設定假設的步驟,從而可以更靈活地尋找數據之間的客觀規律[27]。常見的數據挖掘算法包括神經網絡[28]、支持向量機[29]、決策樹模型[30]、貝葉斯網絡和狄利克雷分布等算法[31]。其中,神經網絡算法受到學者們廣泛地認可,由于其具有良好的自學習和聯想儲存功能,能夠高速尋找優化解,有效提高了需求預測準確率。
因此,本研究將借助BP神經網絡模型對多維度下的企業微博信號的重要程度進行評估,從而預測出電影首周票房收入,進一步拓展信號分析和電影票房預測研究體系。
2 信息收集
針對所研究的具體問題,本文首先明確了需收集的企業微博信號范圍和信息數據來源。
2.1 信號選擇范圍
2.1.1 企業微博范疇——企業創作內容特征
企業創作內容作為企業在社交媒體中正式地、官方地生產的網絡內容[32],已逐漸成為企業推介產品、客戶關系管理、傳播品牌和危機公關等的重要方式[33],同時也為消費者提供了近距離接觸信息優勢方的最直接渠道。捕捉企業創作內容中呈現的關鍵信息,有利于深化消費者對產品的認知和理解。參考Nelson在營銷學領域提出的經典廣告分類方法,將企業創作內容特征分為兩大類,信息性特征和說服性特征[34]。
信息性特征,明確地告知消費者產品的存在、價格和物質形態等與產品相關的特征[35],目的在于降低消費者的搜尋成本[36]和決策風險[37]。甚至可以在消費者做出購買決策之前,通過傳遞可靠的信號使經驗品變成搜尋品[38]。
說服性特征,為企業和品牌創造、培養了一定特色,塑造了獨特的市場形象,滿足目標消費者的某種偏愛和情感需求[39-40]。它雖然往往與具體的產品或服務本身無關,但對于無法準確地用信息性內容描述質量的經驗品十分重要。它擅長利用友善的、有趣的、感性的、高互動的溝通手段與信號接收者建立親密的、長久的良性關系,使得用戶不僅把企業視為追求利潤的經濟實體的代言人,同時也是具有感情和溝通能力的人格化角色,拉近企業與用戶間的距離,提升了用戶對企業的好感和青睞,從而將企業產品自然納入商品備擇集中,因此是對潛在消費者心智方面的長期投資。另一方面,它通過向消費者表明企業有實力投資于非信息性廣告,鼓勵消費者對該信號進行簡單的聯想和推斷,使其間接相信產品具有高質量,可以通過高銷量抵消廣告方面的支出[35]。
因此,企業創作內容的信息性特征和說服性特征均可作為企業在微博平臺發布的信號,為消費者提供推斷產品真實價值的途徑。
2.1.2 企業微博范疇——企業微博發布策略
在信息稀缺的情景下,信息長度經常作為內容深度的度量指標,并被證實與內容的有用性正向相關[41]。相似地,企業發布的信息越長,每條信號傳遞出的有效內容越多,可被消費者參考的線索越豐富,能更好地評估產品細節提供幫助[42]。
同時,企業發布信息的頻率可以反映出影片的宣傳力度和受重視程度。在一定時間范圍內,用戶接收信號的數量越多,其工作記憶越深刻,認知程度越高。頻繁的強信號刺激可能會積極地促進消費者的購買決策行為,因此,本研究從企業創作內容的發布策略視角出發,視信息平均長度和信息發布密度為對預測產品銷量有益的信號。
2.1.3 企業微博范疇——企業關注者響應程度
對于不了解產品的潛在消費者而言,其他關注者對企業微博的反饋同樣也可作為重要信號輔助其決策。
在企業發布微博后,粉絲的轉發行為能夠有效幫助企業在社會網絡中擴散信息,令消息跨越社交網絡結構中的稀疏區域,使信息抵達更廣泛的人群。一方面,消費者的購買行為是從對商品的認知開始的[43],該舉動使得企業創作內容呈現在更多用戶視野中,有效地提升產品的曝光度,使得產品進入更多消費者的備擇集合中。另一方面,用戶自愿地在個人主頁宣傳企業的商業信息,表明了對產品最大程度的認可和滿意[44]。此時,不僅轉發者本身有更高概率選擇該產品,而且由于關注者和被關注之間常常是朋友關系或其他具有較高信任的關系(如名人與粉絲),這種認可和滿意會被信號的下級接收者感受到,加深其記憶、思維和聯想,最終幫助企業在商品銷售中獲得更高的銷量。
同時,用戶的評論行為可作為企業與消費者雙向溝通關系成立的信號,而點贊行為直接體現了用戶對企業的支持態度和好感。當消費者制定購買決策時,更傾向于選擇形象親切、口碑良好、值得信賴的企業和產品,即使市場上可能同時存在其他替代產品。因此,企業創作內容收獲更多的評論和點贊數量有利于企業進一步提升商品的銷量。
于是,本研究將社交網絡中關注者整體的響應程度(即轉發、評論和點贊量)作為一種信號,認為其對電影線下的票房收入產生影響。
2.1.4 其他范疇信號
許多研究發現,對于難以準確描述細節的經驗品而言,僅憑借企業主動發布的信號可能無法全面地預測其價值。而產品特征和市場競爭環境信息[56]也會向消費者傳遞一定的可供聯想和推斷的線索[45]。同時,由于本文重點對上映后的首周數據進行預測,因此排除了在電影上映前屬性未知的指標。最終在電影產品特征層面選取了評分、出品國、類別、導演和IP版權信號,在市場競爭環境層面選取了上映日特殊性和市場競爭水平信號。
評分。在電影市場中,有些已消費的用戶或機構依據親身經驗對產品質量的優劣進行評價,這些最直接的反饋為潛在消費者提供了重要信號[31]。發達的社交網絡也促使觀影口碑成為影響票房的因素之一,但對于評論內容而言,非結構化數據的準確處理相對困難,而評分可以認為是主流口碑的簡單化呈現,能夠代表大部分評論的情感傾向[23]。因此,我們將選取社交網絡中的影評分數作為用戶口碑的整體評價。
出品國。由于院線每年合法引進的電影數量僅有60部左右,出于商業目的,院線往往選擇引進大制作商業片,而觀眾往往因為精良質量和演員陣容選擇觀看進口大片,因而進口電影與國產電影表現出明顯的票房差別。
影片類型。不同電影天然上就有不同的受眾群,部分類型的影片會比其他類型的影片票房更高。例如Dellarocas指出冒險/動作類影片的票房顯著高于其他類型影片[46]。因此,我們單獨對冒險類和動作類電影進行計算。
導演影響力。導演的能力大小往往決定了一部電影的內涵與層次,甚至在很大程度上影響著最終的票房收入[30]。由于每位導演所導演的影片數目不同,我們利用藝恩網對于導演執導的電影數據進行統計,選取的是導演所執導的最近5部電影票房表現的平均值。
IP(Intellectual Property,知識產權)版權。IP為可以改編為電影的作品,包括文學作品、戲劇、故事大綱、故事梗概和原創劇本等[47]。在當下的文化消費市場,可被翻拍為電影的IP原著往往已經具備了一定的粉絲群體、較高的影響力與成功的口碑,消費者對于原IP的支持態度可能會影響其對影片的判斷[21]。因此我們認為“是否由IP作品改編”可作為預測電影質量的信號,影響著票房的走向。
上映日特殊性。經諸多研究發現,雖然特殊的上映日期會提升產品間的競爭,但也會為電影票房帶來額外的收入,如周末、公共假日、特殊節日等。本文重點識別出賀歲檔(指從11月20日左右開始直到春節長假結束,以影片大規模上映為開端)、暑期檔(指每年6月1日至8月31日的時段內,主要受眾為4~24歲的學生觀眾)、國慶檔(指每年國慶節7天長假期間)、特殊節日(包括情人節、圣誕節、光棍節、520等)和周末(即星期六與星期日)。
市場競爭水平。由于影片生命周期的短暫性,同期上映的影片之間具有較強的競爭關系,這種市場競爭水平也會影響消費者的注意力和決策結果,從而影響院線從該影片獲得的票房收入。本研究統計每部影片前后2周時間內上映的影片數量(包括該影片自身)作為對電影市場競爭水平信號的測量。
2.2 信息數據來源
以新浪微博作為微博研究平臺,選取中國最大的電影院線企業——萬達院線作為研究對象。萬達院線已連續8年在票房、觀影人次、市場份額等方面位居國內首位,以代表性的領先企業作為樣本,不僅可以消除由行業競爭對模型帶來的影響,還可使研究發現具有“對總體的外部效度”的概率更高[48]。
爬取以下幾部分數據:企業微博維度:1)萬達院線在新浪微博(www.weibo.com)中注冊的官方賬號“萬達電影生活”從2014年12月至2015年12月期間發布的所有企業創作內容數據,共計1 584條;2)與企業創作內容對應的用戶響應結果數據(包含評論、轉發、點贊),共計637 046條。其他維度:1)2014年12月至2015年12月期間,中國萬達院線(www.wandafilm.com)上映電影的每日票房數據,共計294部影片;2)每部影片在豆瓣電影社區(www.douban.com)中的評分、類別、導演、簡介等信息;3)從藝恩網(www.entgroup.cn)獲取影片導演近5年拍攝作品的票房收入。
獲取數據后,對其進行初步清洗處理,將不完整的、有噪聲的和不一致的臟數據清除。并在初步規范化數據格式后,將數據由多源合并成一致的數據存儲,形成了最終的完整數據集。
3 信號辨識
信號辨識是對收集到的不完全的、離散、模糊的信息進行整理,確定合適的分析維度和用以衡量信號強度的指標體系,量化信息和數據。由于數據集主要由結構化數據和非結構化文本內容構成,對其處理主要分為以下過程:
3.1 文本內容特征解構
對企業創作內容特征的辨識采用內容分析法,即一種將不系統的、定性的符號性內容,如文字、圖像轉化成系統的、定量的數據資料的研究方法,具體識別標準見表1。在處理企業創作內容特征的影片歸屬問題時,信息性特征起到了關鍵作用。而在缺乏信息性特征的企業創作內容中,說服性特征與具體影片無明顯關聯,較難判斷。鑒于電影上映前后1周為電影主要的宣傳期,因此,我們通過判斷發布時間是否屬于某部電影上映前后7天(共14天)的時間窗口,來對其進行指定計算。若企業創作內容同時屬于多部電影的窗口期,則分別進行計算。
3.2 信號強度測量
本研究的輸出預測變量為電影首周票房收入,輸入信號共15個,具體測量方式及描述性統計,見表2。
式中:InfoFeaturemi為與第m部電影相關的第i個信息性特征數量,PersFeaturemj為與第m部電影相關的第j個說服性特征數量。RepostVolw、CommentVolw、LikeVolw分別表示微博w的轉發、評論和點贊量,Trepost、Tcomment和Tlike分別表示轉發、評論和點贊行為的發生時間。DirectorBoxOfficemn為第m部電影的導演最近指導的第n部影片所收獲的電影票房。WandaBoxOffice為萬達影院每日票房。
3.3 輸入變量預處理
由于不同信號數據有著不同的取值范圍,為消除不同量綱數據對預測效果的影響,我們對各輸入指標進行歸一化處理,以便后續進行BP神經網絡模型構建[49],即將數值限定在[0,1]區間內,歸一化公式為:
4 信號解讀
信號解讀是通過對經過辨識階段量化的信號進行多方面的揭示和判斷,從而獲取對預測有價值的結論。本研究主要借助BP神經網絡模型分析收集到的信號。
4.1 相關性分析
為避免各輸入因素間相互干擾,對其進行相關性分析,探索各因素間依存關系,見表3。各因素間相關系數均小于0.7,故不用刪去任何指標。
4.2 BP神經網絡構建
BP神經網絡是基于BP算法的多層前饋網絡,其算法成熟,網絡結構簡單,具備較強的非線性映射能力的突出特點,已成為目前應用最廣泛的神經網絡模型之一[50-51]。傳統的BP算法是基于最小二乘法(OLS)思想的一種有監督的學習算法,目的在于求解誤差函數的最小值。學習過程由信號的正向傳播與誤差的逆向傳播兩個過程構成。正向傳播時,模式作用于輸入層,經隱含層處理后,傳向輸出層。對于輸出層的輸出值,如果不是預期中的期望值,則會反向的對網絡不斷地進行修正,逐層修正各個連接的權值,并完成誤差的修正過程。通過不停地修正,最后準確率也不斷提高,直到達到期望值所在范圍或達到設定的學習次數才終止學習。權值不斷修改的過程,也就是神經網絡的學習過程,具體流程圖見圖1。
圖1 BP神經網絡學習流程圖
4.2.1 確定網絡結構
網絡層數:BP網絡一般由1個輸入層,1個輸出層及若干隱含層構成。實際應用中,對于電影票房的預測,通常利用1個隱含層就基本上能滿足問題的需求[50]。雖然增加隱含層數可以提高預測精度,但盲目地增加隱含層層數,往往會使學習速度變慢,同時增加了結構的復雜性。因此,我們選擇1個隱含層。
輸入層節點數:輸入層節點數由影響輸出變量的輸入變量個數來決定,節點過少使得網絡不能很好地獲得輸入與輸出數據的非線性關系,如果過多則會增加過擬合的危險。本研究共有15個變量,故輸入層節點選為15個。
輸出層節點數:輸出層節點數取決于輸出數據類型和表示該類型所需的具體數據。本研究的輸出層包含1個節點,為電影首周票房收入值。
隱含層節點數:對于輸入與輸出均為有限個數的神經網絡,隱含層節點數的選擇原則是保證預測精度的情況下選擇盡量少的節點數[51],過多的隱含層節點數會導致學習時間過長,但隱含層節點數太少則使得容錯性差,對未經學習的樣本識別能力大大降低,所以必須綜合多方面的因素進行設計。本研究依據張向寧和黃章樹提出的經驗公式計算隱含層的神經元初始值,計算結果約為7[52]。最終,確定BP神經網絡模型圖,見圖1。
l=(0.43m·n+0.12n2+2.54m+0.77n+0.86
式中:m、n分別為輸入層結點數與輸出層結點數,l為隱含層節點數。
4.2.2 實驗參數設置
本文選用Clementine12.0軟件來實現BP網絡學習過程,Clementine工具箱不但支持整個數據挖掘流程(包括從數據獲取、轉化、建模、評估到最終部署的全部過程),而且包含豐富有效的模型算法,使得BP網絡的建立、訓練以及預測更具可靠性和精確性。同時,訓練過程非常直觀,令神經網絡模型具備高實踐性。
隱含層部分采用S(Sigmoid)函數(即S(t)=11+e-t,式中t為上層組合函數的結果)為傳遞函數,輸出層傳遞函數采用線形傳遞函數。允許誤差設定為0.01,學習速率選定0.01,最大迭代次數為3 000次,動量參數使用0.8。
為了得到相對準確的誤差估計,盡量避免過擬合,本研究建立Partition節點,并連接到數據流上的超節點上,隨機選取50%為訓練樣本集,50%作為檢驗樣本集。
4.3 信號敏感度分析
輸出變量是數值型變量,預測精度的方法為:R=1-Yi-Y′iYmax-Ymin(式中,Yi-Y′i表示第i個樣本實際值與模型預測值的誤差絕對值;Ymax為最大輸出變量的實際值,Ymin為最小輸出變量的實際值)。經過訓練,神經網絡的預測精度R為0.95158,結果比較理想。
由于各層節點間通過權值交錯相連,無法直接觀測到各輸入信號對輸出變量的影響程度。因此,我們基于不同的輸入變量取值對輸出變量的改變程度而進行敏感度分析,通過敏感度的大小反映各信號對預測變量的影響程度[53],分析結果見圖3。
對票房影響最大的信號為企業微博中的企業創作內容信息性特征,說明企業傳遞與產品緊密相關的信號越多,對消費者影響越大,對電影票房的干預作用越顯著。同時,相比于評論,點贊與轉發量體現出更高的影響力。原因在于社交媒體作為一個利用碎片化時間向消費者傳遞信號的平臺,信息的理解成本越低,對消費者的影響價值越大。點贊和轉發量可以直觀地傳遞出用戶整體的好感和支持程度。而評論則需要用戶額外付出認知、心智和時間成本來判別觀點的情感傾向,其數量無法直接表達消費者的意向和態度結論,因此無法作為有效信號。
另外,在其他信號中,影片評分作為結論化的口碑傾向,較直接地降低了消費者的不確定性,益于其制定購買決策。相比于冒險類影片,動作類影片對消費者產生更高的吸引力。導演作為影片最核心的創作人員,掌握著影片藝術創意的領導權,其職能不僅局限于審美范疇,還影響著投資立項、資金調度、演員任用等工作。因此,導演的影響力可以較準確地反映出影片的制片水準和審美層次,具有高影響力的導演所指導的電影作品很大程度上會相應的產生較高的市場價值。市場競爭水平對電影首周票房收入也有較強影響,在消費者對產品質量并不完全了解時,積極參與競爭的影片可以成功地傳遞出其對高質量產品充滿信心的可靠信號,吸引消費者做出購買決策。
相較之下,評論數量和冒險類影片的敏感度低于0.01,對電影票房預測的貢獻度較低。
4.4 預測結果穩健性分析
首先,為了驗證企業微博維度中最重要信號的穩健性,我們將輸入變量作為自變量,將輸出變量作為因變量,利用計量經濟學中的多元OLS回歸方法對電影首周票房收入的影響因素進行分析。發現模型擬合度為0.523,低于BP神經網絡模型。在較高的顯著性水平(P=0.000)下,企業創作內容的信息性特征內容仍為對電影首周票房影響最大的因素(未標準化系數為15 722.123,標準誤為1 635.312),證實了該信號對于電影票房的預測而言至關重要。
其次,對BP神經網絡模型的預測效力進行檢驗。我們采用交叉驗證法對神經網絡模型和回歸模型的預測精確度做了比較[27]。具體地,我們隨機地將樣本數據分成了4個不同子集,即每個子集包含有71部電影,每個子集輪流被用作測試樣本。當其中某一子集作為測試樣本時,其余子集則為訓練樣本,每一次測試都會得到輸出變量的預測值,將其與電影票房的真實值進行比較,便可計算出其平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)。計算公式為:
按照此步驟分別對兩類模型進行測試,最終得出MAPE值,見表4。發現BP神經網絡模型的MAPE值均小于回歸模型,代表神經網絡預測模型在本研究情景下,面向電影票房預測問題具有更優的解決效果。
最后,橫向地與類似研究結果進行比較,王煉等基于網絡搜索的票房預測模型MAPE為0.399[18];Ainslie等學者構建的電影生命周期預測模型MAPE為0.387[54];Liu在考慮口碑對票房的影響后,電影首周票房預測模型MAPE為0.387,電影總體票房預測模型MAPE為0.47[55]。參照其他研究,發現以信號分析方法為工具,納入了企業微博信號指標的預測模型具有較高的預測價值。
5 結 語
本文以電影行業為例,基于企業微博信息,創新性地將信號分析方法的基本原理與BP神經網絡模型相結合,對企業短期績效進行成功地預測,在提升預測準確率方面取得了良好效果。實驗結果表明,企業微博信息與電影票房變化有很高的相關性,企業發布的與產品緊密相關的信息性內容特征數量及以轉發量與點贊量呈現出的結論化用戶響應程度,作為有效信號,對電影首周票房收入預測具有很好的指示作用。同時依據其他信號與輸出變量的敏感度分析,發現水平較高的導演、合適的上映時機、受歡迎的影片類型也是傳遞電影市場價值信息的重要信號。
在理論層面,本文實現了:1)在信息情報學領域,基于信號分析視角甄選出預測能力較強的指示信號,證實了企業微博的高利用價值。發現企業社交媒體參與工作、其他關注者的社交媒體響應、影片自身質量和市場競爭水平對票房預測具有一定的影響作用;2)在企業營銷領域,創新地將企業社交媒體營銷內容與市場績效相結合,跳脫出目前學術界單純以虛擬用戶卷入結果來衡量企業社交媒體營銷效果的研究格局,為評估企業線上營銷工作價值提供了真實的物質基礎和客觀量化條件;3)在票房預測領域,預測結果顯示相比于其他類似研究,基于BP神經網絡和微博信號的預測模型能夠提高票房預測的準確性。
在實踐層面,得到了以下啟示:1)在社會化營銷工作方面,企業可適當地增加信息性內容在企業創作內容中的比重,因為當消費者接收到高質量的有用信號后,會樹立起對企業和產品更深層次的認知,降低了決策風險和不確定性,推動了雙方在商業交易中達成共識,從而提升了產品銷量和企業收入。2)在提升社交網絡中其他用戶的參考價值方面,相較于精細地閱讀和判斷其他用戶的評論內容,消費者更需要能迅速識別影片質量、降低理解成本、有助于決策的簡單信號。因此,網站運營者應重點呈現那些經過統計處理的關于影片質量的結論化信息(如網絡口碑評分、轉發量和點贊量),而企業應將提升其分數和數量作為社交媒體營銷活動的重點任務。3)在電影籌備方面,制片方應著重考慮導演的影響力,選取高票房導演增大了影片成功的概率。4)在電影放映方面,選擇在多部影片云集的高競爭檔期上映,既向消費者傳遞出質量可靠的信號,也可激發出觀影者的獵奇心理,有助于吸納更多票房。
本文仍存在不足之處。1)僅重點關注與短期營銷收入相關的企業微博信號,未來應進一步廣泛考察各方面信號對于企業整體市場價值的影響。2)僅單獨調查了一個行業和業內的領先企業,整體數據量不算龐大,部分變量的缺失也可能對模型預測的結果造成影響,未來考慮將基于信號分析理論的研究擴展到更多企業和行業。
參考文獻
[1]Aaker D A,Keller K L.Consumer Evaluations of Brand Extensions[J].Journal of Marketing,1990,54(1):27-41.
[2]Connelly B L,Certo S T,Ireland R D,et al.Signaling Theory:A Review and Assessment[J].Journal of Management,2011,37(1):39-67.
[3]張洋,張津華,謝齊.基于信號分析方法的微博信息分析系統設計與實現[J].情報理論與實踐,2013,36(5):104-110.
[4]Java A,Song X,Finin T,et al.Why We Twitter:An Analysis of a Microblogging Community[M]//Advances in Web Mining and Web Usage Analysis.DBLP,2009:118-138.
[5]Asur S,Huberman B.Predicting the Future with Social Media[J].Social Science Electronic Publishing,2010,7(2):492-499.
[6]Bollen J,Mao H,Zeng X.Twitter Mood Predicts the Stock Market[J].Journal of Computational Science,2011,2(1):1-8.
[7]王晰巍,邢云菲,王楠阿雪,等.新媒體環境下突發事件網絡輿情信息傳播及實證研究——以新浪微博“南海仲裁案”話題為例[J].情報理論與實踐,2017,40(9):1-7.
[8]余波.微博的情報學意義探討[J].圖書情報工作,2010,54(22):57-60.
[9]許鑫,張嵐嵐.突發事件網絡輿情預警模式探索[J].圖書情報工作,2010,54(22):135-138.
[10]Moorthy S.Can Brand Extension Signal Product Quality?[J].Marketing Science,2012,31(5):756-770.
[11]Elberse A,Eliashberg J.Demand and Supply Dynamics for Sequentially Released Products in International Markets:The Case of Motion Pictures[J].Marketing Science,2003,22(3):329-354.
[12]利亞姆·費伊.競爭者:以才智、謀略與績效制勝[M].北京:中國人民大學出版社,2005.
[13]沈固朝.信號分析:競爭情報研究的又一重要課題[J].圖書情報工作,2009,53(20):11-14.
[14]劉千里,童悅.信號分析的若干理論與方法探析[J].圖書情報工作,2009,53(20):15-19.
[15]楊雪萊,許傳華.中國金融風險預警指標的最優閾值及預測績效分析[J].金融經濟學研究,2012,(2):121-128.
[16]王雄元,彭旋.穩定客戶提高了分析師對企業盈余預測的準確性嗎?[J].金融研究,2016,(5):156-172.
[17]Shugan S,Swait J.Enabling Movie Design and Cumulative Box Office Predictions Using Historical Data and Consumer Intent-to-View[J].University of Florida,2009.
[18]王煉,賈建民.基于網絡搜索的票房預測模型——來自中國電影市場的證據[J].系統工程理論與實踐,2014,34(12):3079-3090.
[19]Duan W,Gu B,Whinston A B.Do Online Reviews Matter?——An Empirical Investigation of Panel Data[J].Decision Support Systems,2008,45(4):1007-1016.
[20]Spann M,Ernst H,Skiera B,et al.Identification of Lead Users for Consumer Products Via Virtual Stock Markets[J].Journal of Product Innovation Management,2009,26(3):322-335.
[21]侯永,王鐵男,李向陽.質量信號的連續傳遞性——電影市場質量信號的影響邊界[J].寧夏大學學報:人文社會科學版,2014,36(4):133-140.
[22]羅曉芃,齊佳音,田春華.電影首映日后票房預測模型研究[J].統計與信息論壇,2016,(11):94-102.
[23]王錚,許敏.電影票房的影響因素分析基于——Logit 模型的研究[J].經濟問題探索,2013,(11):96-102.
[24]Elberse A,Eliashberg J.Demand and Supply Dynamics for Sequentially Released Products in International Markets:The Case of Motion Pictures[J].Marketing Science,2003,22(3):329-354.
[25]夏妮亞,蒲勇健.基于多國面板數據的電影產業經濟特征分析與國內電影票房影響因素研究[J].經濟問題探索,2012,(6):136-144.
[26]嚴建援,張麗,張蕾.電子商務中在線評論內容對評論有用性影響的實證研究[J].情報科學,2012,30(5):713-719.
[27]趙麗娜,韓冬梅.基于BP神經網絡的在線評論效用影響因素研究[J].情報科學,2015,33(6):138-142.
[28]連聰聰,杜儀,張輝.基于電影營銷因素分析的電影票房預測[J].中國傳媒大學學報:自然科學版,2015,22(4):26-30.
[29]王曉耘,袁媛,史玲玲.基于微博的電影首映周票房預測建模[J].現代圖書情報技術,2016,32(4):31-39.
[30]王玉帛.基于數據挖掘對影響電影票房因素的淺析[J].通訊世界,2017,(2):236-237.
[31]Eliashberg J,Elberse A,Leenders M A A M.The Motion Picture Industry:Critical Issues in Practice,Current Research,and New Research Directions[J].Marketing Science,2006,25(6):638-661.
[32]Qu Q X,Qi J,Tan Y.User-Generated Content(UGC)Encountered Enterprise-Generated Content(EGC):Quantifying the Impact of EGC on the Propagation of Negative UGC[C]//PACIS,2014:88.
[33]王戰平,阮成奇,李鳴瑜,等.企業微博傳播效果測評研究[J].情報科學,2014,32(9):52-59.
[34]Nelson P.Information and Consumer Behavior[J].Journal of Political Economy,1970,78(2):311-329.
[35]Milgrom P,Roberts J.Price and Advertising Signals of Product Quality[J].Journal of Political Economy,1986,94(4):796-821.
[36]Stigler G J.The Economics of Information[M].Belknap Press of Harvard University Press,1984.
[37]Bettman J R,Park C W.Effects of Prior Knowledge and Experience and Phase of the Choice Process on Consumer Decision Processes:A Protocol Analysis[J].Journal of Consumer Research,1980,7(3):234-248.
[38]Klein L R.Evaluating the Potential of Interactive Media through a New Lens:Search Versus Experience Goods[J].Journal of Business Research,1998,41(3):195-203.
[39]Nelson P.Advertising as Information[J].Journal of Political Economy,1974,82(4):729-754.
[40]Goldman R,Papson S.Sign Wars:The Cluttered Landscape of Advertising[M].Guilford Press,1996.
[41]Mudambi S M,Schuff D.What Makes a Helpful Review?A Study of Customer Reviews on Amazon.com[J].2010.
[42]曾偉.基于ELM的在線評論有用性研究——商品類型的調節影響[J].現代情報,2014,34(12):148-153.
[43]蔡佩兒,沙振權.互聯網視頻貼片廣告下的品牌說服效果[J].管理學報,2016,(10):1525-1533.
[44]Chung S,Animesh A,Han K,et al.Firms Social Media Efforts,Consumer Behavior,and Firm Performance[J].2014.
[45]Balachander S,Sanjoy G.Reciprocal Spillover Effects:A Strategic Benefit of Brand Extensions[ J ].Journal of Marketing,2003,67(1):4-13.
[46]Dellarocas C,Zhang X M,Awad N F.Exploring the Value of Online Product Reviews in Forecasting Sales:The Case of Motion Pictures[J].Journal of Interactive Marketing,2007,21(4):23-45.
[47]李宏宇.“IP”改編電影與其市場表現分析[J].中國電影市場,2016,(12):31-34.
[48]傅慧芬,賴元薇.消費電子品品牌社交媒體內容營銷策略研究——基于聯想、華為、HTC和三星微信公眾號的內容分析[J].管理評論,2016,28(10):259-272.
[49]付斌,張吉軍,鐘健,等.基于BP神經網絡的數據挖掘方法在需求預測中的應用研究[J].情報科學,2017,35(11):132-135.
[50]周樸雄,張兵榮,趙龍文.基于BP神經網絡的情境化信息推薦服務研究[J].情報科學,2016,34(3):71-75.
[51]丁筠.學術期刊影響力指數(CI)預測模型的構建[J].情報科學,2017,35(2):27-32.
[52]張向寧,黃章樹.基于BP神經網絡的CPI 預測研究[J].商情,2007,(2):104.
[53]袁海霞.網絡口碑的跨平臺分布與在線銷售——基于BP人工神經網絡的信息熵與網絡意見領袖敏感性分析[J].經濟管理,2015,(10):86-95.
[54]Ainslie A,Drèze X,Zufryden F.Modeling Movie Life Cycles and Market Share[J].Marketing Science,2005,24(3):508-517.
[55]Liu Y.Word of Mouth for Movies:Its Dynamics and Impact on Box Office Revenue[J].Journal of Marketing,2006,70(3):74-89.
[56]彭靖里,可星,李建平.企業技術競爭情報中的市場信號分析及實證研究[J].情報理論與實踐,2016,39(1):82-87.
(責任編輯:孫國雷)