999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

影響電影微博互動效果的隱藏主題探究方法及應用

2020-02-04 07:18:36張新香趙彩霞
知識管理論壇 2020年5期

張新香 趙彩霞

摘要:[目的/意義]探究影響電影微博互動效果的隱藏主題能發掘用戶關注的熱點問題,為企業提供有效的營銷策略。[方法/過程]從新浪微博上爬取2017年上映的123部電影的熱門微博,采用主題建模方法挖掘電影微博文本中的隱藏主題,利用回歸方法分析隱藏主題對電影微博互動效果的影響。 [結果/結論]結果發現6個可解釋主題:電影人物、電影宣傳、互動營銷、電影內容、電影評價和線下活動,其中電影宣傳、互動營銷、電影內容和電影評價4個主題正向影響電影微博的互動效果;同時發現用戶粉絲數和話題討論熱度正向影響電影微博的互動效果。

關鍵詞:電影微博? ? 互動效果? ? 主題模型? ? LDA

分類號:G206

DOI:10.13266/j.issn.2095-5472.2020.027

引用格式:張新香, 趙彩霞. 影響電影微博互動效果的隱藏主題探究方法及應用[J/OL]. 知識管理論壇, 2020, 5(5): 283-291[引用日期]. http://www.kmf.ac.cn/p/223/.

微博作為新媒體時代的網絡社交平臺,因具有互動性、公開性、便捷性等優點[1]得到了千萬網民的喜愛,發展迅速。同時微博平臺因其短小而豐厚、平等而互動、快速而價優等優勢[2]也得到眾多企業青睞,其中就包括影視企業。《2018年度微博電影白皮書》報告顯示,2018年82部票房過億的電影,100%開通了官方微博,全年累計電影閱讀點評總量達568億[3]。事實數據說明微博平臺擁有海量的用戶,同樣正成為影視企業進行產品營銷的重要平臺。

企業微博營銷效果的一個重要衡量指標是微博的互動效果[4],即微博所引發用戶的點贊、轉發和評論的數量,故分析電影微博互動效果的影響因素是重要且有意義的。影響微博互動效果的因素有很多,其中,微博主題是一個較難獲取和分析的因素,而用戶往往對關注度高的主題有更強的互動意愿。鑒于此,本文嘗試找出電影微博中的隱藏主題及其對互動效果影響的一種方法。基于研究發現,為各影視企業進行微博營銷提供實踐指導。

1? 文獻綜述

關于影響微博互動效果的探究,席林娜等[5]從情感、時間線、粉絲數等方面研究影響微博互動效果的因素,結果表明情感和粉絲數對微博的互動效果影響顯著,而時間線對微博的互動效果影響不顯著;陳姝等[6]結合“理性行為”原理探究微博中用戶參與互動的原因,研究發現微博用戶的興趣、個人影響力、微博活躍程度等顯著影響互動效果,而微博文本的表達形式對互動效果影響不明顯;謝正霞[7]認為微博用戶的粉絲數量正向影響互動效果,并根據這種關系得出使某一微博的互動效果達到一定程度的最佳粉絲數量;周慶山等[8]將微博中的精英用戶分為:商業明星、娛樂明星和文化明星,探究他們是否對用戶的互動意愿產生不同的影響,結果表明娛樂明星引起用戶的互動意愿最強烈,其次是商業明星,最后是文化明星;陳娟等[9]基于政務微博數據,以轉發和評論數作為微博互動效果的測量指標,探究影響辟謠微博互動效果的因素,結果發現謠言的方式和類型、微博的原創性、圖片的數量、微博的互動意愿等對互動效果有顯著影響;魏萌等[10]以點贊數和轉發數作為互動效果的測量指標,探究“網紅”微博內容的特征及其對互動效果的影響,結果表明不同類型的“網紅”的受歡迎程度不同,且微博內容在互動性、豐富性、娛樂性和生動性上明顯不同;S. Wu和J. M. Hofman 等[11]研究了Twitter 上不同用戶所發布微博的互動程度,將Twitter用戶分為2個等級:一般用戶與精英用戶,研究表明精英用戶所發布的微博更容易引起其他用戶的互動;M. Cha和F. Benevenuto等[12]在探究Twitter中信息的流行時發現已經認證過的博主所發布的文章更容易引起轉發;L. Zhanglun和T. Q. Pengtaiquan 等[13]在探究影響微博互動效果的因素時發現文本長度對互動效果的影響顯著,即較長微博文本能夠促進傳播的廣度和速度; J. So和A.Prestin 等[14] 以轉發數作為微博的互動效果的評測指標,探究了肥胖在 Twitter中的普遍觀念和態度,結果表明貶損內容比非貶損能夠更能引起用戶的轉發與關注,且具有幽默性的微博內容也容易引起用戶的轉發與關注;A. Soboleva和S. Burton等[15]用轉發數作為微博的互動效果的評測指標,分析了影響轉發數的關鍵因素,結果表明賬號的使用時長、好友數量以及博主的粉絲數量影響轉發數,而微博文本中的標簽和URL超鏈接對轉發數的影響不顯著。

從國內外研究現狀上來看,學者們主要以微博的轉發、評論等數據作為互動效果的測量指標,圍繞信源、信息內容和信息接收者等方面探究微博互動效果的影響因素,而從信息內容維度出發探索微博互動效果的影響因素時,多從內容的組成形式和內容情感等方面進行探究,鮮有人探究微博內容中的隱藏主題對互動效果的影響。對于電影微博領域,更是少有研究探討主題對微博互動效果的影響。為了彌補上述缺陷,本文嘗試找出電影微博中的隱藏主題及其對互動效果影響的一種方法。基于研究發現,為各影視企業進行微博營銷提供實踐指導。

2? 影響電影微博互動效果隱藏主題的研究方法

本文嘗試結合LDA和多層回歸模型探究電影微博中的隱藏主題及其對互動效果的影響。LDA模型是一種常見的主題模型,能夠有效識別短文本數據中的隱藏主題[16],而多層回歸模型能夠分析多個層級的影響因素對互動效果的影響[17]。

2.1? LDA

LDA是一種詞袋模型,假設一篇文檔由一組詞組成,詞和詞之間沒有先后關系,文檔中潛在的主題將詞和文檔關聯起來,即一個文檔由一組不同概率的主題組成,一個主題由一組不同概率的詞組成。在LDA中,文檔中的詞是已知的,主題是未知的,根據已知的詞和文本的生成規則,LDA通過概率推測來完成參數估計。LDA生成文本的規則如下:

抽取文檔d中所有主題的分布關系θd~ Dir(α),Dir(α)是參數為α的Dirichlet分布,θd是文檔-主題的Multinomial分布;

抽取一個具體的主題zdn ~ θd;

抽取主題zdn中所有詞的分布關系φk~ Dir(β),Dir(β)是參數為β的Dirichlet分布,φk是主題-詞的Multinomial分布;

抽取一個具體的詞wdn ~ φk。

重復上述步驟,不斷迭代直到最終形成文檔。若文檔集中一共有T個主題,則各個主題在文檔d中的分布概率可以表示為一個T維向量,這個T維向量滿足。

文檔中詞和主題間的聯合概率分布見公式(1):

其中w表示文檔中的詞語。

2.2? 回歸方法

本文使用回歸分析來檢查隱藏主題的解釋能力。一條微博接收到的轉發數量、點贊數量、評論數量和用戶關注數量越多,表示其引發的互動效果越強烈。在微博平臺上,每條微博下面顯示有微博被用戶轉發、點贊和評論的數量,而某一條微博吸引的新的粉絲數是不確定的,本文將每條微博的轉發數量、點贊數量和評論數量作為衡量電影微博互動效果的指標。

不同電影微博的轉發數量、點贊數量和評論數量存在巨大差異(見表1),可能會引起數據的較大波動,產生高異方差性,故本文在指標處理時將參考王林等人的處理方法[18],利用自然對數分別將指標進行歸一化,意在減小數據波動和可能存在的異方差性。最后對每一個指標進行權重賦值,則可得出每條電影微博互動效果Y的計算方法,如公式(2)所示:

其中X1、X2、X3分別為該條微博的轉發數量、評論數量和點贊數量,α1、α2、α3為其對應的權重。

王林和張玥等[18-19]研究認為博主的粉絲數量影響微博的轉發數量,故本文將指標粉絲數量添加為自變量。話題閱讀量是指在微博上以電影為中心形成的話題被微博用戶訪問的數量,能夠表示此電影在微博用戶中的歡迎程度。劉彤等[20]指出受眾感興趣的話題能引起更多人的關注和評論,故本文添加“話題閱讀量”為自變量。

為了確定隱藏主題對電影微博互動性的影響,本文構建了因變量相同、自變量不同的兩個回歸模型。第一個回歸模型的自變量僅包括用戶粉絲數量和話題閱讀量,見公式(3);第二個回歸模型添加了主題虛擬變量,即從LDA模型中訓練得到的隱藏主題,見公式(4)。

其中,Yd表示第d條微博的互動效果,Fd表示發布第d條微博的博主粉絲數量,Rd表示第d條微博所涉及到的電影話題的閱讀量。Tk,d為第k個主題在第d條微博中的分布概率,且k = 1, 2, …, K,。β0為常數項,β1、β2、βk為回歸系數,εd為隨機擾動因子。

3? 方法實現

3.1? 數據獲取

本文數據集來源于電影票房網PC端和新浪微博手機客戶端,使用Python編程爬取。首先從電影票房網PC端獲取2017年上映的所有電影,共421條,并非所有的電影能夠在微博上形成以“電影名字”為主題的話題頁面,故最終用于實驗分析的電影有123個;其次以“電影名字”為搜索條件在微博上進行手動搜索,找到電影在微博上形成的話題討論頁面,選擇熱門微博,獲取話題閱讀量及每條微博的詳情鏈接;最后根據微博詳情鏈接獲取每條微博的微博ID、微博轉發數量、微博點贊數量、微博評論數量、微博文本以及博主的用戶粉絲數量,共26 543條,刪除重復及無用微博后,最終用于實驗的有19 061條。使用stata分析工具對爬取的數據進行描述統計,結果見表1。轉發、評論和點贊對應的數量最小值都為0,最大值分別為12 042 061、250 387、1 032 796,兩者之間相差都較大(標準差明顯大于均值),且中位數明顯偏向最小值的一邊。用戶粉絲數從1到120 754 022不等,中位數大于均值。話題閱讀量的最小值為114.3萬,最大值為414 000萬。

3.2? 數據預處理

3.2.1? 微博文本數據的預處理

LDA模型是詞袋模型,即用一組詞向量表示微博文本,而原始的微博文本是由句子組成的,故在模型訓練之前,使用Python工具對微博文本進行預處理,處理方式如下:①構建所有電影微博文本的語料庫;②過濾掉無關的微博信息,包括“#話題名#”格式的內容、“@用戶”格式的內容和文本字數小于一定值的微博文本;③使用停用詞列表刪除不相關和不常見的術語(例如“有”“將”“只是”)、數字和特殊字符;④把意思相近的詞語合并成同一個術語,例如“笑點”和“笑料”被組合成“笑點”;⑤不同詞性的詞對主題表達的貢獻程度不同,對主題表達和辨識作用最大的是名詞和動詞[21],故本文只考慮名詞和動詞作為特征詞;⑥分析發現詞頻具有明顯的“長尾特征”,即多數詞出現較小的次數,少數詞出現較高的次數,這和唐曉波等[22]的結論一致。本文使用0.99級別的RemoveSparseTerms函數,刪除所有文檔中出現小于1%的動詞和名詞[23],這是一種常見的做法,允許研究人員獲得更短的術語列表和更多有用的信息。經過預處理,最終用于LDA訓練的詞語有393個,使用Python的wordcloud庫繪制了電影微博文本詞頻的詞云圖,如圖1所示:

3.2.2? 變量的預處理

使用Python工具對變量進行預處理,處理方式如下:將所有變量進行歸一化,第i條微博的第j個變量表示為xij,標準化后的

本文使用信息熵計算轉發、評論和點贊量3個指標的權重[17]。信息熵是刻畫信息無序度的一個指標,熵值越大,表示信息的無序化程度越高,相對應的信息效率越高[24]。計算變量轉發數量、評論數量和點贊數量的信息熵:

根據公式(2)計算出每條微博的互動效果,將其與歸一化后的轉發數量、評論數量和點贊數量這3個指標分別做相關分析,發現相關系數分別為0.91、0.9、0.94,均大于0.9,說明權重賦值合理[17]。

3.3? 試驗結果

3.3.1? LDA結果

使用Python中的scikit-learnLDA包訓練電影微博文本數據。LDA最重要的組成部分之一是確定構成所有文本的主題數量,本文使用perplexity指標[25]來確定微博文本的最佳主題數量,測試主題數量編號從2到15,結果表明最佳選擇是6個主題,見圖2。使用pyLDAvis包來可視化主題映射,圖3顯示6個主題都在自己的非重疊區域中,這表明6個主題之間沒有相關性,每個主題都是獨立且信息豐富的。

LDA的結果中每個主題由一組詞組成。一個好的主題模型不僅取決于模型在可衡量的統計指標中的表現,還取決于每個主題的合理性和可解釋性。每個主題中的前15個主題詞見表2。LDA允許一些詞語出現在多個主題中,例如,詞語“導演”出現在主題1和主題6中,詞語“發布”出現在主題2和主題4中。表2中的結果顯示主題1包含相關電影人物介紹方面的術語,例如“導演”“演員”“角色”“飾演”,因此本文將主題1命名為“電影人物”;主題2的主題詞更可能描述了有關電影宣傳的微博,例如“預告”“海報”“預告片”“公映”,因此本文將主題2命名為“電影宣傳”;主題3包含互動營銷方面的術語,例如“轉發”“關注”“機會”“贈送”,因此本文將主題3命名為“互動營銷”;主題4更可能是有關電影主題、情節、插曲的微博,因此本文將主題4命名為“電影內容”;主題5主要包含電影觀后感及評價方面的術語,例如“喜歡”“支持”“好看”“搞笑”,因此本文將主題5命名為“電影評價”;主題6包含電影線下宣傳活動方面的術語,例如“現場”“發布會”“路演”“首映禮”,因此本文將主題命名為“線下活動”。審查文本產生的所有6個不同主題都是可解釋和合理的。

3.3.2? 回歸結果

使用stata分析工具對數據進行回歸處理,結果見表3。模型1中,所有變量的系數在1%水平上具有顯著性,“用戶粉絲數”和“話題閱讀量”的系數均為正,這表明“用戶粉絲數”和“話題閱讀量”正向影響微博的互動效果。在模型2中,變量“用戶粉絲數”及“話題閱讀量”的系數和模型1中的結果基本相當。除了模型1中的自變量之外,模型2還添加了LDA中的隱藏變量。由于自變量矩陣X中的項Tk,d滿足,為了避免自變量間的多重共線性的產生,本文參考H. Yan等[25]的做法,將主題1從模型中刪除。對主題1之外的所有自變量進行多重共線性檢驗,結果見表4,方差膨脹因子VIF的Mean=1.44>1,Max=1.75<10,故變量之間不存在多重共線性。模型2結果顯示主題2、主題3、主題4和主題5在1%水平上都具有統計顯著性,且系數均為正,表明電影微博文本中有關“電影宣傳”“互動營銷”“電影內容”和“電影評價”的主題正向影響微博的互動效果,可能對微博的互動效果有促進作用。

4? 總結與討論

4.1? 總結

本文通過結合LDA和2層回歸模型的方法找出了電影微博中的隱藏主題及其對互動效果的影響。本文研究主要結論如下:

(1)使用主題挖掘模型LDA發現了隱藏在電影微博文本中的6個可解釋主題:“電影人物”“電影宣傳”“互動營銷”“電影內容”“電影評價”和“線下活動”,主題可視化映射結果表明6個主題之間沒有相關性,每個主題都是獨特且信息豐富的。

(2)構建2層回歸模型分析6個隱藏主題對電影微博互動效果的影響。結果表明變量“用戶粉絲數”和“話題閱讀量”正向影響電影微博互動效果。添加主題虛擬變量后增加了模型的解釋能力,主題“電影宣傳”“互動營銷”“電影內容”以及“電影評價”對微博互動效果影響具有顯著性。

4.2? 營銷建議

本研究結果能夠為企業開展電影微博營銷提供一些啟示和建議。

首先,回歸結果顯示“用戶粉絲數”和“話題閱讀量”對電影微博互動效果影響顯著。微博大V往往具有龐大的粉絲數量,企業可以通過與微博大V合作,使電影得到更廣泛的互動和宣傳。

其次,回歸結果同時表明主題“電影宣傳”“互動營銷”“電影內容”和“電影評價”正向影響電影微博互動效果。企業一方面可以在官方微博中發布一些有獎轉發之類的活動以及和電影有關的歌曲、海報、主題、情節、精彩片段;另一方面,企業應主動邀請一些在微博中有影響力的人物觀看電影并對電影做出相關評價。

4.3? 研究不足與展望

本研究有一些限制,希望未來能進一步完善這些不足。首先在用perplexity指標選擇最佳主題時,只測試了主題數為2-15的模型困惑度,對主題數大于15的情況沒有考慮。未來研究可以測試更多主題數,挖掘隱藏在電影微博文本中更細粒度的主題。其次主題的可解釋性來自主觀判斷,未來將采用專家調研和內容分析等技術科學獲取主題的命名,以提升主題的可解釋性。

參考文獻:

[1] 夏立新, 張純, 陳健瑤, 等.企業微博內容對網絡口碑及品牌認可度的影響[J].情報科學, 2019, 37(4):79-85.

[2] 李慧, 王麗婷.基于話題標簽的微博熱點話題演化研究[J].情報科學, 2019, 37(1):30-36.

[3] 新浪微博數據中心.2018年度微博電影白皮書[EB/OL].[2019-02-03].https://data.weibo.com/report/reportDetail?id=430.

[4] 李紅, 項子晴.企業微博營銷效果影響因素分析——以小米公司為例[J].價格月刊, 2017(11):78-80.

[5] 席林娜, 竇永香.基于計劃行為理論的微博用戶轉發行為影響因素研究[J].數據分析與知識發現, 2019, 3(2):13-20.

[6] 陳姝, 竇永香, 張青杰.基于理性行為理論的微博用戶轉發行為影響因素研究[J].情報雜志, 2017, 36(11):147-152, 160.

[7] 謝正霞. 基于用戶交互的企業微博傳播效果評價研究[D].廣州:華南理工大學, 2019.

[8] 周慶山, 趙雪, 趙需要, 等.我國數字內容產業研究的主題知識圖譜分析[J].情報理論與實踐, 2012, 35(4):56-61.

[9] 陳娟, 劉燕平, 鄧勝利.政務微博辟謠信息傳播效果的影響因素研究[J].情報科學, 2018, 36(1):91-95, 117.

[10] 魏萌, 張博.新浪微博“網紅”的微博內容特征及傳播效果研究[J].情報科學, 2018, 36(2):88-94.

[11] WU S, HOFMAN J M, MASON W A, et al. Who says what to whom on twitter[C]//Proceedings of the 20th international conference on world wide Web. Hyderabad: ACM, 2011: 705-714.

[12] CHA M, BENEVENUTO F, HADDADI H, et al. The world of connections and information flow in twitter[J]. IEEE Transactions on Systems, Man, and Cybernetics-Part A: systems and humans, 2012, 42(4): 991-998.

[13] ZHANG L, PENG T Q. Breadth, depth, and speed: diffusion of advertising messages on microblogging sites[J]. Internet research, 2015, 25(3): 453-470.

[14] SO J, PRESTIN A, LEE L, et al. What do people like to “share” about obesity? a content analysis of frequent retweets about obesity on Twitter[J]. Health communication, 2016, 31(2): 193-206.

[15] SOBOLEVA A, BURTON S, MALLIK G, et al. ‘Retweet for a Chance to…: an analysis of what triggers consumers to engage in seeded eWOM on Twitter[J]. Journal of marketing management, 2017, 33(13/14): 1120-1148.

[16] 周煒翔, 張仰森, 張良.面向微博熱點事件的話題檢測及表述方法研究[J].計算機應用研究, 2019, 36(12):3565-3569, 3578.

[17] 劉艷秋, 方建群, 胡靜, 等.人格因素及家庭環境對生態移民青少年冒險行為的影響[J].中國健康心理學雜志, 2019, 27(12):1871-1875.

[18] 王林, 潘陳益, 朱文靜, 等. 機構微博傳播力影響因素研究[J]. 現代情報, 2018, 38(4): 35-41.

[19] 張玥, 孫霄凌, 浦正寧, 等. 微博輿情傳播影響因素研究——基于信源特征和信息形式的視角[J]. 情報資料工作, 2014(3): 59-64.

[20] 劉彤, 尹仔鋒. “可及”環境與“不可及”環境——電影微博營銷影響因素探析[J]. 新聞界, 2012(23): 66-70.

[21] 李莉, 林雨藍, 姚瑞波. 基于LDA 模型的交互式文本主題挖掘研究——以客服聊天記錄為例[J]. 情報科學, 2018, 36(10): 64-70.

[22] 唐曉波, 王洪艷. 基于潛在語義分析的微博主題挖掘模型研究[J]. 情報學報, 2013, 56(24): 114-119.

[23] HENG Y, GAO Z, JIANG Y, et al. Exploring hidden factors behind online food shopping from Amazon reviews: a topic mining approach[J]. Journal of retailing and consumer services, 2018 (42): 161-168.

[24] 金堅.大數據時代信息熵的價值評價研究[D].長春:吉林大學, 2019.

[25] WANG Y, AGICHTEIN E, BENZI M. TM-LDA: efficient online modeling of latent topic transitions in social media[C]// KDD ‘12: Proceedings of the 18th ACM SIGKDD international conference on knowledge discovery and data mining. New York: Association for Computing Machinery, 2012: 123–131.

作者貢獻說明:

張新香:指導論文構思與寫作,提出修改意見并修改終稿;

趙彩霞:負責數據采集、初稿撰寫及論文修改。

主站蜘蛛池模板: 婷婷五月在线| 亚洲综合色婷婷中文字幕| 国产成年无码AⅤ片在线| 中文字幕在线日韩91| 日韩黄色在线| 国产人在线成免费视频| 久久精品中文字幕免费| 国产精品无码AV片在线观看播放| 制服丝袜无码每日更新| 精久久久久无码区中文字幕| 国产精品页| 在线不卡免费视频| 成人在线综合| 欧美国产成人在线| 日韩第八页| 亚洲女同一区二区| 日韩第一页在线| 99re热精品视频中文字幕不卡| 亚洲天堂日韩av电影| 超清无码熟妇人妻AV在线绿巨人| 三上悠亚在线精品二区| 国产又黄又硬又粗| 国产97视频在线观看| 国产精品欧美激情| 91欧美在线| 精品国产一区91在线| 国产二级毛片| 欧美日本激情| 伊人久久大线影院首页| 99久久精品国产综合婷婷| 日韩精品一区二区三区中文无码| 茄子视频毛片免费观看| 国产肉感大码AV无码| 婷婷综合缴情亚洲五月伊| 特级毛片免费视频| 成人午夜久久| 国产欧美日韩18| 国产性精品| 亚洲高清资源| 72种姿势欧美久久久大黄蕉| 亚洲香蕉在线| 久久99精品久久久久纯品| 中文字幕有乳无码| 亚洲成人动漫在线| 国产91高跟丝袜| WWW丫丫国产成人精品| 国产毛片基地| 69综合网| 无码一区二区三区视频在线播放| 久青草网站| 亚洲精品中文字幕午夜| 国产黄色免费看| 青草视频网站在线观看| av手机版在线播放| 97免费在线观看视频| 国产成人综合久久精品尤物| 亚洲天堂首页| 手机在线看片不卡中文字幕| 亚洲国产精品VA在线看黑人| 免费A∨中文乱码专区| 欧美国产在线一区| 日本人又色又爽的视频| 欧美日韩精品在线播放| 性欧美在线| 久久精品只有这里有| 成人国产免费| 91视频首页| 99久久精品视香蕉蕉| 亚洲综合国产一区二区三区| 欧洲高清无码在线| 国产精品福利尤物youwu | 国产精品第| 青青国产视频| 国产无人区一区二区三区| 亚洲视频免| 毛片手机在线看| 小13箩利洗澡无码视频免费网站| 亚洲三级a| www.91中文字幕| 成人福利在线视频免费观看| 成人国产精品网站在线看| 欧美日韩亚洲综合在线观看|