李 凡, 杜義華
1(中國科學院 計算機網絡信息中心, 北京 100190)
2(中國科學院大學, 北京 100049)
手機的普及, 使網絡信息的傳播變得更加方便, 微視頻、微博、微信等在新媒體時代下成為大量用戶信息交互的平臺. 合理利用網絡渠道往往能提升活動的影響力. 近些年, 中科院及其附屬單位開展了多次網上宣傳評比活動, 諸如“鏡頭中的最美科學家”視頻征集活動、科普短片征集評比活動等. 然而, 此類網上評比活動缺乏有效的評估方法.
對視頻進行征集評比時, 一方面要考慮專家們的綜合意見, 另一方面也要考慮網上網友們對視頻播放點贊轉發等互動行為. 目前的多維指標綜合評價模型主要使用用戶自主賦予權重、均等分配權重等方法[1],存在很大的劣勢, 諸如人為主觀因素對權值分配干擾過強、指標太多時導致評價實施的復雜性等等. 網上評比需要考慮多維度的參考指標, 因此基于視頻的多維交互量, 本文分析了評比影響要素并構建了層次分析模型, 引入層次分析法并加以算法改進, 確立了具體的指標權值, 給出了合理的評比方法.
現有的視頻網上評比方案存在許多問題. 用戶投票評比法存在刷票、真正觀看視頻人數存在水分等數據失真問題. 僅依靠播放量等數據的評比法, 指標集比較粗糙, 數據不能夠全面客觀反映視頻在觀眾中的傳播影響力. 經過充分的問卷調查以及與專業人士的探討, 得出如下結論: 視頻網上評比, 不僅需要考慮直接的播放指標, 也需要考慮體現視頻人氣屬性以及社交影響力的評論點贊以及轉發等指標, 才能更全面科學地評測視頻的傳播效果及用戶的喜好性. 利用層次分析法能很好地解決此問題. 因此本文主要從播放指標、評論點贊指標、轉發指標這三個方面綜合考慮視頻評比問題.
各一級指標下的二級指標應客觀真實且較易獲取.對于播放次數, 只有播放記錄超過2分鐘時才會在后臺記錄為一次播放, 以減少視頻點擊后短期內退出等現象對指標的影響. 平均播放時長指標一定程度上反映出視頻對用戶的吸引力, 質量更好的視頻往往會吸引用戶觀看更長時間. 用戶對于偏喜好的視頻, 傾向于留下表達自己想法的評論并點贊, 因此總評論數、總評論用戶數、總點贊數指標能體現出一定偏好性. 轉發功能能讓視頻更方便地在網絡中傳播, 用戶對喜愛的視頻可以隨意轉發, 因此總轉發次數和總轉發用戶數可以反映視頻的傳播程度, 是一定程度上影響力的體現.
由上分析, 確立如表1的評比層次分析模型.

表1 視頻網上評比層次分析模型
表1中左側欄為目標層, 對應的是評比模型中視頻的綜合得分, 中間欄和右側欄對應的是評比模型的準則層, C11、C12是播放指標的二級指標, C21、C22、C23是評論點贊指標的二級指標, C31、C32是轉發指標的二級指標.
選取樣本集合為S 需要對樣本集中數據的每一個指標進行歸一化處理. 歸一化處理如公式(1)所示.

其中x為指標的原有值,xmax、xmin分別為樣本集中該指標的最大值和最小值. 歸一化后的指標數值范圍在[0, 1], 便于量化計算.
視頻評比最終得分用公式(2)表示:

式中x(j)為樣本集中某元素的第j個指標歸一化后的數值,w(j)為第j個指標的權值, 通過層次分析法獲取某指標對應的權值.
日常生活中人們經常遇到需要考慮多維多層次因素的決策問題, 由美國運籌學家托馬斯·塞蒂提出的層次分析(AHP)能很好地解決此類問題, 它是一種定性和定量相結合的、系統化、層次化的分析方法[2]. 一般會根據需要達到的最終目標剝離出問題的影響因素,按照因素間的邏輯關系將各因素層次化劃分, 形成一個層次分析模型. 之后逐步進行定性和定量分析, 確定從目標層到最低因素層的權值分配方案, 提供最終的決策方法.
層次分析法具體主要步驟如下:
1) 分析層次模型
分解出影響因素, 充分考慮因素間的內在關聯, 將問題中遇到的各個因素進行邏輯分層, 建立起從最終決策到底層因素的多級層次. 在層次分析法中一般將層級劃分為目標層、準則層、方案層等. 上層因素的權值等于其下屬層各因素的權值之和.
2) 構造判斷矩陣
對指標進行兩兩比較, 用1到9這9個數值表示指標間的相對重要程度[3]. 每個數字級別代表的重要度含義如表2所示.
判斷矩陣是否合理直接影響到最終結果的可信度.由專家提供權威的判斷, 對所有指標兩兩對比后, 得到該目標的判斷矩陣A.


表2 重要度比較表
3) 計算矩陣的特征值與特征向量
在層次分析法分析過程中, 矩陣的特征值、特征向量并非需要完全精確的數值, 只需要求出近似的結果即可滿足要求. 此處采用“方根法”近似計算判斷矩陣的特征值與特征向量[4,5].
求解過程如下:
① 求出判斷矩陣每一行元素乘積的n次方根, 表示為:


③ 求出矩陣當前對應的最大特征值:

4) 一致性檢驗
在判斷矩陣A中, 滿足如下關系:

一致性檢驗中需要用到一致性指標CI, 其表示當前判斷矩陣不一致性的程度,CI的值與最大特征向量λm以及判斷矩陣的階數n有關,CI值越小的判斷矩陣越趨向于完全一致性[6,7]. 計算CI的方法如公式(8)所示:

其中,n為判斷矩陣的階數,λm為當前判斷矩陣的最大特征值.
計算一致性比例CR:

其中,RI為平均隨機一致性指標, 查閱相關資料, 得到常用的RI數據如表3所示.

表3 一致性指標
所有階數小于等于2的判斷矩陣都滿足完全的一致性. 此外, 當CR<0.1時, 矩陣滿足一致性要求, 否則需對矩陣元素進行調整來重新計算矩陣的特征值與特征向量, 直到該判斷矩陣達到最終的一致性要求.
上述層次分析法, 依靠判斷矩陣實現了指標的權值分配. 但是, 它僅僅反映了各指標間的獨立比較關系,并沒有考慮到各指標間的依賴關系. 因此, 本文在對指標分析權重時, 考慮指標間的依賴關系, 參考谷歌PageRank算法, 對原始AHP算法加以優化.
1) PageRank算法介紹
PageRank算法是一種應用廣泛的鏈接分析算法,由Larry Page和Sergey Brin在研究網頁排序算法時提出的, 是一種評估網頁重要性的測量方法[8].
其基本思想是: 訪問越多的網頁, 其網頁質量偏向于越高. 某一頁面的PageRank值是通過遞歸算法計算所有鏈入它的頁面的因子的和得到的[9]. 因而一個網頁要想有較高的等級, 必須具有較多的鏈入頁面, 高質量的鏈入頁面越多, 會導致等級越高[10].
2) 改進AHP指標權值
通過普通層次分析法得到的指標權值分配, 初步體現了指標間層次因果關系, 但是還存在一些局限性,比如沒有考慮到同級指標間的依賴關系. 因此參考PageRank算法對已得到的權值向量加以改進.
對于某個指標A1, 如果它依賴于指標A2, 則認為A1需要將自己的部分權值因子分配給A2. 諸如視頻的播放量指標就依賴于轉發數、點贊數等指標, 所以需要將播放量指標的權值分一部分給轉發數、點贊數等指標. 這和PageRank算法的鏈接傳遞關系很相似.
對于某一指標i, 將它的被依賴指標集記為S, 考慮依賴關系得到:

每一輪更新后, 指標權值就會發生相應變化. 需要對更新后的權值作歸一化處理:

重復步驟(10)和(11)作迭代運算, 直到數值趨于穩定.
矩陣變更運算是否已經收斂的判定條件是:

當δ≤0.1時, 可以認為矩陣的變更已趨于穩定, 可以停止迭代運算.
經過PageRank算法思想改進的指標權值, 體現了各指標間的內在關聯, 符合整體性考慮的要求.
1) 構造層次分析模型
構建出如表1的層次分析模型.
2) A-B層間的權向量
首先需要建立合理的判斷矩陣, 它是指標元素兩兩重要性比較的直觀數據體現. 根據反映指標相對重要性的九級度量法, 初步構造出目標層與一級指標層之間的判斷矩陣如表4所示.

表4 判斷矩陣A-B
下面計算矩陣特征向量與特征值.
根據公式(4)可以得到:

根據公式(5)可以得到:

同理,w2= 0.4054,w3= 0.1140.
即A-B的特征向量為:

由公式(6)可以得到:

下面檢驗該判斷矩陣是否滿足一致性要求. 由公式(8)、(9)可以得到:

因為CR<0.1, 故矩陣滿足一致性要求.
3) B-C層間的權向量
參照2)所示步驟, 分別求出以下幾個B-C層次間特征向量為:

4) 計算綜合權重表
根據以上步驟, 利用權向量對權值的分配, 得到綜合權重表如表5所示.

表5 綜合權重表
5) 基于PageRank的優化算法對權重表修正
考慮各指標間的依賴與被依賴關系, 得到指標依賴關系圖如圖1所示.

圖1 指標依賴關系圖
圖1中總播放次數C11指標依賴于總評論數C21、總點贊數C23、總轉發次數C31、總轉發用戶數C32, 同時C11也被總轉發數C31指標所依賴. 其他指標也都存在各自的依賴指標集以及被依賴指標集.
根據公式(10)、(11)、(12)作多次迭代運算, 直到各指標權值實現穩定收斂.
經過基于PageRank的優化算法, 得到更新后的權值表如表6所示.

表6 AHP優化后的綜合權重表
為驗證本文提出的評比模型的有效性, 進行了模擬實驗. 從數據集中選取了十個征選視頻, 首先由相關工作人員進行打分, 得出專家評估分. 再分別用本文的層次分析法模型以及均等權重法進行量化打分, 計算出各自的綜合評比分數. 由實驗結果表7看出, 本文評比模型計算出的評分數據與工作人員給出的評分數據更為接近, 說明其具有一定合理性.
本文提出了基于層次分析優化算法的視頻網上評比方法, 首先分析了評比因素并建立了層次分析模型,通過層次分析優化算法得出各指標的被賦予權重, 最后計算出在該模型下的綜合得分, 經實驗驗證該方法具有良好的分析效果. 與傳統的人為主觀賦予權重方法相比, 減少了主觀因素的不利影響, 合理有效地解決了多指標應用場景的綜合評比問題. 本文引入的方法簡單、易于操作, 能很好地解決視頻網上評比問題, 為新媒體時代其他傳播工作的研究也提供了一些參考價值.

表7 實驗結果