陳齊瑞,徐家寧,張維,俞佳莉,蔣穎
(國網浙江省電力有限公司營銷服務中心(計量中心),浙江 杭州 310014)
微信公眾號可以實現對話服務,本質上是一個絕佳的信息溝通與意愿表達的反饋系統。多個領域可以通過微信公眾號完成一定的服務,為日常工作帶來了極大的便捷性[1]。電力企業的服務與居民生活緊密相關,微信公眾平臺的出現,為電力企業服務提供了新的手段,國網江蘇省電力公司以及國網山東省電力公司是電力微信公眾號嘗試的代表,尤其是國網江蘇省電力公司,出現首個電力公司微信公眾號,通過使用得到了出色的服務成果,被評為了微信優秀案例,并對其進行大力推廣使用[2-3]。
由于關系網絡尺寸的局限,導致現有電力微信公眾號信息溯源方法定位精準度較低,為此提出基于AARRR模型的電力微信公眾號信息溯源方法。AARRR模型指的是Acquisition(獲取用戶)、Activation(提高活躍度)、Retention(提高留存率)、Revenue(獲取收入)與Refer(自傳播),分別指的是移動應用生命周期的5個重要環節,希望通過應用AARRR模型提升方法在10 000數量級以上網絡尺寸的信息源定位準確度[4]。
電力微信公眾號信息傳播具有一定的網絡結構,其是定位信息源的基礎,為此,此研究首要的任務就是構建微信公眾號關系網絡[5-6]。
電力微信公眾號關系網絡是以微信公眾號用戶為節點,以信息之間的相似度為邊形成的網絡。在微信公眾號關系網絡中,邊權重是依據公眾號發布信息的相似度進行計算的,計算式為式(1)。
ωi,j=w(d1,d2)
(1)
式中,ωi,j表示i-j邊權重;w(di,dj)表示信息di與信息dj的相似度。
由式(1)得到的邊權重可以清晰地反映信息之間的相似程度,判斷信息傳播的概率[7-8]。
依據構建的微信公眾號關系網絡,通過AARRR模型分析信息傳播路徑。
AARRR模型示意圖如圖1所示。

圖1 AARRR模型示意圖
由圖1可知,AARRR模型實質上是一個數據模型,展示了電力微信公眾號信息自傳播的全過程,也顯示了電力微信公眾號的管理與服務流程。為了簡化信息溯源過程,搭建信息傳播模型,信息傳播路徑步驟如下所述。
步驟一:初始階段:基于微信公眾號關系網絡G,Sate=0,Rate=0,設置所有節點均是可傳播狀態;
步驟二:傳播階段:若是節點被傳播,以矩陣Rate中的概率傳播給相鄰的節點,則相鄰節點也變成了傳播點;反之則更新矩陣Sate與Rate;
步驟三:最終階段:依次獲取被傳播節點,將其依次連接,則得到了信息傳播途徑[9]。
電力微信公眾號關系網絡數量級較大,無法實時觀測每一個用戶節點,為此,基于節點緊密度選取可觀測節點,并計算信息傳播激活時刻向量[10]。
基于節點緊密度選取可觀測點,可以突破網絡數量級的限制,增加信息溯源方法的適用范圍。緊密度是一種中心度測量方法,顯示了節點與傳播路徑中其它節點的遠近程度,計算式為式(2)。
(2)
式中,Cj表示節點j的緊密度;N表示用戶節點的總數量;dij表示用戶節點i與用戶節點j的最短路徑長度。
在微信公眾號關系網絡中,距離信息源節點越遠的節點被激活的時間越晚,若是替換源節點,就會違背上述事實。依據上述原理,建立信息溯源估計函數。信息溯源估計函數主要由信息傳播激活時刻向量與信息傳播時間近似矩陣構成,如式(3)。
to=ts+τ(υ,o)
(3)
式中,to表示信息溯源估計函數;ts表示源節點激活時刻,是未知的;τ(υ,o)表示節點υ到可觀測節點o的傳播時間間隔。
近似信息傳播時間矩陣向量計算流程如圖2所示。

圖2 近似信息傳播時間矩陣向量計算流程圖
圖中的計算流程實現了基于AARRR模型的電力微信公眾號信息源節點的定位,為電力微信公眾號的安全提供更加有效的保障。
為了驗證電力微信公眾號信息溯源方法在10 000數量級以上網絡尺寸的信息源定位準確度,設計仿真對比實驗,對比方法采用現有電力微信公眾號信息溯源方法中代表方法,分別是基于SI模型的電力微信公眾號信息溯源方法與基于部署觀察點的電力微信公眾號信息溯源方法。其中,基于SI模型的信息溯源方法構建了輿論中心偵測模型,以此來定位信息源;基于部署觀察點的信息溯源方法是通過在微信公眾號關系網絡中部署一定的觀察點收集信息,利用統計分析定位信息源。
為了保障測試的順利進行,選取國網江蘇省電力公司微信公眾號作為測試對象,國網江蘇省電力公司微信公眾號界面實物圖如圖3所示。

圖3 測試對象界面實物圖
信息源定位準確度主要由溯源成功率與真實源節點平均排名比例來評估,其計算式為式(4)。

(4)
式中,SR表示溯源成功率;ARP表示真實源節點平均排名比例;|V|表示用戶節點數量。
常規情況下,溯源成功率越高、真實源節點平均排名比例越小,表明信息溯源方法的準確度越高。
溯源成功率還會受到噪聲的干擾,分別在噪聲30 dB與50 dB情況下進行測試。以測試對象關系網絡數量級為自變量,得到溯源成功率對比情況如表1、表2所示。

表1 噪聲30 dB情況下溯源成功率對比情況表

表2 噪聲50 dB情況下溯源成功率對比情況表
由表1和表2可知,在噪聲30 dB情況下,提出方法的溯源成功率范圍為89.95%-95.03%;在噪聲50 dB情況下,提出方法的溯源成功率范圍為80.10%-88.12%。通過對比研究發現,在噪聲30 dB與50 dB情況下,提出方法的溯源成功率均高于現有代表方法。隨著噪聲程度的增加,信息溯源方法溯源成功率呈現下降的趨勢。
在噪聲30 dB與50 dB情況下,通過測試得到真實源節點平均排名比例對比情況如圖4、圖5所示。

圖4 噪聲30 dB下真實源節點平均排名比例對比情況圖
由圖4和圖5可知,提出方法的真實源節點平均排名比例遠遠低于現有代表方法。隨著噪聲程度的增加,真實源節點平均排名比例呈現增加的趨勢。

圖5 噪聲50dB下真實源節點平均排名比例對比情況圖
上述測試結果顯示:在10 000數量級以上網絡尺寸中,提出方法的溯源成功率高、真實源節點平均排名比例小,表示提出方法信息源定位準確度高。
電力微信公眾號的使用已經逐漸成熟,關系網絡拓撲結構變得愈加復雜,用戶量逐漸攀升,信息在用戶間傳播的方式也更加多樣化。在電力微信公眾號中,信息質量無法保障,再加上信息管理制度不夠完善,導致謠言、惡意言論大肆傳播。由此可見,如何追溯信息的源頭是治理電力微信公眾號的關鍵。為此提出基于AARRR模型的電力微信公眾號信息溯源方法研究,該方法可以提升信息溯源方法的使用范圍,為電力微信公眾號的安全提供更高的保障。