潘吳斌
市場上手機廠商、手機型號以及硬件的差異,使得YouTube在傳輸視頻過程中需進行視頻碼率、分辨率等方面的識別及適應,以DASH-APP,HLS-APP,HPD-APP三種傳輸模式為例,這3種傳輸模式的段數特征差異很大。因此,本文通過分析3種傳輸模式之間的差異性、加密算法及更換流等內容,為進行YouTube模式識別提供技術支撐。
移動端加密視頻傳輸模式識別模型構建
本文提出基于在線和離線2種模式的模式識別模型構建,首先通過貝葉斯模型進行離線訓練,然后采用A-I-P-FP進行在線識別。
樸素貝葉斯多項式模型
①貝葉斯分類器原理及流程

CountVecotrizer作用是特征向量化,特征向量化示例圖如圖2所示。。

MutinominalNB模塊的主要功能是基于樸素貝葉斯多項式模型算法。
A-I-P-FP方案
A-I-P-FP方案離線訓練模塊的實現如圖3所示。Stream Filter模塊用于檢測客戶端到服務器端,并過濾出視頻樣本首部第一條視頻流F、和其后一條流F+1,2條有效的視頻流,此部分基于tshark實現。

實驗與結果分析
數據集合描述
采用表1設備進行數據集描述,共分為20和160,2次進行YouTube熱門視頻采集。

實驗評估
yi5樸素貝葉斯多項式模型實驗評估
在數據集合中隨機選取200個視頻樣本,為分析T時間參數選擇對分類器的影響進行了實驗,其D1準確率、召回率與F1-score結果如表2所示。

圖4給出了這次實驗的混淆矩陣,圖5展示了對樸素貝葉斯多項式模型構建的分類器進行了10次交叉驗證的結果。由圖4和圖5可見其平均準確率達到92.25 %。

A-I-P-FP方法實驗評估
將500個視頻集合D2分為S2、T2兩個集合。訓練集為80 %,測試集為20 %。表3用查準率、查全率和F-score及其均值,展示了對方法的評估。

如表3結果所示,識別效果最好的2種模式是DASH-APP和HPD-APP。并且如圖6所示為對500個視頻進行了10次交叉驗證的結果。可見本文方法均能取得良好的識別效果。

為完成YouTube移動端加密視頻流的識別、關聯以及傳輸模式的識別,研究了基于DASH,HLS,HPD等視頻傳輸模式在加密情況下的特征和區別,分析了在移動App,PCWEB端進行YouTube視頻傳輸模式的差異性和共同性,并深入分析了不同型號手機對視頻觀看的影響,最后提出了A-I-P-FP視頻傳輸加密方法,為在線識別YouTube視頻傳輸模式提供了一種高效、可行的解決方案。