彭旭東,夏士明,孫吉明(.解放軍理工大學氣象海洋學院,南京,0;.空軍航空大學航理系,長春,300)
基于視頻的天氣類別識別分類器設計
彭旭東1,夏士明1,孫吉明2
(1.解放軍理工大學氣象海洋學院,南京,211101;2.空軍航空大學航理系,長春,130022)
通過實驗發現SVM多分類(導向無環圖)對于不同場景的天氣類別識別能力較弱,而以隨機森林為弱分類器構成的AdaBoost強分類器能有效提高對不同場景的識別能力。基于此,本文最終提出了基于視頻的天氣類別自動識別分類器的設計。
天氣類別;AdaBoost;SVM
天氣類別識別屬于有監督的學習問題。常用的有監督分類器有支持向量機(SVM)和AdaBoost。常見的天氣類別包括晴、多云、陰、霧、雨、雪等,因此本文的基于視頻的天氣類別識別是一個有監督的多分類問題。
目前,基于視覺的天氣類別研究主要采用SVM作為分類器。但SVM對于不同場景的天氣類別識別能力較弱。而以隨機森林為弱分類器構成的AdaBoost強分類器能提高對不同場景的識別能力。
AdaBoost強分類器是由多個弱分類器構成,每個弱分類器會按照既定規則選擇部分樣本構成訓練集進行訓練,因此每個訓練樣本都被賦予權重,以表明它被某個弱分類器選入訓練集的概率。如果某樣本點已經被準確地分類,那么在構造下一個訓練集時,它被選中的概率將降低;相反,如果某樣本點沒有被正確分類,那么它的權重就將提高。通過該種方式,AdaBoost方法能夠聚焦于那些較難區分的樣本上。
為了驗證方法的正確性,本文在主頻為2.9GHz,內存為8GB 的PC機上,采用Matlab2009a進行了分類識別實驗。實驗數據為本文采集的視頻數據,通過對視頻數據進行采樣得到圖像序列。每組圖像序列包含時間、天氣類別、場景信息以及氣象要素信息。
在進行學習訓練的過程中,將數據集按時間劃分,即將每類天氣下的數據按時間排序好,選擇前面部分樣本作為訓練樣本,將剩下的部分數據作為測試樣本,主要是為了研究不同時段下的分類識別。因此本文的實驗主要是研究不同分類器對相同場景的數據的區分能力。

表1 SVM多分類的識別結果
首先直接采用SVM多分類器對天氣類別進行分類。將訓練樣本集按時間排列,選擇前一半采用不同核函數進行學習,后一半用于測試,從而找出效果最好的核函數。SVM多分類結果如表1所示,分別為SVM一對多、SVM一對一、SVM導向無環圖和SVM二叉樹的分類效果,可以看出SVM一對一和SVM導向無環圖的方法要明顯優于SVM一對多的方法。一對一與導向無環圖在本質上是一致的。導向無環圖是在一對一的基礎上,讓所有的兩分類器按照一定方向進行排列,這樣可以使得判別結果更公正。一對一是通過對所有兩分類器進行判斷,統計哪個類別出現的次數最多,有可能出現多個類別出現次數相同,這樣就很難判斷屬于哪一類天氣類別,而導向無環圖可以克服這個不足。由于二叉樹的性能取決如何構造二叉樹,而二叉樹的構造可人為設定也可以根據距離最大或最小原則構造,人為設定缺乏客觀性,根據距離最大或最小原理穩定性較差,因此本文重點研究導向無環圖。
為了比較SVM多分類(重點研究導向無環圖)與AdaBoost強分類器的效果,以及AdaBoost強分類器(多棵決策樹)是否的確比單棵決策樹(CART)的效果要好。分別采用SVM導向無環圖、CART(單棵決策樹)和AdaBoost RF(隨機森林為弱分類器,由很多棵決策樹構成)作為分類器對相同場景進行學習訓練,識別結果如表2所示。可以看出SVM導向無環圖的識別率最高,另外AdaBoost RF的分類效果比CART多分類效果要好,表明對于本文的數據,強分類器的效果要優于弱分類器。因此,對于相同場景,本文采用SVM導向無環圖作為分類器,可提高識別準確率。
文獻[2]中采用wild數據庫進行單一場景的分類實驗,實驗中只有一個場景。wild天氣類別數據庫包含白天夜晚各個整點的圖像數據,圖像數據中涵蓋不同天氣、不同季節的數據,每個圖像數據有對應的時間、天氣類別、光照條件、風向風速、能見度、溫度、相對濕度等信息,共錄制了一年的數據。文獻[2]采用wild圖像數據庫,對常見的天氣類別進行自動識別研究,其識別結果如表3所示。
本文場景較多,訓練樣本和測試樣本都包含相同數目的場景,采用SVM導向無環圖進行識別結果如表4所示。與表3相比,可以看出本文場景較多(訓練分類都采用多個相同場景),識別類別較多(可以對五類天氣類別進行識別),準確率較高(每類天氣類別的識別率都可達90%以上)。因此,如果測試樣本的場景與訓練樣本場景相同,采用SVM多分類器(導向無環圖)進行測試的效果較好。
通過實驗發現SVM多分類對于不同場景的天氣類別識別能力較弱,而以隨機森林為弱分類器構成的AdaBoost強分類器能有效提高對不同場景的識別能力。基于此,本文最終提出了基于視頻的天氣類別自動識別分類器的設計。
[1] Wu X, Kumar V, Quinlan J R, et al.Top 10 algorithms in data mining[J].Knowledge and information systems,2008, 14(1): 1-37.
[2] Li Q, Kong Y, Xia S.A method of weather recognition based on outdoor images[C]//Computer Vision Theory and Applications (VISAPP), 2014 International Conference on.IEEE, 2014, 2: 510-516.
[3] Burton G J, Moorhead I R.Color and spatial structure in natural scenarios[J].Applied Optics, 1987, 26(1): 157-170.
Development of A Video-based Weather Category Automatic Recognition Classifier
Peng Xudong1,Xia Shiming1,Sun Jiming2
(1.Institute of Meteorology and Oceanography,PLA University of Science and Technology,Nanjing,211101;2.Department of Aviation Theory,Aviation University Air Force,Changchun,130022)
It was found that the skill of SVM multi-classification (directed acyclic graph)for different scenarios of weather categories was weak,but AdaBoost strong classifier based on random forest weak classifier can effectively improve the ability to recognize different scenarios.Above all,this paper proposed a video-based weather category automatic recognition classifier.
Weather recognition;AdaBoost;SVM

表2 相同場景下各分類器識別結果

表3 文獻[2]采用wild數據庫識別結果

表4 本文數據識別結果