

關鍵詞:相關向量機;機器學習;學習算法;算法研究;算法應用
中圖法分類號:TP309 文獻標識碼:A
1前言
近年來,社會經濟和科學技術都快速發展,機器學習也運用于諸多領域,并取得了良好的效果和作用。但與此同時,無論是時代發展還是現代社會大眾,對機器學習的要求都在不斷提升。因此,本文提出了一種基于相關向量機的機器學習算法。與傳統的支持向量機相比,相關向量機能夠體現數據中最核心的特征,以此為基礎可以有效減少核函數的計算量。并且,相關向量機還能克服所選核函數必須滿足Mercer的缺點,提升了機器學習的效果。
2關于相關向量機算法的描述
傳統的SVM擁有諸多缺點:無法計算樣本輸出的后驗概率分布;不太適用于多分類問題;超參數需要通過交叉驗證得到,非常耗費時間;核函數必須正定。而相關向量機算法的出現和運用則有效克服了以上SVM的諸多缺點。另外,相關向量機算法的核函數可以進行任意指定,這也使其最終得到的解比傳統的SVM更加稀疏。
RVM與SVM具有同樣的模型:
假設模型的殘差符合高斯分布,以此能夠得到數據的極大似然估計:
而且,相關向量機算法是一種貝葉斯方法———需要給予其函數先驗分布,并且是零均值不同方差高斯先驗分布。在這種情況下,每一個參數都可以得到相對應的樣本。在實際的研究過程中可以發現,隨著參數的不斷迭代、更新,其中一部分相對應值會逐漸趨于無窮大,對應的權值向量w則會無限趨于零,這意味著部分相對應的基函數會逐漸被“剔除”。因此,與傳統的SVM相比,相關向量機算法的解具有稀疏性,這是其獨特的優勢之一。
3相關向量機算法的改進優化模型
3.1經典的相關向量機算法
首先,經典的相關向量機算法可以針對線性可分的情況進行分析。而對于線性不可分的情況,經典的相關向量機算法通過使用非線性映射算法,將低維輸入空間線性不可分的樣本轉化為高維特征空間,使其線性可分,從而使高維特征空間采用線性算法對樣本的非線性特征進行線性分析成為可能。
其次,基于結構風險最小化理論,在特征空間建構最優分割超平面,可以全局最優化學習器,并在整個樣本空間的期望風險以某種概率滿足一定上界。因此,目前支持向量機只適合處理小批量樣本的任務。
3.2改進優化模型
一方面,相關向量機算法具有減少核函數計算量、稀疏性明顯和學習效率比較高等特點,可以提升機器學習的水平;另一方面,相關向量機算法包含異常值相對敏感、噪聲數據的影響比較大等缺點,會影響基于相關向量機的機器學習算法的現實應用。因此,我們需要注重對相關向量機算法的改進和優化。
有學者和專家推出了一種用于分類和回歸的廣義相關向量機模型,其繼承了GLM統一模型結構的優勢,并且提升了相關向量機算法的適用性,可以應對更加廣泛的學習任務。經實際應用后也可以發現,分類和回歸的廣義相關向量機模型具備相對良好的綜合性能。
另外,還有學者和專家推出一種具有噪音方差系數的相關向量機模型,其能夠解決傳統相關向量機算法存在的魯棒性比較差的問題。這一優化方式的核心思想是:在每一個訓練樣本中引入獨立的噪聲方差系數。由于在具體的訓練過程中,異常值的噪聲方差系數會逐漸減小,從而可以實現對異常值的自動監測和剔除,相關向量機算法也就有了較好的魯棒性。
此外,還有學者和專家為了克服相關向量機算法的異常值敏感的缺點,提出了一種基于加權方案的相關向量機模型,其可以在訓練的過程中進行自動計算。經過綜合分析和計算之后可以發現,這一優化方式的性能表現始終優于傳統相關向量機算法。因此,在后續的發展過程中,可以高度重視基于加權方案的相關向量機模型的應用、優化、完善,從而解決傳統相關向量機算法存在的異常值敏感的問題。
4基于相關向量機的機器學習算法的具體應用闡述
基于相關向量機的機器學習算法解決以上兩種問題的框架圖如圖1所示。
4.1故障檢測中的具體應用
所謂故障檢測,顧名思義就是運用不同的檢查和測試方法,檢查和發現系統、設備中是否存在故障情況。
其中,一種量子粒子群的啟發式相關向量機算法在實際的應用過程中,可以針對相關向量機的參數實現優化處理。目前,在滾動軸承的故障檢測過程中運用了這一機器學習算法——將預處理之后的軸承震動信號作為這一模型的輸入向量,可以找到全局最優解參數。根據實際的故障檢測結果來看,運用這一機器學習算法可以使分類的準確率達到90%左右。但是,其在故障檢測中的運用也存在一定的不足——在學習、訓練階段需要花費的時間代繳比較高。而經過專家和學者再一次針對這一機器學習算法進行優化,相關向量機算法的分類能力進一步增強,且在更加精細化的工業領域得以運用。其中,包含乙烯裂解爐工藝和乙烯加熱工藝過程等,具有較高的準確率和較低的陽性率,對工業生產工藝水平的提升效果非常顯著。
4.2模式識別領域中的具體應用
模式識別指的是:通過計算機數學技術形成研究模式的自動處理和判讀過程。目前,一種基于相關向量機的含噪聲人臉圖像識別算法運用了模式識別技術,它極大地拓寬了相關向量機的應用領域。相關向量機在模式識別領域中的運用,可以將ORL人臉庫作為具體的訓練樣本和測試樣本,通過二維小波交換和K?L變化提取對應的樣本特征,這能夠提高識別準確率和克服對圖像噪聲不敏感的缺點。在此基礎上,為了進一步降低特征數量,通過對ORL、AR、YaleB和戶外人臉庫四種數據集的實驗發現,人臉識別準確率進一步提升、人臉識別時間進一步減少。
4.3網絡安全領域中的具體應用
基于相關向量機的機器學習算法在網絡安全領域的應用具有較強的代表性,形成了高水平的入侵檢測刺痛,這是一種基于軟件的監控系統,可以對網絡中是否存在惡意活動進行檢測。但是,在實際的研究和分析過程中能夠發現,基于相關向量機的機器學習算法在網絡安全領域的運用還存在一定的不足。其中包含懲罰參數的設置受到人為因素的影響相對明顯等問題,在這種情況下,可以采取一種基于粒子群優化的方式,使其形成對應的網絡入侵檢測模型。實驗表明,上述模型的檢測精確度能夠達到95%左右,與傳統的SVM、BPNN項目相比,這一模型具有較大優勢,比較適合在網絡安全領域進行運用。
5結語
基于相關向量機的機器學習算法與傳統算法相比具有多種優勢,但是同樣存在一定的不足。在后續的發展過程中,需要不斷對基于相關向量機的機器學習算法進行優化和完善,這樣才能滿足時代的發展和大眾的需求。
作者簡介:
羅遠軍(1971—),碩士研究生,講師,研究方向:移動互聯網、大數據、網絡體系結構。