摘 要:隱馬爾可夫模型(HMM)是建立在馬爾可夫鏈的基礎上的統計模型。雖然隱馬爾可夫模型是一種計算高效的機器學習模型,但是當處理的數據集規模過于龐大時,分析的時間太長。因此,我們有必要研究隱馬爾可夫模型的并行化設計,以提高模型的運算速度。近年來,開放計算語言(OpenCL)的出現,使得設計通用的并行程序成為可能。該文,我們分析了隱馬爾可夫模型三類算法的并行特性,并設計基于OpenCL的并行實現。實驗結果表明,隱馬爾可夫模型在GPU上的并行化實現最高獲得了640倍的加速比。
關鍵詞:隱馬爾可夫模型 GPU通用計算 OpenCL 并行計算
中圖分類號:TP301 文獻標識碼:A 文章編號:1674-098X(2013)05(c)-0030-02
隱馬爾可夫模型作為一個時間序列的統計分析模型在語音識別、生物序列分析等領域中有著重要的應用。雖然HMM是一種計算高效的機器學習模型,但是當處理數百萬長度的序列或同時處理多個序列時,分析的時間往往需要幾小時、幾天。因此,設計HMM的并行算法,提升模型的訓練速度,具有重要的意義。
在該文,我們詳細分析了HMM相關的三類關鍵算法的并行化設計,并在對三種關鍵算法深入研究的基礎上,開發了基于開放式計算語言(OpenCL)的并行實現。實驗結果表明在各種情況下獲得了良好的加速比性能。
1 隱馬爾可夫模型
隱馬可夫模型實際上是一個雙重的隨機過程,由一個隱藏的具有有限狀態的馬爾可夫鏈和一個與馬爾可夫鏈狀態相關聯的隨機函數集組成。本文只專注于離散時間系統。……