趙新秋 楊冬冬 賀海龍 段思雨
(燕山大學工業計算機控制工程河北省重點實驗室 秦皇島 066004)
近些年來,隨著軟硬件水平的不斷提升,計算機視覺相關技術得到了爆炸式的發展。 計算機視覺[1]是研究如何像人類視覺系統一樣,從數字圖像或視頻中理解其高層內涵的一門學科,簡而言之就是研究如何讓計算機看懂世界,它包括對數字圖像或視頻進行預處理、特征提取、特征分類、分析理解幾個過程,可以實現將現實世界中的高維數據向低維符號信息的映射,進而觸發自主決策。 計算機視覺的應用方向包括場景重建、視頻跟蹤、圖像恢復、目標物體識別等等。 其中目標物體識別還能細分為物體識別、人臉識別、姿態識別、手勢識別、行為識別等。計算機視覺研究方面最近幾年有了很大的發展。文獻[2]提出了一種基于生成對抗網絡(generative aversarial nets,GANs)的主動半監督學習算法。學習者以對抗或合作的方式相互協作,以獲得對整個數據分布的全面感知。采用交替更新的方式,對整個體系結構進行端到端的訓練。實驗結果驗證了該算法相對于現有模型的優越性。文獻[3]提出了一種新的雙向主動學習算法,該算法在雙向過程中同時研究無標記和有標記數據集。為了獲取新知識,正向學習從未標記的數據集中查詢信息量最大的實例。在雙向探索框架下,學習模型的泛化能力可以得到很大的提高。文獻[4]提出了一種新的弱監督框架,該框架可以同時定位動作幀和識別未裁剪視頻中的動作。……