□ 文/孟祥廣
為什么人工智能在安防行業落地
□ 文/孟祥廣
說到人工智能,很多都覺得是一個很抽象的概念,隨著近兩年圖像識別、語音識別、人臉識別、無人駕駛與機器人等人工智能技術進入人們的視野和生活,人們對人工智能的認知度也大大提高,尤其是在過去的2016年,AlphaGo大戰人類圍棋冠軍李世石,并且以 極 大 優 勢 贏 得 比 賽 ,人 工 智 能 已 經 成 為 最為 火 熱 的 話 題 ,產 品 和 技 術 影 響 諸 多 行 業 ,其進入安防行業也是必然趨勢,近兩年安防企業都一致引入了人工智能概念并推出了極具科技感的安防智能產品,為什么人工智能會成為安防行業熱點并率先落地,行業發展又呈現怎樣的態勢。
人工智能(Artificial Intelligence,縮寫AI)始于20世紀50年代中期,之后數十年發展 起 起 伏 伏 。在 8 0 年 代 末 隨 著 深 度 學 習( 人工神經網絡)研究的興起,人工智能進入一個新的階段。深度學習在歷史上經歷了兩次低谷和三次高潮,如今正式處在第三次高潮當中,那么深度學習算法為何經歷了如此大的波動呢;我們能夠從其中得到什么樣的啟示?
首 先 還 是 來 回 顧 一下 深 度 學 習的 發 展史。其最早可以追溯到1957年,Rosenblatt提出 最 簡 單 的 單 層 感 知 機 算 法 。這 一 事 件 可 以被認為是神經元網絡類算法第一次大發展的開端,但是很快在1969年,Minsky和Papert在其 出 版 的 《 感 知 器 :計 算 幾 何 簡 介 》 中 提 到 單層神經元網絡無法解決XNOR這樣的簡單問題,其算法存在重大的理論缺陷;同時還表示,兩層以上的多層神經元網絡理論上可以克服這些缺陷,擬合任何非線性問題,但當時情況下沒有任何一種方法可以對多層感知機進行有效的訓練,深度學習第一次陷入低谷。
直到198 6 年,Ru mel ha r和H inton等人 提出了基于反向傳播(Back Propagation,簡稱BP)算法的訓練方法,使得兩層神經元網絡在理論上可以進行有效的訓練和優化。神經 元網絡算法 也因此 進 入了第二次快 速發展期。這一時期最有名的突破便是1998年 ,L e c u n 教 授 第 一 次 使 用 卷 積 神 經 元 網 絡(convolutional neural network,簡稱CNN)在郵政 手 寫 字 符 識 別 上 取 得 了 9 9 . 2 % 的 高 分 ,奠 定 了卷積神經元網絡在圖像處理領域的地位。但是當 時 的 神 經 元 網 絡 算 法 也 存 在 眾 多 不 足 ,最 重要的就是當時沒有適合于大規模并行計算的硬件,神經元網絡的訓練速度非常慢,并且其結構的設計和優化也需要大量的試錯,缺乏經驗性的指導,導致在中小數據集上的應用遠沒有同時 期 的 S V M 算 法 靈 活 和 方 便 ,因 此 ,神 經 元 網絡算法逐漸進 入了第二次低谷期。
在第二次低谷期期間,雖然外界對于神經元網絡算法普遍報以不信任的態度,但是在Hinton等人的努力下,理論上逐步解決了前期神經元網絡的諸多問題,提出了針對硬件能力不足和算法難以優化的“預訓練-微調”方法,針對梯度消失問題的Relu激活層等。同時期GPU的 大 力 發 展 也 巧 合 的 解 決 了 并 行 計 算 問 題 ,原本用于圖形渲染的GPU架構成為了之后深度學習的利器。直到2010年前后,ImageNet數據集 問 世 ,解 決 了 神 經 元 網 絡 證 明 自 己 的 最 后 一個門檻----數據量。眾所周知,在中小數據集上,以SVM為代表的淺層網絡算法已經取得了相當好的效果,以至于學術界和工業界都認為其在大數據集上也會有不錯的表現。然而事實卻說明傳統的淺層網絡算法在ImageNet數據集上表現差強人意,直到2011年,其年度最佳算法的錯誤率仍然高達25%。此時時間轉向2012年,在又經歷了近10年二次低谷和潛心修煉后,神經元網絡算法迎來了爆發。2012年,Alexnet網絡在ImageNet數據集上取得了16.4%錯誤率的成績,以10個百分點的優勢奪冠,而后每 年 都 是 基 于 神 經 元 網 絡 的 方 法 取 得 冠 軍 ,并年年刷新紀錄。而此時的網絡深度已經從lenet時期的5-8層上升為了100甚至1000層,成為了名 副 其 實 的 “ 深 度 學 習 ”。 到 今 天 ,基 于 C N N 、RNN等結構的深度學習網絡已經在圖像分類-檢測-分割、人臉識別、語音識別等方面大放異彩。
從人工智能的發展歷程來看,歷經兩起兩落,第三次浪潮還在持續中,其原因主要有:1、深層模型的表達能力(算法)的突破;2、大規模的訓練數據(數據)的產生;3、高性能并行計算(硬件)出現。使得譬如微軟、蘋果等產業巨頭紛紛加入,并把人工智能作為核心來進行發展,加大投入力度,從而才能使得基于人工智能的產品和應用可以大規模的實現。
雖然人工智能第三次浪潮使得算法大規模產品化應用成為可能,但是不可否認的是,現階段在人 工智能方面仍然存在挑戰:
數據資源:海量的、多樣的、有標簽的數據集中在少數單位中,導致深度學習技術研究無法廣泛開展
基礎理論:大規模密集型計算和海量數據訓練、深度神經網絡模型優化等具有挑戰
核心硬件:面向深度學習的架構與芯片的研制處于起步階段
實際應用:針對不同應用場景,存在深度學習網絡模型通用性的問題
產 業 生 態 :存 在 產 學 研 結 合 不 緊 密 ,數 據 訓練、算法驗證等公共服務能力不足的問題
綜 上 ,雖 然 存 在 挑 戰 ,但 是 我 們 也 應 該 看 到 ,有些行業還是已經具備了非常好的基礎和發展條件,比如安防行業,安防是人工智能最具市場前景的 領 域 之一。
首 先 ,安 防 行 業 的 基 礎 :1 、視 頻 監 控 高 清 化 ,解決了視頻監控從看得見到看得清的問題,視頻蘊含更多的信息;2、視頻監控的網絡化,使得數據 從 分 散 到 匯 聚 ,傳 輸 更 加 快 捷 ;正 是 因 為 有 了高清化和網絡化的基礎,才能使得智能化得到快速發展,而智能化恰恰解決人們看得懂的問題,從越來越懂得視頻中找到人們關注的重要的信息 。其 次 ,視 頻 監 控 體 量 大 :隨 著 平 安 城 市 建 設 的不 斷 推 進 ,監 控 點 位 越 來 越 多 ,從 最 初 的 幾 千 路 ,到幾萬路,甚至于到現在幾十萬路的規模,為人工智能提供了堅實的基礎。最后,行業需求比較大:以公安行業為例,一個中等城市:3萬路高清3 0 天 ,視 頻 存 儲 容 量 3 6 P B ,3 千 個 卡 口 一 年 的 過 車數據100億條,海量監控視頻中無用數據完全淹沒了少有的價值數據。隨著數據量的劇增,人工查閱的方式效率低、時間久,已經完全滿足不了業務需求。人工進行案件關聯分析、軌跡跟蹤,容易受個人主觀判斷、數據分析量、分析維度等因素的干擾;現有的監控系統過于單一、被動,僅提供視頻 錄 入 存 儲 的 功 能 ,在 事 前 預 警 、事 中 協 作 、事 后檢索等方面比較薄弱。
綜上,從安防行業來看,數據豐富,行業客戶迫切想要更智能化的產品來解決視頻體量激增帶來的分析問題,并且隨著平安城市等建設,客戶非常愿意在視頻監控和智能方面加大投入。也就是說,安防本身業務應用的需求決定了安防人工智能市場的潛在需求巨大,就算沒有外來資本及技術的進入,安防企業本身也會通過資本渠道去接觸和學習人工智能的知識與技術。
深度學習的出現,解決了傳統算法的不足,讓我們對視頻智能分析應用產生了更多期待。相信在不久的將來,產品會更加智能,為視頻的深度應用奠定堅實的基礎。
作者單位:杭州海康威視數字技術股份有限公司