池衛紅 韓曉樂 / 中國人民解放軍95894部隊,北京市 昌平區 100085
為應對海量偵察數據,美國積極推進人工智能技術在偵察影像識別判讀領域的開發。本文以識別衛星影像為例介紹了美國正在開發的人工智能輔助判讀技術以及為推進該技術所需解決的問題。
美軍偵察平臺多,收集能力強,衛星、無人機和其他偵察監視平臺收集的數據遠超出人類可以分析的能力。以美軍無人機為例,美軍現有11000多架,每年收集數十萬小時的視頻數據。情報部門每天用一個傳感器在一個戰區內捕捉到的數據超過美國國家橄欖球三個賽季的高清圖像數據。例如,一個廣域運動圖像傳感器,它可以觀察整座城市,但是20多位分析人員夜以繼日地工作也只能分析其中的6%~12%。為應對海量數據,減輕影像判讀人員的工作量,美國積極推進人工智能技術在影像識別判讀領域的開發。
美國情報預研局從2017年7月到2018年2月啟動了“世界功能地圖挑戰賽”,旨在通過利用人工智能技術,對衛星影像自動化分析方面實現突破。美國情報預研局成立于2006年,參照國防預研局設立,受美國家情報局長領導。它共有500個合作機構,為美國政府17個情報機構服務。
“世界功能地圖挑戰賽”邀請了工業界和學術界研發人員開發能夠掃描和識別衛星圖像中不同類別物體的深度學習算法。情報預研局提供了100萬張做好標注的高分辨率衛星圖像,供參研人員和機構使用自動算法和大量圖像訓練算法,使其將對象分為63類,如機場、學校、油井、造船廠或港口。
研究人員通過將稱為卷積神經網絡(convolutional neural networks)的大型神經網絡和具有大量處理能力的計算機結合起來,為深層學習算法提供動力。在提供給大量訓練數據后,可以學習識別和分類衛星圖像上不同的物體。通過將一些這樣的網絡組合成整體,該算法可以判斷每個卷積神經網絡的結果,最終產生一個比單個卷積神經網絡更強更優的結果。上述是美洛克希德·馬丁小組的設計方案,該小組使用機器學習軟件和從在線開源軟件庫(如Tensor Flow)獲取的框架開發了其卷積神經網絡。該算法在識別速度上獲得了前五名,算法總精度達到83%,并能夠實現每秒對100個對象進行分類,如果使用完全有效的算法,該軟件可將人類1h完成的圖像識別任務,縮減至到幾秒鐘。該小組的算法擅長識別具有鮮明特征的物體,以高于95%的精度成功識別了核電站、隧道口、跑道和風力發電場等,但是識別特征相似的物體存在困難,如船廠、港口、醫院、辦公樓和警察局等。開發人員指出,從衛星圖像來看,這些物體根本沒有任何區別性特征。
若要這些新類型算法產生作用,所需添加的最重要成分是數據集,因為這些算法需要大量的數據進行訓練,這是一種類似于人類童年時期學習如何識別事物的方式。需要“這些物體是什么”的大量例子,然后開始概括,逐漸做出自己的判斷。但是,即使有大量正確標記的訓練數據,今天的深度學習技術可能也不能達到更高層次的智力水平,識別細微差別。例如,洛克希德·馬丁公司小組的算法將船廠和港口混淆的次數達56%。小組開發人員稱,人類看到一個圖像時,通常觀察事物的細微處,如干船塢內是否有船只,是否存在某種類型的起重機,從而可以區分出港口或造船廠,而人工智能算法目前還做不到。開發小組正在尋找圖像中這些深度學習算法目前無法計算的更高層次或更復雜的細節。目前,情報預研局人員正在更新和維護數據集,以確保算法可以獲得最新的數據信息進行訓練,最終使基于卷積神經網絡的算法更受信任。例如,某一區域中細小的變化將使系統大腦混亂,系統會給出完全錯誤的答案,因此,情報預研局人員計劃不斷地研究這個地區,確保其正在開發和為政府重新評估的算法繼續得到測試和使用,最終在應用中變得更加強壯。
美國大學也正在開展算法研究工作。波士頓大學的一個研究小組正在使用“世界功能地圖”數據集和經過測試的算法創建熱圖(heat maps),這些熱圖可以顯示出算法所使用的那部分圖像。他們發現,有時不是物體本身,而是圍繞在物體周圍的線索在分類識別中提供了最多的幫助。例如,風車顯示的陰影可以很好的幫助識別出風車這一物體。陰影為識別物體提供了更好的視圖。波士頓大學熱映射算法實際上指出了陰影的重要性,它是識別出風車的關鍵特征。這一算法利用了影像判讀識別特征之一—陰影。
美軍和地方技術工業部門指出,實現人工智能技術輔助解譯判讀面臨數個挑戰,需要解決好一些問題。
利用某一地區數據訓練的算法應用到另一個新地區,最初可能會出現一些低級錯誤。為解決這一問題,研究人員目前在用戶界面中加入了一個名為“訓練AI”的按鈕。如果發現算法誤將棕櫚樹識別為人或出現類似錯誤時,分析員可點擊“訓練AI”按鈕對算法進行訓練,將該幀視頻從戰區環境中分離出,單獨進行數據標記,并迅速發送給算法開發人員,由開發人員對算法重新訓練并進行優化。
為構建算法,需要大量的訓練數據和標記數據。對于計算機視覺,需要為成千上萬的圖像貼上標簽,即常說的結構化數據,而不是原始數據或非結構化數據,這樣系統才能識別出它們所看到的東西。若不經過標記,算法很難完成其工作。目前美軍正在構建一個國防部數據標簽體系。政府、學術界和工業界正在尋找更好的方法,促成機器能夠理解新的數據,并利用大量的未標記數據。約翰·霍普金斯大學應用物理實驗室致力于將遷移學習技術應用于圖像分類、檢測和分割。通過使用卷積神經網絡,機器學習可以從先前面向一個問題的數據集應用到面向另一個問題的數據集。利用遷移學習和無監督機器學習可以提高算法。

圖1 利用人工智能識別標注出的三個機場,三個機場位于美國佛羅里達州中部。

圖2 北京首都機場局部衛星影像圖
為算法操作人員和分析人員提供的用戶界面必須是可定制和自適應的。用戶界面應該使操作人員能夠根據正在執行的任務選擇相應的算法,為某個區域定制的算法并不會完全適合另一個區域。用戶界面還應提供可調節置信度的工具。部分操作人員可能希望算法識別置信度達到80%及以上,另一些操作人員可能會將置信度降至20%,這有可能識別人類通常無法發現的結果。
計算能力是算法開發的一個重要依賴。如果沒有云計算,算法戰是達不到效果的,但是今天的云計算技術并不是針對人工智能和機器學習優化的,需要進一步的開發。未來的量子計算和量子計算機將是這一方面最具有發展希望的解決方案。
需要指出的是,這些算法并不能在不久將來替代圖像判讀分析人員,人工智能不會奪走判讀人員的工作并取代人類,重要的判斷和高層次思考仍舊需要人類,人類需要做的是找出如何有效使用人工智能技術,了解人工智能的優勢和弱勢,使其充分發揮效能。■