基于圖像識別的大屏幕人機交互系統(tǒng)建設(shè)與實踐

2019-05-13 10:15:56李厚恩余里程廖耀隆

數(shù)字技術(shù)與應(yīng)用 2019年1期

李厚恩　余里程　廖耀隆

摘要：本文在圖像識別基礎(chǔ)上，以期解決人機交互系統(tǒng)內(nèi)攝像頭標定復雜問題，提出一種全新的人機交互系統(tǒng)建設(shè)途徑。首先分析了基于圖像識別的大屏幕人機交互系統(tǒng)概述，同時闡述了系統(tǒng)建設(shè)原理，最后總結(jié)了系統(tǒng)建設(shè)實踐。

關(guān)鍵詞：圖像識別；人機交互；系統(tǒng)建設(shè)；系統(tǒng)實踐

中圖分類號：TP391.41 文獻標識碼：A 文章編號：1007-9416（2019）01-0092-02

目前應(yīng)用的人機交際系統(tǒng)主要包含兩種，一是借助激光筆，實現(xiàn)遠距離的交互，另一種則是實現(xiàn)人體一部分，比如：手部、眼睛等部位的遠距離交互。人體部位交互不需要外部設(shè)備的協(xié)助，在實際應(yīng)用中，這類交互技術(shù)更加自然與友好。本文主要研究的是基于圖像識別的大屏幕人機交互系統(tǒng)建設(shè)與實踐，詳細闡述如下。

1 系統(tǒng)概述

本文研究的基于圖像識別的大屏幕人機交互系統(tǒng)，通過利用人眼交互，以此獲取眼球內(nèi)的轉(zhuǎn)動信息，將攝像頭集中在用戶關(guān)注的位置，以此實現(xiàn)對計算機系統(tǒng)的控制，采集相關(guān)的視頻圖像[1]。借助人手可將眼球信息投放在大屏幕上，因而又稱之為手勢識別基礎(chǔ)上的人機交互。

本文研究的基于圖像識別的大屏幕人機交互系統(tǒng)，主要是將兩個廣角攝像頭分別安裝在A點、B點，安裝點需要與大屏幕正對，且鏡頭一致對準地面。用戶只需要在攝像頭與地面之間的任意距離位置，移動手臂，一般采取上下移動、左右移動兩種，通過控制大屏幕內(nèi)的鼠標定點。在鼠標移動到指定位置后，用戶站在原地，彎曲會伸展食指就可實現(xiàn)鼠標點擊。此人機交互系統(tǒng)的每個攝像頭主要負責用戶手部圖像采集，通過獲取用戶之間的二維圖像位置坐標，在透視投影模型的支持下，以此將指尖成像點與地面之間的坐標位置求解出來。將攝像頭位置、地面坐標視作一條直線，系統(tǒng)總計2條直線，兩條直線交互，則能夠?qū)⒅讣饪臻g坐標求解出來，以此獲取之間空間做標與屏幕二維碼做標。通過將物理做標轉(zhuǎn)換為專門的邏輯坐標，可求解出手指指向屏幕的實際坐標，以此實現(xiàn)大屏幕的精準定位。在系統(tǒng)完整定位之后，通過采集用戶指尖視頻圖像，可判斷食指狀態(tài)。

2 基于圖像識別的大屏幕人機交互系統(tǒng)建設(shè)原理

本系統(tǒng)的攝像頭，采取的是透視投影成像模型，如圖1所示。透視投影O型在實際應(yīng)用中，可將一個場景光線透過投影屏幕，聚集在中心。在投影中心位置，與成像平面垂直，以此形成投影軸/光軸，此階段，x，y，z點固定。

透視投影映射圖2所示，攝像頭的平面直角坐標系，其原點處于投影中心，坐標軸與投影軸相互重合，指向特定的場景，x軸與y軸圖像平面坐標與、軸平行，此階段xy平面與圖像平面之間的距離用表示，也稱之為攝像頭的焦距[2]。實際攝像頭中，圖像平面集中在投影中心后面距離位置，其投影圖像屬于倒立圖像。此階段場景內(nèi)的y點、x點、z點坐標需要在圖像平面相交點上獲取。

3 基于圖像識別的大屏幕人機交互系統(tǒng)建設(shè)實踐

以主配網(wǎng)電網(wǎng)為例，系統(tǒng)建設(shè)分析如下。

3.1 個性化專題監(jiān)控

（1）設(shè)備全維度在線監(jiān)測。通過“電網(wǎng)-變電站/輸電線路-設(shè)備”個層次遞進展示整個深圳電網(wǎng)設(shè)備整體情況，實現(xiàn)不同層次的用戶掌握電網(wǎng)及設(shè)備運行情況。（2）電網(wǎng)全維度監(jiān)測。電網(wǎng)全景信息用于展示整個深圳電網(wǎng)設(shè)備全維度在線監(jiān)測的情況，包括：電網(wǎng)規(guī)模、各類關(guān)鍵設(shè)備數(shù)量、關(guān)鍵設(shè)備狀態(tài)評價結(jié)果、各類設(shè)備壽命分布情況、不同等級的設(shè)備風險次數(shù)、不同等級的電網(wǎng)風險次數(shù)、電網(wǎng)污區(qū)分布情況等。（3）變電站全維度監(jiān)測。電網(wǎng)全景信息用于展示整個變電站設(shè)備全維度在線監(jiān)測的情況，包括：變電站基礎(chǔ)信息、變電站運行信息、變電站各類狀態(tài)監(jiān)測覆蓋情況、接入情況、在線情況、變電站的設(shè)備狀態(tài)評價結(jié)果、基準態(tài)評價結(jié)果、風險評估結(jié)果等。（4）輸電線路全維度監(jiān)測。輸電線路全景信息用于展示架空線路和電纜線路設(shè)備全維度在線監(jiān)測的情況，具體如包括：輸電線線路走勢、線路運行信息、輸電線路桿塔狀態(tài)、線路負載率、輸電線路實時視頻等。（5）設(shè)備全維度監(jiān)測。設(shè)備全景信息用于展示單體設(shè)備的全景信息，包括：單體設(shè)備的安裝、采購、項目、運行、維修、價值、缺陷、壽命、狀態(tài)、狀態(tài)評價結(jié)果、風險評估結(jié)果、基準態(tài)分析結(jié)果和故障預(yù)測結(jié)果等信息。（6）缺陷分布統(tǒng)計。以巡維中心、廠家為維度進行缺陷對比分析，支持鉆取具體的缺陷信息，具體展示包括：設(shè)備運行年限平均故障率、廠家設(shè)備故障指數(shù)、某類設(shè)備非正常狀態(tài)趨勢分布、某類設(shè)備非正常狀態(tài)運行年限分布、展示某類設(shè)備非正常狀態(tài)廠家分布、缺陷數(shù)據(jù)統(tǒng)計分析結(jié)果等。（7）客戶全方位指標監(jiān)控。展示各服務(wù)渠道的客戶訴求、客戶服務(wù)情況，監(jiān)控客戶訴求（包括12398、12345等外部渠道）的受理、分布、處理、跟蹤并閉環(huán)以及后續(xù)處理，回訪情況，以便發(fā)現(xiàn)客戶服務(wù)薄弱環(huán)節(jié)，同時對客戶供電質(zhì)量、客戶問題、故障停電進行實時監(jiān)控。（8）電動汽車充電運營監(jiān)控。展示深圳供電局目前拓展的電動汽車充電競爭性業(yè)務(wù)的總體運營情況，具體展示內(nèi)容包括：充電站樁規(guī)模、充電樁當前運行情況、充值金額、充電金額、充電電量、充電樁利用率等。（9）低壓集抄指標監(jiān)控。展示深圳供電局低壓集抄建設(shè)和集抄運行的總體情況，具體展示內(nèi)容包括：集抄覆蓋率、終端在線率、數(shù)據(jù)采集完整率、遠程抄表投入率、遠程抄表成功率、已驗收臺區(qū)數(shù)、已驗收電表數(shù)等[3]。

3.2 大屏展示

3.2.1 大屏（含控制終端）展示

（1）大屏展示手段。通過大屏動態(tài)切換或者大屏拼接的方式演示簡短視頻、展示綜合場景，供會議或者匯報使用，同時也可以設(shè)置若干主題供監(jiān)控人員使用。展示內(nèi)容需要能適應(yīng)多種分辨率的大屏，包括中央?yún)^(qū)域大屏、兩側(cè)區(qū)域大屏以及入口區(qū)域大屏。（2）終端控制。搭建移動終端和大屏展示的互動工作臺，通過移動終端發(fā)出指令，發(fā)給可視化監(jiān)控系統(tǒng)進行互動展現(xiàn)，并可根據(jù)大屏配置最優(yōu)化展示效果[4]。

3.2.2 視覺效果設(shè)計與場景展示

將深圳供電局各部門各層級關(guān)注的關(guān)鍵指標信息、月報指標信息、個性專題指標信息以及網(wǎng)公司關(guān)鍵指標信息，運用視覺設(shè)計手段，通過標志的造型和特定的色彩等表現(xiàn)手法，使企業(yè)的經(jīng)營理念、管理特色、服務(wù)標準等形成一種整體形象，展示深圳電網(wǎng)良好形象。

包括建立生產(chǎn)域視覺效果場景設(shè)計、投資計劃域視覺效果場景設(shè)計、物資域視覺效果場景設(shè)計、基建域視覺效果場景設(shè)計、營銷域視覺效果場景設(shè)計、人力資源域視覺效果場景設(shè)計、財務(wù)域視覺效果場景設(shè)計、信息域視覺效果場景設(shè)計、電網(wǎng)發(fā)展視覺效果場景設(shè)計、資產(chǎn)全生命視覺效果場景設(shè)計、設(shè)備全維度視覺效果場景設(shè)計、客戶全方位視覺效果場景設(shè)計、電動汽車充電運營視覺效果場景設(shè)計、低壓集抄視覺效果場景設(shè)計。實現(xiàn)不同主題域的視覺效果設(shè)計[5]。

通過視覺效果設(shè)計的場景，運用視頻處理、三維動畫、數(shù)字合成等技術(shù)，構(gòu)建生產(chǎn)域視覺效果視頻與動畫組件、投資計劃域視覺效果視頻與動畫組件、物資域視覺效果視頻與動畫組件、基建域視覺效果視頻與動畫組件、營銷域視覺效果視頻與動畫組件、人力資源域視覺效果視頻與動畫組件、財務(wù)域視覺效果視頻與動畫組件、信息域視覺效果視頻與動畫組件、電網(wǎng)發(fā)展視覺效果視頻與動畫組件、資產(chǎn)全生命視覺效果視頻與動畫組件、設(shè)備全維度視覺效果視頻與動畫組件、客戶全方位視覺效果視頻與動畫組件、電動汽車充電運營視覺效果視頻與動畫組件、低壓集抄視覺效果視頻與動畫組件。實現(xiàn)不同主題域的視頻展示，展示深圳局運營監(jiān)控成果。

4 結(jié)語

綜上所述，本文是在圖像識別原理基礎(chǔ)上，提出的一種全新的大屏幕人機交互系統(tǒng)構(gòu)建方式，通過應(yīng)用雙目立體視覺，解決了大屏幕人機交互系統(tǒng)內(nèi)的攝像標定問題，順應(yīng)時代發(fā)展需求，融入了各類全新的技術(shù)，提出了一種更加簡單的空間定位方式。

參考文獻

[1] 盧思羽.基于多模態(tài)人機交互的虛擬樂器演奏系統(tǒng)研發(fā)[D].華中師范大學，2016.

[2] 郭星.大屏幕人機互動中若干關(guān)鍵技術(shù)研究[D].安徽大學，2013.

[3] 李建新.大屏幕多媒體互動展示系統(tǒng)實現(xiàn)技術(shù)與設(shè)計[D].安徽大學，2012.

[4] 李志.基于圖像識別的大屏幕人機交互系統(tǒng)研究[D].安徽大學，2010.

[5] 黃燕榮.基于視頻輸入的虛擬交互系統(tǒng)的設(shè)計與實現(xiàn)[D].大連理工大學，2004.

Abstract：On the basis of image recognition， in order to solve the complex problem of camera calibration in human-computer interaction system， this paper proposes a new way to build human-computer interaction system. Firstly this paper analyses the overview of large screen human-computer interaction system based on image recognition， expounds the principle of system construction， and finally summarizes the practice of system construction.

Key words：image recognition； human-computer interaction； system construction； system practice

數(shù)字技術(shù)與應(yīng)用2019年1期

數(shù)字技術(shù)與應(yīng)用的其它文章: 計算機網(wǎng)絡(luò)安全中防火墻技術(shù)的應(yīng)用研究; 基于觸摸屏的機械手虛擬設(shè)計; 嵌入式現(xiàn)場可編程門陣列在人工智能領(lǐng)域的應(yīng)用; 基于mapgis地質(zhì)大數(shù)據(jù)共享平臺應(yīng)用研究; 基于TI多核DSP TMS320C6678的BOOT方式研究; 基于人機界面控制的立體倉庫系統(tǒng)的設(shè)計