高建新 關(guān)禹 李俊杰 石超
摘要:傳統(tǒng)的會議模式已不能滿足用戶方便、高效的召開視頻會議的需求。文章提出建立優(yōu)化型智能會議系統(tǒng),系統(tǒng)由5大模塊組成,分別為人臉識別模塊、語音識別模塊、智能控制中樞、云計算平臺和會議平板。各模塊協(xié)調(diào)工作,實現(xiàn)會議簽到、攝像機自動特寫、會議紀(jì)要生成等功能,以提高視頻會議的自動化程度、便捷性、智能化,降低會議成本,有效解決用戶體驗差等問題。
關(guān)鍵詞:人工智能;優(yōu)化智能會議系統(tǒng);系統(tǒng)技術(shù)
中圖分類號:TN948.63?文獻標(biāo)識碼:A?文章編號:1672-9129(2020)10-0062-02
引言:現(xiàn)如今,國網(wǎng)視頻會議召開頻繁,2019年召開國網(wǎng)視頻會議近4萬場。國網(wǎng)總部與網(wǎng)省電力公司之間聯(lián)系緊密,工作交流頻繁。會議規(guī)模不斷擴大,隨之會議成本、會議系統(tǒng)的復(fù)雜度不斷提高。企業(yè)各部門的會議也多采用網(wǎng)絡(luò)視頻形式,但對網(wǎng)絡(luò)視頻會議的體驗有諸多不滿,例如自主服務(wù)體驗差、系統(tǒng)功能不夠人性化、音頻效果差等。實現(xiàn)完成網(wǎng)視頻會議的系統(tǒng)主要有視頻、音頻、中樞控制等部分。系統(tǒng)終端操作復(fù)雜,負(fù)責(zé)操作終端的工作人員往往需要長期技術(shù)培訓(xùn)后才能夠正常完成工作。以往的視頻會議需要多個專業(yè)人員進行電子設(shè)備管控,以保證會議正常進行,效率低、用工成本高。
因此,傳統(tǒng)的會議模式已越來越不能滿足公司發(fā)展需求,亟需探索建立一種新的智能會議系統(tǒng)。本文結(jié)合目前人工智能的研究成果,提出一種智能會議系統(tǒng)技術(shù),來提高會議系統(tǒng)自動化程度,提升用戶體驗。
1?智能會議系統(tǒng)現(xiàn)狀
目前常見的智能會議系統(tǒng),其終端是電腦,具有原筆記簽到、終端設(shè)備桌面共享、無線投影、自動生成會議紀(jì)要、參會人員信息交互、投票、資料分發(fā)等功能。智能會議系統(tǒng)具有自適應(yīng)性,會根據(jù)會議所在場地環(huán)境自動調(diào)節(jié)系統(tǒng)模式,例如音頻接受,系統(tǒng)中有降噪模塊,會對非人類語言發(fā)出的聲音外的其他聲音音量減少或者消除,提高語音清晰度。智能會議系統(tǒng)與傳統(tǒng)視頻會議相比,可以提高視頻會議的效率、降低會議的經(jīng)濟成本與時間成本。
近年來,智能手機的普及率不斷提高,走入人們的生活日常,越來越多會議的進行選擇使用智能手機。微信軟件是每部智能手機上必備的一款軟件,這款軟件不僅方便親朋好友間的交流,更是方便了人們的日常工作。通常,一個團隊的負(fù)責(zé)人會用微信建群,有什么工作通知會在群里發(fā)布,也常常會用微信群來召開視頻會議。參加會議的人員可以隨時隨地跟進會議,掌握會議內(nèi)容。這種會議切實地提高工作效率,使得對人員的管理更加便捷。
2?智能會議系統(tǒng)技術(shù)
2.1系統(tǒng)總體技術(shù)架構(gòu)。優(yōu)化智能會議系統(tǒng)主要由 5 個模塊組成,分別是語音識別模塊、人臉識別模塊、智能控制模塊、云計算平臺模塊、智能控制模塊、會議平板,每個模塊子系統(tǒng)分別獨立完成相應(yīng)功能,各個子系統(tǒng)之間分工協(xié)作,共同實現(xiàn)智能輔助功能。
2.2技術(shù)原理。
(1)人臉識別模塊。
人臉識別模塊是負(fù)責(zé)整個系統(tǒng)的人臉圖像采集、人臉特征提取、人臉圖像識別與人臉圖像匹配工作。會議室門口的攝像機采集的參會者人臉畫面經(jīng)過視頻編碼后,送至人臉識別子系統(tǒng),對參會者進行面部識別。會議過程中,通過會議攝像頭監(jiān)控與會者發(fā)言狀態(tài),廣播發(fā)言者特寫圖像。
人臉圖像采集是指將攝像頭拍攝到的圖像進行預(yù)處理,標(biāo)注出圖像中人臉的大小與人臉位置。
人臉特征提取是指用數(shù)字化信息得出人臉中各個器官的形狀大小和各個器官間的位置關(guān)系信息。把這些數(shù)字化信息作為人臉分類的特征依據(jù),人臉的特征分量為曲率、角度、歐式距離等。
人臉圖像識別與人臉圖像匹配的實現(xiàn)是根據(jù)人臉特征提取得到的特征數(shù)據(jù)信息與人臉特征數(shù)據(jù)庫中的信息進行比對。設(shè)置一個最適的閥值,這個閥值可以使系統(tǒng)可以成功識別出人臉的概率最大。若識別結(jié)果的相似度大于所設(shè)閥值,就將匹配到的結(jié)果輸出。
(2)語音識別模塊。會議過程中,通過麥克風(fēng)采集錄制參會人員說出的語音,語音信號經(jīng)編碼后送達語音識別子系統(tǒng),從而對語音信號進行智能識別,將語音轉(zhuǎn)換成文字形式保存。
(3)智能控制模塊。智能控制子系統(tǒng),負(fù)責(zé)將語音識別出的命令轉(zhuǎn)換為會議系統(tǒng)自身可識別的一系列控制指令發(fā)送給相應(yīng)的設(shè)備。利用 API 接口進行集中管理,實現(xiàn)有效實現(xiàn)有效屏蔽終端設(shè)備發(fā)出的控制指令。與傳統(tǒng)視頻會議系統(tǒng)相比,優(yōu)化型智能控制系統(tǒng)可以有效減少對會議系統(tǒng)運作的人為干預(yù),降低操作難度。
(4)云計算平臺模塊。系統(tǒng)的語音識別與人臉識別的實現(xiàn)過程中,有龐大的數(shù)據(jù)信息需要處理,普通計算機是無法完成系統(tǒng)中的海量數(shù)據(jù)處理。因此,本文提出的系統(tǒng)選用云計算平臺來進行對語音識別與人臉識別中的數(shù)據(jù)處理。云計算平臺具有極高的處理效率、準(zhǔn)確率,以實現(xiàn)系統(tǒng)的實時性。云計算平臺的運行是由系統(tǒng)總公司統(tǒng)一分派數(shù)據(jù)信息,總公司與各分公司為云端,將需要處理的所有音視頻數(shù)據(jù)通過 IP 網(wǎng)絡(luò)集中上傳至總公司,總公司對數(shù)據(jù)信息進行處理,并及時將處理結(jié)果反饋給各分公司。云計算平臺具有龐大的信息儲備空間,除了可以對數(shù)據(jù)信息快速、高精確度的處理外,還可以將員工的各種信息數(shù)據(jù)儲存,以便于實時查詢、實時調(diào)取分析處理。
(5)會議平板。會議演示平板是最近會議室常用的一款集高清大屏顯示、多點觸控、電腦、電子白板、音響、網(wǎng)絡(luò)傳輸于一體的高科技多媒體產(chǎn)品,其采用超薄機身設(shè)計,防炫光玻璃表面,支持超高分辨率顯示,觸控反應(yīng)速度靈敏,支持雙系統(tǒng)一體化和多屏互動,并可以配合云會議平臺實現(xiàn)召開電視會議功能。
個人會議平板,可取代紙質(zhì)會議材料,方便會議組織者及時將更新的會議資料發(fā)給參會者。另外還具有文檔批注及保存、投票、發(fā)送即時消息、請求服務(wù)等功能。
3?智能會議系統(tǒng)功能作用
3.1會議室準(zhǔn)入、會議簽到和面部檢測。利用人臉識別技術(shù),系統(tǒng)可以采集與會者的人臉信息,與預(yù)約時的信息比對,一致時,會議室門禁打開,并進行會議簽到。防止會議室被未登記的人員占用,節(jié)省會議簽到時間。
在會議進行中,系統(tǒng)能夠?qū)υ谥飨_發(fā)表講話的人的面部表情做實時檢測。當(dāng)系統(tǒng)檢測到要開始發(fā)言的參會者,系統(tǒng)中的智能控制模塊會將攝像頭調(diào)節(jié)至對準(zhǔn)要發(fā)言的人,對其特寫,并投射到屏幕和各個終端。提高智能會議系統(tǒng)自動化,減少負(fù)責(zé)會議的工作人員的工作量。
3.2會議語音轉(zhuǎn)錄為文字。通過語言識別智能技術(shù),系統(tǒng)對會議音頻做實時檢測、記錄,及時記錄、生成會議紀(jì)要,有效降低文秘和參會人員的會議相關(guān)工作量。
3.3會議過程的靈活控制。在會議進行中,系統(tǒng)通過麥克風(fēng)接收用戶在端口發(fā)出的語音指令,然后將接收到的指令上傳到云端到語音識別模塊。語音識別模塊把接收到的語音指令譯作系統(tǒng)可以識別的計算機代碼Command API,將Command API傳送至端口設(shè)備,端口設(shè)備接收到指令后,完成相應(yīng)的任務(wù),例如觀看會議、輪巡會場、點名發(fā)言、演示PPT等。
3.4會議平板應(yīng)用。會議平板可以連接傳屏器,實現(xiàn)無線投屏,以便捷地進行會議內(nèi)容演示;支持會議演示平板反向觸控電腦,投屏后可直接由會議平板控制電腦進行打開文件、ppt翻頁等操作,無需演講者來回切換設(shè)備;電子白板功能可以書寫、保存批注,與電視會議功能相結(jié)合,處于不同地點的終端可以在“同一屏幕”上進行實時雙向協(xié)同,標(biāo)記、批注、繪圖、數(shù)據(jù)共享等。
個人會議平板,支持會議資料批量上傳、多人同步批注,讓會議進程更加順心和高效;每個平板獨立顯示,資料隨時無線同屏共享;創(chuàng)新手勢控制,輕輕一劃,來回切換共享畫面和自己的畫面,讓會議更加靈活有趣;便捷呼叫服務(wù)功能,及時準(zhǔn)確地傳遞每位參會者的需求給會場服務(wù)員,提高服務(wù)效率;會議結(jié)束后可一鍵下載會議資料,刪除會議后自動清空所有相關(guān)信息,不留痕跡,為重要會議保駕護航。
4?結(jié)語
本文在以往學(xué)者提出的智能會議系統(tǒng)和人工智能科技的基礎(chǔ)上,提出優(yōu)化型智能會議系統(tǒng)。優(yōu)化型會議系統(tǒng)具有人臉識別、語音識別、原跡簽字、自動生成會議紀(jì)要等功能,有效地提高了會議效率,降低會議成本。系統(tǒng)相較于以往的視頻會議系統(tǒng),其自動化程度大大提高,體驗效果提升,便捷程度提升,從而將視頻會議系統(tǒng)運行提升到全新水平。系統(tǒng)在各個模塊的設(shè)計、自動化程度有待提高,例如自動生成的會議紀(jì)要的有效性和準(zhǔn)確度,人臉識別的準(zhǔn)確率和識別速度等。
參考文獻:
[1]劉曉東.智能會議系統(tǒng)在會議管理中的應(yīng)用及發(fā)展趨勢[J].建筑工程技術(shù)與設(shè)計,2017,(15):3354.
[2]顧克明,顧程.智能會議系統(tǒng)的自適應(yīng)性[J].電聲技術(shù),2017,41(2):1-3,57.
[3]鄭廣寧,車四四,魏永靜等.基于人工智能的電視會議自主控制系統(tǒng)[J].電力信息與通信技術(shù) , 2018, 16(8): 72-76.
[4]馮嬌.基于阿米西棱鏡的高光譜成像系統(tǒng)研究[D].南京:南京郵電大學(xué),2015.