萬海川
(成都地鐵運營有限公司,成都 610081)
隨著我國城市的快速發展,城市中的人口出現快速的增長,特別是特大城市,巨大的人口數量已經對人們的日常出行和城市交通造成巨大的壓力。近年來,為了優化城市交通結構,倡導“綠色出行,低碳生活”,各地政府都在大力推動公共交通的發展,尤其是能有效緩解城市擁堵的軌道交通系統。現代化的軌道交通系統應具有快捷、方便的特點,同時其客運服務也應該更加人性化,信息發布也應該更加準確、及時。廣播系統作為軌道交通系統中乘客信息發布的關鍵系統,其重要性不言而喻,該系統播放的語音內容對軌道交通的客流組織和引導起著不容小覷的作用[1]。但是,目前大多軌道行業廣播系統的工作方式還停留在固定的播放模式下,無法起到實時適應環境變化的作用。因此如何推進和實現軌道交通廣播系統的智能化也逐步成為行業從業者思考的問題。本文結合近年來出現的“大數據”和“互聯網+”技術,對語音智能在城市軌道交通廣播系統中的應用進行深入的分析。
廣播系統作為車站引導乘客,發布客運服務信息以及緊急信息的關鍵系統,其功能要求也根據發布信息的不同不斷變化。同樣,對于不同區域乘客發布的信息也要有所區別。因此,廣播系統的功能也根據不同需求不斷增加,與此同時,許多使廣播系統更加智能化、人性化的新技術也應運而生[2]。本文將對與廣播系統密切相關的語音智能技術的現狀和系統架構分別進行闡述與分析。
隨著人工智能技術的發展和推廣,目前的語音分析和識別技術已經上升到相對成熟的階段,許多行業已經將語音技術應用到實際的工業生產、智能控制以及人們日常的生活中。其中,手機的語音喚起、語音門禁系統等都是語音識別和分析技術應用最為常見的領域,但是這些語音技術都僅僅是語音分析技術較為簡單的應用,并未體現語音技術應用于大場景復雜環境的優勢。近年來,“互聯網+”和“大數據”的發展為語音技術帶來新的發展機遇,以互聯網環境下的大數據為數據背景的語音分析技術已逐步地走上智能技術的舞臺。
本文接下來將分別對軌道交通廣播系統架構和語音智能技術的系統架構進行分析討論。
前文主要對廣播系統和語音智能技術的發展作了簡要的概括,本節將對廣播系統的架構和主要設備功能進行闡述分析。現代軌道交通系統的廣播系統主要由控制中心廣播、車站廣播以及連接兩者的傳輸通道組成[3]。其網絡具體解決方法如圖1所示,不同地方的廣播系統設備的作用和功能均不相同,它們各司其職,共同組成廣播系統的網絡架構。

圖1 廣播系統網絡架構圖Fig.1 Architecture of broadcast system network
控制中心廣播系統主要由廣播操作臺、控制設備以及網絡管理設備組成,同時還提供話筒和綜合監控系統的互聯通道。這些中心設備都能通過傳輸通道與車站的廣播系統相連。
1)廣播控制臺主要設置在行調和環調的調度臺位置,分別為行調和環調提供各自的信息廣播功能,行調與環調都能進行整條線的選站、選路,并進行對應的廣播。同時環調對于廣播系統的控制權要高于行調。
2)中心的控制設備和網絡管理設備主要完成廣播選擇控制、設備網絡管理、車站選擇和監視監聽等功能。
相比控制中心,車站的廣播系統構成相對比較復雜,除了廣播控制臺和前級話筒外,還有后備廣播控制盒、噪聲檢測器和錄音裝置。噪聲檢測器主要是完成對站廳、站臺的語音環境檢測,調整廣播系統的語音音量,以達到提高語音清晰度的目的[4]。
廣播控制臺主要是為站務人員提供一個方便操作平臺,站務人員可以通過該平臺進行不同區域的廣播和監聽。
廣播控制和功放設備主要完成語音信號的功率放大,同時提供與傳輸系統及綜合監控的接口。
噪聲檢測裝置主要完成各個廣播區域噪聲情況的檢測,并實時將檢測到的信息反饋給廣播系統控制設備。
為使控制中心與車站能夠互聯,并且控制中心能夠控制車站的廣播系統,傳輸系統的RPR板卡為控制中心與車站提供一個10 M的以太網通道。控制中心與車站的廣播系統是通過這個以太網通道進行數據和控制指令的下發。
具體以成都地鐵4號線為例,成都地鐵4號線各個車站主要采用MSTP780B,與控制中心的MSTP780A設備相連,完成車站與控制中心廣播系統的互聯。
為了保證傳輸通道網絡的穩定,每個車站的廣播系統均采用主備冗余的連接方式,對廣播系統的傳輸通道進行保護[5]。
車輛段廣播系統與車站廣播系統的設備構成大致相同。但是車輛段為了工作人員能在發現緊急情況后,將信息廣播出來,在車輛運轉庫安裝了語音插播盒。語音插播盒主要是在緊急情況下為現場作業人員提供信息廣播的功能,這樣便為現場作業人員的安全提供了多一層的保障。
以上兩個小節對廣播系統的基本功能和架構進行分析與介紹,但這些功能比較傳統,無法適應現代軌道交通行業客流的組織和發展的需要。當前的軌道交通發展十分迅速,各項新型的技術也逐步開始應用于軌道交通的客運服務中。下面本文將對語音智能感知技術的系統架構及其在軌道交通廣播系統中的應用和所起到的關鍵作用進行分析與討論。
前文已經提到“大數據”和“互聯網+”,這兩項技術是實現語音智能分析技術的關鍵。“大數據”為語音分析提供了最為基本的人類聲學模型和數以萬計的人類聲音片段(包括聲音頻段、聲帶震動程度等信息)數據。同時“互聯網+”又為語音的智能分析提供網絡支撐,利用互聯網的信息互通又進一步擴大語音分析的數據基礎[6]。下面結合語音智能的網絡架構圖,分析語音智能系統的工作原理和工作方式。
語音智能分析技術的應用架構如圖2所示,同時也說明智能語音系統的工作流程。其具體工作流程如下。

圖2 語音智能分析系統Fig.2 Speech intelligent analysis system
第一步:語音分析系統從人流密集的公共場所中收集基本的語音數據,并交給語音智能分析服務器。
第二步:語音智能分析服務器將現場的語音信息按照不同的類別進行分類,并與語音數據庫中的基本語音數據進行對比,基本分析出現場人員的密度和年齡分布。
第三步:通過對收集的現場語音數據進行敏感詞匯和語音內容的分析,提取關鍵詞,對現場人員的類別和個人當前情況進行大致的分析。
第四步:當分析完成后,語音智能分析系統將對現場的廣播系統進行自適應控制,播放最適合現場人員環境的語音段和相關的廣告語,以匹配現場人員的年齡和現場的環境。
第一,場景感知分析功能:語音智能系統將會對檢測區域內的語音進行提取,并與數據庫中的人聲片段進行對比,分析處理現場人員的基本情況,包括年齡、談論話題、關注熱點等。
第二,播放語音更為合理:由于語音智能分析系統的語音來源于現場的采集,并能對現場的人員及環境情況進行分析,因此語音智能分析系統能根據分析得到的現場人員的不同情況而播放不同的文明提示音或商業廣告,以達到合理引導現場人員和針對性廣告播放的目的。
第三,敏感信息提取:智能語音分析系統還能提取分析現場的語音內容,對于一些較為敏感的詞語進行預警,并向保衛人員發送提示信息。
第四,敏感信息定位:如果智能檢測系統在檢測現場檢測設備分布較多,可以根據提供敏感信息檢測設備的具體位置,預警該區域人員的危險程度,為安保人員提供敏感內容的位置信息。
軌道交通車站屬于人流量特別大的公共場所,由于人多而嘈雜,所以雜音時常會影響到候車的乘客對列車到站廣播的注意,廣播音量過小的話,將會被淹沒在人們的說話聲中。為避免車站現場的嘈雜影響廣播播音的效果,廣播系統中設計噪聲感應器用于檢測現場的噪聲狀況[7]。通常情況下,噪聲感應器安裝于上下行站臺的首尾端以及站廳中部,廣播系統收到噪感檢測的噪聲后,將對揚聲器的音量進行控制,以達到理想的播音效果。廣播系統噪聲感應控制音量原理如圖3所示。這種技術是語音智能的初期表現,但是只能進行環境嘈雜度的檢測,不能分析語音內容,從而進行高級的語音控制。因此語音智能分析技術便成為解決這一難題的關鍵。

圖3 車站智能檢測系統Fig.3 Station intelligent detecting system
隨著“互聯網+”和大數據技術的發展,檢測識別技術已經逐步發展起來,語音識別技術主要功能可以通過對語音的分析,并與大量的數據對比,從而判斷發出語音的人大概的年齡范圍,對檢測區域內人員的年齡比例分布情況進行分析。最后語音控制系統會根據識別到的語音發聲者的年齡分布比例播放對應的語音段。當語音識別模塊感知到現場語音中存在大量兒童或者老年人時,將頻繁播放“尊老愛幼”的提示音;當語音識別模塊感知到現場語音中存在大量青壯年時,便會頻繁播放“先下后上,注意安全”的提示音。該控制技術原理如圖3所示。
圖3中,站臺檢查聽筒會將站臺的乘客語音傳遞給智能分析服務器,智能分析服務器通過與大數據庫中的語音數據進行對比,分析出此時站臺乘客的主要年齡分布,最后選擇最合適的站臺文明語音進行播放,合理引導站臺乘客上下列車。這樣實現了廣播系統自適應地根據環境的變化而變化,播放當前環境情況下最為適合語音信息,已達到提高廣播系統播放信息針對性的目的。
本文從廣播系統的原理和組成架構出發,對廣播系統的主要功能和語音智能技術當前的發展現狀進行分析闡述。在此基礎上,本文進一步對廣播系統的基本功能和組成的分析,并對語音智能技術在“大數據”和“互聯網+”技術環境下的系統結構和應用優勢進行分析與討論。對語音智能分析技術在廣播系統中的應用方式和原理進行分析和介紹,并重點說明語音智能分析技術對客運服務的作用和影響及其關鍵功能的原理和方法。最后通過原理圖說明了語音智能技術在實現靈活、安全的客運服務中所起到的重要作用。