中國移動(dòng)通信集團(tuán)江蘇有限公司網(wǎng)絡(luò)部 王玉申
現(xiàn)有騷擾電話治理中,存在的主要問題是:識別的號碼數(shù)量多與客服撥測人員工作量大之間的矛盾。相比于目前通常采用的人工撥測方式,計(jì)算機(jī)自動(dòng)處理有著速度快、效率高、誤差率低等特點(diǎn),尤其是針對重復(fù)內(nèi)容的自動(dòng)撥測和處理技術(shù)更是具有不可替代的作用。近年來,語音識別技術(shù)已經(jīng)得到了長足的發(fā)展,通過引入語音識別技術(shù)對錄音文件進(jìn)行甄別,可以極大提高騷擾電話的撥測效率。
通過新增1套騷擾電話撥測識別系統(tǒng),實(shí)現(xiàn)騷擾電話的自動(dòng)撥測、識別、錄音和取證功能。該系統(tǒng)與現(xiàn)有騷擾電話治理各系統(tǒng)間的關(guān)系如圖1所示。

該系統(tǒng)通過文件接口從騷擾電話識別系統(tǒng)采集需要撥測的號碼清單,對號碼進(jìn)行撥測、錄音、語音識別,撥測結(jié)果輸出到攔截系統(tǒng)和客服系統(tǒng)進(jìn)行后續(xù)處理。通過騷擾電話自動(dòng)撥測識別系統(tǒng)代替客服的人工撥測和審核,提升騷擾電話人工審核的效率和準(zhǔn)確度,提高騷擾電話治理效果。
騷擾電話撥測系統(tǒng)的處理流程見圖2。

騷擾電話自動(dòng)撥測識別系統(tǒng)的業(yè)務(wù)流程主要分為4步,分別是:待撥測號碼的采集分析、對號碼進(jìn)行撥打呼叫、對騷擾電話的識別和判斷、結(jié)果輸出。
撥測錄音模塊設(shè)計(jì)了2個(gè)方案供選擇:測試卡方案或模擬主叫號碼方案。測試卡方案:利用自動(dòng)撥測系統(tǒng)的撥測儀進(jìn)行撥打。模擬主叫號碼方案:利用自動(dòng)撥測系統(tǒng),采用PBX(專用小交換機(jī))撥測設(shè)備進(jìn)行撥打。
1.2.1 方案一 測試卡方案
為滿足多張本省和外省測試卡在撥測儀上進(jìn)行測試,設(shè)計(jì)采用自動(dòng)撥測系統(tǒng)上已配備的SUM(服務(wù)器集中監(jiān)控管理)設(shè)備集中插放SIM(用戶識別模塊)卡,通過遠(yuǎn)程調(diào)用的方式實(shí)現(xiàn)SIM卡自動(dòng)切換撥測,以達(dá)到測試的目的。系統(tǒng)構(gòu)架圖見圖3。

1.2.2 方案二 模擬主叫號碼方案
在現(xiàn)有自動(dòng)撥測系統(tǒng)基礎(chǔ)上,使用PBX中繼撥測儀實(shí)現(xiàn)自動(dòng)撥測與錄音功能,以達(dá)到測試的目的。保持現(xiàn)網(wǎng)自動(dòng)撥測系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)不變,新增的專業(yè)撥測儀采用IP方式接入,接受自動(dòng)撥測系統(tǒng)管理。組成拓?fù)湟妶D4。

本方案中新增1臺(PBX)中繼撥測儀,通過TCP/IP(傳輸控制協(xié)議/網(wǎng)際協(xié)議)方式接入自動(dòng)撥測系統(tǒng),接受CMS(內(nèi)容管理系統(tǒng))的管理和維護(hù)。中繼撥測設(shè)備通過E1中繼專線方式連接匯接局或MSC(移動(dòng)交換中心)、且與STP(信令轉(zhuǎn)接點(diǎn))間開鏈路。使中繼撥測儀成為移動(dòng)MSC下的一個(gè)專用PBX用戶端局。通過匯接局或MSC可以實(shí)現(xiàn)與MSC、GMSC(網(wǎng)關(guān)移動(dòng)交換中心)以及其他運(yùn)營商網(wǎng)絡(luò)的用戶通信。為專用的E1(2.048 Mb/s數(shù)字同步傳輸)中繼電路配置專用OPC(源信令點(diǎn)編碼),并設(shè)置為免費(fèi),解決計(jì)費(fèi)問題。
為了提高騷擾電話撥測系統(tǒng)的識別準(zhǔn)確率,降低騷擾電話誤識別率,我們采用了多種組合算法進(jìn)行騷擾電話的識別。具體的算法說明如下。
1)先進(jìn)行較小文件過濾。通過對騷擾電話的錄音分析,發(fā)現(xiàn)騷擾電話都有較長的通話時(shí)長(約30~100 s),錄音文件也都比較大(起碼大于800KB)。因此先將一部分較小的文件過濾掉(都是關(guān)機(jī)、停機(jī)、暫時(shí)無法接通等),這些小文件的幾乎都可以確定都是非騷擾電話。獲得較小文件大小的經(jīng)驗(yàn)值為450KB,小于450KB的認(rèn)為是非騷擾電話。
2)騷擾電話號碼識別庫過濾。騷擾電話號碼識別庫可以通過歷史的自動(dòng)撥測系統(tǒng)平臺全國共享,避免同一個(gè)號碼重復(fù)識別,節(jié)約系統(tǒng)資源,提高騷擾電話的判斷效率和準(zhǔn)確性。
3)PESQ(語音質(zhì)量的感覺評定)過濾(過濾掉長時(shí)間的振鈴、無人接聽和來電提醒等)。參考文件為常見的非騷擾電話,score(ITU-TP.862)speech分?jǐn)?shù)大于2,認(rèn)為評估文件是非騷擾電話。
PESQ語音評估軟件其本質(zhì)就是一個(gè)相似度比對系統(tǒng),原理是把無法自動(dòng)判斷的錄音文件,比如怪異的接聽?wèi)?yīng)答音,先通過人為判定是否是騷擾電話,然后設(shè)取比對值,作為一個(gè)文件藍(lán)本庫保存。當(dāng)下次撥測產(chǎn)生與之相似度高的錄音文件時(shí),自動(dòng)判斷成藍(lán)本庫所屬內(nèi)容,確定是不是騷擾電話。因此,隨著不斷的開展撥測工作,樣本庫文件會不斷的豐富,最終的識別率也會不斷提高。
4)語音識別。使用一系列常見的騷擾電話關(guān)鍵字進(jìn)行識別,同時(shí)對正常帶彩鈴的號碼進(jìn)行識別。語音識別系統(tǒng)其本質(zhì)是一套通過對錄音文件中的關(guān)鍵字匹配來確認(rèn)是否是騷擾電話的系統(tǒng)。關(guān)鍵字如“公證處”“抽獎(jiǎng)”“中獎(jiǎng)”“獎(jiǎng)金”等,其內(nèi)容庫可以通過語音訓(xùn)練不斷豐富,以提高最終的識別率。
語音識別軟件采用定制的InterReco語音識別系統(tǒng),是一款與說話人無關(guān)的語音識別系統(tǒng),能夠完成電話應(yīng)用環(huán)境下的語音識別功能。定制的語音識別系統(tǒng)采用了ASR(自動(dòng)語音識別)技術(shù)。它是一種使計(jì)算機(jī)能夠識別人通過麥克風(fēng)或者電話輸入的詞語或語句的技術(shù)。簡單地說,就是能夠讓計(jì)算機(jī)聽懂人說話。它的最終目標(biāo)是使得計(jì)算機(jī)在不受詞匯量限制,在各種噪聲環(huán)境、語音信道下,能夠?qū)崟r(shí)、準(zhǔn)確地識別不同方言、口音等特點(diǎn)的說話人的語句。包含了騷擾電話特征詞,如:中獎(jiǎng)、公證處、賭博、六合彩等。
由語音識別模塊對經(jīng)過“騷擾電話號碼庫”過濾的錄音文件進(jìn)行自動(dòng)識別,判斷出具有騷擾電話特征的錄音文件,并判斷為騷擾電話,隨錄音文件一起送至輸出接口模塊。語音識別中不符合騷擾電話特征的錄音文件繼續(xù)轉(zhuǎn)交下一步處理。
5)PESQ語音再評估(語音識別的識別率只有70%~80%,還有20%~30%的疑似騷擾電話沒有被識別出來)。我們對這些沒有被識別出來的20%~30%的疑似騷擾電話進(jìn)行PESQ語音評估,目的是提高被降低的語音識別漏判率。
騷擾電話撥測系統(tǒng)于2013年3月底完成平臺的搭建,實(shí)現(xiàn)了對騷擾電話的撥測測試。撥測系統(tǒng)初期對江蘇移動(dòng)提供過的三批共計(jì)2 758個(gè)騷擾電話樣本做了識別判斷,具體測試情況見表1。

?
采用基于語音識別的騷擾電話撥測系統(tǒng)對1 000個(gè)號碼進(jìn)行撥測和識別,需要的時(shí)間約為20min,存儲空間約為12GB,大大提升了騷擾電話的人工審核效率。同時(shí),對于無法確認(rèn)的號碼輸出撥測錄音,供客服人員人工判斷,有效解決了部分號碼無法通過系統(tǒng)進(jìn)行識別的問題。
我們把完成1~5項(xiàng)步驟的判斷機(jī)制定義為“模式一”,把僅完成1~3項(xiàng)步驟的判斷機(jī)制定義為“模式二”。模式一是對模式二識別出來的疑似騷擾電話號碼再進(jìn)行一次語音識別和PESQ再評估,目的是降低誤判率,而語音識別和PESQ再評估沒有100%地將騷擾電話識別出來,因此,漏判率增加了。
模式二的思路是排除非騷擾電話,剩下的認(rèn)為是騷擾電話;模式一的思路是排除非騷擾電話,剩下的進(jìn)行語音識別和PESQ再評估,識別出來的是騷擾電話,沒有識別出來的是非騷擾電話。因此,模式一比模式二誤判率低,漏判率高。
在實(shí)際使用中,可能還會存在正常帶彩鈴的錄音文件,這個(gè)必須要借助語音識別系統(tǒng)來判斷,所以說必須要用模式一的判斷機(jī)制來進(jìn)行撥測。當(dāng)然模式二的測試結(jié)果給了我們一些參考,比如在測試當(dāng)中發(fā)現(xiàn)和論證了這樣一個(gè)問題:模式一比模式二誤判率低,漏判率高。如果不使用語音識別軟件(即模式二),漏判率反倒有明顯的降低。結(jié)合上述三批測試,模式二測試情況見表2。

?
經(jīng)過反復(fù)比對和論證,查明的原因是:第三方的語音識別軟件本身也存在一定的不足,語音識別率只有70%~80%,即使我們已經(jīng)通過PESQ語音評估進(jìn)行補(bǔ)漏,也不能達(dá)到100%的識別率,會漏掉很多的騷擾電話,只能不斷來優(yōu)化完善它,后續(xù)需不斷進(jìn)行改進(jìn)。
從理論上分析,使用語音識別后可以減少誤判的發(fā)生,隨著語音識別軟件的日益完善,這方面的效果會越來越得到體現(xiàn)。本著盡可能減低騷擾電話誤判率(為此可以犧牲部分的漏判)的原則,體現(xiàn)真實(shí)的判斷效果,且正確判斷正常帶彩鈴的號碼,建議繼續(xù)使用語音識別系統(tǒng),即模式一這樣的全程判斷機(jī)制來做騷擾電話撥測。
基于語音識別的騷擾電話撥測系統(tǒng),除了能夠準(zhǔn)確識別騷擾電話外,還可以廣泛應(yīng)用于基于語音識別的語音撥測系統(tǒng),如:來電提醒系統(tǒng)的撥測、10086客服系統(tǒng)的撥測等,從而極大地提升系統(tǒng)撥測的效率,提高系統(tǒng)的運(yùn)行穩(wěn)定性。 ◆