宮湘琦


摘 要 本文中所描述的項目旨在連接到公共電話網絡(PSTN)的語音電話用戶和在網絡環境(IP協議域)下運行的移動投票系統之間建立一個中間軟橋。此投票軟橋將在語音電話用戶和基于網絡的投票系統之間建立一個實時的通信會話。投票系統采用選舉標記語言(EML)為標準。在投票過程沖采用語音引導選民。這將增加選舉的投票率,并減少選舉成本。它也將提高選舉制度的完整性,最大限度地減少發生無效選票(多投,少投和手寫選票)的產生。
關鍵詞 語音投票 軟橋 選舉標記語言(EML) 在線選舉系統
中圖分類號:TP334 文獻標識碼:A
0 引言
投票軟橋將信息分三種數據格式進行管理:語音流,VoiceXML 格式的文本和EML格式的文本。語音用戶使用電話座機或手機提供語音流,投票軟橋接收到聲音,通過自動語音識別(ASR)引擎把它轉換成VoiceXML的文本,然后改寫成的EML格式的文本并最終輸出到投票系統。投票系統接受信息,并給出EML文本格式的反饋,投票軟橋則將數據轉換成VoiceXML格式的文本,再將它們通過文本到語音(TTS)轉換引擎轉換為語音流,說給語音用戶聽。
投票選舉是民主制度的一個重要組成部分, 不少新的科技手段已被用選舉以使其更容易,更方便。2000年,在佛羅里達州的總統選舉中第一次使用了電子投票選舉。從那時起,電子選舉在我們的民主生活中變得越來越流行。①電子投票系統,可以使用不同類型的媒體,像自動取款機(ATM),直接記錄設備(DRE),電話,互聯網和短消息服務(SMS)。電子投票可分為現場監督和未監督兩種。現場監督是指在投票現場有選舉官員對于投票過程進行監督,選民必須到投票站使用電子投票器進行投票。無監督情況下的投票時指選民通過互聯網或電話網絡在任意地點進行投票,在這種情況下,整個過程沒有任何人進行直接或者間接的監督。事實上,在投票過程中,有很多人需要其他人的協助才能完成投票,比如盲人,老年人和文盲,對于他們來說,最好的投票方式是使用語音。
該項目側重于使用固定電話線和手機投票。 2001年5月開始,OASIS開始致力于制定一個電子投票系統的標準,選舉標記語言(EML)。 EML促進并實現了各種選舉硬件,軟件和服務的供應商之間的操作性。選舉標記語言是基于XML的,是一種在互聯網中廣泛使用和理解的互聯網技術。文本到語音(TTS)和自動語音識別(ASR)技術的發展,使得語音投票成為可能。我們就是要建立在語音用戶和電子投票系統之間建立一個基于軟橋的接口,這里的電子投票系統采用EML標準。語音投票軟橋將把信息在語音流,VoiceXML文本和EML文本三種格式之間進行轉換,并在整個投票工程中引導選民。
通過手機投票,可以讓更多的人來參與投票,這將增加選舉的投票率,同時也會因為不再需要投票站和選舉官員而大大降低了選舉成本。在投票過程中,通常有一些無效票,如多選,少選和手寫票。少選是指選民選出的候選人人數不足;多選意味著選的人比規定的更多。手寫是指投票時選民在選票上手寫一個新的候選人的名字。一般情況下,我們將少選選票的數量作為一個投票系統的性能指標。②是否有無效票的出現是對于一個投票系統完整性的測量。我們希望這個項目將有效減少無效選票的出現以提高投票系統的完整性。
1 相關工作
選舉標記語言EML是對于電子投票系統的一個標準。它是一組被定義為XML模式的數據和消息。③它已在作為標準應用于一些網上投票系統,比如在美國的網絡投票系統VoteHere(www.votehere.com)和SERVE(www.serveusa.gov)。
軟橋是在有通訊鴻溝的應用程序之間建立的一個通信平臺。④它在將數據轉換成各種不同的格式,使他們在各個終端之間實現互相通信。在我們的系統中,一個端點是語音用戶,另一個是網上投票系統,接受EML格式的文本。投票軟網橋將提供一個交流的平臺,并轉換數據格式。它還在終端之間傳輸數據,實現互相通信。
文本到語音轉換(TTS)是指創建一個語音版本的文本并將它存儲在計算機文件中。 ⑤語音自動識別引擎(ASR)是指用戶不必使用鍵盤只需要簡單說出所想輸入的內容,引擎可以自動識別用戶語音,并將其轉換為文本進行存儲。⑥ TTS和ASR通常被用做語音和文本之間的數據轉換。
VoiceXML(http://www.w3.org/tr/voicexml20/),是建立于XML 語言規范基礎之上,是一種應用于語音瀏覽的標記語言。利用VoiceXML可以建立基于WEB的語音應用和服務。
2 目標
該項目的目標是在語音用戶和電子投票系統之間建立一個實時的通信會話。用戶將使用語音投票,并接受語音指導。投票軟橋也將被作為電話網絡和IP網絡之間的交流平臺。
3 技術概述
主要目標是要建立語音投票軟橋(VSB)。語音投票軟橋的兩個終端是語音用戶和在線電子投票系統。語音用戶使用固定電話或手機連接到公共交換電話網絡(PSTN)或者第三代(3G)手機網絡。投票系統是一個基于EML格式的IP網絡上的在線投票系統,投票系統分為兩個部分,一部分是數據庫登記中心,另外一部分則是投票中心。語音投票軟橋對于語音用戶就像一個呼叫中心,接收并響應呼叫。軟橋將使用ASR和TTS技術實現語音和文字之間的格式轉換功能,同時它也將成為電話網絡和IP網絡之間的一個橋梁。
圖1顯示的是數據在語音投票軟橋內部的運轉。首先, 語音用戶撥打投票電話輸入語音流,軟橋接收數據,并使用自動語音識別系統將其轉換成VoiceXML的文本,再將其轉換成 EML文本,輸出到投票系統。投票軟橋實現其將語音用戶信息傳輸至投票系統的功能。投票系統將反饋的EML格式的文本信息輸送給投票軟橋,軟橋將數據轉換到VoiceXML格式的文本, 再使用文本到語音轉換說給語音用戶聽,給他/她指導。軟橋實現了語音用戶和投票系統之間的實時通信和信息傳輸。
圖2顯示了軟橋在投票過程中的控制。在選舉日之前,選民必須登記,并獲得獨特的選民身份(ID)和密碼(PIN),所有選民信息將被存儲在注冊數據庫中。在選舉日,選民調用語音選舉軟橋,一旦響應,語音用戶就和軟橋之間建立了會話,然后,用戶將被要求給出選民的身份和密碼進行選民身份的識別,驗證身份后,軟橋將用戶連接到投票中心。投票后中心回應用戶并給出語音投票提示,引導用戶完成整個投票過程。
4 總結
該項目將為投票系統建立一個軟網橋,使語音用戶和以選舉標記語言為標準的投票系統之間實現實時通信。它將幫助到盲人,老人,文盲和一些其他不方便參加選舉的人,使他們能夠更加方便快捷的參與到選舉中,使用固定電話或手機投票對大部分選民而言,也更加方便,從而使更多的人參與到投票中,提高選民的投票率。語音投票軟件通過減少少選,多選和手寫等無效選票的方式,將有效提高選舉系統的完整性。
注釋
① Kohon T., Stubblefield A., Rubin A.D., and Wallach D.S., “Analysis of an electronic boting system”, in Proceedings of the IEEE Symposium on Security and Privacy, May 2004 .
② Rebecca T. Mercuri, L.Jean Camp, “the code of elections”, pp. 53-57, Communications of the ACM, October, 2004.
③ Ross J., Spencer P., Borras J., “EML Process and Data Requirements (version 4.0)”, pp.12-15, Sep. 6, 2004 http://xml.coverpages.org/emlv40d-20040903-reqs.pdf.
④ Lewis J., Tucker W. and Blake E. (2002). “SoftBridge: An Architecture for Building IP-based Bridges over the Digital Divide”. Proceedings of the South African Telecommunications Networks & Applications Conference, SATNAC 2002, Drakensberg, South Africa, 2002.
⑤ Dutoit Thierry, An Introduction to Text-to-Speech Synthesis (Text, Speech and language Technology, v3), pp. 24-27,Kluwer Academic Publishers, 1999.
⑥ Becchetti Claudio, Ricotti Prina Lucio, Speech recognition: Theory and C++ Implementation, 1999.