針對視障人群的無障礙電子政務信息服務技術與軟件

2013-12-31 00:00:00胡國平閆張旭趙碧瑩趙亞妮余月華

消費電子·下半月 2013年7期

摘要：20世紀90年代以來，隨著信息技術的高速發展，電子政務已經成為提高政府工作績效，辦事效率，增強政府透明度，聯系政府和人民大眾之間的重要途徑和紐帶。政府的門戶建設使更多的人通過網絡獲取政務信息與政府服務，然而視力存在障礙的人群（包括盲人、色盲、色弱等）卻只能望而卻步。本項目將針對盲人群體，研究具有一定智能化和方便使用的盲人無障礙信息公開技術，并基于所研究的技術開發相應的獨立軟件系統，使其在安裝后，在瀏覽政府網站的同時進行語音導航。

關鍵詞：視障人群；無障礙電子政務信息；服務技術與軟件

中圖分類號：TP393.09 文獻標識碼：A 文章編號：1674-7712 （2013） 14-0000-02

一、項目背景

20世紀90年代以來，隨著信息技術的高速發展，電子政務已經成為提高政府工作績效，辦事效率，增強政府透明度，聯系政府和人民大眾之間的重要途徑和紐帶。政府的門戶建設使更多的人通過網絡獲取政務信息與政府服務，然而視力存在障礙的人群（包括盲人、色盲、色弱等）卻只能望而卻步。目前，我國視力殘疾人數約1233萬，占殘疾人總數14.86%。對于這一特殊群體，更好地獲取政務信息，是他們作為公民應該享有的權利，也是他們在工作和生活中所迫切需要獲得的服務。但目前我國各級政府網站的無障礙化建設仍然處于起步階段，很多政府網站仍然缺乏有效的技術支持這些建設。

視障人群指的是色弱、色盲、及完全失明的人士。無障礙電子政務信息服務指的是盲人無困難的瀏覽政府網頁。技術與軟件指的是我們開發的是一個具有技術含量且獨立運行的軟件系統。本項目將針對盲人群體，研究具有一定智能化和方便使用的盲人無障礙信息公開技術，并基于所研究的技術開發相應的獨立軟件系統，使其在安裝后，在瀏覽政府網站的同時進行語音導航，使盲人通過語音輸入從而自動地收聽獲取想要了解的信息。

本項目的研究開發具有很好的社會效應，使殘障人士充分感受到政府人性化和社會關懷，使他們更加積極地參政論政，對我國電子政務的發展，縮小與發達國家的差距也有一定的促進作用。

二、可行性分析

目前我國本土企業開發的讀屏軟件通過語音合成技術將屏幕上顯示的網頁文本內容讀出，使盲人通過收聽獲取網頁內容。但是軟件只能根據網頁有順序地朗讀它的全部內容，耗時長、瀏覽速度慢，這些都成為他們獲取信息的最大障礙。其次，一些語音網站系統的出現，雖然克服了讀屏軟件本身的一些弊端，但一方面轉換欄目和內容需要進行人工設置，另一方面需要根據網站內容的變化進行人工更新，此外，盲人用戶需要記憶大量快捷鍵組合，這些都使他們感到無所適從。當然，轉換網頁內容也有一定條件限制，較大網站其實只能轉換其中很少部分。最后，市場上還出現了盲人電腦，但是造價較高，而且需要對盲人進行專業培訓。家庭條件以及家庭思想觀念等各方面原因都使盲人電腦的使用得不到大范圍的普及。這些技術對于方便的支持政府網站針對盲人無障礙電子政務信息公開服務具有復雜和不方便等多種局限。

三、技術實現

本項目的最終成果是一個可交付軟件，該軟件實現智能抓取電子政務網站內容并轉換成語音朗讀出來。因此，技術實現分為兩大部分：智能抓取網頁內容、文本轉語音技術。

（一）智能抓取網站內容

（1）分析URL

對于待抓取網站，程序并未內置網站網址。目前，實現方式是手動輸入URL，系統接收輸入并分析URL。如果URL的合法性和正常連接出現問題，系統將拋出錯誤，正常終止。如果URL合法，將轉入下一階段進行處理。

（2）待抓取網頁預處理

Web頁面信息的抽取的基礎工作是對Web文檔的結構和內容進行分析，因此，對web文檔進行解析是Web頁面信息抽取的前提。由于HTML的語法規則有很大的隨意性，經?？梢杂幸恍┦÷院筒灰幏兜膶懛ù嬖?。如只有開始標識而缺少結束標識、開始標識和結束標識的大小寫不一致、鏈接屬性缺少引號及結束標識、標識不匹配等。這類非良構的HTML文檔實際上不能為抓取程序所識別。解決之一是在抓取程序中手動編寫相關代碼將其轉換成“良好格式”的HTML文檔。由于技術和能力的限制，項目實際采取忽略非規范內容，抓取時僅將范圍鎖定在規范文本。

（3）基于正則表達式的過濾性抓取

對網頁內容進行智能抓取，首先要過濾的就是圖片等視覺信息，將抓取范圍局限于文本。同時，在網頁預處理的基礎上，分析Web頁面樹狀結構標簽，在文本內容范圍內，鎖定需要提取的文章或新聞的標題內容。

根據確定的待提取內容，定義類似“（.*？）”的正則表達式，在整個網頁源文件中進行模式匹配，相關編程語言都實現了對于給定正則表達式的模式匹配函數或方法。在java中，用pattern類定義正則，用Matcher進行匹配。傳統C++對于正則匹配的處理非常的復雜而麻煩，但是，現在仍可以在C++Builder6上使用Boost正則表達式庫，并提供regexexpressio用于設置匹配模式。這些先進技術，使得過濾性的抓取得以實現。

由于并未對待抓取網頁做任何規范性處理和添加標記處理，因此，這種基于正則表達式進行模式匹配的過濾性抓取是有很大局限的，并不能實現按優先級對標題進行部分抓取，應該說，這種過濾是一種大范圍的普遍性過濾，并沒有在其基礎上進行深層處理。

（二）文本轉語音技術

（1）SAPI簡介

語音技術包含兩方面內容：一個是語音識別（speechrecognition），一個是語音合成（speechsynthesis）。這兩個技術都需要語音引擎的支持。

SAPI全稱TheMicrosoftSpeechAPI，是微軟提供的基于語音開發的應用編程接口。這個語音引擎支持多種語言的識別和朗讀，包括英文、中文、日文等，相關的SR和SS引擎位于SpeechSDK開發包中。

（2）使用TTS引擎實現文本轉語音

微軟提供的語音處理編程接口大大的簡化了語音開發的難度，也使得項目自行開發文本轉語音程序成為了可能。項目用到的部分是語音合成，主要是通過封裝的ISpVoice類。主要分為兩步：語音接口初始化，調用發音函數。

創建對象之前，調用CoInitialize函數來初始化COM。定義一個ISpVoice對象，調用CoCreateInstance并傳入第一個參數ISpVoice對象的CLSID以創建一個ISpVoice的新實例，得到一個HRESULT類型的返回值。這是一個主要存儲錯誤信息的變量，它的取值包含S_OK（成功）、E_UNEXPECTED（意外失敗）、E_NOTIMPL（未實現）、E_POINTER（無效指針）、E_HANDLE（無效句柄）、E_FAIL（未指定失敗）等諸多錯誤信息類型。對其判斷不可簡單地用S_OK和S_FAIL比較，更為明智的方法是使用SUCCEEDED和FAILED宏進行判斷。

正確初始化以后，可對朗讀音量、音速進行設置。Volume可以提供音量設置，取值為0到100。Rate提供速度設置，取值為-10到10。朗讀則需調用ISpVoice的speak方法或者speakstream方法，針對字符串或流對象分別進行朗讀。

我們編寫網頁抓取的語言采用的是C++，盡管JAVA提供了更加方便和有效的方法，但是考慮到后面與文本轉語言程序的結合，我們采用了統一的編程語言。

四、總結

目前，我們所實現的這個技術還是需要發展和完善的，其中也存在著些許不足之處，但是主要方法我們已經實現且能為視障人士提供一定的便利。今后，我們將繼續致力于這項技術的深入研究。

參考文獻：

[1]馬霞.中科院服務器端語音推送系統讓盲人也能\"上網\"[N].科技日報，2011，01，21.

[2]梁哲煒，宋小波，朱珍民.一款新型盲用瀏覽器的設計與實現[J].計算機工程與應用，2004，14.

[3]吳英樺.語音上網助力信息無障礙[J].互聯網天地，2008，11：78-79.

[4]林俊.讓網站“說”給你聽.[J/OL].信息化建設，2011，11.

[5]第二次全國殘疾人抽樣調查發布主要數據公報.[J/OL].http：//wuxizazhi.cnki.net/Article/CJRZ200612003.html，2006，12.

[6]陳威剛，鄭雄波，張銓.網絡無障礙技術研究及成果[J/OL].

http：//www.cnki.com.cn/Article/CJFDTotal-XDDX200703006.htm，2007，3.

[作者簡介]胡國平（1991.4-），女，四川自貢人，陜西師范大學，2010級本科生，計算機科學學院，軟件工程專業；閆張旭（1992.7-），女，陜西渭南人，陜西師范大學，2010級本科生，計算機科學學院，軟件工程專業。

消費電子·下半月2013年7期

消費電子·下半月的其它文章: “相似論”在“自動控制理論”課程教學中的運用; 高職機電專業《電工電子課程》學生動手能力的培養; 淺析我國農村普法教育存在問題和對策; 中職校園文化建設對學生管理工作的作用; 基于項目資源庫的軟件開發專業教學研究; 多媒體技術在語文教學中的運用