占善華 張永平
(廣東司法警官職業學院信息管理系 廣東省廣州市 510520)
公共法律服務是政府公共服務體系的重要組成部分,是司法行政機關的基本職責任務。近年來隨著公共法律服務平臺建設,語音數據快速增長,但這些數據并未進行深入的數據分析和挖掘,因此,為了更精確地分析人民群眾的法律服務需求,提高法律服務的質量以及輿情數據的分析,擬引入智能語音技術對語音數據進行轉寫以及對轉寫后的內容進行分析、挖掘,提供可融入日常工作的公共法律服務智能語言數據管理系統,實現對語音數據價值最大化。
在智能語音領域,對于如何將利用好司法行政系統內的法律服務平臺的海量語音數據,如何做到識別和轉換后的語義分析,國內外研究和實現很少,語音識別的聲學建模主要用于建模語音信號與音素之間的關系,業界相繼提出了前饋型序列記憶網絡(FSMN,Feed-forwardSequential Memory Network)[1]作為聲學建模框架以及深度全序列卷積神經網絡(DFCNN,Deep Fully Convolutional Neural Network)[2][3]。針對目前最好的語音識別系統采用雙向長短時記憶網絡(LSTM,Long Short Term Memory)[4-7]訓練復雜度高、解碼延時高等缺陷,一般來說可以使用深度全序列卷積神經網絡來克服雙向 LSTM 的缺陷,從而提高識別正確率。
公共法律服務平臺包括電話,網絡平臺,實體大廳,數據分散,需要建立一個統一的語音數據管理系統,對語音數據和文本數據以及業務關聯數據進行統一存儲、管理、應用,并建設可視化數據管理平臺,開放接口。……