999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于深度神經網絡的漢語語音合成韻律結構預測模型

2019-11-30 10:21:25吳樹興張秀琴
科技資訊 2019年27期

吳樹興 張秀琴

摘? 要:近年來,隨著語音信號處理技術的發展,合成語音在很多場景下已經能夠滿足實際的基本要求,但在自然度上方面,還需要進一步提高和改進。在漢語語音合成中,韻律結構的預測對于自然度的影響非常大,如何精確預測韻律結構,成為語音合成技術中需要解決的重要問題。該文結合注意力機制將深度神經網絡雙向RNN模型用于漢語韻律詞的預測,得到的預測結果表明,具有注意力機制的雙向RNN模型在進行韻律詞的預測方面能夠獲得比較準確的效果。

關鍵詞:韻律詞? 雙向RNN? 注意力機制? 深度神經網絡

中圖分類號:TP391 ? ?文獻標識碼:A 文章編號:1672-3791(2019)09(c)-0023-02

很多學者采用HMM模型,神經網絡等技術對韻律結構進行預測,取得了不錯的效果,但仍然得不到令人滿意的效果。韻律詞的預測可以說是韻律結構預測是基礎,該文將采用深度神經網絡,結合注意力模型對韻律結構中的韻律詞預測進行嘗試。

1? 漢語韻律結構

在漢語語言中,為了表達語義和情感,在連續的語流中,音節的發出不是連續的而是一組一組發出的,我們把這樣的一組音節稱為節奏群。同一節奏群中的音節之間緊密連接,其整體語調曲線也較連貫,不同節奏群之間會稍有停頓。節奏群里的最后一個音節與前邊的音節不同,常以特殊邊界形式表示,隨后的節奏群開始的基頻要重置,以上這種語音片段分分合合的結構被稱作韻律結構。韻律結構是韻律特征主要部分,對生成語音的自然度和可懂度有著重要的影響,只有在連續的語流中,每個音節對應的韻律參數與當前的上下文語境協調一致時,才能得到自然度、清晰度和可懂度較高的語音結果。韻律結構主要是指韻律層級信息,包括不同的層級邊界信息及不同韻律層級的詞或短語的構成等信息[1]。一般來說,漢語中的韻律層級結構可分為:韻律詞、韻律短語以及語調短語這3個層次。

2? 詞向量及語言模型

在自然語言處理中,需要將詞表示成模型可處理的表示方法,比較流行的兩種表示方法是One-Hot表示和詞向量表示。詞向量表示可以在任意兩個詞之間建立關聯,這種向量表示方法使相關或者相似的詞,在向量空間上距離更為接近。向量的距離可使用歐氏距離來衡量,也可以用余弦夾角來衡量。詞向量可以表征詞語深層的語義信息,同時它是一種低維實數向量,詞向量是伴隨著對神經網絡語言模型的研究而提出的,2013年一款將詞表征為實數值向量的工具Word2vec[4]被開發出來。由Word2vec訓練出的詞向量可以用來做許多自然語言處理相關的工作,比如詞性分析、聚類、分詞等。詞向量的維度一般在100維以下,就可以很好地表示詞與詞之間關聯了,因此,避免了高維度輸入特征帶來的模型訓練和學習的負擔。另外,詞向量具有較好的可移植性,能夠在自然語言處理范圍中作為輸入特征處理多種任務,對于神經網絡來說通用性較好。

3? 基于深度神經網絡的韻律結構預測模型

韻律詞的預測是韻律結構預測是基礎。只有準確地預測出韻律詞,再預測其他韻律結構,才能在語音合成中合成自然度高的語音。深度神經網絡中的循環神經網絡(RNN)對于處理seq2seq的序列預測問題有著較好的效果,這里引入RNN對韻律詞進行預測。

我們采用雙向RNN編碼器,并使用注意力機制[3],與RNN解碼器構成韻律詞預測模型,如圖1所示。圖1中的解碼器的序列輸出與編碼器的序列輸入數目相同,輸出序列的取值只有{0,1}二值序列,如果為0則表示前詞和后詞一起構成同一個韻律詞,如果為1則表示前詞和后詞各自構成韻律詞,也就是標志著前一個韻律詞的結束邊界和后一個韻律詞的起始邊界。形成標注數據時,將分詞Xt所對應的標簽0或1與輸出Yt進行損失函數的計算,然后訓練權值。注意力采用全局方式,權值分配按照距離和相似度來進行計算。

4? 實驗結果及分析

該語音合成使用的標注語料是由清華大學人機交互與媒體集成研究所完成(簡稱TH-CoSS),共5406句,其中5000句為訓練語句,文件為TH_CoSS.txt,其余406句為測試集。進行韻律結構的預測主要分為如下4個步驟。

第一步,進行分詞,采用全網新聞數據(SogouCA),大小為2.1G,對文件中存在問題的數據進行處理,得到干凈的全文本數據,使用中文分詞開源工具jiaba運行jieba_seg.py文件進行分詞,得到的分詞文本語料與己經分好詞的標注語料(TH_CoSS.txt)合并,作為詞向量訓練的輸入數據。

第二步,使用工具word2vec進行詞向量訓練,在訓練詞向量時選擇,我們訓練出來的詞向量最終是要用于訓練網絡模型的,也就是說用于訓練網絡模型的標注語料中的詞需要在詞向量表中被找到。

第三步,使用訓練語料查找詞向量,同時使用C編制的小程序按照分詞結果將韻律詞標識為0/1,形成訓練數據。

第四步,將訓練數據輸入神經網絡模型,進行訓練,然后使用測試集進行統計。獲得的預測結果表1所示。

從表1中可以看出:(1)隨著詞向量維度的增加,相應的模型訓練時間也增加了。(2)隨著詞向量維度的增加,韻律詞預測錯誤率有所下降,在20維達到最小之后隨著詞向量維數增加,錯誤率不會進一步降低反而有少許升高。因此,適當地增大詞向量維數可以提高模型的預測能力,但是當維數過大時,韻律詞錯誤率不會有改善反而增加了模型訓練時間。

5? 結語

該文采用深度神經網絡雙向RNN模型并結合注意力機制對漢語語音的韻律詞進行了預測,結果顯示采用深度神經網絡模型對韻律詞進行預測是比較有效的,進一步提高預測精確度仍然是今后的努力方向。

參考文獻

[1] 賀琳,初敏,呂士楠,等,漢語合成語料庫的韻律層級標注研究[A].第五屆全國語音學學術會議論文集[C].2003:323-326.

[2] Mikolov T,Yih W T,Zweig G.Linguistic Regularities in Continuous Space Word Representations[A].In HLT-NAACX,Association for Computational Lingaistics[C].2013.

[3] Vaswani,Ashish,et al.Attention is all you need.Advances in Neural Information Processing Systems[Z].2017.

主站蜘蛛池模板: 久久国产精品夜色| 强乱中文字幕在线播放不卡| 好吊色国产欧美日韩免费观看| 干中文字幕| 亚洲天堂.com| 国产特一级毛片| 婷婷丁香在线观看| 五月丁香伊人啪啪手机免费观看| 午夜视频日本| 欧美第一页在线| 精品国产自在现线看久久| 在线观看无码a∨| 国产 在线视频无码| 欧美日韩激情在线| 色屁屁一区二区三区视频国产| 亚洲精品福利网站| 亚洲成av人无码综合在线观看| 71pao成人国产永久免费视频| 欧亚日韩Av| 国产欧美亚洲精品第3页在线| 2021亚洲精品不卡a| 人妖无码第一页| 野花国产精品入口| 东京热av无码电影一区二区| 真实国产乱子伦视频| 色婷婷丁香| 久久精品无码中文字幕| 亚洲高清在线天堂精品| 最新亚洲人成无码网站欣赏网| 精品视频第一页| 激情成人综合网| 久久久久免费精品国产| 国产福利观看| 综合成人国产| 亚洲天堂免费观看| 99久久精品国产麻豆婷婷| 中文无码日韩精品| 性色在线视频精品| 77777亚洲午夜久久多人| 日韩毛片免费观看| 日韩午夜福利在线观看| 亚洲色偷偷偷鲁综合| 国产免费高清无需播放器| 综合色亚洲| 日韩专区欧美| 国产精品手机在线播放| 日本伊人色综合网| 精品91在线| 亚洲欧美自拍中文| 久久性视频| 2020最新国产精品视频| 国内丰满少妇猛烈精品播| 国产在线观看高清不卡| 91色综合综合热五月激情| 国产99热| 手机精品福利在线观看| 久久久久久国产精品mv| 欧美成人看片一区二区三区| 久久久久无码精品| 国产色爱av资源综合区| 亚洲国产精品一区二区第一页免| 日韩毛片基地| 超碰精品无码一区二区| 日韩二区三区无| 日韩在线视频网| 亚洲人成网址| 国产成年女人特黄特色毛片免| 无码中文字幕乱码免费2| 激情無極限的亚洲一区免费| 国产一区二区丝袜高跟鞋| 高清免费毛片| a色毛片免费视频| 国产成人久久综合一区| 国产精品女同一区三区五区| 在线观看网站国产| 波多野结衣中文字幕久久| 亚洲侵犯无码网址在线观看| 色偷偷一区| 91免费观看视频| 亚洲精品色AV无码看| 国产黑人在线| 国产亚洲现在一区二区中文|