999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合上下文短時譜特征的漢語重音檢測研究

2014-04-29 00:44:03趙云雪張瓏鄭世杰
智能計算機與應用 2014年4期

趙云雪 張瓏 鄭世杰

摘要:重音是語言交流中不可或缺的部分,在語言交流中扮演著非常重要的角色。本文基于ASCCD朗讀語篇語料庫,使用MFCC算法提取每個語音段的融合上下文子段拼接短時譜信息,構建基于MFCC算法的上下文短時譜特征集;并選用NaiveBayes分類器對這類特征集進行建模,而且將具有最大后驗概率的類作為該對象所屬的類,這種分類方法充分利用了當前語音段的相關語音特性;融合上下文的MFCC短時譜特征組在ASCCD上能夠得到83.6%的漢語重音檢測正確率。實驗結果證明,融合上下文子段拼接特征規整方法可以用于漢語重音檢測研究中。

關鍵詞:重音; 上下文; 短時譜特征; 重音檢測

中圖分類號:TP319 文獻標識碼:A文章編號:2095-2163(2014)04-0036-03

Abstract:Accent is a critically important component of spoken communication, and plays a very important role in spoken communication. This paper selects from ASCCD corpus and conducts accent by using MFCC algorithm to extract each voice segment of short-time spectrum based on context sub-segment splicing information. After that, the paper builds integration context short-time spectrum feature sets based on MFCC algorithm, and chooses NaiveBayes classifier to model the two feature sets. NaiveBayes is to choose the classes with maximum a posteriori probability as the object's class. This classification method makes full use of the related phonetic features of speech segment. Integration context short-time spectrum of MFCC feature set respectively achieves 83.6% accent detection accuracy on ASCCD. The experimental results indicate that integration context sub-segment splicing feature structured method of MFCC can be used in Chinese accent detection study.

Key words:Accent; Context; Short-time Spectrum Features; Accent Detection

0引言

漢語重音檢測技術是韻律特征研究領域的一個重要組成部分。韻律特征主要包括重音、語調和聲調等,重音在語言交流中起到非常重要的作用,研究韻律特征可先從“重音”入手。

重音可以使人們的語言聽起來抑揚頓挫,而不是平鋪直敘。另外,重音還有避免歧義和加強語義的作用。比如句子,“我在準備考試了”,重音落在“我”和“考試”上,強調的內容是不一樣的。再比如,“我想明天去游泳”,如果重音落在“明天”和“我”上,雖然語義相同,但說話人強調的內容卻是不同的。

漢語重音檢測是指通過對語音信號的分析處理,提取影響重音的語音特征或建立相應的語音模型,用來確定某個音節是否是重音。本文主要研究融合上下文的子段拼接MFCC特征,構建了用于漢語重音檢測的融合上下文的短時譜特征集。

1研究狀況

胡偉湘等人[1]利用音長和音高聲學相關特征集,采用基于分類回歸樹結構的區分度模型,在韻律標注語料庫ASCCD上能夠達到80%的重音檢測正確率。邵艷秋等人[2]則利用神經網絡對聲學相關特征、語言學相關特征和混合特征進行漢語重音檢測,能夠得到78.4%、83.2%和84.3%的正確率。同時,陳楠等人[3]又提出了基于動態幀長的基音同步能量和基音同步峰值特征的英語重音檢測,聯合使用新特征與傳統特征,可使誤識率下降6.65%。更進一步地,陳楠等人[4]使用非線性加權能量特征以及與傳統特征的特征組合對英語進行重音檢測,非線性加權能量特征比傳統特征魯棒性更高,聯合使用新特征與傳統特征,可使系統誤識率下降3.58%。而且,陳楠等人[5]還從聽覺模型的角度出發,利用能同時表征瞬時頻率和強度信息的基音同步幅度峰值特征進行重音檢測。李坤等人[6]即根據聽感知特性,引入半音程和響度特征,并以歸一化的音節最高值代替其平均值,系統正確率達到78.7%,漏檢率為9.37%。在此基礎上,也陸續提出了基于掩蔽效應的突顯度模型,系統正確率提高到83.4%,漏檢率下降到5.72%。相應地,倪崇嘉等人[7-8]亦對漢語重音檢測開展了進一步的研究,利用聲學相關特征以及詞典語法相關特征對漢語重音進行檢測,并采用Boosting集成分類回歸樹對當前音節的聲學相關特征以及詞典和語法相關特征進行建模,其后更對詞典和語法相關特征采用條件隨機場方法進行了建模,最后,再將Boosting集成分類回歸樹模型和條件隨機場模型通過加權組合而獲得識別率更高的混合模型,在ASCCD語料庫上隨即獲得76.3%重音檢測正確率。此外,李心廣等人[9]研究基于重音與韻律的英語句子客觀評價系統,通過提取語音的能量特征,對英語句子進行重音劃分。

現有的重音檢測方法一般都采用基于整個音節提取當前音節級的聲學特征及其統計特征。本文提出了一種針對NaiveBayes輸入特征規整的改進方案,即融合上下文子段拼接方法的短時譜特征(語音幀級特征),子段拼接的短時譜特征是以每個音節的語音段為單位,將每個漢字的所有語音幀平均分為多段,相當于將時長、強度、聲母和韻母進行了細分。由此看來,融合上下文子段拼接的短時譜特征包含更多的信息,可以更細致地刻畫語音的細節,對漢語重音檢測也更具力度。

ASCCD朗讀語篇語料庫(Annotated Speech Corpus of Chinese Discourse)由語篇語料、語音數據和語音學標注信息組成,適用于語言語音研究、語音工程開發和基礎漢語普通話教學等領域。語料文本是18篇敘事體、議論體語篇,每篇3-5個自然段,每個自然段500-600個音節,總計9 000個音節,共10個發音人,5男5女,分別記為M001、M002、M003、M004、M005、F001、F002、F003、F004、F005,使用標準普通話,以自然的方式,標準的語速,流暢地朗讀語篇。所有語音都經過標注,音段采用SAMPA-C標準標注[10],韻律采用C-ToBI韻律標注系統標注,具體標注了音節拼音、聲韻母、聲調、韻律邊界等級以及語句重音信息[11],標記了每個韻律單位的重音,共分0、1、2、3級,漢語的重音也是與韻律結構對應的層級結構。韻律詞中最重音節重音標為1,次要韻律短語中最重音節重音標為2,主要韻律短語中最重音節重音標為3,0則表示不重讀,即正常讀音。在本文研究中,需將音節分為正常讀音和重音,而并不細分音節之間的差別,為此則將韻律詞重音和次要韻律短語(MIP)重音看做正常讀音,卻只將主要韻律短語(MAP)重音看作是重讀。ASCCD語料庫中重音的分布如表1所示。

梅爾頻率倒譜系數MFCC充分利用了人耳的聽覺感知特性,并將該特性與聲音產生機制結合,即更好地模擬了人耳對語音信號的處理過程,其提取的特征也更能真實反映聽覺系統的獨特性質。因此,融合上下文子段拼接的 MFCC短時譜特征集在漢語重音檢測研究中都能取得較好的識別率。實驗結果也證實了這一推想。

4結束語

本文詳細闡述了融合上下文子段拼接的MFCC短時譜特征集。然后,采用NaiveBayes分類算法在ASCCD朗讀語篇語料庫上對當前音節的短時譜特征進行建模,NaiveBayes即選擇具有最大后驗概率的類作為該對象所屬的類,這種分類方法則充分利用了當前語音段的相關語音特性。實驗結果也進一步表明融合上下文子段拼接的MFCC短時譜特征有著很高的識別率。下一步,就要對所用的特征進行簡化,或改進MFCC算法,旨在提取最少的特征得到更高的識別率。

參考文獻:

[1]胡偉湘,董宏輝,陶建華,等. 漢語朗讀話語重音自動分類研究[J]. 中文信息學報,2005(6):80-85.

[2]邵艷秋,韓紀慶,劉挺,等. 自然風格言語的漢語句重音自動判別研究[J]. 聲學學報,2006(3):203-210.

[3]陳楠,賀前華,王偉凝,等. 基音同步幀長特征在英語詞重音檢測中的應用[J]. 計算機應用,2008(6):1533-1536.

[4]陳楠,賀前華. 非線性加權能量特征在英語詞重音檢測中的應用[J]. 聲學學報(中文版),2008(6):520-525.

[5]陳楠,賀前華,李韜. 基于聽覺模型的特征在英語重音檢測中的應用[J]. 計算機工程,2009(8):26-27,30.

[6]李坤,劉加. 基于聽感知特征的英語句子重音檢測[J]. 清華大學學報(自然科學版),2010(4):613-617.

[7]倪崇嘉,張愛英,劉文舉. 基于聲學相關特征與詞典語法相關特征的漢語重音檢測[J]. 計算機學報, 2011(9): 1638-1649.

[8]倪崇嘉,劉文舉,徐波. 基于互補模型的漢語重音檢測[J]. 計算機工程,2011,23:20-23.

[9]李心廣,王桂珍,楊思哲. 考察重音與韻律的英語句子客觀評價系統研究[J]. 計算機工程與應用,2013,(8):105-109,150.

[10]CHEN Xiaoxia, LI Aijun, SUN Guohua, et al. An application of SAMPA-C for standard Chinese[C]//Proceedings of the International Conference on Spoken Language Processing. Beijing, China, 2000:652-655.

[11]LI Ai jun. Chinese prosody and prosodic labeling of spontaneous speech[C]//Proceedings of the Speech Prosody 200.Aix-en-Provence, France, 2002:39-46.

主站蜘蛛池模板: 2022精品国偷自产免费观看| 99re热精品视频国产免费| 国产精品免费电影| 青青操国产| 九色视频线上播放| 国产精欧美一区二区三区| 农村乱人伦一区二区| 亚洲大学生视频在线播放| av在线人妻熟妇| 亚洲第一区欧美国产综合| 国产麻豆aⅴ精品无码| 小13箩利洗澡无码视频免费网站| 国产精品内射视频| 高清免费毛片| 国产日本欧美在线观看| 国产在线无码av完整版在线观看| 国产精品欧美激情| 尤物亚洲最大AV无码网站| 2021精品国产自在现线看| 拍国产真实乱人偷精品| 亚洲天堂视频网站| 国产成在线观看免费视频| 亚洲国产精品成人久久综合影院| 日本午夜视频在线观看| 就去吻亚洲精品国产欧美| 国产va免费精品观看| 亚洲美女一区二区三区| 欧美不卡在线视频| 免费高清毛片| 伊人久久久久久久| 亚洲 欧美 日韩综合一区| 国产精品中文免费福利| 99re在线免费视频| 婷婷久久综合九色综合88| 国产va视频| 午夜欧美理论2019理论| 毛片视频网址| 亚洲天堂在线免费| 爆乳熟妇一区二区三区| 久久国产V一级毛多内射| 欧洲高清无码在线| 真实国产乱子伦视频| 色妺妺在线视频喷水| 色哟哟国产精品一区二区| 国产亚洲精品91| 日韩第九页| 麻豆国产原创视频在线播放| 国产精欧美一区二区三区| 亚洲黄色高清| 国产18在线播放| 久久一色本道亚洲| 色综合天天视频在线观看| 中文无码毛片又爽又刺激| 一级毛片在线免费视频| 亚洲人成网址| 亚洲精品中文字幕午夜| 亚洲欧美精品日韩欧美| 波多野结衣一级毛片| 成人福利在线视频免费观看| 欧美区一区| 91精品视频在线播放| 日韩精品毛片人妻AV不卡| 欧美精品一区在线看| 日本日韩欧美| av在线无码浏览| 91精品国产丝袜| 亚洲国产亚洲综合在线尤物| 亚洲天堂首页| 亚洲欧美日韩精品专区| 国产网友愉拍精品| 欧美视频在线不卡| 2021亚洲精品不卡a| 国产在线一二三区| 久久网欧美| 草草线在成年免费视频2| 91精品啪在线观看国产| 91无码人妻精品一区二区蜜桃| 99精品伊人久久久大香线蕉 | 国产丝袜一区二区三区视频免下载| 亚洲欧美人成电影在线观看| 欧美日韩高清在线| 国内毛片视频|