999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

字符序列標注的維吾爾語詞干提取方法

2020-06-19 07:51:31古麗尼格爾·阿不都外力買合木提·買買提吐爾根·依布拉音早克熱·卡德爾西熱艾力·海如拉王路路
現代電子技術 2020年12期
關鍵詞:特征提取

古麗尼格爾·阿不都外力 買合木提·買買提 吐爾根·依布拉音 早克熱·卡德爾 西熱艾力·海如拉 王路路

摘 ?要: 詞干提取是形態豐富語言信息處理中的基礎任務,對其他自然語言處理任務有著重要的影響。該文將詞干提取任務看作序列標注問題,以字符為切分粒度來表征維吾爾語單詞的構成機制,結合條件隨機場模型,實現基于字符序列標注的維吾爾語詞干提取方法。首先使用詞典查詢方法進行詞干提取,然后結合字符的弱化發音特征、音類特征以及語音特征,針對受限數據和非受限數據采用條件隨機場訓練模型及預測結果。實驗結果表明,該方法在非受限數據集上效果較佳,且能廣泛應用到其他語言。

關鍵詞: 詞干提取; 序列標注; 條件隨機場; 特征提取; 模型訓練; 預測結果

中圖分類號: TN912.34?34; TP391 ? ? ? ? ? ? ? ?文獻標識碼: A ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)12?0151?04

Abstract: Stemming is a fundamental task in the morphologically rich language information processing and has an important influence on other natural language processing (NLP) tasks. Taking the task for stemming as the process of character sequence labeling in this paper, and using the character as the segmentation unit to represent the formation mechanism of Uyghur word, the method of Uyghur stemming based on character sequence labeling is realized in combination with the conditional random field model. The dictionary query method is used to stemming, and then the model training with the conditional random field and the results′prediction are performed for the restricted data and unrestricted data by combining with the weak pronunciation features, sound class features and speech features of characters. The experimental results this method has well effect on unrestricted datasets and can be widely used in other languages.

Keywords: stemming; sequence labeling; conditional random field; feature extraction; model training; prediction results

0 ?引 ?言

維吾爾語是典型的形態復雜的黏著性語言。黏著性語言的主要特點是沒有詞內部的屈折,每個語法范疇都由一類詞綴來表示?[1]。由于詞干連接的詞綴不同,因此會構成不同的單詞,將造成嚴重的數據稀疏問題。如“Biz(我們)”與“ni?(的)”相連接會構成“Bizni?(我們的)”,與“ni(把)”相連接會構成“Bizni(把我們)”,而詞干提取是去除詞綴獲取詞干的過程,使單詞的不同形態變體還原成一種統一形式,從而有效地提高自然語言處理?[2]以及信息檢索??[3]等任務的性能。

由于維吾爾語構詞方法較為豐富,因此,利用相關技術深入研究詞干提取才能有效解決維吾爾語形態復雜問題。……

登錄APP查看全文

猜你喜歡
特征提取
特征提取和最小二乘支持向量機的水下目標識別
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
基于DNN的低資源語音識別特征提取技術
自動化學報(2017年7期)2017-04-18 13:41:09
Bagging RCSP腦電特征提取算法
一種基于LBP 特征提取和稀疏表示的肝病識別算法
基于DSP的直線特征提取算法
基于改進WLD的紋理特征提取方法
計算機工程(2015年4期)2015-07-05 08:28:02
基于CATIA的橡皮囊成形零件的特征提取
基于MED和循環域解調的多故障特征提取
主站蜘蛛池模板: 国产精品欧美日本韩免费一区二区三区不卡 | 天天做天天爱天天爽综合区| a级毛片免费网站| 国产精品视频系列专区| 无码网站免费观看| 伦伦影院精品一区| 国产成年女人特黄特色大片免费| 99成人在线观看| 波多野结衣一区二区三区88| 色婷婷视频在线| 亚洲精品片911| 日日拍夜夜嗷嗷叫国产| 亚洲欧美成人网| 91久久夜色精品| 国产第八页| 激情视频综合网| 久久一本日韩精品中文字幕屁孩| 国产91小视频在线观看| 久99久热只有精品国产15| 五月丁香在线视频| 久草国产在线观看| 日韩精品毛片| 97色婷婷成人综合在线观看| 无码AV高清毛片中国一级毛片| 毛片在线区| 国产成人久久综合777777麻豆| 中文字幕人成乱码熟女免费| 午夜日韩久久影院| 国产精品私拍99pans大尺度| 精品少妇三级亚洲| 高清国产va日韩亚洲免费午夜电影| 久久无码免费束人妻| 91精品国产一区自在线拍| 成人午夜精品一级毛片| 全部无卡免费的毛片在线看| 91网在线| 久草性视频| 国产成年女人特黄特色大片免费| 免费av一区二区三区在线| 国产精品偷伦在线观看| 欧美a网站| 亚洲一欧洲中文字幕在线| 亚洲精品麻豆| 毛片三级在线观看| 成人午夜久久| 久久黄色影院| 亚洲色图欧美激情| 她的性爱视频| 国产免费久久精品44| 伊人网址在线| 日本欧美午夜| 国产精品lululu在线观看| 91www在线观看| 国产无遮挡猛进猛出免费软件| 99中文字幕亚洲一区二区| 成人综合网址| 欧美精品啪啪| 国产日韩欧美精品区性色| 国产欧美日韩免费| 这里只有精品在线播放| 爆操波多野结衣| 色偷偷综合网| 国产一区二区三区精品欧美日韩| AV老司机AV天堂| 69视频国产| 夜夜操国产| 啪啪啪亚洲无码| av在线5g无码天天| 久久久噜噜噜久久中文字幕色伊伊 | 综合天天色| 日韩国产综合精选| 国产精品 欧美激情 在线播放| 国产欧美成人不卡视频| 中文字幕一区二区视频| 狠狠色综合久久狠狠色综合| 亚洲精品无码不卡在线播放| 亚洲中文字幕23页在线| 亚洲丝袜第一页| 亚洲AV无码久久天堂| 青青草原国产av福利网站| 2024av在线无码中文最新| 国产精品第三页在线看|