999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺談蒙古文單詞自動識別系統的研究

2011-10-16 01:51:22烏云塔娜
赤峰學院學報·自然科學版 2011年11期
關鍵詞:詞根單詞用戶

烏云塔娜

(赤峰學院 數學與統計學院,內蒙古 赤峰 024000)

淺談蒙古文單詞自動識別系統的研究

烏云塔娜

(赤峰學院 數學與統計學院,內蒙古 赤峰 024000)

在信息技術席卷全球范圍時,具有悠久文化歷史的蒙古族人也不甘落后于時代的步伐,各種用途的蒙古文軟件也像雨后春筍般涌現出來.本文中主要描述了對蒙古文單詞自動識別系統(以下簡稱為蒙文單詞識別系統)的介紹,設計過程及今后的發展展望.

Access;Unicode;音素

我國是一個統一的多民族國家.國家在《憲法》和《民族區域自治法》中規定,各民族都有使用和發展自己語言文字的自由,并積極幫助各少數民族用自己的語言文字發展教育.那么,對于使用人口有320多萬的蒙古族而言,今后人們對蒙文信息處理方面的應用和需求將不斷擴大.因此,借鑒和吸收其他民族的先進經驗及技術,開發實用的蒙古文軟件是我們今后的發展趨勢.

1 蒙文單詞識別系統簡介

蒙文單詞識別系統是以蒙古文單詞詞性為研究的系統.它使用了Borland C++Builder集成開發環境,以Microsoft Access 2003為后臺數據庫,以內蒙古明安圖互連網技術開發有限公司開發的Mongolian Unicode Editor為編輯器開發出來的.

1.1 系統功能

對于用戶而言,蒙文單詞識別系統具有對用戶輸入的一段蒙古文文字或一篇蒙古文文章自動識別每個單詞詞性的功能.而且,也為用戶設計了系統幫助模塊,主要是對用戶的使用加以了說明.

對于管理者而言,蒙文單詞識別系統又分別設計了管理模塊和添加模塊.管理模塊中包括詞根管理、詞尾管理、詞典管理(主要是為了后續程序設計的方便,將蒙古文單詞的詞性用大寫英文字母分別表示出來,為此而建立的Access庫)、用戶管理.添加模塊中包括添加詞根和添加詞尾,主要功能是為詞根庫及詞尾庫添加或刪除詞根及詞尾.

1.2 系統工作界面

蒙文單詞識別系統由11個窗口組成,其中采用的工作界面是Windows模式的操作界面.用戶只要在相應的命令上點擊鼠標即可完成對應的操作.系統針對用戶的主要工作界面如下圖1所示.

1.3 基本操作

1.3.1 蒙文單詞詞性的識別

用戶需要將在Unicode下編輯的蒙古文通過Windows的記事本轉換成ASCII字符集的文本,再用蒙古文單詞識別系統中的文件->打開命令即可完成蒙古文單詞詞性的自動識別工作,也可對處理后的文本進行保存、打印等操作.

圖1

1.3.2 詞根及詞尾的添加

這個操作主要是針對管理員而言的.首先從“系統基本操作”窗口中點擊“添加”菜單,然后從彈出的子菜單中選擇“添加詞根”命令,輸入您要添加的詞根以及此詞根對應的輸入符,再從詞性欄中選擇當前的詞根所能構成的詞性,點擊“確定添加”按鈕,出現如圖2所示確認窗口,點擊“確定”,出現數據添加成功窗口,如圖3.

圖2

圖3

如果在圖2中選擇“取消”按鈕,系統將不添加您此次輸入的詞根.

添加詞尾的操作基本與添加詞根的操作相同.

2 蒙文單詞識別系統的設計過程

2.1 字庫統計

字庫統計是蒙文單詞識別系統設計的重點,如果字庫收集的全面、準確的話,將對后繼系統的判斷帶來很大的幫助.但是蒙古文自發展以來已有800多年的歷史,期間文字的演變就經歷了好幾代,即使是在現在,蒙古文也有好幾種寫法.那我們到底是以什么為標準呢?最后,由于時間及人力的限制,我們主要是依據《近代蒙語》整理了字庫.

蒙古文文字本身是拼音文字,字母上下連書,行款從左到右.其中詞的結構可劃分為詞根、詞干及詞尾部分.單詞中直接由詞根組成的詞叫基本詞.由詞根、詞干及詞尾組成的詞叫合成詞.基本詞統計時較容易,我們只需將蒙古文文字的所有詞根從相關的書籍上查找到錄入到庫中就可以了.但也并不是說一點問題都沒有.例如:判斷這個詞時可以是名詞也可以是形容詞,這種詞只能到語句的環境中才可以識別.那我們建庫時到底把這個詞列入到名詞當中還是形容詞當中呢?我們采取的方法是將此類文字的詞性設成經常使用到的詞性,盡量減少錯誤的發生.

字庫建立當中,輸入詞尾時也出現了一些問題.例如:輸入感嘆詞“因為我們的系統只能一個單詞一個單詞地識別詞性(在2.2程序設計中詳細說明).所以在建庫時不管是輸入詞根還是詞尾,中間都不可以有空格.也就是說,比如你輸入詞尾時,要是輸入成那系統就會出現錯誤.所以解決這類問題時,我們采取的辦法是庫中只存入“”,系統判斷時分兩次判斷,分別都輸出成感嘆詞.這樣也不會造成什么語法錯誤.但是,這樣做只能解決部分問題,像有些連詞就不可以了.如它不是重復一個單詞,而且分別把它們設成是連詞的話,也有語法錯誤.這是本系統所未能解決的問題,希望今后能夠有機會完善此項工作.

2.2 程序設計

蒙文單詞識別系統的程序設計思路是先將導入的文章截取出一行,之后以空格為依據劃分出單詞,再把單詞從頭至尾以2個字節為單位進行切分(蒙文音素在計算機中占2個字節),切分一次就到詞根庫里查詢一遍,一旦從詞根庫里查詢到就把單詞的詞根部分去掉將剩下的詞尾部分到詞尾庫里判斷,最后在單詞后面以大寫字母N、A、M、V、R、D、G、C、S、I(N/名詞、A/形容詞、M/數詞、V/動詞、R/代詞、D/副詞、G/后置詞、C/連詞、S/語氣詞、I/感嘆詞)輸出詞性.例如:判斷的詞性時,第一步,先切分出“”之后到詞根庫里找,沒有相匹配的,繼續切分單詞.第二步,切分出再到詞根庫里找,沒有相匹配的,繼續切分單詞.第三步,切分出再到詞根庫里找,有匹配的,就視乘下的部分為詞尾,提取出到詞尾庫里找匹配的.有匹配的輸出結果

程序流程圖如圖4所示:

當然在系統的程序設計中還有一些不夠完善的地方:

1)由于系統在劃分單詞時是以空格為依據的,所以在字庫中不可以有空格.這將導致一些詞尾無法錄入到詞尾庫中,造成詞尾的遺漏.

2)由于Borland C++Builder中的RichEdit控件不是很好的兼容Unicode中編輯的文字,所以文章識別前需將在Unicode下編輯的蒙古文通過Windows的記事本轉換成ASCII字符集的文本,再用蒙古文單詞識別系統識別.這給用戶的操作帶來了一定程度的麻煩.

3)由于蒙古文文字是豎寫文字,而我們使用的Borland C++Builder中的MCSprite組件不能很好的控制換行,所以本系統處理后的文字也是橫排的.這給用戶的觀看帶來了一定程度的麻煩.

4)由于本系統設計時先從詞根庫里查找,找到匹配的之后,就截取出詞尾到詞尾庫里查找,而這種設計方法對有些單詞判斷不了的.出現這種情況的單詞大部分是人名.比如說

3 蒙文單詞識別系統展望

3.1 操作更加簡單、直觀

在上述的2.2節中已經描述了本系統的程序還未完善的幾個問題,其中包括文字的轉換與編排問題,希望今后在本系統的完善工作中以上問題能夠得到解決.

3.2 字庫更加龐大

字庫的建立是本系統的核心部分.希望今后能夠建立起一個包含蒙古文全部詞根及詞尾的字庫,為蒙古文文化的發展添磚加瓦.

3.3 能夠成為今后其它蒙文軟件開發基礎

蒙文單詞詞性識別工作全面完善之后,可對今后蒙古文句子成分的判斷帶來幫助,也可由此判斷句子的正誤情況,是一項有研究價值的題目.

〔1〕余明興,吳明哲.Borland C++Builder實例精解[M].北京:清華大學出版社,2001.

〔2〕哈斯額爾敦.近代蒙語[M].呼和浩特:內蒙古教育出版社,1996.

TP391.4

A

1673-260X(2011)11-0052-02

猜你喜歡
詞根單詞用戶
藏在英文里的希臘詞根(二十二)
英語世界(2023年10期)2023-11-17 09:19:18
藏在英文里的希臘詞根(十八)
英語世界(2023年6期)2023-06-30 06:29:38
藏在英文里的希臘詞根(九)
英語世界(2022年9期)2022-10-18 01:11:48
單詞連一連
看圖填單詞
看完這些單詞的翻譯,整個人都不好了
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
主站蜘蛛池模板: 国产无码制服丝袜| 国产性生大片免费观看性欧美| 91视频免费观看网站| 老司机aⅴ在线精品导航| 毛片免费在线视频| 91探花国产综合在线精品| 久久国产V一级毛多内射| 欧美日本视频在线观看| 欧美激情福利| 五月丁香在线视频| 国产欧美日韩另类| 国产91视频观看| 一级香蕉人体视频| 无码专区在线观看| 久久人午夜亚洲精品无码区| 亚洲av日韩综合一区尤物| 亚洲综合在线最大成人| 国产成人91精品| 国产在线观看99| 日韩资源站| 精品国产香蕉在线播出| 亚洲一区二区日韩欧美gif| 国产v欧美v日韩v综合精品| 91丝袜乱伦| 日韩免费成人| 58av国产精品| 国产高颜值露脸在线观看| 国产精品尤物铁牛tv | 2021国产精品自产拍在线观看| 亚洲第一色网站| 国产特级毛片| 国产日韩欧美在线播放| 国产女人爽到高潮的免费视频 | 波多野结衣视频网站| 精品国产黑色丝袜高跟鞋| 欧美午夜网| 一本大道无码日韩精品影视| 亚洲精品无码AV电影在线播放| 自拍偷拍一区| 国产本道久久一区二区三区| 亚洲AV无码精品无码久久蜜桃| 亚洲天堂视频网站| 国产亚卅精品无码| 操国产美女| 亚洲人成成无码网WWW| 日韩高清成人| 色婷婷在线影院| 福利在线免费视频| 久久精品最新免费国产成人| 欧美日本不卡| 亚洲香蕉伊综合在人在线| 亚洲三级色| 国产va欧美va在线观看| 手机精品福利在线观看| 国产丝袜丝视频在线观看| 亚洲妓女综合网995久久| 91偷拍一区| 国产欧美在线观看精品一区污| 日本亚洲成高清一区二区三区| 日本高清免费一本在线观看| 女同国产精品一区二区| 激情六月丁香婷婷| 国产日本一区二区三区| 亚洲高清无在码在线无弹窗| 日韩精品高清自在线| 国产第四页| 黄网站欧美内射| 91精品国产一区| 天天摸夜夜操| 欧美曰批视频免费播放免费| 99精品免费在线| 免费在线观看av| 十八禁美女裸体网站| 狠狠v日韩v欧美v| 少妇精品久久久一区二区三区| 精品一区二区三区自慰喷水| 国产9191精品免费观看| 一本大道AV人久久综合| 国产女人在线| 久久久国产精品免费视频| 国产成年女人特黄特色毛片免| 国产精品不卡永久免费|