張晶 李婷 許爽 王帆
【摘 要】本文依托滿文的特點,根據滿文的音節特點和滿文單詞的拼寫規則建立滿文字母樣本庫。經過對樣本庫中滿文字母的黑色像素遍歷,繪出像素分布直方圖,定位字母基線,再通過上下基線拼接達到合成滿文單詞圖像的目的,實現單詞圖像合成,利用Matlab的GUI實現系統的可視化界面。
【關鍵詞】滿文單詞;合成;字母基線;圖像拼接
【Abstract】Relying on the characteristics of the Manchu words, the sample database of Manchu words is established based on its syllable characteristics and spelling rules. After traversing the black pixels of the Manchu words in the sample library, a pixel distribution histogram is drawn. After positioning the letter baseline, we stitch the upper and lower baseline to realize the word image synthesis, in order to achieve the purpose of synthesis Manchu word image. At last, Matlab GUI is used to implement the visualization interface.
【Key words】Manchu words; Synthesis; Letter baseline; Image Stitching
0 引言
作為統治了中國近三百年之久的清王朝,孕育了豐富多彩的滿族文化。滿族是一個擁有獨特文化的民族,不僅有自己的歷史文化、風俗習慣,還有自己的語言和文字,現存的用滿文寫成的浩如煙海的典籍和檔案文獻,為我們留下了珍貴的文化遺產。隨著歷史進程,滿文逐漸成為了一種歷史文字。時至今日,精通滿文的人已為數不多,滿族語言文字已瀕臨失傳,這就使得各個領域對滿文歷史資料和滿文信息化的的研究顯得十分困難。內蒙古大學的魏宏喜,高光來[1]等人在蒙古文的識別和合成方法上,提出了Word Spotting的改進技術,而現有針對滿文文字的合成研究卻是非常少的。實現滿文文字字母樣本庫的建立和滿文單詞的合成,不僅有助于對滿文的學習和研究,也對我國其他少數民族語言文字處理的發展有借鑒作用。
1 滿文文字特點
滿文[2]是屬于阿爾泰語系的通古斯語族的一種古文字,在詞的構造和拼寫上與英語、漢語等語種有很大的差異。
1)滿文的基本字母由6個元音和36個輔音字母構成,其中一個字母有最多8種的寫法,且不同元音字母和輔音字母搭配在一起或字母在單詞中的位置不同都可能使其在書寫上具有不同的形式。……