999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種湘西民間苗文字形的動態生成方法及其實現途徑

2016-10-12 08:29:49莫禮平周愷卿
北京大學學報(自然科學版) 2016年1期
關鍵詞:結構

莫禮平 周愷卿

?

一種湘西民間苗文字形的動態生成方法及其實現途徑

莫禮平1,2,?周愷卿3

1.吉首大學信息科學與工程學院, 吉首 416000; 2.中南大學信息科學與工程學院, 長沙 410083; 3.馬來西亞理工大學計算學院, 士古來 81310; ?通信作者, E-mail: zmx89@163.com

為了有效地解決湘西民間苗文字形的生成及描述問題, 提出一種字形的動態生成方法。該方法將苗文字形的生成過程表示為由苗文構件作為操作數、由構件位置關系決定運算符的組合運算表達式, 將2~3個構件進行不同的組合運算, 即可動態生成不同結構的苗文字形。利用操作系統自帶的表意文字描述序列解釋機制, 將構件組合運算表達式轉換為表意文字描述序列, 即可實現該方法。測試結果表明, 根據該方法編寫的映射腳本生成的湘西民間苗文字形可以滿足實用要求。

民間苗文; 字形; 上下文無關文法; 表意文字描述序列

湘西民間苗文由清朝末年以來一些民族知識分子創制, 主要包括板塘苗文、老寨苗文、古丈苗文三套方塊苗文[1]。2011年以來, 隨著《湖南武陵山片區區域發展與扶貧攻堅規劃(2011–2020)》的全面實施, 以世界自然遺產旅游區張家界和國家歷史文化名城鳳凰重點旅游景區為依托的民族文化旅游產業得到迅速發展, 非物質民族文化遺產數字化保護工作也逐漸受到重視。然而, 作為武陵山片區民族文化主要載體的湘西民間苗文, 其信息處理研究工作和成果鮮有報道。近年來, 莫禮平等[2–4]針對三套方塊苗文, 在字庫設計、文字輸入等方面開展了一系列研究, 并取得階段性成果。

字形的生成及描述是湘西民間苗文在字層面信息處理技術研究的重要內容。本文提出一種基于構件組合運算的湘西民間苗文字形動態生成方法, 并結合Unicode提供的表意文字描述規范, 討論該方法不占用編碼區間的實現途徑。

1 湘西民間苗文的造字原理及構字方式

1.1 造字原理

板塘苗文、老寨苗文和古丈苗文這三套湘西民間苗文均屬于表意文字, 基本上都是合體字。創制者借鑒漢字的造字原理, 創造性地運用形聲、會意、象形、假借等手段, 采用一字一音節的方法來標記一個語素或詞。三套文字的結構類型大致分為4種[1]: 左右結構(最多)、上下結構(較多)、側圍結構(較少)和內外結構(極少)。表1給出不同結構的湘西民間苗文字例及其漢義。

表1 不同結構湘西民間苗文字例及漢義

湘西民間苗文創制時, 遵循“取個人認為最易認易記的漢字或符號作為代表符號”的標準, 直接用含義明確、結構或筆畫較簡單且日常使用頻率較高的漢字或偏旁, 以及極個別無音無義的純粹符號(如“X”、“~”)作為義符、聲符或形符構件[5]。表2按構件拼音首字母次序給出從文獻[1,5–6]整理出的、作為苗文構件使用的203個漢字(偏旁)和兩個純粹符號。

表2 湘西民間苗文構件

1.2 構字方式

湘西民間苗文的字形由構字方式決定。同一個字形可以呈現多種風貌, 但其構字規律固定。當一個苗文由3個及3個以上部分構成時, 按照構件選取標準, 其中的某2個或3個部分通常可組成一個簡單漢字。此時, 宜將此簡單漢字視為一個構件。對文獻[1, 5–6]所提及湘西民間苗文進行統計的結果表明, 大部分苗文均可視為二構件型, 僅個別左右結構和上下結構的苗文需當作三構件型處理。

圖1給出不同結構湘西民間苗文字例的字形拓撲結構和構字方式。圖1(a)~(d)所示的二構件型字例的字形分別取決于構件“口”“打”、構件“尖”“口”、構件“毛”“比”和構件“門”、“竺”。圖1(e)~(f)所示的三構件型字例的字形分別取決于構件“扌”、“氵”、“井”和構件“合”“目”“目”。盡管“打”、“尖”、“竺”和“目目”均可進一步分解為兩個構件, 但按照構件選取原則, “打”、“尖”和“竺”宜作為一個構件使用, 無須再拆分為虛線框內的兩個部分, 而“目目”則宜繼續分解為兩個構件“目”和“目”。

2 湘西民間苗文字形動態生成方法

2.1 基本思想

當前計算機處理表意文字時, 主要在“單字”層面上對其逐一編碼, 相應的字體設計也必須“逐字”進行。這種方法使得表意文字的字體設計工作量巨大, 同時導致編碼字符集也難以瘦身。

與通過26 個字母的自由組合即動態生成很多的英文單詞字形一樣, 將有限構件按照一定規則進行組合, 理應也能動態生成無窮多的湘西民間苗文字形。根據造字原理和構字方式, 湘西民間苗文的字形可視為由2~3個構件組合運算得到。按照構件在苗文合體字中的位置關系, 可以將組合運算分為6種: 左右連(left-right link, LRL)、上下連(up-down link, UDL)、左上包(left-up contain, LUC)、左下包 (left-down contain, LDC)、右上包(right-up contain, RUC)和全包(all contain, AC)。兩個構件經某種運算生成一個二構件型的苗文字形, 生成結果再與另一個構件進行某種運算, 即可得到一個三構件型的苗文字形。

取表2中的205個構件作操作數進行6種運算, 不僅能夠生成文獻[1, 5–6]中提及的所有湘西民間苗文字形, 還能創制很多新字形。這意味著湘西民間苗文可視為一個開放的文字集合, 采用字形動態生成方法, 能夠生成用戶所需的各種新的苗文字形。具體例子如下。

1)左取構件“女”、“米”、“衤”、“亻”和“蛋”, 右取構件“能”, 通過左右連運算, 可分別生成漢義為“年輕媳婦”、“稻谷”、“穿衣”、“人”、“蛋”的二構件型左右結構苗文字形。

2)上取構件“雨”, 下取構件“加”、“龍”、“助”、“奴”、“送”、“號”、“者”、“朽”、“氣”、“風”、“白”等, 通過上下連運算, 可生成表示天氣的一組二構件型上下結構苗文字形。

3)上取構件“蟲”, 下取構件“~”, 通過上下連運算, 可以生成漢義為“蛇”的二構件型上下結構苗文字形。

4)左取構件“疒”, 右取構件“相”, 通過左上包運算, 可生成漢義為“生病”的二構件型側圍結構苗文字形。

5)左取構件“色”, 右取構件“白”、“黑” “青” “紅” “綠”等, 通過左下包運算, 可生成表示顏色的一組二構件型側圍結構苗文字形。

6)左取構件“扌”、“口”、“月”或“乙”, 右取構件“一”、“二”、“三”、“四”、“五”、“六”、“七”、“八”、“九”、“十”、“百”、“千”、“萬”等, 通過左右連或左下包運算, 可生成4組與數字相關的二構件型左右結構或側圍結構苗文字形。

7)左取構件“去”, 右取構件“飛”, 通過右上包運算, 可生成漢義為“飛去”的二構件型側圍結構苗文字形。

8)外取構件“門”, 內取構件“出”, 通過全包運算, 可生成漢義為“出去”的二構件型內外結構苗文字形。

9)上取構件“合”, 下取兩個構件“目”進行左右連運算的結果, 再作上下連運算, 可生成漢義為“打瞌睡”的三構件型上下結構苗文字形。

2.2 運算符的定義

設為任意湘西民間苗文構件,和為整數, 用(,)表示像素點位置, 則苗文構件的二值圖像可用函數F(,)定義。F(,)=1時, 圖像為黑像素, 表示構件有筆畫經過(,)點;F(,)=0時, 圖像為白像素, 表示構件無筆畫經過(,)點。

任意取兩個湘西民間苗文構件和, 其二值圖像函數分別為F(,)和F(,)。將F(,)=1和F(,)=1時和的最大、最小值分別記為maxx(), maxx(), maxy(), maxy(), minx(), minx(), miny()和miny(), 則上述6種運算符的定義可用邏輯公式描述如下。

定義1 若(maxx()≤minx())∧((miny()≤miny()≤maxy()≤maxy())∨(miny()≤miny()≤maxy()≤maxy())), 則稱左右連, 記為LRL。

定義2 如果(miny()≥maxy())∧((minx()≤minx()≤maxx()≤maxx())∨(minx()≤minx()≤maxx()≤maxx())), 則稱上下連, 記為UDL。

定義3 如果(minx()<minx()≤maxx()≤maxx())∧(miny()≤miny()≤maxy()<maxy()), 且當,滿足(minx()≤≤maxx())∧miny()≤≤maxy())時,F(,)=0, 則稱左上包, 記為LUC。

定義4 如果(minx()<minx()≤maxx()≤maxx())∧(miny()<miny()≤maxy()≤maxy()), 且當,滿足(minx()≤≤maxx())∧miny()≤≤maxy())時,F(,)=0, 則稱左下包, 記為LDC。

定義5 如果(minx()≤minx()≤maxx()<maxx())∧(miny()≤miny()≤max()<maxy()), 且當,滿足(minx()≤≤maxx())∧miny()≤≤maxy())時,F(,)=0, 則稱右上包, 記為RUC。

定義6 如果(minx()<minx())∧(maxx()>maxx())∧(miny()<miny())∧(maxy()>maxy()), 且當滿足(minx()≤≤maxx())∧miny()≤≤maxy())時,F()=0, 則稱全包, 記為AC。

2.3 運算表達式的構成

根據上述思想, 苗文字形的動態生成過程可表示為由苗文構件作操作數、由構件位置關系決定組合運算符的中綴表達式。表達式中, 所有運算符優先級相同, 均服從左結合規律, 括號內運算符優先級高于括號外運算符。

由于湘西民間苗文大部分為二構件型, 僅個別為三構件型, 所以運算表達式通常只有如下4種形式: 1)構件+運算符+構件; 2)構件+運算符+構件+運算符+構件; 3)(構件+運算符+構件) +運算符+構件; 4)構件+運算符+(構件+運算符+構件)。其中, 形式2和形式3等價。

3 湘西民間苗文字形動態生成方法的實現途徑

3.1 基于IDS的實現途徑

湘西民間苗文字形動態生成方法實現的最直接途徑是, 根據運算符定義和組合運算表達式形式, 設計構件組合運算算法和構件像素坐標提取算法, 并通過構造不同構件筆畫的生成函數, 動態獲取各種不同的苗文字形。但是, 該實現途徑的工作量較大。表意文字描述規范[7]為湘西民間苗文字形動態生成方法的實現提供了一種簡捷的途徑。

表意文字描述規范最早出現在Unicode 3.0中。該規范定義了12個表意文字描述符(ideo-graphic description characters, IDC), 給出了基于遞歸定義的表意文字描述算法。算法將表意文字遞歸地分解為部件的組合, 將文字的結構類型符作為操作符, 文字或部件作為操作數, 用操作符和操作數組成的前綴表達式表示文字字形。算法的理論依據是, 所有的表意文字都可以拆分為更小的部件, 而這些部件本身是表意文字。由于算法允許IDS本身繼續被分解, 且Unicode字符集中表意文字部件存在重復出現情況, 所以, 一個表意文字的字形描述序列可能不唯一。原則上, IDS越短越好。采用IDS描述表意文字字形時, 限制序列長度不得多于16個Unicode碼位; 若無IDC分隔, 構成序列的部件最多6個。表意文字描述規范使得表意文字字形描述與現有文字編碼系統相結合, 為表意文字字形動態生成技術的實用化奠定了堅實基礎。目前, IDS已成功應于古籍數字化[8]和錯字處理[9], 以及繁體漢字向量組字編輯器[10]、文字影系統(Kage System)[10–11]等動態組字技術研究中。

表3 IDC與運算符的對應關系

3.2 實現途徑的上下文無關文法表示

湘西民間苗文字形動態生成方法實現時, 苗文字形的IDS構成可用定義7給出的上下文無關文法進行描述。

定義7(N,T,,)。N和T分別表示非空有窮的非終結符集和終結符集, 且N∩T=?;為形如“”的產生式集;為文法G的開始符,N且至少在一條產生式中作為左部出現。N,T和取值如下:

N{,,,,};

T{U+2FF0, U+2FF1, U+2FF4, U+2FF5, U+2FF8, U+2FF9, U+2FFA, U+4E00……U+9FFF, U+0020……U+007E};

{,

U+2FF0U+2FF1U+2FF4U+2FF5U+2FF8U+2FF9U+2FFA,

翻譯是一種心理活動,是對原語的解碼并提取意義,然后用目標語言進行編碼的過程。方夢之也認為“翻譯過程中譯者受多種心理機制的作用,譯者的心理狀態對轉換行為產生直接影響”。[1]“翻譯心理學從文化心理學的角度分析把“誤譯”分為“有意識誤譯”和“無意識誤譯”。“無意識誤譯”源自于譯者的無意識誤讀,這不屬于翻譯心理學研究的范疇。而“有意識誤譯”是指譯者翻譯時故意誤讀;譯者的故意誤讀受控于譯者的文化心理因素,如譯者的本土文化意識形態(包括政治態度)[2]24,有意識誤譯實際上就是歸化的表現。

,

U+4E00……| U+9FFF,

U+0020……|U+007E。

中各符號的含義見表4。

表4 G中的文法符號含義

圖1(a)~(f)中6個湘西民間苗文字例的字形生成IDS如表5所示。按照構件選取標準, 圖1(a)~(d)和(f)中字例的字形只有一種描述序列, 而圖1(e)中字例的字形可以有兩種描述序列。

表5 動態生成湘西民間苗文字形的IDS示例

4 湘西民間苗文的字形生成測試

目前, 已完成OpenType字體布局表的規劃, 并以湘西民間苗文的字形動態生成方法及基于IDS的實現途徑為基礎, 設計了構件組合映射腳本, 初步創建了湘西民間苗文OpenType字庫。以微軟OpenType字體布局設計軟件VOLT提供的Proofing Tool為測試工具, 對字庫進行了初步測試。測試結果表明, 映射腳本生成的湘西民間苗文字形整齊規范, 基本上達到實用要求。對應左右連運算和左下包運算的組合映射腳本所生成的二構件型左右結構和側圍結構苗文字形的測試結果如圖2所示。

5 結語

以往研究將湘西民間苗文編碼限定在Unicode私用區[U+EF00~U+FFFF], 每個字形占用一個碼位, 已創建的苗文TrueType字庫中的每個文字皆以獨立的字形輪廓進行描述。這種方式雖然可行, 但不利于移植。本文提出的方法, 通過2個或3個構件和6種組合運算符構造運算表達式, 再利用IDC及苗文構件的Unicode編碼的組合描述序列來實現運算表達式, 借助操作系統自帶的IDS解釋機制, 便能動態生成用戶所需的各種湘西民間苗文字形, 這對于實現湘西民間苗文字形的高效存儲和快速顯示技術有重要作用。

下一步, 擬研究湘西民間苗文字形動態生成方法在無字庫苗文處理系統中及互聯網上跨平臺苗文信息傳播中的應用技術。

[1]趙麗明, 劉自齊. 湘西方塊苗文. 民族語文, 1990, 12(1): 44-49

[2]莫禮平, 周愷卿, 蔣效會. 板塘苗文的計算機編碼及字庫創建. 吉首大學學報: 自然科學版, 2013, 34(2): 31-35

[3]莫禮平, 周愷卿, 張兆海. 基于Windows IMM-IME的接口式方塊苗文輸入法的實現. 計算機應用與軟件, 2014, 31(3): 64-66, 81

[4]莫禮平, 曾水玲, 周愷卿. 音形結合的方塊苗文輸入編碼方案研究. 計算機科學與探索, 2014, 8(8): 1017-1024

[5]楊再彪, 羅紅源. 湘西苗族民間苗文造字體系. 吉首大學學報: 社會科學版, 2008, 29(6): 130-134

[6]龍正海. 渝、湘、鄂酉水流域方塊苗文造字法再探. 重慶教育學院學報, 2012, 25(5): 56-59

[7]Lu Qin, Chan Shiutong, Li Yin,et al. Decomposition for ISO/IEC 10646 ideographic characters [EB/OL]. (2004–06–01) [2015–01–06]. http://www.aclweb.org/ anthology/W/W02/W02-1209.pdf

[8]肖禹, 王昭. 動態組字的發展及其在古籍數字化中的應用. 科技情報開發與經濟, 2013, 23(5): 118-122

[9]李小慶. 面向漢字教學的錯字處理工具設計與實現[D]. 內蒙古: 內蒙古師范大學, 2010: 17-29

[10]百度百科. 動態組字[EB/OL]. (2010-07-10) [2015-01-19].http://baike.baidu.com/view/908298.htm?fr= aladdin

[11]Miyazaki I, Tomabechi T. Omega/CHISE: a type-setting framework based on the character information service environment [EB/OL]. (2004–05–13) [2015–02–08].http://coe21.zinbun.kyoto-u.ac.jp/papers/ws-type- 2003/077-Omega-CHISE.pdf

[12]The Unicode Consortium. Unicode7.0 character code charts [EB/OL]. (2014–07–16) [2015–03–29]. http://www. Unicode.org/Public/UCD/latest/charts/CodeCharts.pdf

A Dynamical Glyph Generation Method of Xiangxi Folk Hmong Characters and Its Implementation Approach

MO Liping1,2,?, ZHOU Kaiqing3

1. College of Information Science & Engineering, Ji Shou University, Jishou 416000; 2. Institute of Information Science & Engineering, Central South University, Changsha 410083; 3. Faculty of Computing, University Teknologi Malaysia, Skudai 81310;? Corresponding author, E-mail: zmx89@163.com

To effectively solve the glyph generation and glyph description problem, a dynamical glyph generation method of Xiangxi folk Hmong characters is proposed. According to this method, the glyph generation process can be described as a combination arithmetic expression. Hmong characters component acts as the operand, and the location relationship between the components decides the operator. Glyphs in different structure can be dynamically generated by combination of two or three components. Further, if combination arithmetic expression is converted to ideographic description sequence (IDS), the proposed method can be implemented with the help of the IDS explain mechanism of operation system. Test results illustrate that, the Xiangxi Hmong characters glyph, which generated by the mapping script based on the proposed method, can meet practical requirements.

Folk Hmong characters; glyph; context-free grammar; ideographic description sequence (IDS)

10.13209/j.0479-8023.2016.019

TP391

2015-06-04;

2015-08-15; 網絡出版日期: 2015-09-29

國家自然科學基金(61462029)和中國計算機學會中文信息技術開放課題基金(CCF2014-02-01)資助

猜你喜歡
結構
DNA結構的發現
《形而上學》△卷的結構和位置
哲學評論(2021年2期)2021-08-22 01:53:34
論結構
中華詩詞(2019年7期)2019-11-25 01:43:04
新型平衡塊結構的應用
模具制造(2019年3期)2019-06-06 02:10:54
循環結構謹防“死循環”
論《日出》的結構
縱向結構
縱向結構
我國社會結構的重建
人間(2015年21期)2015-03-11 15:23:21
創新治理結構促進中小企業持續成長
現代企業(2015年9期)2015-02-28 18:56:50
主站蜘蛛池模板: 全裸无码专区| 一级毛片网| 亚洲性日韩精品一区二区| 在线视频亚洲欧美| 伊人丁香五月天久久综合| 成人a免费α片在线视频网站| 午夜色综合| 日本欧美中文字幕精品亚洲| 国产第三区| 国产精品3p视频| 干中文字幕| 狠狠久久综合伊人不卡| 欧美精品二区| 制服丝袜亚洲| 九九久久精品免费观看| 国产69囗曝护士吞精在线视频| 国产爽妇精品| 日本人妻一区二区三区不卡影院| 毛片一级在线| 国产精品原创不卡在线| 国产欧美日韩视频一区二区三区| 成人毛片免费观看| 中文无码日韩精品| 91精品福利自产拍在线观看| 2021天堂在线亚洲精品专区 | 国产中文一区a级毛片视频 | 久久精品只有这里有| 欧美福利在线| 99精品在线视频观看| 日韩欧美视频第一区在线观看| 亚洲欧美人成电影在线观看| 88av在线| 国产91高清视频| 一级香蕉视频在线观看| 色窝窝免费一区二区三区| 久久国产精品影院| 亚洲水蜜桃久久综合网站| 国产成人精品无码一区二| 国产69精品久久久久孕妇大杂乱| 国产网站免费看| 狠狠色噜噜狠狠狠狠色综合久| 性色一区| 青青青国产视频| 亚洲中文字幕在线观看| 2020国产精品视频| 99在线观看精品视频| 在线观看免费AV网| 久久a级片| 狠狠色香婷婷久久亚洲精品| 精品自窥自偷在线看| 久久99精品久久久久久不卡| 看你懂的巨臀中文字幕一区二区| 就去吻亚洲精品国产欧美| 97免费在线观看视频| 国产在线视频导航| 99久久精品国产综合婷婷| 婷婷亚洲综合五月天在线| 国产免费怡红院视频| 欧美在线一二区| 成人在线第一页| 日本黄色不卡视频| 欧美高清日韩| 久久亚洲国产视频| 免费a级毛片18以上观看精品| 青青草a国产免费观看| 欧美a在线视频| 美女内射视频WWW网站午夜| 日本黄色不卡视频| 97亚洲色综久久精品| 四虎综合网| 成人综合在线观看| 无码久看视频| 久久精品无码国产一区二区三区| 专干老肥熟女视频网站| 亚洲最大看欧美片网站地址| 国内精品久久久久鸭| 999国内精品久久免费视频| 久久国产精品嫖妓| 国产免费羞羞视频| 伊人久久婷婷| 国产资源免费观看| 韩国v欧美v亚洲v日本v|