孫玥佳

【摘要】隨著互聯網普及和我國對漢字的逐漸重視,依靠排列組合原理,利用一種新的漢字輸入法——拼音筆畫輸入法,解決重碼和讀音不準問題,科學構建漢字字庫系統、漢字單字或多詞組應用數據分析系統和漢字信息快速搜索系統,使漢字發展能更好地適應新形勢所需.
【關鍵詞】拼音筆畫;數學;體系構建
一、數學聚集整合技術的應用
英國著名科學家李約瑟編撰的《中國科學技術史》一書,曾這樣說過:中國是最早發明水排的國家,也是最早發明風箱的民族,但卻沒有把它們整合起來變成蒸汽機.其原因是沒有最終把兩者有機整合在一起.
說起蒸汽機,首先想到瓦特,但他并不是發明者.瓦特的重大貢獻就在于技術改進,且運用數學原理,經過反復實驗、計算得出運行效率高于以往四倍的結果,使蒸汽機性能大大提高,從而促進了第一次工業革命的興起.下面介紹的拼音筆畫輸入法,就是利用了聚集、整合技術和數學方法構建的.
二、拼音筆畫輸入法
我們知道漢語拼音是由聲母和韻母組合而成的漢字字音,而拼音筆畫輸入法是利用拼音聲母與漢字筆畫相結合來實現的.漢語拼音總共有23個聲母,漢字筆畫可分為五種:橫、豎、撇、捺、折,可以用鍵盤數字1、2、3、4、5代替.每一個漢字都是由聲母與筆畫組合而成,根據數學中排列組合乘法定理,可以計算出總組合數來.現將乘法定理敘述如下:
完成一件事,需要將其過程分成幾個步驟,做第一步有m1種不同的方法,對于第一步的每一種方法,做第二步均有m2種不同的方法;對于前兩步的每種方法,做第三步有m3種方法……以此類推,做第n步,對于前(n-1)步的每種方法,均有mn種方法,那么完成這件事共有P=m1*m2*——*mn種不同的方法.
1.漢字的單字輸入法
規則:取聲母232取筆畫53
筆畫取法:上下結構的漢字取第一、第二筆畫和末筆畫;左右結構的漢字取左側的第一筆畫和右側的第一筆畫及末筆畫;不夠三筆的漢字用空格代替.
聲母與筆畫總組合數為:232*53=2875種
例如:漢 h454 字 z421
需要說明,不是每一種聲母與筆畫的組合都可以組成一個漢字,但是每一個漢字都是由聲母與筆畫組成,這里的總組合數為平均數.根據國家公布《通用規范漢字表》(2013版),共收錄漢字8105個左右.假設每一個聲母和筆畫都可以組成一個漢字,那么平均重碼率8105/2875≈3個漢字.從理論上來講基本上滿足我們使用要求,不翻頁或少翻頁找字,極大地節約了輸入漢字的時間.
2.漢字的雙字詞組輸入法
規則:取聲母組合數232取筆畫組合數52
筆畫取法:取第一個字的第一筆畫與第二個字的最后一筆.
雙字詞組總組合數為:232*52=13225
例如:科學kx32 東西dx11
根據《現代漢語詞典》詞匯總量約六萬條,其中雙字詞組不超過四萬條,漢字平均重碼率40000/13225≈3個字,同樣也節省了漢字雙字詞組輸入的時間.
3.漢字的三字詞組輸入法
規則:取聲母組合233筆畫輸入52
筆畫取法:取第一個字第一筆,最后一個字末筆畫.
漢字三字詞組總組合數為233*52=304175
例如:俄羅斯 els32
漢字三字詞組基本上不存在重碼,大多不需要翻頁.
4.漢字四字詞組輸入法
規則:直接輸入聲母,筆畫輸入基本上不需要采用.
四個字聲母組合數234=279841
例如:一針見血yzjx 一心一意yxyy
五個字及其以上的詞組(容量235=6436343)只要使用聲母就可以完成漢字詞組的輸入,不需要再輸入筆畫,這樣輸入速度更加快捷方便.
三、拼音筆畫輸入法特點
從以上對漢字單字及詞組進行計算與分析,得出規律為:漢語拼音的聲母用來輸入漢字或詞組,筆畫用來確定矯正每一個漢字或詞組.當輸入四個字及其以上的詞組時,根據其組合容量,基本上不需要輸入筆畫,這樣極大地減少了敲擊鍵盤的次數,使輸入詞組更加快速方便.拼音筆畫輸入法還有以下一些特點:
1.減少敲擊鍵盤的平均次數
以拼音輸入為例,輸入一個漢字,最少敲擊2次鍵盤 (不算重碼翻頁)(壹yi),最多敲擊6次鍵盤(狀zhuang),平均輸入鍵盤3.5次。
從上表中可以看出,采用拼音筆畫輸入法,敲擊鍵盤的次數明顯減少.
2.解決漢字讀音不準的問題
地區方言差異較大,聲母不易讀準的音zh、ch、sh與z、c、s;韻母不易讀準的音en、eng、in、ing,這些不容易讀準的聲母和韻母在漢字中占有很大比例,由于讀音不準確,導致在拼音輸入過程中輸入速度受到影響.
3.解決漢字輸入過程中的重碼問題
無論是使用拼音輸入法還是筆畫輸入法都存在大量的重碼,但把兩種輸入法結合起來,就大大地降低了重碼率,節約輸入時間,從而使漢字輸入更加簡便、快捷.
4.加深人們對漢字字型的印象
漢字是語言與字型完整結合的產物,這是漢字文化固有特點,使用這種輸入法,可以加深對中國傳統漢字字型的記憶印象,加強對中國漢字書寫與閱讀的繼承與發展,具有不可替代的意義.
5.推進漢字輸入法的延伸和擴展
漢字的字形結構形式比較復雜,它不僅有上下、左右結構,還有許多字形結構形式,如里外型(國)、品字型(森)、倒品型(馨)及獨體字型(凸、凹)等,為了減少重碼,增加幾個常用字根以及相對應的數碼,使輸入漢字更快捷.所增加的字根及數碼鍵盤對應如下:
鍵盤0:口、日、目、月、田、罒等,此類部首占漢字總量16%~20%左右.
例如:國g014 、 啟q450 、曼m004 、眼 y054
鍵盤7:七、土、士、扌、艸等,此類部首占漢字總量10%左右;
例如:草c702 、地 d757 、把b757、北b217
鍵盤8:八、乄、人、丷、灬.小等,此類部首占漢字總量10%左右.
例如:放f438 、然r348 、眾z888、兌d805
增加的3個數碼,其拼音與筆畫組合數為:23*83=11776.重碼率為8000/11776≈0.68%
四、建立與時俱進的漢字輸入應用體系
漢字拼音筆畫輸入法被大家認同需要一個過程.但它應用數學原理建立起來的數學體系非常重要.馬克思說:“一門學科只有當它達到了能夠成功運用數學時,才能真正發展”.數學原理的引入為我們在工作中解決實際問題提供了理論依據,它揭示了事物內在規律,化難為易,把奧妙變為常識.為此,拼音筆畫輸入法的應用又進一步拓展了空間.
1.建立屬于自己的漢字字庫系統
由于每個人使用漢字的用途及專業分類領域不同,使用漢字單字和詞組的頻率也不盡相同.因此,有必要組建屬于自己的漢字字庫系統,從字庫系統中提煉出屬于自己的漢字字庫,再結合漢字輸入過程中的聯想功能和學習記憶功能等,以便更好地為我所用.例如:普通人手機微信、短信交流,約3000~3500個常用漢字足夠用,但是研究中國古代漢語的,約需要1.5萬個漢字,作為醫生除了常用漢字外,還需要在字庫里儲存較多專業名詞或大量的藥品名稱等.
2.建立漢字單字或多詞組應用數據分析系統
漢字與英文單詞有很大不同,英語由26個字母組合成單詞,而漢語是由單字與詞組組合而成,而且每一個單字又可以組合成詞組,這就造成漢字的新詞組不斷涌現.我們有必要建立漢字應用數據分析系統,對漢字或詞組的使用頻率、新舊詞組的增減、漢字字庫的容量等進行科學統計,利用統計結果對漢字的使用情況進行分類,把漢字進行數字化、科學化的整理,讓漢字更好地為各行各業人群服務.
3.建立快速漢字信息搜索系統
我們在網上搜索信息時,一般需要將漢字信息全部輸入,方可查尋到此類信息.如果我們建立快速漢字信息搜索系統,根據聲母的排列組合的組合數容量,5個字以下利用聲母與筆畫相配合查找,五個字以上的,直接輸入聲母就可以非常快速查詢到此類信息.此方法非常適合圖書館的信息檢索系統.
基于數學原理的拼音筆畫輸入法,不僅是一門漢字輸入技術,而且能使漢字體系進一步深化,為快速發展的各個領域提供更好的服務.