鄧學雄, 李京陶, 李 牧
(華南理工大學設計學院,廣東 廣州 510006)
毛筆書法臨帖的計算機評價
鄧學雄, 李京陶, 李 牧
(華南理工大學設計學院,廣東 廣州 510006)
針對書法初學者學習的特點,基于計算機輔助技術,根據(jù)適用于初學者的書法水平評價標準,提出相似度的算法。將初學者的臨帖作品通過掃描或拍照后輸入計算機,利用計算機圖像處理技術進行臨帖作品預處理。通過圖像骨架、不變矩、灰度投影等方法,對臨帖字體的結體特征、點畫形態(tài)和章法布局的特征進行描述。對臨帖字體與原碑帖字體進行相似度計算,實現(xiàn)對書法初學者臨帖作品綜合評價的輔學系統(tǒng)。
計算機應用;書法教育;毛筆書法;臨帖;計算機評價
中國的各種古代藝術門類中,最具標志性,最能集中地、典型地、鮮明地、持續(xù)而廣泛地表現(xiàn)民族精神和時代精神的藝術,非書法莫屬[1]。我國教育部下發(fā)的《中小學書法教育指導綱要》文件為書法教育實現(xiàn)提供了有力保障,但當代書法教育在普及過程中仍存在諸多問題如:缺少書法學習氛圍、師資力量薄弱,教學資源匱乏以及學生對書法藝術缺乏興趣等,使得書法教育的發(fā)展舉步維艱。
參照中國書畫等級考試標準(書法類)[2]可知,書法學習的初級階段,是以模仿能力為主要考核標準的。而書法學習的模仿能力是由學習者的臨帖字體與原碑帖字體的相似度決定。其中,“碑”源于古代碑石上的字為書法名家所書,字跡可供后人取法,后人將碑石上的字用薄紙、焦墨捶拓下來再經(jīng)裝裱;而“帖”原是指書法家的墨跡真筆,“碑帖”合為一辭,用來泛指供學習書法取法的范本。“臨帖”是指書法練習者將字帖置于案前,觀察字的形態(tài)、結構、筆劃,領會其精神,并下筆仿寫。
本研究的目的是實現(xiàn)計算機輔助評價臨帖字體與原碑帖字體相似度,給書法初學者提供練習效果的評價,指引其下一步的學習。目前,在漢字筆畫特征提取和輪廓回復方面的研究,馬小虎等[3]、He和Yan[4]、陳睿等[5]、王建平等[6]已實現(xiàn)提取漢字筆畫特征,趙琪等[7]在輪廓恢復方面亦作了深入研究,并已取得成效。此外,使用漢字圖像的彈性網(wǎng)絡特征[8]、Gaber特征[9]、和梯度特征[10]以及Kato等[11]使用方向元素特征這些方法進行漢字識別均能達到較好的漢字識別效果。這些研究成果對于本研究中的書法字特征提取有著重要的參考作用,為進一步提出書法字相似度算法打下堅實的基礎。
結合書法學習步驟和各階段要求,本研究選取用于評價書法初學者臨帖效果的標準,利用計算圖形學、數(shù)字圖像處理技術,從結體特征、點畫形態(tài)、章法布局三方面,通過深入探討書法字特征提取與相似度算法,判斷臨帖作品的“形似”程度,構建一個書法輔助教學平臺,完成評價臨帖作品的繁瑣任務,減少書法教師的工作量之余,還能暫時彌補部分書法教師在專業(yè)能力上的欠缺。此外,本系統(tǒng)的界面遵循娛樂化規(guī)則設計,目的寓教學于娛樂,激起青少年學習書法藝術的熱情,進而推動書法教育的蓬勃發(fā)展。
書法練習者的臨帖字體與原碑(原帖)字體是通過掃描或拍照后以圖像格式文件輸入計算機的。首先要對輸入的字體圖像進行預處理,如進行二值化[12]、去噪處理等。然后將字體的二值圖像進行剪切、縮放,得到像素大小相同的正方形圖像。圖 1所示為原碑字體的預處理過程。至于原帖和臨帖字體是白底(或灰底)黑字,預處理時不需要第三步的“反色”。

圖1 原碑字體的預處理
(1) 圖像二值化、去噪:將輸入到計算機臨帖字體和原碑帖字體進行二值化處理,即圖像分割。對字體與背景進行識別,本研究采用迭代法進行圖像二值化處理。同時,對二值圖像進行區(qū)域面積的計算,刪除面積特小的區(qū)域,以去除圖像中的斑點、劃痕等噪聲。
(2) 圖像裁剪縮放:將去噪處理后的圖像通過剪切、縮放,使原碑(原帖)字體和臨帖字體的二值化圖像大小相同(如像素為 128×128),以便于下一步特征提取和相似度計算。
參考書法臨帖的要求和書法初級考試標準[2],對書法初學者臨帖作品質(zhì)量的綜合評價主要從結體特征、點畫形態(tài)和章法布局三方面進行。深入探討特征提取與相似度算法,獲取評價的依據(jù)。
2.1 結體特征
2.1.1 書法字骨架提取
圖像的中軸部分亦即圖像骨架,最能夠反映出圖像的結構特征,本研究提出計算書法字圖像骨架的相似度的算法,對臨帖字體與原碑帖字體在結體特征方面進行相似度的評價。
提取圖像骨架,需對二值圖像進行細化處理,將二值圖像的骨架提取出來,同時盡可能保持圖像細小部分的連通性,進而達到突出形狀特征和減少冗余信息的目的[6]。本研究采用數(shù)學形態(tài)學細化法[13]提取書法字骨架。
細化算法中,為保證細化后圖像的連通性,如圖2(e)所示,可以借助中心像素點的八鄰域情況來判斷如何確定一個像素點是否應該被刪除。
設置一個5×5鄰域模板S,如圖2(c)。模板各點為S[i, j](0≤i≤4,0≤j≤4),中心點為S[2, 2],如圖2(b)。將模板S各位置上的點賦值,黑點為1,白點為0,模板S的中心像素點需要同時滿足以下4個條件[14],即當中心像素點不為內(nèi)部點、孤立點、線端點和邊界連通點這4種中的任何一種情況時,才能被刪除:
(1) 2≤N(S[2,2])≤6;
(2) T(S[2,2])=1;
(3) S[1,2]×S[2,1]×S[2,3]=0同時T(S[1,2])≠1;
(4) S[1,2]×S[2,1]×S[3,2]=0同時T(S[2,1])≠1。
根據(jù)以上原理,書法單字二值圖像的骨架提取過程如下:
① 書法單字圖像裁剪時,預留出寬度為2像素的白邊,循環(huán)處理圖像中的所有像素。
② 若當前像素點為白色,則重復執(zhí)行①。
③ 若當前像素點為黑色,則定義一個模板S,設模板S中心與當前像素點重合。如圖2(a)所示為一個書法字的二值圖像,其上方(小正方形)區(qū)域的放大圖如圖2(b)所示。以該區(qū)域第一個黑點為中心設置5×5共25個像素的區(qū)域,如圖2(c);得到5×5的結構元素模板S,如圖2(d)。
④ 模板S覆蓋的位置,像素為黑點,則在模板S對應的結構元素置為1,像素為白點置0。
⑤ 通過對中心像素點8鄰域(如圖2(e))和16鄰域(如圖2(f))的判斷,如果模板S同時滿足 4個條件,則刪除中心像素點,將其填充為白色。圖2(c)的中心像素點沒有同時滿足4個條件,則不能刪除。
⑥ 循環(huán)①~⑤,直到處理完圖像中所有像素點。
⑦ 將⑥中得到的結果作為下一輪掃描的對象,循環(huán)①~⑥,直到?jīng)]有需要刪除的像素點。
圖3(a)為第一輪細化的結果,大部分邊界點被刪除,目標區(qū)域縮小了一圈。圖3(b)~(d)分別為第二、三、四輪細化的結果,黑色區(qū)域不斷從外部向內(nèi)部腐蝕。圖3(e)為多輪細化的最終結果,區(qū)域的寬度信息已經(jīng)除去,僅剩寬度為 1像素的骨架細線。此方法提取書法字骨架提取結果如表 1所示,基本實現(xiàn)書法字的結構特征表達,所提取結果用于下一步的骨架相似度計算。

圖2 5×5結構元素

表1 書法字骨架提取結果
2.1.2 骨架相似度計算
如圖4(a)為經(jīng)提取的臨帖字體骨架(淺色)和原碑帖字體骨架(深色),先求出兩者的差異度,然后根據(jù)差異度判斷兩者在結體特征方面的相似度。差異度是指臨帖字體骨架上某個像素點與原碑帖字體骨架中對應的像素點之間的距離[13]。
(1) 本研究是采用人工設定適當區(qū)域(如圖4(a)的矩形),在臨帖字體骨架上取任意點m(x1, y1)(如圖4(b)),則m與原碑帖字體骨架上任意點n(x2, y2)之間的距離為:

(2) 計算 m點與這個區(qū)域內(nèi)另一個骨架上各點的距離,取與m點距離最小的n′點,定義dmn′為m點到另一個骨架的距離dmin,如圖4(c)所示。
(3) 用臨帖字體骨架每個像素點與原碑帖字體骨架對應點之間的距離之和表示兩字體骨架的差異度:

式中的 i和 j分別為書法字骨架圖像的寬度和高度。
因差異度和相似度成反比,故距離之和的倒數(shù)能夠反映出兩個骨架的相似度λ:

其中,sum是臨帖字體骨架上像素點總數(shù)。
表2為臨帖字體與原碑帖字體骨架的比較實驗,其中將骨架相似度λ換算為百分制的分數(shù)S1。當S1越高表示骨架相似度越接近,得到的評價就越好。
2.2點畫形態(tài)

圖4 書法字骨架差異計算示意圖

表2 書法字體結體特征相似度計算結果
點畫形態(tài)的相似度是描述筆畫的形狀特征,描述的方法應不受形狀區(qū)域平移、旋轉的影響。Hu[15]提出的利用7個幾何不變矩來描述圖像的形狀特性,這種方法可以有效排除點畫中的結構信息,適用于描述點畫形狀。
本研究使用“套索”的工具,通過交互方式分別選取臨帖字體和原碑帖字體的對應筆畫(如圖 5“容”字中的撇),然后將所選的筆畫分別進行不變矩計算。當兩者對應的矩相差越小,則臨帖筆畫和原碑帖筆畫的相似度就越高。
實驗結果如表3所示,將不變矩平均誤差值的倒數(shù)設為M,并換算成百分制的分數(shù)S2。當S2越高表示點畫形態(tài)的相似度就越接近,評價就越好。

圖5 不變矩計算

表3 字體點畫形態(tài)相似度計算結果
2.3 章法布局
將臨帖字體和碑帖字體進行圖像二值化后,處理成白底黑字的書法字圖像。再將該圖像向豎直方向(圖6(a))和水平方向(圖6(b))進行投影,在直方圖中得到的空白區(qū)域長度分別為行距和字距離。根據(jù)臨帖和碑帖行距和字距的對比,作為章法布局的相似度。
實驗結果如表4所示,μ1、μ2分別是行距和字距的相似度,S3為換算成百分制的分數(shù),當S3越高表示章法布局相似度越接近,評價就越好。

圖6 書法字圖像投影圖

表4 書法字章法布局相似度計算結果
本研究采用Visual Studio 2010作為系統(tǒng)集成開發(fā)環(huán)境,使用C#語言進行系統(tǒng)編程。當輸入原碑帖和臨帖作品圖像(如掃描件或照片),經(jīng)過圖像預處理后,即可進行章法布局、單字結體特征和點畫形態(tài)的評價,如圖7(a)~(c)所示。評價系統(tǒng)綜合這三方面相似度算法結果,得出臨帖書法作品的平均分、平均等級以及綜合評語,如圖 7(d)所示。書法練習者可根據(jù)評價結果,較為全面地了解自己的學習狀況,為進一步練習提供參考。

圖7 書法臨帖的計算機評價
本研究是針對書法初學者早期對臨帖“形似”要求較高的特點,以及依據(jù)《中國書法等級考試標準》的基本內(nèi)容而展開的。借助計算機圖像識別技術,對臨帖字體和原碑帖字體的相似程度作出判別和評價。在字體結構、筆畫形態(tài)和章法布局三方面提出了相似度的算法,實現(xiàn)了對書法初學者臨帖效果進行評價的計算機輔學系統(tǒng)。近年來,隨著國學熱,以及教育部出臺的《關于中小學開展書法教育的意見》與《中小學書法教育指導綱要》等,有些高校還開設了書法專業(yè),書法教育受到重視,書法愛好者不斷增多。本研究結合傳統(tǒng)文化和現(xiàn)代科技,在計算機輔助書法學習方面開展了初步的嘗試。當然,還有眾多技術問題有待于進一步地研究和完善。此外,書法學習是一個非常復雜的思想過程,它包含著非常豐富的文化內(nèi)涵。如果把書法字體僅限于在“形”的相似顯然是遠遠不夠的,還需要探討書法字體的很多屬性。
[1] 湯大民. 中國書法簡史[M]. 南京: 南京師范大學出版社, 2012: 1-10.
[2] 吳慧平. 中國書畫等級考試攻略[M]. 合肥: 安徽美術出版社, 2009: 1.
[3] 馬小虎, 潘志庚, 張福炎. 基于筆畫描述的樣條漢字庫以及應用[J]. 計算機學報, 1996, 19(3): 81-88.
[4] He Rong, Yan Hong. Stroke extraction as pre-processing step to improve thinning results of Chinese characters [J]. Pattern Recognition Letters, 2000, 21(8): 817-825.
[5] 陳 睿, 唐 雁, 邱玉輝. 基于筆畫段分割和組合的漢字筆畫提取模型[J]. 計算機科學, 2003, 30(10): 74-77.
[6] 王建平, 錢自拓, 王金玲. 基于數(shù)學形態(tài)學的圖像漢字筆畫細化和提取[J]. 合肥工業(yè)大學學報, 2005, 28(11): 1431-1435.
[7] 趙 琪, 薛環(huán)振, 張顯俊. 基于統(tǒng)計模型的書法筆畫輪廓恢復[J]. 計算機應用研究, 2010, 27(10): 3977-3978.
[8] 劉 偉, 朱寧波, 何浩智. 基于彈性網(wǎng)格模糊特征的手寫體漢字識別方法[J]. 中文信息學報, 2007, 21(3): 117-121.
[9] Ge Yong, Huo Qiang, Feng Zhidan. Offline recognition of handwritten Chinese characters using Gabor features, CDHMM modeling and MCE training [C]//Proceeding of IEEE International Conference on Acoustics, Speech and Signal Processing 2002, 2002: 1053-1056.
[10] Liu Chenglin. High Accuracy handwritten Chinese character recognition using quadratic classifiers with discriminative feature extraction [C]//Proceedings of 18th International Conference on Pattern Recognition, 2006: 942-945.
[11] Kato N, Suzuki M, Omachi S, Aso H, Nemoto Y. A Handwritten character recognition system using directional element feature and asymmetric mahalannobis distance [J]. IEEE Trans. on Pattern Analysis and Machine Intelligence, 1999, 21(3): 258-262.
[12] 朱 虹. 數(shù)字圖像處理基礎與應用[M]. 北京: 清華大學出版社, 2013: 1-79.
[13] 俞 凱. 計算機書法若干關鍵技術研究[D]. 杭州: 浙江大學計算機科學與技術學院, 2010.
[14] 聯(lián) 駿. 圖像編程精髓[M]. 北京: 電子工業(yè)出版社, 2006: 6-7.
[15] Hu Mingkuei. Visual pattern recognition by moment invariants [J]. IEEE Transactions on Information Theory, 1962, 8(1): 179-187.
Computer Evaluation of Imitation in Chinese Calligraphy
Deng Xuexiong, Li Jingtao, Li Mu
(School of Design, South China University of Technology, Guangzhou Guangdong 510006, China)
For the characteristics of calligraphy learning beginners, on the base of computer aided technologies, according to the evaluation standard of calligraphy towards beginners, algorithms of calligraphy similarity are proposed. Calligraphy imitations are fed into computer by scanning or taking pictures and preprocessed by utilizing computer image processing technology. By means of making Image skeleton, invariant moment and gray projection algorithm, feature extractions of imitation fonts is made, from the aspect of structure feature, stipple form and writing rules, respectively. Similarity calculation of imitation fonts and original fonts is also completed, and the auxiliary learning system that provides comprehensive assessment of calligraphy imitations for beginners is realized.
computer application; calligraphy education; brush calligraphy; imitation; computer evaluation
TP 391
A
2095-302X(2014)06-0899-06
2014-02-27;定稿日期:2014-05-05
鄧學雄(1957-),男,廣東三水人,教授,碩士。主要研究方向為計算機圖形學、CAD、工程圖學、計算機藝術等。E-mail:dengxuexiong@263.net