999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于區域生長算法的漢字筆畫統計與分析

2023-07-15 02:43:54蔡志偉奚海丹田云松
大連民族大學學報 2023年3期
關鍵詞:生長區域

蔡志偉, 奚海丹, 田云松

(1.大連民族大學 a.計算機科學與工程學院;b.大連市漢字計算機字庫設計技術創新中心,遼寧 大連 116605;2.沈陽開放大學,遼寧 沈陽 110003)

筆畫是漢字的組成部分,研究漢字的組成結構等離不開筆畫。統計漢字筆畫的編碼及筆畫類別、筆畫數量、各種筆畫在字庫中出現的頻率等數據,對于基于筆畫的漢字輸入法和漢字的聯機手寫識別等方面具有重要的指導意義[1]。

漢字數以萬計,是中華民族傳統文化的核心和信息交流的主要工具。每個漢字不論簡體或繁體都需要按照筆畫順序進行書寫。因此,漢字的筆畫及其筆順對于漢字書寫和設計至關重要。

1 研究現狀

1.1 漢字筆畫數據集構建研究現狀

(1)漢字筆畫數據集現狀。林華[2]于2004年通過提取漢字筆畫輪廓線抽取漢字筆畫,實現計算機輔助漢字筆順教學;吳建國等人[1]于2005年統計漢字筆畫的相關信息并將其應用于標準鍵盤和數字鍵盤;導夫[3]于2013年按《漢字內碼擴展規范》總筆畫數進行排序、統計。

(2)圖像分割現狀。覃學標等[4]于2023年提出基于目標檢測及邊緣支持的魚類圖像分割方法;齊小祥等[5]于2021年提出基于邊緣檢測的SAR圖像自適應區域分割;李建華等[6]于2022年提出基于Canny算子和距離正則化水平集的乳腺植入物圖像分割算法。

1.2 現有漢字筆畫數據集及其構建的不足

表1 漢字筆畫種類示意圖

(2)漢字筆畫數據集中只含有總筆畫數,未出現筆畫細節及個數。現流行數據集大多只存儲漢字編碼、漢字字形、筆畫總數以及筆順等信息,丟失單個字形所含有的筆畫類別及數量信息如圖1。

圖1 漢字筆畫數據集示例

1.3 主要研究內容

采用文獻[8]提出的漢字筆畫分割數據集(Chinese character stroke segment dataset,CCSSD),對漢字筆畫分割數據集進行筆畫統計,由于CCSSD將筆畫交叉區域劃分為新一類,并且將所屬橫折折撇的兩種寫法如圖2。記作兩類,共計34類,在統計漢字筆畫類別數量時,采用區域生長算法將交叉類歸還給原筆畫,根據連通域數量計算筆畫類別,采用統計學方法對漢字筆畫進行分析。

圖2 橫折折撇示例圖

2 區域生長算法

區域生長算法是一種常用的圖像分割方法,其核心思想是通過將具有相同性質的像素點逐步合并以實現圖像分割的目的。在該算法中,首先針對每個區域指定一個種子點作為生長節點,然后將其周圍的像素點與該種子點進行對比,將相似性質的像素點合并至同一區域,隨后繼續對新的像素點進行對比,直至該區域的生長完成。而當沒有滿足條件的像素點被包含進來時,該區域的生長也即告結束。具體步驟見表2。

表2 區域生長算法步驟

3 基于區域生長算法的漢字筆畫統計

本文采用應用于圖像分割的CCSSD數據集,利用其灰度圖像,不同筆畫類別以不同灰度進行標注,筆畫交叉區域作為第34類,采用區域生長算法,從每個筆畫類別入手,采用八鄰域搜索,判斷周圍是否擁有筆畫交叉區域,若有將其歸屬于一類,判斷結束,根據連通分量進行統計筆畫數量并保存。具體流程如圖3。

圖3 基于區域生長算法的筆畫統計流程

區域生長算法的好壞取決于:1.初始點(即種子節點)的選取;2.生長準則;3.終止條件。為了提高算法的準確性,本算法采用每個筆畫類別的第一個像素值的位置作為種子節點,將相同類別和交叉類別作為生長準則,若無相同筆畫類別或交叉筆畫,則終止生長。

假設采用如圖4,大小為5×5的圖像矩陣,以7作為種子節點,像素生長準則為7或9,按照區域生長算法對該圖像進行分割。

圖4 圖像矩陣

采用八鄰域搜索方式加快查找速度,生長區域為7或9,第一次生長結果如圖5。第二次生長如圖6。

圖5 第一次生長結果

圖6 第二次生長結果

第三次生長可見周邊鄰域內沒有滿足生長條件的像素點,故停止生長,至此,將生長區域標記為1,未生長區域標記為0,分割結果如圖7。

圖7 分割結果圖

4 實驗結果與分析

標準宋體“安”字按照灰度圖分割所得筆畫如圖8,方正蘭亭黑“安”字分割所得筆畫如圖9??梢钥闯?算法適用于不同種類字體,且對于連通分量計算筆畫個數更為準確。

圖8 標準宋體“安”筆畫示意圖

圖9 方正蘭亭黑“安”筆畫示意圖

此外,本文采用連通域統計,計算各漢字各筆畫種類數量,并按照GB2312編碼順序將其包含的6 763個中文漢字進行編碼分析,由于橫折折撇有兩種寫法,但是同一個unicode編碼,故將這兩種歸屬于橫折折撇類,6 763個中文漢字共計32個種類,筆畫編號、類別及編碼見表3,其中每個含有該32個種類的漢字數量見表4。

表3 筆畫基本信息表

表4 含有32個筆畫的漢字數量

統計各種類筆畫總數量占比如圖10?;诠P畫的漢字輸入法鍵盤設計具有重大意義,從圖10可以看出,橫、豎、撇、點、橫折占比最多,說明字體設計中這五種作為常用筆畫。

圖10 筆畫總數量占比

字庫中包含某筆畫的漢字數量見表4??梢钥闯鳇c、橫、撇、豎、提作為基本筆畫,應用廣泛。

本文構建新數據集下載網址:https://github.com/caixiaocai1234/glyph。

5 結 語

構建漢字筆畫數據集對于漢字的拼接組成具有重大意義,使用區域生長算法將交叉域歸還原筆畫,提高了筆畫數量計算的準確率,同時小筆畫數據集構建有助于提高字體設計師設計效率,統計常用小筆畫分類有助于筆畫鍵盤布局設計。筆畫往往與筆順相關聯,對于小筆畫分類的筆順分布還少之又少,如何利用算法進行小筆畫筆順分布以減少人力和時間,是當下主要研究之一。

猜你喜歡
生長區域
永久基本農田集中區域“禁廢”
今日農業(2021年9期)2021-11-26 07:41:24
碗蓮生長記
小讀者(2021年2期)2021-03-29 05:03:48
分割區域
共享出行不再“野蠻生長”
生長在哪里的啟示
華人時刊(2019年13期)2019-11-17 14:59:54
野蠻生長
NBA特刊(2018年21期)2018-11-24 02:48:04
生長
文苑(2018年22期)2018-11-19 02:54:14
《生長在春天》
關于四色猜想
分區域
主站蜘蛛池模板: 九色在线观看视频| 一级一毛片a级毛片| 永久免费av网站可以直接看的| 色综合天天娱乐综合网| 亚洲不卡无码av中文字幕| 亚洲性色永久网址| 国产福利观看| 久久综合五月婷婷| 亚洲无码视频喷水| 亚洲福利片无码最新在线播放 | 国产va在线观看免费| 婷婷五月在线视频| 老司机精品99在线播放| 国产情精品嫩草影院88av| 亚洲色图欧美在线| a级免费视频| 狼友视频一区二区三区| 99热6这里只有精品| 免费国产高清视频| 国产特级毛片aaaaaaa高清| 久久久精品久久久久三级| 91精品国产福利| 亚洲无码高清免费视频亚洲| 99久久精品国产自免费| 日本五区在线不卡精品| 国产91成人| 波多野结衣一区二区三视频 | 欧美劲爆第一页| 久操线在视频在线观看| 99在线视频免费| 免费va国产在线观看| 直接黄91麻豆网站| 亚洲天堂网在线观看视频| 国产哺乳奶水91在线播放| 色哟哟色院91精品网站| 欧美高清三区| 丰满的少妇人妻无码区| 91精品啪在线观看国产60岁| 在线观看av永久| 在线播放精品一区二区啪视频| 在线看片免费人成视久网下载| 国产经典三级在线| 欲色天天综合网| 亚洲无线视频| 少妇露出福利视频| 国产视频一二三区| 波多野结衣AV无码久久一区| 国产精品久久久久久久伊一| 中文无码日韩精品| 亚洲国产综合精品中文第一| 亚洲无码熟妇人妻AV在线| 欧美人人干| 国产成人区在线观看视频| 国产特级毛片aaaaaaa高清| 凹凸精品免费精品视频| 国产成人喷潮在线观看| 美女高潮全身流白浆福利区| 国产成人一区免费观看| 日韩不卡高清视频| 婷婷六月综合| 日本高清在线看免费观看| 日韩中文无码av超清| 色婷婷丁香| 免费无码AV片在线观看国产| 欧美久久网| 亚洲妓女综合网995久久| 亚洲性日韩精品一区二区| 精品国产Av电影无码久久久| 国产精品欧美日本韩免费一区二区三区不卡| 中文精品久久久久国产网址| 奇米精品一区二区三区在线观看| 国产大片黄在线观看| 中文字幕久久亚洲一区| 视频国产精品丝袜第一页| 小蝌蚪亚洲精品国产| a亚洲天堂| 日本国产一区在线观看| 狠狠ⅴ日韩v欧美v天堂| 韩国v欧美v亚洲v日本v| 亚洲国产精品不卡在线| 久久久久人妻一区精品| 成人在线不卡视频|