999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

用Python對常用字進行多維度特征分析

2020-04-01 15:08:07溫且姆·薩迪克布合力齊姑麗·瓦斯力熱依漢古麗·薩迪克木合塔爾·沙地克
教育教學論壇 2020年10期

溫且姆·薩迪克 布合力齊姑麗·瓦斯力 熱依漢古麗·薩迪克 木合塔爾·沙地克

摘要:文章用Python實現對常用字的詞性、拼音、韻母與聲調之間的多維度特征分析,從開發環境搭建開始詳細介紹了每個步驟和代碼。

關鍵詞:Python;Jieba;python-docx-master;python-pinyin-master

中圖分類號:G642.0? ? ?文獻標志碼:A? ? ?文章編號:1674-9324(2020)10-0120-02

一、環境的搭建

用Python對漢字進行分析不僅要安裝Python開發環境,還需要安裝Python中文分詞組件jieba,Python Word文本處理組件python-docx-master,Python處理漢字轉拼音組件python-pinyin-master。本文用Anaconda Spyder作為開發環境,從相關網站下載以上各組件壓縮包,解壓到工作目錄,在命令行分別進入各組件解壓目錄,執行python setup.py install即可完成環境的準備。

二、主要代碼解釋

(一)引入相關組件,并以gb18030編碼格式打開常用字txt文件

(引入相關組件代碼略)

#打開常用字txt文件

text=open('sys_Char2500.txt',encoding='gb18030').read()

#從text中篩選字符部分

char_changyong=[char for char in text if char.isalpha()]

(二)定義一個函數,獲取漢字的詞性,把詞性英文簡稱轉換中文名稱

def get_peg(arg):

#獲取arg的詞性

pegc=peg.cut(arg)

flag2=''

#把詞性英文簡稱轉換漢字名稱

for peg1,flag1 in pegc:

if 'n' == flag1[0]:

flag2='名詞'

elif 't' == flag1[0]:

flag2='時間詞'

else:

flag2=flag1

return flag2

(三)獲取漢字的詞性、拼音和韻母特征,把他們存儲在一個詞典里,并進行排序統計

for char in char_changyong:

#獲取漢字帶聲調的拼音

yin3=''.join(lazy_pinyin(char,style=Style.TONE3))

#獲取漢字不帶聲調的拼音

pyin=''.join(lazy_pinyin(char))

#獲取漢字的韻母

yunm=''.join(lazy_pinyin(char,style=Style.FINALS))

#把以上獲取的特征存放在詞典和列表里

char_flag_dict[char]=(tone,pegc,pyin,yunm)

(四)對漢字的詞性與聲調進行統計分析,將統計結果存入Document對象的表格中

#游歷所有詞性統計列表

for pegc,count in pegc_all_count:

#游歷存放漢字特征的詞典

for char,val in char_flag_dict.items():

if pegc == val[1]:

tones = tones + str(val[0])

chars = chars + str(char)

pegc_tones[pegc]=tones

#定義Document對象

doc_new = Document()

doc_new.add_heading('一、詞性統計:',0)

#定義表格

table = doc_new.add_table(rows=1,cols=8)

hdr_cells = table.rows[0].cells

#創建表格列名

hdr_cells[0].text = '序號'

#對漢字的詞性與聲調進行統計

#將統計結果存入表格中

for key,val in pegc_tones.items():

len_tones=len(pegc_tones[key])

count=Counter(pegc_tones[key])

row_cells = table.add_row().cells

row_cells[0].text = str(i)

(五)對漢字的拼音與聲調進行統計分析,將統計結果存入Document對象的表格中

#游歷所有拼音統計列表

for pyin,count in pyin_all_count:

#游歷存放漢字特征的詞典

for char,val in char_flag_dict.items():

if pyin == val[2]:

tones = tones + str(val[0])

chars = chars + str(char)

pyin_tones[pyin]=tones

#添加標題

doc_new.add_heading('二、拼音統計:',0)

#定義表格

table = doc_new.add_table(rows=1,cols=8)

hdr_cells = table.rows[0].cells

hdr_cells[0].text = '序號'

#對漢字的拼音與聲調進行統計

#將統計結果存入表格中

for key,val in pyin_tones.items():

len_tones=len(pyin_tones[key])

count=Counter(pyin_tones[key])

row_cells = table.add_row().cells

row_cells[0].text = str(i)

row_cells[7].text = str(count6)

(六)對漢字的韻母與聲調進行統計分析,將統計結果存入Document對象中

#游歷所有韻母統計列表

for yunm,count in yunm_all_count:

#游歷存放漢字特征的詞典

for char,val in char_flag_dict.items():

if yunm == val[3]:

tones = tones + str(val[0])

chars = chars + str(char)

yunm_tones[yunm]=tones

#添加標題

doc_new.add_heading('三、韻母統計:',0)

#創建表格

table = doc_new.add_table(rows=1,cols=8)

hdr_cells = table.rows[0].cells

hdr_cells[0].text = '序號'

#對漢字的韻母與聲調進行統計

#將統計結果存入表格中

for key,val in yunm_tones.items():

count=Counter(yunm_tones[key])

len_tones=len(yunm_tones[key])

row_cells = table.add_row().cells

row_cells[0].text = str(i)

row_cells[7].text = str(count6)

(七)把統計結果存入Word文檔中,用于下一步分析

doc_new.save('漢字統計分析.docx')

Multi-dimensional Feature Analysis of Common Words with Python

Wynchem Sadiq1,Buzhiguri Vasley2,Hayhanguri Sadiq3,Muhtar Shadick4

(1.Kashgar Shule County Secondary Vocational and Technical School,Kashgar,Xinjiang 844200,China;

2.College of Mathematics and Science,Xinjiang Institute of Education,Urumqi,Xinjiang 830043,China;

3.Hanan Like Town Middle School,Kashgar Shule County,Kashgar,Xinjiang 844207,China;4.Education Management Information Center of Xinjiang Uygur Autonomous Region,Urumqi,Xinjiang 830049,China)

Abstract:In this paper,Python is used to analyze the multi-dimensional features of common characters,such as part of speech,pinyin,vowel and tone.Start with the development environment building and introduce each step and code in detail.

Key words:Python;Jieba;python-docx-master;python-pinyin-master

主站蜘蛛池模板: 伊人色婷婷| 国产在线精品香蕉麻豆| 国产精品人人做人人爽人人添| 国内精品小视频在线| 国产毛片一区| 日韩欧美国产区| 国产一区二区免费播放| 91av国产在线| 久久香蕉国产线| 亚洲日韩精品伊甸| a毛片在线播放| 国产丝袜91| 色综合久久久久8天国| 91色国产在线| 偷拍久久网| 国产精品高清国产三级囯产AV| 91免费在线看| 久久精品国产电影| 亚洲第一视频免费在线| 成人福利在线视频| 无码 在线 在线| 亚洲国产无码有码| 天天躁夜夜躁狠狠躁图片| 国产精品太粉嫩高中在线观看| 欧美在线伊人| 91久久国产热精品免费| 国产成人1024精品下载| 亚欧美国产综合| 国产又色又爽又黄| 久久亚洲精少妇毛片午夜无码| 国产精品亚洲αv天堂无码| 国产成人在线无码免费视频| 麻豆AV网站免费进入| 国产黑丝视频在线观看| 久久永久视频| 成人午夜视频网站| 天天躁日日躁狠狠躁中文字幕| 在线观看国产小视频| 色综合久久久久8天国| 高潮爽到爆的喷水女主播视频 | 性网站在线观看| av色爱 天堂网| 中文字幕第4页| 成人亚洲视频| 日本午夜影院| 国产啪在线| 国产精品无码AV片在线观看播放| 色有码无码视频| 国产免费久久精品99re不卡| 国产精品55夜色66夜色| 日韩国产黄色网站| www.av男人.com| 亚洲成A人V欧美综合| 日韩欧美成人高清在线观看| 亚洲欧美一区二区三区麻豆| 午夜久久影院| 国产成人1024精品| 国产香蕉一区二区在线网站| 免费毛片网站在线观看| 久久人妻系列无码一区| 真人免费一级毛片一区二区| 国产草草影院18成年视频| 天天综合天天综合| 久久免费视频6| 欧美午夜在线视频| 日韩av无码精品专区| 国产成人做受免费视频| 久久久国产精品无码专区| 亚洲综合18p| 无码精品国产dvd在线观看9久| 一区二区偷拍美女撒尿视频| 67194亚洲无码| 日本影院一区| 国产日韩欧美视频| 国产粉嫩粉嫩的18在线播放91| 国产精品污视频| 国产交换配偶在线视频| 波多野结衣久久高清免费| 国产亚洲精品97在线观看| 一级毛片在线播放免费观看| 欧美翘臀一区二区三区| 欧美激情第一区|