999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于身高和拃長數(shù)據(jù)的性別分類研究

2016-09-21 06:53:46王澤昕陜西省商洛中學(xué)
科學(xué)中國人 2016年24期
關(guān)鍵詞:模式識別分類

王澤昕陜西省商洛中學(xué)

基于身高和拃長數(shù)據(jù)的性別分類研究

王澤昕
陜西省商洛中學(xué)

本文以身高和拃長②數(shù)據(jù)為特征,對男女性別進(jìn)行分類,采用的分類方法為最小錯誤率貝葉斯決策。本文統(tǒng)計(jì)了樣本數(shù)為25時的決策分類詳細(xì)結(jié)果,并研究了樣本數(shù)為5~50時錯誤率的變化趨勢。研究結(jié)果表明,以身高和拃長數(shù)據(jù)為特征時,能夠較為有效地區(qū)分出男女性別,且當(dāng)訓(xùn)練集樣本數(shù)量逐漸增大時,錯誤率顯現(xiàn)出逐漸減小的趨勢。

性別分類;模式識別;貝葉斯決策;Matlab編程

1.引言

模式識別(也稱模式分類)是指對表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過程,是信息科學(xué)和人工智能的重要組成部分,被廣泛運(yùn)用與文字識別、語音識別、指紋識別、遙感、醫(yī)學(xué)診斷等領(lǐng)域。

性別分類是模式識別領(lǐng)域中廣受關(guān)注的一個問題,它能體現(xiàn)男女性別在某些方面的差異,為人體生理學(xué)和心理學(xué)等方面研究提供理論基礎(chǔ)和數(shù)據(jù)支持。目前,已有學(xué)者進(jìn)行了人臉特征性別分類[1][2]、社交媒體使用習(xí)慣的性別分類[3]、觸覺經(jīng)驗(yàn)性別分類[4]、基于語音的性別分類[5]、基于頭發(fā)信息的性別分類[6]、基于步態(tài)的性別分類[7]等。

本論文將研究利用人體某些數(shù)值型的生理數(shù)據(jù)(身高與手掌長度)進(jìn)行分類,以探索出性別分類的簡易、方便的模型和方法,同時加深人們對男女性別與生理特征之間的關(guān)系的理解。模式識別包含許多種分類方法,能夠?qū)υS多領(lǐng)域的問題進(jìn)行數(shù)據(jù)處理和分析。本課題采用最小錯誤率貝葉斯決策方法,以人體的身高和拃長數(shù)據(jù)為特征,對數(shù)據(jù)集進(jìn)行性別分類。本課題的特征數(shù)據(jù)易于搜集和處理,且分類錯誤率較低,有力地體現(xiàn)了男女性別在這兩種體征上的差異性。

2.分類方法介紹

分類可以看成一種決策過程,也即我們根據(jù)對樣本的觀測做出其應(yīng)歸屬哪一類的決策[8]。我們采用的分類方法為最小錯誤率貝葉斯決策。下面我們將詳細(xì)介紹最小錯誤率貝葉斯決策的決策原理。

在這里,我們僅討論兩類的情況:記類別為ω1和ω2,假設(shè)現(xiàn)在我們已知數(shù)據(jù)的特征x,用P(ω1|x)和P(ω2|x)分別表示此時兩類的后驗(yàn)概率。所謂后驗(yàn)概率,是指某事件已經(jīng)發(fā)生,要求該事件發(fā)生的原因是由某個因素引起的可能性的大小。例如,此處的P(ω1|x)和P(ω2|x)分別表示,在已知我們觀測到數(shù)據(jù)特征為x時,造成我們觀測到特征為x的原因分別是由于該數(shù)據(jù)屬于ω1和ω2的概率。

根據(jù)貝葉斯公式,我們可以將P(ωi|x)(i=1,2)表示為:

其中P(ωi)(i=1,2)為ω1和ω2這兩類的先驗(yàn)概率。所謂先驗(yàn)概率,就是在事件還沒有發(fā)生,要求這件事情發(fā)生的可能性的大小。在此處,先驗(yàn)概率P(ωi)(i=1,2)是指我們還沒有開始進(jìn)行觀測樣本時,ω1類和ω2類的概率。通常可以用預(yù)先知道的知識(例如ω1類和ω2類的數(shù)量占比)來得到。

在一般的模式識別問題中,我們往往希望盡量減少分類的錯誤率,即目標(biāo)是追求最小錯誤率。從這一目標(biāo)要求出發(fā),利用(2-1)中的貝葉斯公式就能得出使得錯誤率最小的分類決策,稱之為最小錯誤率貝葉斯決策。最小錯誤率貝葉斯決策可描述為:

P(x|ωi)(i=1,2)的具體值可由訓(xùn)練集數(shù)據(jù)在一定分布假設(shè)下求得。通常我們可認(rèn)為人群中的身高和拃長分布滿足正態(tài)分布,雙變量正態(tài)分布聯(lián)合概率密度函數(shù)公式為如下:

其中-∞<x,y<+∞;-∞<μ1,μ2<+∞;σ1,σ2>0;-1≤ρ≤1。其中μ1,μ2分別為x和y的均值,σ12,σ22分別為x和y的方差,ρ為x 和y的相關(guān)系數(shù)。

3.研究方案設(shè)計(jì)

3.1數(shù)據(jù)集說明

本課題所采用的數(shù)據(jù)集來自于賓夕法尼亞州立大學(xué)Mind on Statistic公開數(shù)據(jù)庫①。該數(shù)據(jù)集包含167名大學(xué)生的身高(單位:英寸)與拃長數(shù)據(jù)(單位:厘米),其中女性89名,男性78名。

我們在數(shù)據(jù)集中隨機(jī)挑選一定數(shù)目的數(shù)據(jù)作為訓(xùn)練集(訓(xùn)練集中男女性別數(shù)量一致),而測試集為整個原始數(shù)據(jù)集。我們首先選取了樣本數(shù)為25的訓(xùn)練集,對最小錯誤率貝葉斯分類器進(jìn)行訓(xùn)練,得到參數(shù)。為了研究訓(xùn)練集大小對分類效果的影響,我們研究并記錄了訓(xùn)練集大小為5~50的情況下分類錯誤率,并繪制了錯誤率隨訓(xùn)練集大小變化的趨勢圖,具體結(jié)果見第4章。

3.2整體錯誤率的計(jì)算

整體錯誤率的計(jì)算公式如下:

也即整體錯誤率是各類錯誤率的加權(quán)平均和,各類的錯誤率的權(quán)重即為該類的先驗(yàn)概率。其中P(ω1)和P(ω2)分別代表ω1類和ω2類的先驗(yàn)概率,e1和e2分別代表ω1類和ω2類的分類錯誤率。e1與e2的計(jì)算公式如下:

3.3仿真環(huán)境介紹

在本課題中,我們采用MATLAB作為仿真環(huán)境。MATLAB是美國Math Works公司出品的商業(yè)數(shù)學(xué)軟件,在數(shù)值計(jì)算方面具有強(qiáng)大的能力,被廣大科研人員和工程技術(shù)人員所采用。我們主要用MATLAB的m文件編程功能來進(jìn)行數(shù)據(jù)的預(yù)處理、最小錯誤率貝葉斯分類器的建立以及決策分類過程的實(shí)現(xiàn)。

3.4 MATLAB程序設(shè)計(jì)框架

本課題的MATLAB程序設(shè)計(jì)思路及流程如下:

(1)數(shù)據(jù)預(yù)處理。首先將公開數(shù)據(jù)集導(dǎo)入到Excel表格中,然后利用MATLAB的m文件編寫讀取數(shù)據(jù)的函數(shù),將數(shù)據(jù)讀取到MATLAB工作空間中。

(2)設(shè)定訓(xùn)練樣本數(shù)量,從數(shù)據(jù)集中隨機(jī)選取一定數(shù)目的樣本作為訓(xùn)練集。根據(jù)訓(xùn)練樣本計(jì)算公式(2-3)中的μ1,μ2,σ12,σ22,ρ,以便后續(xù)建立最小錯誤率貝葉斯分類器。

(3)根據(jù)(2)中計(jì)算結(jié)果,結(jié)合(2-3)可得P(x|ωi)(i=1,2)的表達(dá)式,并結(jié)合(2-2)建立最小錯誤率貝葉斯分類器。

(4)利用(3)中建立的最小錯誤率貝葉斯分類器,對測試集每個樣本進(jìn)行決策分類,決策分類的依據(jù)為(2-2)。

(5)利用公式(3-2)和公式(3-3)計(jì)算ω1類和ω2類的錯誤率,并利用公式(3-1)計(jì)算整體錯誤率,以判斷決策效果。先驗(yàn)概率P (ω1)和P(ω2)均取0.5,即默認(rèn)男女比例為1:1。這和我們的日常生活經(jīng)驗(yàn)是一致的。

(6)改變樣本大小,將樣本大小從5取到50,分別統(tǒng)計(jì)不同樣本大小下的的整體錯誤率。

4.決策分類結(jié)果

我們采用Matlab建立最小錯誤率貝葉斯分類器,首先在樣本大小為25的情況下進(jìn)行決策分類。決策分類中間過程參數(shù)值及最終錯誤率見表4.1。

表4.1 樣本數(shù)為25時的決策分類結(jié)果記錄表

接下來,我們對訓(xùn)練集大小為5~50的情況進(jìn)行了分類,共計(jì)46次分類實(shí)驗(yàn)。為了減小數(shù)據(jù)隨機(jī)噪聲的影響,在每次分類實(shí)驗(yàn)中,我們進(jìn)行了共計(jì)10次測試,并統(tǒng)計(jì)每次測試的錯誤率,而后求取平均值,作為最終的錯誤率。46次實(shí)驗(yàn)對應(yīng)的錯誤率與訓(xùn)練集大小之間的關(guān)系記錄如表4.2,變化趨勢圖如圖4.1:

表4.2 樣本數(shù)為5~50時的決策分類結(jié)果記錄表

由表4.2和圖4.1可見,分類錯誤率隨著訓(xùn)練集的增大有減小的趨勢。

5.總結(jié)

性別分類是模式識別領(lǐng)域中廣受關(guān)注的一個問題,它能體現(xiàn)男女性別在某些方面的差異,為人體生理學(xué)和心理學(xué)等方面研究提供理論基礎(chǔ)和數(shù)據(jù)支持。本文采用最小錯誤率貝葉斯決策方法,利用賓夕法尼亞州立大學(xué)Mind on Statistic公開數(shù)據(jù)庫的數(shù)據(jù)集,對身高和拃長數(shù)據(jù)集進(jìn)行性別分類。本課題的算法實(shí)現(xiàn)相對簡單,且數(shù)據(jù)易于搜集和處理,分類結(jié)果較為明顯。同時,我們發(fā)現(xiàn),分類錯誤率隨著訓(xùn)練集的增大有減小的趨勢,說明在有條件的情況下應(yīng)選取盡可能多的數(shù)據(jù)作為訓(xùn)練集。

注釋:

①Data Sets for Mind on Statistics(Utts and Heckard):http:// sites.stat.psu.edu/~rho/mindon/readme.htm l

②拃長:指一個人張開大姆指和中指(或小指)兩端的距離。

[1]趙海英,楊一帆,徐正光.基于多角度LBP特征的三維人臉性別分類[J].自動化學(xué)報(bào),2012,09:1544-1549.

[2]武勃,艾海舟,肖習(xí)攀,徐光祐.人臉的性別分類[J].計(jì)算機(jī)研究與發(fā)展,2003,11:1546-1553.

[3]王晶晶,李壽山,黃磊.中文微博用戶性別分類方法研究[J].中文信息學(xué)報(bào),2014,06:150-155+168.

[4]崔倩,葉浩生.觸覺經(jīng)驗(yàn)對性別分類的影響:具身的視角[J].廣州大學(xué)學(xué)報(bào)(社會科學(xué)版),2013,03:41-45.

[5]高原.基于性別分類的說話人識別研究[D].江蘇師范大學(xué),2012.

[6]劉爽,謝金融,呂寶糧.基于頭發(fā)信息的性別分類[J].計(jì)算機(jī)仿真,2009,02:212-216.

[7]余美霞.基于步態(tài)的性別分類研究[D].北方工業(yè)大學(xué),2013.

[8]張學(xué)工.模式識別[M].第三版.北京:清華大學(xué)出版社,2010:13-13.

王澤昕(1999-),男,漢族,陜西省商洛人,就讀于陜西省商洛中學(xué),高中在讀,研究方向機(jī)械自動化與智能系統(tǒng)。

猜你喜歡
模式識別分類
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
紫地榆HPLC指紋圖譜建立及模式識別
中成藥(2018年2期)2018-05-09 07:19:52
教你一招:數(shù)的分類
淺談模式識別在圖像識別中的應(yīng)用
電子測試(2017年23期)2017-04-04 05:06:50
第四屆亞洲模式識別會議
可拓模式識別算法中經(jīng)典域的確定方法
給塑料分分類吧
主站蜘蛛池模板: 日韩国产精品无码一区二区三区| 青青国产在线| 久久男人视频| 99精品久久精品| 国产女人18水真多毛片18精品 | 一级毛片在线播放| 色亚洲成人| 亚洲中文字幕国产av| 日本人妻一区二区三区不卡影院| 国产一级裸网站| 婷婷六月激情综合一区| 萌白酱国产一区二区| 青草国产在线视频| 国内精品91| 在线五月婷婷| 亚洲成人黄色在线| 国产亚洲日韩av在线| 一级黄色网站在线免费看| 國產尤物AV尤物在線觀看| 真实国产精品vr专区| 中文字幕一区二区人妻电影| 99久久99视频| 亚洲丝袜第一页| 久久久久免费看成人影片| 爱做久久久久久| 亚洲欧美日韩中文字幕一区二区三区 | 国产18页| 漂亮人妻被中出中文字幕久久| 久久毛片免费基地| 亚洲v日韩v欧美在线观看| 欧美日韩一区二区三区四区在线观看| 午夜视频免费一区二区在线看| AV老司机AV天堂| 91精品国产一区自在线拍| 无码国产伊人| 99九九成人免费视频精品| 一级全免费视频播放| 亚洲无码熟妇人妻AV在线| 美女免费黄网站| 欧美日韩国产精品综合| 欧美人人干| 黄色网在线| 久久国产拍爱| 91精品久久久久久无码人妻| 午夜小视频在线| 麻豆国产在线不卡一区二区| 精品久久蜜桃| 国产成人一区免费观看| 亚洲成a人在线观看| 91久久国产成人免费观看| 人妻无码一区二区视频| 亚洲综合久久一本伊一区| 中国成人在线视频| 免费又爽又刺激高潮网址| 噜噜噜久久| 精品国产中文一级毛片在线看| 欧美无专区| yjizz视频最新网站在线| 美女无遮挡免费网站| а∨天堂一区中文字幕| 亚洲成人在线播放 | 国产在线专区| 在线免费无码视频| 2020国产精品视频| 成人国产精品一级毛片天堂| 亚洲福利片无码最新在线播放| 欧美中文字幕在线视频| 国产正在播放| 久久综合五月婷婷| 91麻豆久久久| 成人一级黄色毛片| 毛片一级在线| 91午夜福利在线观看精品| 日韩欧美中文| 手机在线看片不卡中文字幕| 亚洲免费黄色网| 亚洲成人福利网站| 国产香蕉国产精品偷在线观看 | 天堂成人在线| 日韩在线中文| 国模粉嫩小泬视频在线观看| 国产精品主播|