韓 笑,畢 波,,唐錦萍,曹 莉
(1.東北石油大學 數學與統計學院,黑龍江 大慶 163318;2.海南醫學院公共衛生學院,海南 海口 571101;3.黑龍江大學 數據科學與技術學院,黑龍江 哈爾濱 150080)
當今時代,乳腺癌已成為女性最為常見的惡性腫瘤,其發病率在全球范圍內均持續增長,每年的確診人數約高達28萬,具有較高的死亡率,并且越來越傾向于年輕化。臨床研究表明,乳腺癌的演變過程大致可以概括為五個步驟,由一開始乳腺的良性病變,之后乳腺良性增生,乳腺不典型增生,再到后來的乳腺原位癌,到最后的浸潤性的乳腺癌,但并不是所有的患者都一定會按照這樣的規律逐漸演變,有時在臨床當中也可能會發現跳躍式的演變。因此,要想預防乳腺癌或得到早期的治療,就必須及早地進行檢測,發現異常,采取相應的應對措施。
核零空間算法作為一種單分類算法,經常用來進行異常檢測。起初它是源于線性判別分析(LDA)的,利用最大化Fisher準則的思想,將所有的樣本點通過某種線性變換(即FST變換),達到最小化類內散度,最大化類間散度的目的。之后將類內距離變為0,提出了零空間變換(即NFST變換)。但是,這兩種變換都是僅僅考慮了數據的線性特征,而數據往往還存在許多非線性特征,因此提出了該變換的核化方法,即KNFST變換。首先利用核函數將數據進行非線性映射變換到高維空間,然后再利用NFST變換思想,提取使得類內散度為0,且類間散度最大的特征方向,即提取零投影方向。……