豆增發 高琳
摘要:針對生物醫學文本挖掘中有效特征選擇困難的問題,提出了一種新的基于膜粒子群優化和信息熵的文本特征選擇方法,該方法以文本信息熵總和為目標函數,以膜系統的層次結構作為框架,以膜系統的消息傳遞機制作為進化方向,以粒子群優化進化作為進化規則,作為進化規則的粒子群優化算法,分別以局部搜索速率和全局搜索速率搜索得到文本信息熵最大的解,并在不同膜區域之間傳遞搜索結果,直到膜區域之間的消息傳遞結束或者達到限定的迭代次數,實驗結果表明,利用提出的方法對醫學文本特征進行選擇后,對其進行分類,能使分類精確度和召回率分別提高2%和3%左右。
關鍵詞:膜系統;粒子群優化;生物醫學文本;特征選擇;信息熵