摘要:Lasso方法與其他特征選擇一樣,對高維海量或高維小樣本數據集的特征選擇容易出現計算開銷過大或過學習問題(過擬合)。為解決此問題,提出一種改進的Lasso方法:迭代式Lasso方法。迭代式Lasso方法首先將特征集分成k份,對第一份特征子集進行特征提取,將所得特征加入第二份,再對第二份特征進行特征提取;然后將所得特征加入第三份,依次迭代下去,直到第K份,得到最終特征子集。實驗表明.迭代式Lasso方法能夠很好地對高維海量或高維小樣本數據集進行特征選擇,是一種有效的特征選擇方法。目前,此方法已經很好地應用在高維海量和高雛小樣本數據的分類或預測模型中。