吳云鵬,崔佳旭,張永剛
(吉林大學 計算機科學與技術學院,符號計算與知識工程教育部重點實驗室,長春 130012)
近年來,群智能算法由于其收斂速度快、具有良好的適應性等特點,在工業調度[1]、網絡服務優化[2]等領域應用廣泛.目前較流行的新型群智能算法主要有:差分進化(differential evolution,DE)算法[3]、遺傳(genetic algorithms,GA)算法[4]、粒子群優化(particle swarm optimization,PSO)算法[5]、蟻群優化(ant colony optimization,ACO)算法[6]、TLBO(teaching-learning-based optimization)算法[7-9]等.TLBO算法是一種模擬班級教學過程的新型智能算法.由于TLBO算法具有參數少、易實現、收斂速度快等優點[10],因此在機械參數設計[8]、連續函數優化[9]、平面鋼架設計[11]等方面應用廣泛.為進一步提高TLBO算法的性能,目前已有許多研究對其進行了改進,其中影響力最大的是ETLBO(elitist teaching-learning-based optimization)算法[12].在ETLBO算法中,根據成績對學生進行排序,拋棄表現較差的學生,從而使算法一直向當前最優方向搜索.
本文針對ETLBO算法進行改進,通過引入獎勵制度,給出相應的ETLBO-reward算法.在ETLBO-reward算法中,學生在“學”階段能盡可能地選擇表現更優的個體進行學習,從而提升算法的收斂能力.在ETLBO-reward算法的基礎上,本文又提出一種簡單的自適應精英個數策略——隨機精英數策略,并提出了帶獎勵制度的自適應精英個數算法RETLBO-reward.最后,在RETLBO-reward算法的基礎上又給出了一種離散的TLBO算法——D-RETLBO-reward.
在TLBO算法中,將一組學生定義為一個種群.學生學習的科目對應經典優化問題中的決策變量,學習效果則對應優化問題中的適應度函數值.一個種群中學習效果最好的學生被定義為教師.決策變量包含在指定優化問……