姜海富 于化龍 韋 磊
(江蘇科技大學計算機學院 鎮江 212114)
隨著大數據數據量越來越多,給各行各業帶來無限想象力和商業應用價值,尤其是在體育領域。足球比賽作為體育領域熱門的項目,伴隨國內足球氛圍不斷濃厚,足球領域內的各個細分領域也快速發展,足球比賽大數據就是其中之一[1]。目前存在大量熱愛足球的群眾對下一場比賽的結果進行預測,并且通常個人預測對所支持的球隊進行支持。但足球比賽結果因為其的不確定性,即使專家也很難能夠預測下一場比賽勝負[2]。從足球比賽體育大數據的挖掘中發現,足球比賽對于賽果預測的困難,主要是由于足球比賽的結果含有眾多影響因素,例如團隊合作、個人技能、天氣、主場優勢等,很難預料足球比賽的實際結果[3]。即使比賽沒有任何傷害或沒有加時發生,運氣也可能是影響足球比賽結果的一個因素,因此強隊并不一定會贏弱隊。也正是由于足球比賽影響因素多種多樣,比賽情況紛繁復雜,給足球比賽關聯分析更多研究的價值,也給商業界更多的興趣、體育界更多的精力去探索沒有接觸到的特征信息。
當前針對足球比賽預測研究方法眾多,但是對于賽后影響因素分析相對較少,且多見于傳統、簡單統計分析,不能夠從多角度多方面比較價值影響因素[4]。Marcelino R[5]等通過多變量分析中評估賽前因素的組合及其與賽果(贏/輸)的關系,采用預測性機器學習模型(ML)對澳大利亞足球聯賽比賽(AFL)結果預測分析,表明使用ML 方法能提供最大限度地提高獲勝機會的預測變量層次,還能夠預測AFL比賽的結果,為比賽關聯分析提供了一種新的方案啊?!?br>