999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據背景下基于位置數據的足球戰術分析方法及發展趨勢

2021-09-20 09:15:22王澤軍游松輝
上海體育學院學報 2021年9期
關鍵詞:比賽分析

王澤軍,游松輝

(同濟大學國際足球學院,上海200092)

提高足球運動員的比賽表現水平是訓練的出發點和最終目標。足球運動表現分析對實現訓練目標、糾正訓練偏差、改進訓練和比賽策略有著重要作用。足球運動表現系統構成較為復雜,它不僅是體能、技戰術能力、智能的綜合體現,在比賽策略、戰術、隊友、位置、對手、場地、氣候等多種因素影響下,比賽的技戰術表現經常處于動態變化之中[1-2]。雖然鏟球、控球、傳球以及跑動距離這些傳統的事件數據(event data)可以提供許多具體的信息,但它們幾乎不能提供關于比賽最終結果的線索。戰術才是足球比賽獲勝的核心要素。高水平戰術能力對于足球運動員在比賽中的表現至關重要。隨著球員跟蹤技術的進步,比賽數據的質量已經達到足球戰術分析的要求,并促進足球戰術分析方法的發展。尤其是位置數據可以非常準確地反映每名球員以及球的位置,這將有助于識別足球比賽中的戰術模式[3]。因此,本文首先概述足球戰術與位置數據的出現,隨后詳細論述基于位置數據的足球戰術分析方法的研究成果,如球隊中心法、空間控制法、網絡分析法和機器學習算法。然而,位置數據只能提供單一空間模式的大數據,在大數據背景下足球戰術分析需要整合多種不同來源的詳細數據。鑒于此,筆者通過在足球戰術分析中引入大數據技術棧和深度學習技術,試圖較為全面地描繪該領域的研究圖景,以及這些研究的內在聯系和發展趨勢。

1 足球戰術與位置數據

1.1 足球戰術概述

對于競技足球而言,比賽的目標是贏得勝利,選擇一種合適的戰術對于賽前準備工作至關重要。在分析戰術行為時,戰術的概念被一些研究者定義為球員為適應動態變化的比賽情況而采取的行動[4]。還有研究者試圖把戰術與戰略區分開來,認為戰略可以被描述為在考慮可用信息的影響之后預先計劃的比賽要素。從這個角度看,戰術和戰略的不同之處在于二者與時間的關系。戰略執行時允許更長時間的計劃和深思熟慮,而戰術行為是在強大的時間壓力下做出的。戰術決定了一支球隊如何管理空間、時間和個人行動來贏得比賽。在此情境中,空間是指球場上發生的特定行動,或球隊在進攻和防守期間想要覆蓋的球場區域。時間描述的是諸如事件的頻率和持續時間(如控球)或啟動動作的速度。個人行動指定了正在執行的動作類型,如失誤、傳中和傳球。根據參賽球員數量可以將其進一步劃分為個人戰術、小組戰術、球隊戰術和比賽戰術。個人層面的戰術行為分析可以是研究1名球員與其對手或隊友之間的運動關系,如1名邊后衛盯防1名邊鋒或2名中后衛的互動。在小組層面,可以分析選定的1組球員的球隊戰術運動,如后衛線通過一致移動制造越位“陷阱”。在球隊層面,戰術行為分析可以捕獲所有球員團隊行動的變量,如對球隊占用的空間進行分析。在比賽層面上的戰術行為可以通過考察2支對抗球隊之間團隊行動的互動進行研究,如球隊間的距離。在某些情況下,戰略的成功取決于在不同組織層面上的戰術成功。

為了確保所有層面上戰術的成功執行,教練員需要考慮球隊和對手的狀態,以及諸如主客場比賽,甚至天氣等外部因素[5]。球隊為達到特定的目標,使用預先設計好的空間陣型作為戰術。教練員需要了解球隊陣型保持一致的時間比例,以及球隊在什么情況下被迫改變陣型。在為與今后的對手比賽做準備時,對陣型的使用和陣型變化時期的理解也很重要。陣型是球員場上的位置,即相對于其他物體(如球場邊界或球門、隊友或對手)的位置。一方面,在空間上陣型可以是固定的,即球員在比賽區域內的特定位置。另一方面,在空間上陣型可能會發生變化,但在球員之間保持穩定的相對方向,如后衛線在球場上的整體移動。此外,在陣型中扮演特定角色的球員可以通過換人明確地轉換角色,也可以根據戰術需要動態地轉換角色[6]。總之,足球運動表現可以被描述為一個復雜過程的結果,這個過程包括在比賽前做出的戰略決策和在比賽進程中不同組織層面執行的戰術行為。

1.2 位置數據的出現

事件數據是量化和評估個人和團隊表現的標準來源,它包括在整個比賽中所發生事件的頻率、比例和其他累積表現指標。近年來戰術決策變得更為復雜,因而教練員的戰術能力也受到公眾的密切關注[7]。評估競技足球戰術行為和球隊整體表現的傳統標準通常基于個人博弈視角[5,8]。相關領域專家(如教練員、球探)通過觀察一場比賽,根據個人經驗對球隊戰術進行評估。然而,定性的博弈視角缺乏客觀性和系統性,如結構化和綜合性,憑觀察者的主觀印象,分析過程非常緩慢(4~6 h),且需要利用專家的經驗和訣竅[1],以及更多自動的定量方法分析競技足球的戰術行為。由于球員跟蹤技術的進步,如半自動化計算的視覺系統、全球定位系統和基于無線電波的跟蹤系統的運用增多,比賽數據在可用性方面呈現增長趨勢[2]。位置跟蹤系統以每秒25幀的速度確定22名球員和球的x坐標和y坐標(平行于邊線),這相當于每場比賽中每個對象約有13.5萬個位置,所有球員和球的位置總計約有310萬個[9]。

戰術變量通常與球員的位置、距離、空間和數值關系有關。球員的位置坐標是戰術分析的基礎。從數學的視角看,球員的球場位置可以用笛卡爾坐標(x坐標和y坐標)精確地確定。通過收集到的數據,從比賽動態中產生的比賽時空模式可以提供關于足球運動表現的新信息。在實際應用中,位置坐標可以作為數據可視化的一種形式生成熱圖或點圖。這可以用來理解個人、小組球員或一個團隊的特征運動模式[4]。這里以x-y坐標的形式實時顯示所有球員的位置,所獲得的數據被稱作位置數據或跟蹤數據[3]。一方面,對位置數據的評估會有明顯的速度優勢(從6~8 h減少為數分鐘)。另一方面,與事件數據相比,位置數據體量大、多樣、精準,可以為體育可視化研究者提供詳細的數據集。可視化既是數據分析的關鍵技術,也是數據分析結果呈現的關鍵技術[10-11]。位置數據不僅可以用于制訂、描述和理解比賽動態的團隊表現指標,還可以用于探索關鍵事件發生前的動態模式,如得分機會和進球。

2 基于位置數據的足球戰術分析方法

傳統的足球戰術分析主要采用符號分析法,使用傳球、控球、搶球或比賽風格等事件數據。它通過對運動行為以及技戰術應用狀況的分析,為探討足球運動的制勝規律或相關打法理論的形成奠定了基礎,通常用來對足球比賽中技戰術指標進行描述性分析[1],其局限在于未考慮情境信息和方法的解釋力較弱。為了避免此類問題,研究者一方面運用多變量的方法保留情境信息,另一方面更多采用計算機視頻分析技術,如球隊中心法、空間控制法、網絡分析法和機器學習算法[12],尤其是基于位置數據識別球員之間的互動模式,探索比賽中出現的時空模式,解釋一些符號分析法無法量化的戰術行為[9]。表1總結了在團隊運動中使用戰術參數進行自動分析的方法。

表1 基于位置數據的戰術表現分析的候選表現指標[9]Table 1 Candidate performance indicators for tactical performance analysis based on position data

2.1 球隊中心法:確定球隊幾何中心

確定球隊中心是在球隊戰術研究中經常使用的一種方法。它代表一組點的幾何中心,這些點代表了在比賽期間球員在場上的位置,但不包括守門員和球的位置。根據定義,它是一支球隊中所有被分析球員的平均x坐標和y坐標。這個變量可以被單獨分析,也可以通過進一步處理研究其他戰術行為。在比賽過程中,球隊中心之間存在很強的耦合性,球場尺寸變化導致中心距離改變,而像射門這樣的關鍵比賽事件伴有球隊間耦合變異性的增加[12]。例如,2支對抗球隊中心之間的距離經常被用來描述球隊間的距離,但表現出較低的可變性。因此,球員與球隊中心、對手的球隊中心或特定位置的中心(如后衛中心、中場中心和前鋒中心)間距離也被計算為測量位置的一種形式(圖1)。這一舉措使得研究者了解相對于動態團隊(或小組)位置的球員定位,而不是靜態的球場坐標。

球隊離散度是指計算每名球員與最近的對手之間的距離之和,表示沒有對手的整體空間半徑。在比賽層面的分析中,球隊間中心距離量化了2個對手之間的距離,而在個人層面的分析中,最近對手的距離代表了這一概念。因此,這2個變量可以互補使用,從而更全面地表示球隊間從全局到局部的分析距離。雖然單獨分析1支球隊的中心可能無法為表現或行為提供有意義的見解,但可以從不同角度理解球員與球隊之間的動態定位,而且在分析球隊間的互動時也很有價值。在實際應用中,球隊間中心距離和最近對手的距離可以表示2支球隊之間距離的遠近,并提供1支球隊的防守策略信息,如壓迫或防守深度。球隊特定位置的中心間距離有助于量化后衛、中場和前鋒線之間的距離,這有助于教練員確定防守時3條線之間的最佳距離,以及理解進球或阻止得分的過程。

由于足球比賽中的相互作用是復雜的,而從球員位置數據中產生的信號往往是非線性的且帶有干擾,因此,從系統復雜性的角度分析戰術行為的一個關鍵特征是非線性分析。它考慮了球員相互作用的時間序列和動態特性,描述了線性技術無法表示的復雜情況,如均值、標準差和變異系數。非線性分析技術有效測量了戰術行為變量的可預測性和同步性。可預測性的測量對象通常是時間信號的周期性或可重復性模式。這些技術包括近似熵(Approximate Entropy,ApEn)、樣 本 熵、香 農 熵 和 動 態 疊 加[4]。例 如,Memmert等[9]計算隨時間推移中后衛到后衛中心的距離,然后計算該時間序列的ApEn,最后進行聚類分析,將自動得到的ApEn分為高、中、低3個不同可預測性的小組(圖1)。Gon?alves等[13]使用ApEn研究后衛、中場與前鋒線之間和隊內11名球員比賽期間的協調關系。結果表明,3條線球員的中心運動更有規律。因此,ApEn這一度量真正代表的是球隊中心的行為規律本身,它是對團隊行為的一種高度抽象的描述。然而可預測性的測量方法只是比較1個信號和它本身,同步的測量方法可以評估2個或多個不同信號的相似性。這些技術包括相對相位、窗口相關、互相關、跨樣本熵(交叉樣本)、矢量編碼、互信息和聚類相位[4]。在實際應用中,可以利用同步性檢測對方球員之間是否存在盯人,基于對方球隊數據的分析還可以識別在防守時具有同步趨勢的幾組球員。

圖1 球隊陣型和球員到其位置中心之間距離的可預測性[9]Figure 1 Team formation and predictability of distances between players and their positional-centroid

2.2 空間控制法:計算球員所覆蓋的區域

空間控制法是另一種通過計算球員所覆蓋的區域或對球員間距離的各種度量,量化球員在球隊中的分散程度研究球隊戰術的方法。其中最常用的一種比賽空間測量方法是有效比賽空間測量,它使用一種凸殼(convex hull)方法測量比賽外圍隊友的多邊形區域。有效比賽空間也為表面積、覆蓋面積或比賽區域[4]。研究[12]表明:與防守球隊相比,進攻球隊的表面積更大;與經驗不足的球員相比,經驗豐富的球員所覆蓋的區域也更大。另一種更復雜的個人空間的動態計算方法是控制區域法,也稱為泰森多邊形(Voronoi diagram)區域。之前提出的幾種評估競技足球空間控制的方法,從概念上看都是泰森多邊形圖的變體。泰森多邊形圖根據(x,y)坐標球員位置將足球場地細分為單元格[14]。與其他所有球員相比,在一個給定單元格中包含的所有位置都是離各自球員最近的,因此該區域被認為是由該球員控制的。通過累積與球隊相關的單元格,可以估算出球隊控制的總面積。使用控制區域法得到的結果與有效比賽空間測量相近。

在足球運動中,為了控制中場、反擊或有效壓迫對手,團隊運動是不可分割的,球員的協調運動是團隊運動成功的關鍵。因此,對球員在給定時間內到達某一位置的概率進行量化的模型至關重要,該模型被稱為運動模型[15]。Taki等[16]首次提出一種基于球員當前速度、方向和沿不同方向的加速度分布的運動模型,討論了加速度對速度和方向的依賴關系,并強調加速度隨速度的增加而減小。Fujimura等[17]隨后通過增加一個阻力來擴展這種方法,以防止速度無限增長。這極大地簡化了模擬球員移動的物理定律,但模型沒有考慮球員之間的個體差異。Gudmundsson等[18]概述了如何從數據中估計這種個體運動模型。該研究建議在某時刻通過構造一個凸多邊形來模擬1名球員的可到達區域,這個凸多邊形包含球員在這段時間內到達的所有歷史位點,并給出了球員的實際位置。Brefeld等[15]新近提出一種基于位置數據的運動模型估計方法,通過設定球員在給定時間后的初始位置和速度來生成,得到每個速度和時間間隔的可達(x,y)坐標表,并利用核密度估計將這些坐標表轉換成概率運動模型。這種概率方法考慮了球員的特征,用大量的數據進行衡量,并能夠以分布式的方式進行高效計算。總之,之前在優勢區域計算中使用的球員移動函數建模較為簡單,球員的生理約束和先天動力等因素通常被忽略。

控制空間是由每名球員之間的位置和距離決定的。球員的控制區域(或優勢區域)是指在比賽區域中該名球員先于其他所有球員到達的區域[6]。由所有球員的優勢區域導致的細分會將比賽區域劃分為單元格,可以提供1支球隊球員之間時空關系的整體圖景(圖2)。另外,球員的移動會導致優勢區域的合并。1支球隊控制的空間越大就越有“統治力”。優勢區域分析對于計算和評估傳球質量和成功壓制的形成,對團隊行為和互動的分析,乃至于對進攻和防守的組織以及跑位都是必要的。此外,個人比賽區域和優勢區域的變量也提供了球員個人空間的動態值。每名球員的個人區域都是相同的,而對優勢區域的計算是唯一的。守門員和周圍球員在比賽區域具有較大的數值和變異性,導致很難從噪聲中分離出信號。解決這個問題的一種方法是將分析的焦點從比賽層面縮小到較低的層面,例如,Rein等[14]的研究只分析了球隊進攻中的泰森多邊形區域。對于個人比賽區域,需要假設每名球員的比賽區域是均等的,這就對上述分析方法的代表性產生了疑問。因此,最好將這一方法運用于總體層面(球隊或比賽層面)分析。相對于個人層面,更多的研究分析了球隊和比賽層面的比賽空間,這或許是未來研究的一個潛在領域。

圖2 足球比賽情況的泰森多邊形圖示例[14]Figure 2 Example of a Voronoidiagram for a typical game situation in soccer

2.3 網絡分析法:測量球隊的傳球行為

網絡分析法常被用來分析球隊的傳球行為。該方法的基本原理是將球隊中的球員作為頂點,以此為基礎,把每2名球員之間的傳球作為邊。傳球有方向,所以在該模型中所有的邊都是有方向的,而傳球的方向就是有向邊的箭頭指向,球員之間的傳球次數則表示為該邊的權值,如圖3中各邊的方向和數值。根據邊的權值得到頂點的權值,具有競爭角色(中心性)的主要球員很容易通過網絡分析被識別出來,因為他們表現出與其他球員更緊密的聯系[19]。目前的研究主要集中在2類網絡,即傳遞網絡和轉移網絡,分別如圖3的左圖和右圖所示。傳遞網絡可描述為G=(V,E),其中V表示該圖中頂點的集合即球員的集合,E表示邊,即傳球路徑。從球員v1指向v2的路徑為e=(v1,v2),該路徑的權值w(e)表示球員v1成功通過路徑e將球傳遞給球員v2的次數。圖3右圖是在此基礎上加入了結果擴展的轉移網絡,例如,在轉移網絡中的球員C有2次射門和1次控球失誤。

圖3 足球比賽的傳遞網絡(左)和轉移網絡(右)[6]Figure 3 A passing network(left)and a transition network(right)in soccer

網絡分析可以描述每名球員的中心性水平(各個頂點的權值)、球員之間的依賴性(頂點之間的交互)和整支球隊的特定網絡屬性(圖的一般特性)。對傳遞網絡特性的研究中使用最多的測量指標是中心性[6]。在團隊運動中,引入中心性的目的通常是識別關鍵球員或評估球員之間的互動。它包括3個具體的指標:度中心性(degree centrality)、接近中心性(closeness centrality)和 中 介 中 心 性(betweenness centrality)。其中,最常用的指標是度中心性,即與某名球員關聯的相鄰球員的數量。Grund[20]通過分析英超聯賽的760場比賽的進球數發現,整體增加球員間的互動(傳球率)會提高球隊表現,但提升互動中心化會降低球隊表現。根據對2014年足球世界杯賽64場官方比賽的觀察,中場球員被評為最杰出的球員[21]。Clemente等[22]對德國隊詳細分析發現,中場球員具有更高水平的調度能力(球員在場上比賽時將2名或多名隊友聯系在一起的能力)和支配能力(經常參與球隊網絡的能力)。另一項研究[23]分析了導致進球或失球的傳遞序列中的網絡互動,結果表明,進攻中場和邊鋒是最出色的接球手,而右后衛是最主要的傳球手。對球場區域的分析表明,在進攻階段,靠近球門的中心和邊路區域主要影響網絡的互動,從而導致進球。

除自身的度中心性外,每名球員的重要性還與他相鄰近球員的能力緊密相關。例如,PageRank算法作為互聯網網頁重要度的計算方法,最初用于谷歌搜索引擎的網頁排序。事實上,PageRank可以定義在任意有向圖上,后來被應用到社會影響力分析、文本摘要等多個問題。Pe?a等[24]發現運用PageRank算法給每名球員賦的權值約為該球員在固定傳球次數后控球的可能性。這項研究計算了16支頂級球隊球員的PageRank,重點討論了4支頂級球隊的球員。結果顯示,荷蘭隊和烏拉圭隊球員比西班牙隊和德國隊球員的PageRank分布更均勻,表明在前2支球隊中沒有一名球員在傳球體系中擁有支配地位,而西班牙隊的哈維和德國隊的施魏因施泰格在各自的球隊中尤其重要。因此,網絡分析法對球員的傳球行為和空間信息的互動研究為競技足球的戰術行為分析提供了一種有效的方法,比傳統的符號分析法提供了更多信息。

2.4 機器學習算法:自動識別球隊戰術的特征

近年來機器學習算法被廣泛應用于競技足球的戰術決策研究。①機器學習算法被用于對比賽中發生的事件和賽況做出判斷,并對該事件的屬性進行定性或定量分析,如對有威脅的射門或傳球的質量進行評級[25]。此類評估指標可以用來衡量球員和球隊的表現。相較于目前通過視頻分析手動獲得此類指標,自動生成的算法會大大提高這一過程的效率。②預測比賽如何展開的能力已經在計算機視覺領域被廣泛研究。使用可以自動改變俯仰、傾斜和變焦的相機來拍攝比賽的全過程。在理想情況下,場景的構建不僅應包含當前的情景,還應包含未來可能涉及的球員活動及位置。另外,機器學習算法可以高效、自動識別特定的數據模式,如確定球隊陣型。Bialkowski等[26]基于英超整個賽季的位置數據,運用期望最大化(expectation-maximization)算法自動識別球隊陣型,結果表明,球隊在客場比賽中使用更多的防守陣型。而且,機器學習算法可以識別比賽中的球員移動和團隊戰術。Knauf等[27]使用時空卷積核(spatio-temporal convolution kernels)算法對球員軌跡進行聚類,通過分析位置數據能自動判斷比賽雙方的進攻模式。Hirano等[28]使用多尺度比較技術,結合比賽數據和場上位置,自動識別出導致得分的重復進攻序列。Fernando等[29]通過比賽序列的聚類分析區分不同球隊的進攻行為。Montoliu等[30]將詞袋(the bag-ofwords)算法應用于足球比賽視頻片段的編碼,隨后使用隨機森林分類器識別比賽模式。Wang等[31]的研究旨在從傳球序列中識別戰術任務,這類似于從文檔語料庫中識別主題[31]。該研究提出基于潛在狄利克雷分配(latent Dirichlet allocation)的球隊戰術主題模型,作為一種學習常用戰術的非監督方法。

另外,人工神經網絡(Artificial Neural Networks,ANN)也常常被用于足球戰術研究中,它能夠根據位置數據對戰術進行分析。從系統動力學的角度看,團隊行為的運動模式表現出非線性的自組織特征,即團隊各項狀態測算不滿足疊加原理,同時團隊內部具有一定默契的自動調節功能。ANN作為一種重要的非線性處理工具,很適合描述具有非線性屬性的高維數據集[8],可用于模式識別和分類。ANN能夠在數秒內以高成功率(85%以上與專家一致)對位置數據進行分析,如對比賽開始、邊鋒戰術或標準情況(擲界外球、任意球和角球)等各種小組戰術行為進行分析。尤其是利用Kohonen特征圖(Kohonen Feature Map,KFM)對高維數據做出降維處理,從大量的相關變量中選出少量最有效的變量信息。這些信息將有助于制訂有效的訓練方案,用以加強球員之間的自組織協調,同時這種方法也被廣泛用于自動識別球隊陣型[9]。因此,基于ANN的定性分析是了解球員動態屬性的一種非常有效的方法。利用若干ANN的層次化結構,可以根據位置數據自動對復雜和典型的戰術模式、戰術團隊陣型及其動態變化和互動進行分類。

綜上,基于位置數據的足球戰術分析方法主要包括用來確定球隊幾何中心的球隊中心法、計算球員所覆蓋區域的空間控制法、測量球隊傳球行為的網絡分析法、自動識別比賽與球隊戰術模式的機器學習算法。這些方法的共同之處在于它們只是集中于球隊戰術的某一方面,如球隊陣型,缺乏對跨戰術領域合并信息的研究。目前尚不清楚球隊陣型是如何與球員個人的技戰術能力相互作用的。球隊不同的戰術位置會有不同的生理需求,還沒有研究分析如何將這些信息與球隊進攻和防守的戰術陣型結合起來運用。然而,現代跟蹤系統已經發展到足以提供達到科學研究標準的數據,這就為從整體上分析競技足球的技戰術和球員的生理需求提供了可能。例如,可穿戴設備能在足球比賽中提供包含每名球員生理數據在內的實時數據,這些數據無法通過攝像機獲得。考慮到足球戰術分析需要整合多種不同來源的詳細數據,因而有必要探討大數據技術棧和深度學習技術如何幫助研究者解決這些問題。

3 足球戰術分析方法的發展趨勢:整合多種不同來源的詳細數據

目前分析比賽中球隊表現的方法通常基于簡化或總結的測量方法[5]。建立在還原論基礎上的運動表現研究割裂了各種因素之間的聯系,忽視了外部因素對運動表現的影響[1]。例如,傳球次數、球隊中心行為以及近似度量是將大量信息折疊到單個度量上。雖然度量方法本身沒有問題,如樣本均值顯然是有價值的指標,但就比賽而言,這些方法放棄了幾乎所有的情境和程序信息[2]。對于球隊戰術的分析需要整合多種不同來源的詳細數據,包括個人技術、生理表現和球隊陣型等,用以表示球隊戰術行為背后的復雜過程。然而對于這些不同因素如何影響競技足球戰術行為,目前所知甚少。筆者分別從數據的管理和分析技術2個方面探討大數據技術棧和深度學習技術在足球戰術分析中的應用。

3.1 足球戰術分析的大數據技術棧:管理不同來源的數據

大數據技術的興起或許會帶來一種關于模型構建和各種來源數據組合的潛在解決方案,然而大數據并沒有得到普遍認同的定義,它更多是基于特征來描述的[12,32]。大數據的特征是4個v、1個o,即體量大(volume)、多樣性(variety)、速度快(velocity)、價值密度低(value)以及線上(online)。關于足球戰術分析,不同概念可以通過以下方式闡明:①體量是指足球數據集的大小。例如,每場足球比賽的位置數據集通常使用可擴展標記語言(XML)進行編碼,其大小在幾兆到幾百兆之間波動。如果對德國足球甲級聯賽整個賽季的306場比賽進行分析,可能會獲得高達90千兆字節的位置數據。另外,如果將訓練、生理指標、事件數據(傳球、犯規等)和視頻數據等附加數據整合起來,數據量將增加到幾個兆兆字節。與在簡單的Excel表格上執行符號分析法所需的數據量相比,這顯然是一個質的飛躍。大數據技術為存儲這些數據集提供了特定的解決方案,并通過特定的用戶界面和應用程序編程接口訪問。②多樣性是指不同的數據格式和數據源,它可以劃分為結構化、半結構化和非結構化3類數據。結構化數據有明確預定義的模式來描述數據,允許對數據進行簡單的導引和搜索,如關系數據庫系統。相比之下,非結構化數據缺乏明確的模式,如視頻數據和文本信息。半結構化數據則介于這2類數據之間,由一些沒有預先定義模式的數據組成,但它可能有一個變量模式,通常是數據本身的一部分,如用于跟蹤數據的XML數據類型。尤其是足球比賽中存在各種不同的數據格式和數據資源,如位置數據、視頻記錄、書面形式的薈萃數據和比賽期間記錄的體育醫療數據。基于技能測試、心理測試和額外的表現數據(如教練員的觀察結果、戰術測試、健康報告),可以根據需要以問卷、訪談和其他方法的形式增加訓練數據。由于不同類型的數據訪問和數據處理模式不同,大數據技術提供了特定的解決方案來組合分布在這些數據集上的信息。③速度描述生成新數據的速度。在足球運動中,從生理和位置數據的實時數據流到訓練和比賽期間記錄分析的延遲數據流之間存在很大的差異和波動。大數據技術專門解決如何處理和存儲高速數據。總而言之,描述大數據的3個關鍵概念都與競技足球的戰術分析高度相關,大數據技術棧可以為每個領域提供具體的解決方案。

如圖4所示,足球戰術分析的大數據技術棧應按照多個層面進行組織[3]。①除視頻和觀察數據外,還需要必要的基礎設施收集生理和跟蹤數據。②需要一個存儲系統允許高效的數據存儲和訪問。③需要建立處理路徑,從數據中提取相關信息,然后合并信息,建立解釋和(或)預測模型。所有這些處理層面都需要報告和可視化功能監視不同的處理步驟并交流結果。建立大數據技術棧的主要目的是將來自不同領域的信息組合起來,從而得出關于比賽表現的結論,即個人以及球隊的表現。此外,足球數據是由商業機構、職業俱樂部和公共研究機構收集的,必須解決球員的個人隱私問題[33]。例如,球員的個人資料可能會對其職業生涯產生重大影響,職業足球隊可能不愿共享數據,因為這會導致球隊喪失競爭優勢。因此,在大數據方法成為足球研究的可行方法之前,必須解決數據管理問題。在數據分析上,應當盡可能在研究機構之間尋求基于合作的解決方案,將必要的計算機專業知識引入足球研究領域。

圖4 足球戰術分析的大數據技術棧[3]Figure 4 Big data technological stack for tactical analysis in soccer

3.2 深度學習技術在足球戰術分析中的應用:分析不同來源的數據

要挖掘大數據的價值必然要對大數據進行內容分析與計算,而深度學習被認為是大數據分析的基礎[32]。大數據分析的一個核心問題是如何對數據進行有效表征、解釋和學習。傳統的研究也有許多數據表征的模型和方法,但通常都是較為簡單或淺層的模型,其表征能力有限,不能獲得很好的學習效果。深度學習就是利用層次化的架構學會在不同層次上表征對象,這種層次化的表征可以幫助解決更為復雜抽象的問題,高層的概念是通過低層的概念定義的。深度學習通常使用深度神經網絡(Deep Neural Networks,DNN),而卷 積神 經 網絡(Convolutional Neural Networks,CNN)和循環神經網絡(Recurrent Neural Networks,RNN)是目前應用最廣泛的神經網絡架構[34]。隨著可用訓練數據的增加,深度學習可以變得更強大。重要的是,深度學習模型在計算時間上借助硬件加速解決了許多復雜的問題。運用機器學習和深度學習算法實現自動檢測和運動特定動作識別自動化,從而克服手動表現分析方法的局限。研究中使用CNN等深度學習算法的表現要優于ANN等傳統機器學習算法[35]。

鑒于足球比賽的動態性、持續性和高度戰略性,對足球戰術進行手動分析必然存在細粒度的問題,而深度學習能夠自動發現特征。其中,具有處理時序數據的架構RNN常被用于團隊行為研究,如對球員的跑位進行軌跡建模[36]。研究中將自動陣型發現、模仿學習與深度學習方法相結合(稱為深度模仿學習),從足球的高維時空數據中學習復雜的關系。模仿學習在此是指運用機器學習從觀察到的專家行為中自動學習一個好的策略。研究者通過運行一個模擬程序觀察人工智能(Artificial Intelligence,AI)球隊在特定情況下如何行動,而AI球隊是通過“重影”(ghosting)普通和頂級球隊的特征創建的。深度模仿學習在此被用于AI球隊,可以將其球員的行動與聯盟的平均水平或聯盟中的頂級球隊進行比較。這有助于確定球隊可以在哪些地方改變球員的行動和提高得分或減少失球的機會。研究中使用一種被稱作長短期記憶(Long Short-Term Memory,LSTM)的RNN來學習每個時間步中每名角色球員的細粒度行為模型。每名球員由2個隱藏層組成的1個LSTM建模,每層有512個神經元。這些隱藏層神經元的作用是捕獲所有球員最近的歷史行為信息,并映射到下一個時間步的位置。它在某種程度上類似于雅達利(Atari)游戲和圍棋比賽中一個AI程序如何通過訓練數據將比賽歷史映射到下一個行動框架[37-38]。該研究還利用模仿學習的技術訓練一個能學會從自身的預測錯誤中恢復的模型,這樣這個模型就可以在長時間的決策序列中保持穩健性。模仿學習算法不僅能捕獲球隊中每名角色球員的行為,還能捕獲每支球隊中多名球員如何從這一幀到下一幀的共同行為。在此基礎上,Le等[39]還提出一種能在足球比賽中模仿和學習球員行為的多智能體方法,結果表明,與傳統基線相比,擁有一個角色協調模型能改善模仿效果。

另外,將強化學習與DNN相結合(深度強化學習),往往會在一些非常困難的學習問題上獲得令人印象深刻的表現[37-38]。強化學習是指學習者或決策者(統稱為智能體)學習將情境與行動聯系在一起的過程,即依據獎勵最大化原則,通過一系列探索執行目標定向的行為[40]。因此,Dick等[41]提出一種深度強化學習方法來學習評估基于位置數據的多名球員跑位。與模仿學習不同的是,這種純數據驅動的方法并不依賴于任何領域的先驗知識。研究者提取比賽的序列,其中一支球隊保留控球權,既不丟球,也不中斷比賽。每個序列都以一次事件(丟球或中斷比賽)或球隊執行一次“成功行動”結束。成功行動包括球隊進入對方半場最后25 m的威脅區域。如果行動成功,將序列標記為正,否則標記為負。使用這些序列學習一個評分函數,基于深度強化學習的思想和方法,將比賽情況映射到真實的數字。該研究將足球比賽建模為包含所有球員和球的位置數據和運動矢量的比賽設置的馬爾科夫過程。在這個模型中,這些狀態序列由扮演控制器或策略角色的2支球隊的行為創建,并通過CNN來學習該策略的值函數。值函數根據比賽情況對球隊表現進行評估。從經驗上看,預測比分與實際情況的危險性高度相關,這表明在沒有專家知識的情況下對球員跑位進行評估是可行的。

新近研究為足球戰術分析提供了強大的模型,用以檢驗各種具體的比賽情況,如傳球風險和質量、進攻射門威脅、射門機會中的無球跑位。雖然這些模型在特定任務中取得了成功,但對于如何將它們合并到一個更為全面的分析框架中還沒有明確的方法。因此,Fernandez等[42]建立了一個評估每支球隊在足球比賽中期望控球的模型。期望控球值(expected possession value)指的是基于全分辨率時空數據的足球控球的期望結果,通過對22名球員的所有時空特征,以及對任意位置的控球、射門或傳球的潛在值的細粒度評估,量化每次控球時的期望結果。而且,該模型采用解耦設計,將目標值分解為進一步控球的不同動作的期望值,以及這些動作的概率,為比賽情景的可視化和定量分析提供了強大的解釋力,尤其是基于深度學習的組合模型用于捕獲復雜的時空戰術,通過基于大量時空特征的機器學習算法,對模型中的每個組件進行獨立估計。例如:使用邏輯回歸估計傳球率和失誤率;基于球場控制統計模型,在球場控制和球場影響曲面上建立基于CNN的動作似然模型[43]。通過這些DNN來學習傳球和控球的期望值。重要的是,位置數據使得其他相關因素的研究成為可能,如球員運動和斷球、球員和位置之間的距離和角度、自動檢測整個賽場的陣型以及專家指導的手工制作特征等。該研究在組合模型中使用一系列情境因素(如移動、距離、角度等)提高可解釋性和預測能力。更高層面的隨機過程模型以一種內聚的、可解釋的方式把每個組合模型融合在一起。因此,該模型捕獲了大量的位置、運動和背景特征以及球場上任意位置的相對值,模擬了足球運動的一個關鍵特征——理解球員在空間中的互動。

4 結束語

近年來基于位置數據的足球戰術分析逐漸增多,大數據技術正在推動足球研究領域的革命。然而,基于視頻分析技術的位置數據只能提供單一空間模式的大數據,可穿戴設備卻能在足球比賽中提供包含每名球員生理數據在內的實時數據。鑒于此,未來研究應通過整合關于訓練需求、周期負荷、競賽體系、球員體能和疲勞等信息來源,將比賽現場和實驗室測試得到的不同數據,如生理、心理、位置、教練員、球探、觀眾等數據實時壓縮成較小的變量,運用數據可視化與報告等手段,為教練員提供客觀的信息,在某種程度上優化對表現結果的預測。尤其是大數據技術棧和深度學習技術的AI新方法,有望為足球戰術研究提供一條新的途徑。因此,未來需要將計算機科學研究者、體育科學研究者和足球教練員有效結合,從而獲得影響足球比賽結果的個人以及球隊表現方面更為準確的信息。

作者貢獻聲明:

王澤軍:調研文獻,設計論文框架,撰寫論文;

游松輝:提出論文選題,設計論文框架,修改論文。

猜你喜歡
比賽分析
健美比賽
環球時報(2022-03-21)2022-03-21 19:19:19
隱蔽失效適航要求符合性驗證分析
發芽比賽
大灰狼(2019年4期)2019-05-14 16:38:38
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
選美比賽
比賽
電力系統及其自動化發展趨勢分析
最瘋狂的比賽
智慧少年(2016年2期)2016-06-24 06:12:54
賽跑
中西醫結合治療抑郁癥100例分析
主站蜘蛛池模板: 在线欧美日韩国产| 色婷婷丁香| 亚洲熟女中文字幕男人总站| 中文字幕乱码二三区免费| 免费一级毛片完整版在线看| 亚洲AV人人澡人人双人| 欧美午夜在线视频| 亚洲天堂成人在线观看| 亚洲第一在线播放| 国产亚洲成AⅤ人片在线观看| 日韩在线成年视频人网站观看| a天堂视频| 久久精品国产在热久久2019| 亚洲丝袜中文字幕| 啪啪永久免费av| 国产精品久久久久无码网站| 国产精品视频猛进猛出| 美女一级毛片无遮挡内谢| 午夜成人在线视频| 天天躁夜夜躁狠狠躁图片| 国产免费高清无需播放器| 中文字幕在线欧美| 99er精品视频| 亚洲精品视频免费观看| 国产精品自在在线午夜区app| 99精品伊人久久久大香线蕉 | 精品福利网| 在线精品亚洲国产| 天天综合网色| 伊伊人成亚洲综合人网7777| 91精品免费高清在线| 国产永久无码观看在线| 日韩国产亚洲一区二区在线观看| 麻豆国产精品一二三在线观看| 国产男女免费视频| 亚洲最新在线| 国产成人久久综合一区| 2021最新国产精品网站| a毛片免费看| 中国一级毛片免费观看| 91在线免费公开视频| 欧美在线网| 2021国产乱人伦在线播放| 日韩在线欧美在线| 亚洲一区二区日韩欧美gif| 亚洲,国产,日韩,综合一区| 亚洲精品视频免费观看| 再看日本中文字幕在线观看| 亚洲狼网站狼狼鲁亚洲下载| 亚洲日本中文字幕乱码中文 | 欧美成人影院亚洲综合图| 色综合激情网| 中文字幕乱码二三区免费| 72种姿势欧美久久久大黄蕉| 亚洲欧美另类久久久精品播放的| 伦精品一区二区三区视频| 精品视频在线一区| 五月婷婷综合网| 这里只有精品免费视频| 国产成人综合亚洲欧美在| 91精品国产麻豆国产自产在线 | 亚洲第一精品福利| 日本日韩欧美| 在线国产综合一区二区三区| 亚洲成人精品久久| 日韩精品一区二区三区中文无码| 亚洲最黄视频| 中文字幕66页| 美女潮喷出白浆在线观看视频| 国产成人精品免费av| 岛国精品一区免费视频在线观看| 高清视频一区| 二级特黄绝大片免费视频大片| 亚洲欧美自拍中文| 91在线视频福利| 国产美女在线免费观看| 伊人网址在线| 国产美女在线免费观看| 中文纯内无码H| 亚洲天堂视频在线播放| 国产微拍一区二区三区四区| 国产成+人+综合+亚洲欧美 |