滿帥 龍華 熊新 李一民 劉霖璇



摘 要:目前對球員綜合能力的評價方法有TOPSIS法、灰色關(guān)聯(lián)分析法等,但當(dāng)評價指標(biāo)量多時,存在計算效率低等缺陷,同時有些評價指標(biāo)并不是值越大越好,且會對最優(yōu)排序和最劣排序造成影響。為求取最適合的算法、作出準(zhǔn)確的NBA球員綜合能力評價,采用主成分分析法,以現(xiàn)役NBA聯(lián)盟中538名運(yùn)動員的得分、助攻、三分命中率等13項指標(biāo)為實例,進(jìn)行評價方法研究。分析球員多方面能力,得出球員在各項成分中得分排名并計算出各項能力最強(qiáng)的前十名球員,與體育界分析結(jié)果進(jìn)行比較,分析球員的強(qiáng)項和弱項。實驗結(jié)果表明,主成分分析能夠高效地將數(shù)據(jù)降維,表現(xiàn)各項數(shù)據(jù)之間關(guān)聯(lián)性,并且分析結(jié)果正確,適用于NBA球員綜合能力評價。
關(guān)鍵詞:主成分分析;NBA;球員綜合能力評價
DOI:10.11907/rjdk.172838
中圖分類號:TP391
文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2018)006-0185-05
Abstract:At present, the evaluation methods of the player′s comprehensive ability mainly include Topsis method, gray correlation analysis and so on. However, the calculation efficiency is low when the evaluation index is large; indicator magnitude has an impact on optimal scheduling and worst ranking while not all large evaluation indicators equal better performance. Aiming to find the most suitable algorithm to make accurate evaluation of NBA players′ comprehensive ability, we use the principal component analysis to research the evaluation method with 13 indicators involving 538 NBA league athletes′ scores, assists, three point rates and other performance as examples. We analyze the players′ ability in various aspects, calculate the final scores, and select the top ten players to compare with the official analysis of NBA; and then we analyze the strengths and weaknesses of the players. The experimental results show that the principal component analysis can reduce the data dimensionality, present the relationship between the performance of the data and the results are correct.Therefore, it is applicable in NBA players' comprehensive ability evaluation.
Key Words:principal component analysis; NBA; evaluation of players′ comprehensive ability
0 引言
籃球作為一種主流運(yùn)動,受到廣大球迷(特別是大、中學(xué)生)的關(guān)注。NBA是世界男子籃球競技水平最高的聯(lián)賽,隨著人民生活水平的提高,以及通信技術(shù)的飛速發(fā)展,中國對NBA聯(lián)賽轉(zhuǎn)播力度加大,我國人民對NBA的關(guān)注越來越多,在王治郅、姚明、易建聯(lián)、周琦加入NBA后,由于其巨大的商業(yè)價值而受到了社會各界的關(guān)注。[1]
籃球運(yùn)動員的綜合能力評價一直是聯(lián)盟、球隊管理高層和球迷非常關(guān)心的事情。聯(lián)盟每年都會頒發(fā)各種獎項,比如常規(guī)賽MVP、最佳新秀、進(jìn)步最快球員、最佳防守球員等[2],這也是對球員素質(zhì)的評價。最終這些獎項歸誰所有,僅僅根據(jù)球員一個賽季的上場表現(xiàn),由美國資深體育評論員、體育記者、NBA技術(shù)官員和球迷投票選舉產(chǎn)生是遠(yuǎn)遠(yuǎn)不夠的[3],因為這種評價中人為因素影響巨大,缺乏一套科學(xué)而嚴(yán)謹(jǐn)?shù)脑u選體系,應(yīng)該根據(jù)球員們的各項技術(shù)統(tǒng)計進(jìn)行分析。現(xiàn)在NBA進(jìn)入了大數(shù)據(jù)時代,NBA賽場采用SportVU技術(shù)[4],通過使用6只攝像頭追蹤捕捉場上球員動作,每秒可記錄25個動作,一場比賽可以收集到72 000個數(shù)據(jù)點,采集得到的原始數(shù)據(jù)積累成為海量數(shù)據(jù)庫。利用這些海量原始數(shù)據(jù),通常采用TOPSIS法、灰色關(guān)聯(lián)分析法進(jìn)行評價分析,但當(dāng)評價指標(biāo)量多時,計算效率低[5],并且有些評價指標(biāo)并不是值越大越好,對最優(yōu)排序和最劣排序造成影響[6],本文利用多元統(tǒng)計中的主成分分析法進(jìn)行球員的綜合能力分析,很好地解決了這個問題。
1 研究對象
本文選取NBA聯(lián)盟中30只球隊的所有運(yùn)動員在2016-2017賽季的數(shù)據(jù)作為樣本。選取球員上場時間、投籃命中率、三分命中率、罰球命中率、前場籃板、后場籃板、總籃板、助攻、搶斷、蓋帽、失誤、犯規(guī)、得分,作為原始指標(biāo)進(jìn)行統(tǒng)計分析。
2 主成分分析法在NBA球員能力評價中的研究
2.1 TOPSIS法
TOPSIS法[7]即逼近理想解排序法,意為與理想方案相似性的順序選優(yōu)技術(shù),是系統(tǒng)工程中有限方案多目標(biāo)決策分析的常用方法。它是基于歸一化后的原始數(shù)據(jù)矩陣,找出有限方案中最優(yōu)方案和最劣方案(分別用最優(yōu)向量和最劣向量表示),然后分別計算評價對象與最優(yōu)方案和最劣方案的距離,獲得各評價對象與最優(yōu)方案的相對接近程度,以此作為評價優(yōu)劣的依據(jù)。
但是利用TOPSIS法作NBA球員綜合評價時,對高優(yōu)指標(biāo)和低優(yōu)指標(biāo)都很高的球員排名影響大,不能準(zhǔn)確說明球員綜合能力的高低[8]。
2.2 灰色關(guān)聯(lián)分析法
灰色關(guān)聯(lián)分析法[9]是一種通過灰色關(guān)聯(lián)度分析和確定系統(tǒng)因素間的影響程度或因素對系統(tǒng)主行為貢獻(xiàn)的測度方法。灰色關(guān)聯(lián)分析的基本思想是根據(jù)序列曲線幾何形狀的相似程度判斷其聯(lián)系是否緊密。
但是利用灰色關(guān)聯(lián)分析法作NBA球員綜合評價時,存在分辨系數(shù)取值問題,并且球員的某些最優(yōu)指標(biāo)并不是越大越好,比如失誤和犯規(guī),利用該方法對球員的綜合能力作評價存在誤差[10]。
2.3 主成分分析法基本概念及原理
主成分分析法(Principal Component Analysis)[11]是一種通過“降維”的思想將多個指標(biāo)的數(shù)學(xué)統(tǒng)計量轉(zhuǎn)化為少數(shù)有代表性的指標(biāo)量的數(shù)學(xué)統(tǒng)計方法,采用降維的思想解決高維度系統(tǒng)的尋優(yōu)問題[12]。其基本原理是:通過一個正交變換把問題中本來相互關(guān)聯(lián)的隨機(jī)變量轉(zhuǎn)換為一些不相關(guān)的新變量。數(shù)學(xué)上來說,這種方法是將變量的協(xié)方差矩陣轉(zhuǎn)化為相應(yīng)的對角矩陣,將原來的變量系統(tǒng)通過正交變換,構(gòu)成一個新的正交系統(tǒng)[13],使原本相關(guān)的樣本點散列成正交方向,成為不相關(guān)的正交變量。
2.4 算法步驟
X-dp表示第d個球員的第p個技術(shù)統(tǒng)計參數(shù),其中p=(1,2…13),分別代表球員的場均上場時間、投籃命中率、三分球命中率、罰球命中率、場均前場籃板個數(shù)、場均后場籃板個數(shù)、場均總籃板個數(shù)、場均助攻數(shù)、場均搶斷個數(shù)、場均蓋帽數(shù)、場均失誤數(shù)、場均犯規(guī)個數(shù)以及場均得分。
在評價過程中,因為X-dp是有量綱的變量,容易對評價結(jié)果產(chǎn)生不必要影響,因此,根據(jù)主成分分析法對樣本進(jìn)行評價,需要對樣本按照公式(4)進(jìn)行無量綱化處理[14]。其中,定義x-d′p′是無量綱化后的樣本值,X-dp是樣本值,X-p為樣本均值,見公式(2):
2.5 算法流程圖
主成分分析法的算法流程圖,如圖1所示。
3 主成分分析法在球員綜合能力評價的應(yīng)用
3.1 數(shù)據(jù)源
從http://nba.sports.sina.com.cn/teams.php?dpc=1網(wǎng)站上摘取NBA球員的13項統(tǒng)計數(shù)據(jù)。
3.2 計算過程與結(jié)果
根據(jù)公式(4)將原始數(shù)據(jù)矩陣作無量綱化處理后,再根據(jù)公式(5)計算因素之間相關(guān)系數(shù)矩陣R(協(xié)方差矩陣)。結(jié)果如下:
特征根λ-i與相對應(yīng)的特征向量c0-j,如表1所示。
根據(jù)不同的特征根算出不同特征根的方差累積貢獻(xiàn)值,如表2所示。
3.3 結(jié)果分析
由5個函數(shù)關(guān)系式可以看出:Y-1中X-5前場籃板、X-6后場籃板、X-7總籃板、X-10蓋帽、X-12犯規(guī)的方差貢獻(xiàn)率高。可以確定Y-1是一個體現(xiàn)球員爭搶籃板能力與防守籃筐能力的主成分,所以推斷出該主成分計算出結(jié)果得分較高的球員,大多是中鋒、大前鋒位置球員。
Y-2中X-1球員上場時間、X-8助攻、X-9搶斷、X-11失誤、X-13得分的方差貢獻(xiàn)率高。所以推斷出該主成分計算出結(jié)果得分較高的球員,大多是控球后衛(wèi)、得分后衛(wèi)、全能小前鋒位置球員。
Y-3中明顯只有X-4罰球命中率的方差貢獻(xiàn)率高,所以推斷出該主成分計算出結(jié)果得分較高的球員是各個球隊中罰球穩(wěn)定的球員。這些球員在關(guān)鍵時刻、關(guān)鍵罰球得分時派上場,以確保穩(wěn)定的罰球得分。
Y-4中明顯只有X-3三分球命中率的方差貢獻(xiàn)率高,所以推斷出該主成分計算出結(jié)果得分較高的球員,是各個球隊中的穩(wěn)定三分球投手。這些球員在球隊比賽比分膠著時,起到迅速拉大比分作用,在球隊落后較多時,起到穩(wěn)定追分作用,在現(xiàn)代籃球中占有非常重要的地位。
Y-5中明顯的只有X-2投籃命中率的方差貢獻(xiàn)率高,所以推斷出該主成分計算出結(jié)果得分較高的球員是各個球隊中的穩(wěn)定得分手,多為各支球隊的核心球員。這些球員是衡量球隊水平的一大重要因素。
根據(jù)公式(13)~公式(17),計算出得分排序,如表3所示。
結(jié)合上表,可以得出以下結(jié)論:
(1)Y-1得分主要與前場籃板、后場籃板、總籃板、蓋帽和犯規(guī)有強(qiáng)正相關(guān),得分的高低表示球員的拼搶籃板能力強(qiáng)防守效率。根據(jù)上表中的數(shù)據(jù)可以看出:安東尼·戴維斯、卡爾·安東尼·唐斯、德馬庫斯·考辛斯、哈桑·懷特塞德、威斯布魯克、戈貝爾、小喬丹、德拉蒙德和詹姆斯·哈登的得分在全聯(lián)盟538名球員中排名前十,說明這些球員在拼搶籃板能力強(qiáng)、防守效率較高,這也與實際能力情況相符。安東尼·戴維斯、卡爾·安東尼·唐斯、德馬庫斯·考辛斯是當(dāng)今NBA聯(lián)盟中公認(rèn)的內(nèi)線基石球員,他們在場上的位置都為內(nèi)線球員,可以扛起球隊的后場籃板球保護(hù)、前場籃板球拼搶以及守護(hù)籃筐,不讓對手輕易得分。
(2)Y-2得分主要與助攻、搶斷、失誤以及得分貢獻(xiàn)率有關(guān),得分高低表示球員的帶動球隊攻防能力和個人得分能力。根據(jù)上表中的數(shù)據(jù)可以看出:威斯布魯克、詹姆斯·哈登、勒布朗·詹姆斯、德馬庫斯·考辛斯、約翰·沃爾、安東尼·戴維斯、卡爾·安東尼·唐斯、達(dá)米安·利拉德和安特托孔波的得分在全聯(lián)盟538名球員中排名前十,說明這些球員在帶隊攻防能力和個人得分能力出眾,與實際情況相符。威斯布魯克、詹姆斯·哈登、勒布朗·詹姆斯是當(dāng)今NBA聯(lián)盟中帶隊能力最好的三位球員,他們在場上的位置為后衛(wèi)和小前鋒,均為外線球員,能夠在場上創(chuàng)造機(jī)會,精準(zhǔn)把球傳給隊友,關(guān)鍵時刻還可以依靠超強(qiáng)的個人能力得分。這10個人中除了德馬庫斯·考辛斯、安東尼·戴維斯和卡爾·安東尼·唐斯是內(nèi)線球員,其他均為外線球員,證明了Y-2得分較高的球員,大多是控球后衛(wèi)、得分后衛(wèi)、全能小前鋒位置球員的推斷。內(nèi)線球員能上該排名的前十,說明他們不僅有強(qiáng)壯的身體、細(xì)膩的手感,還有后衛(wèi)般控球能力和傳球意識。這也是德馬庫斯·考辛斯、安東尼·戴維斯和卡爾·安東尼·唐斯成為NBA聯(lián)盟中最好的內(nèi)線基石球員的有利證據(jù)。
(3)Y-3得分主要與罰球命中率的貢獻(xiàn)率有關(guān),得分高低表示球員的罰球穩(wěn)定性和持球進(jìn)攻殺傷的能力。根據(jù)上表中的數(shù)據(jù)可以看出:威斯布魯克、詹姆斯·哈登、勒布朗·詹姆斯、德馬庫斯·考辛斯、安東尼·戴維斯、卡爾·安東尼·唐斯、達(dá)米安·利拉德、德瑪爾·德羅贊、以賽亞·托馬斯和保羅·喬治的得分在全聯(lián)盟538名球員中排名前十,說明這些球員的罰球穩(wěn)定性和持球進(jìn)攻造殺傷能力很強(qiáng),與實際情況相符。這些球員都是球隊中核心球員,比賽中是執(zhí)行關(guān)鍵罰球和關(guān)鍵時刻持球個人進(jìn)攻的最好人選。
(4)Y-4得分主要與三分命中率的貢獻(xiàn)率有關(guān),得分高低表示球員的三分穩(wěn)定性和迅速得分能力。根據(jù)表3中的數(shù)據(jù)可以看出:威斯布魯克、詹姆斯·哈登、勒布朗·詹姆斯、達(dá)米安·利拉德、以賽亞·托馬斯、德瑪爾·德羅贊、安東尼·戴維斯、德馬庫斯·考辛斯、凱里·歐文和約翰·沃爾的得分在全聯(lián)盟538名球員中排名前十,說明這些球員三分命中率很穩(wěn)定,除了德瑪爾·德羅贊(三分命中率26.6%)和安東尼·戴維斯(三分命中率29.9%)受得分因素影響較大、排名進(jìn)入前十以外,其他人均于實際情況相符。
(5)Y-5得分主要與投籃命中率的貢獻(xiàn)率有關(guān),得分高低表示球員的投籃穩(wěn)定性。根據(jù)表3中的數(shù)據(jù)可以看出:卡爾·安東尼·唐斯、威斯布魯克、安東尼·戴維斯、德馬庫斯·考辛斯、詹姆斯·哈登、哈桑·懷特塞德、勒布朗·詹姆斯、魯?shù)稀じ曦悹枴蔡赝锌撞ê偷牡掳驳铝摇痰さ牡梅衷谌?lián)盟538名球員中排名前十,說明這些球員的投籃命中率穩(wěn)定,是球隊中的穩(wěn)定得分手,與實際情況符合。而且這些球員除了威斯布魯克、詹姆斯·哈登、勒布朗·詹姆斯,其他均為內(nèi)線球員,實際比賽中內(nèi)線球員的得分范圍較接近籃筐,所以命中率較高,驗證計算準(zhǔn)確。
基于主成分分析結(jié)果,可以得出基于5個主成分的得分靠后的運(yùn)動員應(yīng)該對自己薄弱的環(huán)節(jié)進(jìn)行補(bǔ)強(qiáng)。以達(dá)米安·利拉德和安托特孔波為例,達(dá)米安·利拉德從數(shù)據(jù)上和實際能力上都已經(jīng)達(dá)到了全明星水準(zhǔn),可是這幾年卻頻頻入選不了全明星,這不排除球迷的主觀喜愛程度和對其能力的評價標(biāo)準(zhǔn),但是基于本文中的數(shù)據(jù)分析評價,達(dá)米安·利拉德在Y-1的得分排名是第29名,在Y-2的得分排名是第8名,在Y-3的得分排名是第7名,在Y-4的得分排名是第4名,在Y-5的得分排名是22名。很顯然他需要提高的是Y-1和Y-5上體現(xiàn)出的能力,即提升籃板球拼搶能力和投籃命中率。但是實際情況是,達(dá)米安·利拉德是后衛(wèi)位置球員,身材相對矮小,很難提高籃板球拼搶能力,而且將后衛(wèi)和內(nèi)線高大球員在搶籃板球的上作比較也是不合理的,所以他切實需要加強(qiáng)的是在場上減少犯規(guī)數(shù)和通過訓(xùn)練提高投籃命中率,這樣才能有目的地訓(xùn)練自己,提升為全明星球員。安托特孔波擁有極強(qiáng)的身體天賦,身材高大但不缺靈活性,四肢奇長,有出色的運(yùn)動能力,被業(yè)界評論是可以超越杜蘭特的球員,但是要真正超越杜蘭特,安托特孔波還需要提高一些方面的能力。安托特孔波在Y-1的得分排名是第11名,在Y-2的得分排名是第9名,在Y-3的得分排名是第15名,在Y-4上的排名是第22名,在Y-5的得分排名是第9名。可以明顯得出安托特孔波需要提高在Y-3和Y-4上的能力,即三分球命中率和罰球命中率。在實際情況中,安特托孔波的罰球命中率為77%,三分球命中率為27.2%,預(yù)期比較的杜蘭特罰球命中率為87.5%,三分球命中率為37.5%,兩者差距較大。所以安托特孔波需要努力提升罰球命中率和三分球命中率,才能成為像杜蘭特一樣的超級得分手。
4 結(jié)語
在利用主成分分析法進(jìn)行NBA球員綜合能力評價的過程中,算法在應(yīng)用中表現(xiàn)出一些優(yōu)勢:首先,可以在保證變量數(shù)據(jù)信息損失很小的情況下,實現(xiàn)從高維空間到低維空間的轉(zhuǎn)化。在有538組原始數(shù)據(jù)的情況下,通過主成分分析法降維,使變量之間的分析更為容易。其次,主成分分析法選取正交化的綜合評價指標(biāo)作為主成分,規(guī)避了球員綜合能力評價指標(biāo)間的不確定關(guān)系,因為提取的綜合變量之間相互正交,所以消除了原始變量之間的多重相關(guān)性。綜上所述,主成分分析法在籃球運(yùn)動員的綜合能力評價中具有良好的適用性。
參考文獻(xiàn):
[1] 郭兆輝.NBA智能系統(tǒng)的啟示[J].軟件和信息服務(wù),2012(07):45.
[2] 王彥霞,齊秀英.運(yùn)用TOPSIS法和綜合指數(shù)法綜合評價醫(yī)院醫(yī)療工作質(zhì)量[J].中國病案,2015,16(10):21-23.
[3] 王平,王云峰.綜合權(quán)重的灰色關(guān)聯(lián)分析法在河流水質(zhì)評價中的應(yīng)用[J].水資源保護(hù),2013,29(05):52-54+64.
[4] 何思長,趙大仁,孫渤星,劉志會,張瑞華.基于TOPSIS法和RSR法模糊聯(lián)合的醫(yī)療聯(lián)合體實效評價[J].中國醫(yī)院管理,2016,36(05):7-9.
[5] 顧洲一,邱瑾.基于熵權(quán)TOPSIS評價法的NBA教練執(zhí)教水平評價模型研究[J].南京體育學(xué)院學(xué)報(自然科學(xué)版),2015,14(05):152-157.
[6] 黃寰,王瑋.基于改進(jìn)灰色關(guān)聯(lián)分析法的工業(yè)園區(qū)循環(huán)經(jīng)濟(jì)評價研究[J].軟科學(xué),2016,30(06):130-133+144.
[7] 董倫紅.我國男籃優(yōu)秀大前鋒若干特征分析與評價[J].廣州體育學(xué)院學(xué)報,2005(04):76-78.
[8] 蘇為華.我國多指標(biāo)綜合評價技術(shù)與應(yīng)用研究的回顧與認(rèn)識[J].統(tǒng)計研究,2012,29(08):98-107.
[9] 曹偉.基于改進(jìn)型PSO-BP神經(jīng)網(wǎng)絡(luò)算法的水環(huán)境質(zhì)量評價[D].昆明理工大學(xué),2016.
[1] 吳翔峰.14-16年NBA優(yōu)秀控球后衛(wèi)與得分后衛(wèi)攻防能力的對比分析[D].北京:北京體育大學(xué),2017.
[2] 王曉明.2015-2016賽季NBA季后賽各隊攻、防能力比較研究[D].濟(jì)南:山東師范大學(xué),2017.
[3] 劉國璧,孫群,趙姝.基于LS-SVM的NBA前鋒/中鋒球員綜合能力評價[J].西安文理學(xué)院學(xué)報:自然科學(xué)版,2012,15(4):10-14.
[4] 郭兆輝.NBA智能系統(tǒng)的啟示[J].軟件和信息服務(wù),2012(7):45.
[5] 王彥霞,齊秀英.運(yùn)用TOPSIS法和綜合指數(shù)法綜合評價醫(yī)院醫(yī)療工作質(zhì)量[J].中國病案,2015,16(10):21-23.
[6] 王平,王云峰.綜合權(quán)重的灰色關(guān)聯(lián)分析法在河流水質(zhì)評價中的應(yīng)用[J].水資源保護(hù),2013,29(5):52-54+64.
[7] 何思長,趙大仁,孫渤星,劉志會,張瑞華.基于TOPSIS法和RSR法模糊聯(lián)合的醫(yī)療聯(lián)合體實效評價[J].中國醫(yī)院管理,2016,36(5):7-9.
[8] 顧洲一,邱瑾.基于熵權(quán)TOPSIS評價法的NBA教練執(zhí)教水平評價模型研究[J].南京體育學(xué)院學(xué)報:自然科學(xué)版,2015,14(5):152-157.
[9] 黃寰,王瑋.基于改進(jìn)灰色關(guān)聯(lián)分析法的工業(yè)園區(qū)循環(huán)經(jīng)濟(jì)評價研究[J].軟科學(xué)報,2016,30(6):130-133+144.
[10] 董倫紅.我國男籃優(yōu)秀大前鋒若干特征分析與評價[J].廣州體育學(xué)院學(xué)報,2005(4):76-78.
[11] 蘇為華.我國多指標(biāo)綜合評價技術(shù)與應(yīng)用研究的回顧與認(rèn)識[J].統(tǒng)計研究,2012,29(8):98-107.
[12] 王湘玉,董麗沙.基于主成分分析和Q型聚類分析的NBA球隊綜合研究[J].九江學(xué)院學(xué)報:自然科學(xué)版,2017,32(1):120-122.
[13] 劉靜,錢淦宇,王廣碩.基于主成分分析的大學(xué)教練排名——以美國籃球教練的模糊綜合評價為例[J].赤子(上中旬),2015(16):35-37.
[14] 曹偉.基于改進(jìn)型PSO-BP神經(jīng)網(wǎng)絡(luò)算法的水環(huán)境質(zhì)量評價[D].昆明:昆明理工大學(xué),2016.
[15] 陳剛強(qiáng),宋光輝,李蕊.順序主成份分析——多元數(shù)據(jù)排序問題探討[J].統(tǒng)計與決策,2005(24):27-29.
(責(zé)任編輯:江 艷)