張景香
(江西財經大學 江西南昌 330013)
大數據時代的興奮劑檢測①
張景香
(江西財經大學 江西南昌 330013)
近年來,大數據技術被應用于多個領域,如醫療、銷售及工業等,利用大數據預測疫情的爆發時間及區域,了解消費者消費傾向,發現汽車零件存在的缺陷等使得人們發現大數據隱藏的巨大價值,并使其得到了快速的發展。美國一些新聞機構曾試圖利用大數據判斷運動員是否服用了興奮劑,卻以失敗告終。本人通過閱讀大數據應用的相關領域及其成功經驗,分析大數據應用的關鍵,與興奮劑及其檢測方式的特點,試圖找到其失敗的原因,并探究是否可以用大數據技術進行興奮劑檢測。
大數據技術 興奮劑檢測 觸感技術先導 身體機能
大數據的概念主要是相對于過去的小數據即抽樣調查的概念而提出的。計算機技術的發展,數據收集、存儲與計算能力的提高是大數據時代到來的主要原因,而大數據即將顛覆的是以往研究問題的方法與思維,主要體現在三個方面,一調查樣本選擇全體數據而非抽樣調查;二收集數據時接受混雜性,不追求精確性;三更注重數據之間的相關性而非因果性。在競技體育產業蓬勃發展的今天,興奮劑問題卻像是毒瘤一般一直伴隨著競技體育發展,近些年更有愈演愈烈的趨勢,尤其是基因興奮劑的出現,給興奮劑檢測機構造成了極大地困擾。與興奮劑使用者越來越“精明”的反檢測技能相比,興奮劑檢測機構卻一直在“被牽著鼻子走”,只有當一種物質被使用,并被發現起到了作用且被列入違禁藥物名單時,興奮劑檢測才能有效地檢測出該種物質,這種信息的滯后性給體育的公平、公正性蒙上了陰影。
2012年,美國媒體機構已經嘗試將大數據技術應用于興奮劑檢測當中。2012年7月28日,我國游泳運動員葉詩文以4′28″43的成績奪得倫敦奧運會混合泳400m的金牌,并打破了該項目的世界記錄。然而西方媒體甚至學術期刊卻紛紛發文質疑葉詩文成績的有效性,該文對葉詩文成績的有效性提出兩點質疑:葉詩文在混合泳400m的最后50m的成績(28.93s)甚至比美國運動員羅徹特(Ryan Lochte)的男子400m混合泳的最后50m成績(29.10s)還要快很多,這不符合常理。
其次葉詩文前后兩次大賽(即2011年游泳世錦賽和2012奧運會)的成績在短時間內提升太快,竟然獲得近7s的成績提升,這也是不正常的。如前文描述,在大數據時代,我們需要分析更多的數據,有時甚至需要與某個現象相關的全部數據,而不是依賴于數據的隨機采樣。事實上,該文所謂的“正常”數據僅為除葉詩文之外的2012年倫敦奧運會男、女400m混合泳決賽的運動員,樣本總數也僅為15個如此小的數據集合,難免是有偏差的,而有偏差的數據推出的結論也勢必存在誤導性。
為了保證體育這種公平、公正、健康的理念,應該將一切采取非正當手段,提高運動技能的行為,暴露于陽光之下,興奮劑檢測機構應該有一種發現運動員“異常”的及時性手段。大數據技術的發展給這種手段提供了技術支持,下面本文將通過目前的大數據技術探討其是否可以被應用于興奮劑檢測手段的問題。

表1 當下興奮劑檢測方法及其針對性

表2 不同種類興奮劑的作用
由表1可以發現,興奮劑的檢測方法的針對性比較強,不同的檢測方法只能檢測出具有針對性的興奮劑類藥物,其主要方式都是已知一種興奮劑,然后通過各種方式將其檢測出來,如通過檢測人體體液,發現其中的異常物質,然后對異常物質分解,檢測其所含元素及結構,從而與禁藥列表中的物質相匹配。這種檢測方式不僅過程繁瑣、耗資大、不及時,而且無法預測出禁藥列表中沒有的物質,造成興奮劑檢測機構總是落后一步的現狀。
通過表2可以發現,興奮劑的種類繁多,但其主要的目的只有6種:增加肌肉提高力量、增加血紅細胞提高耐力、使興奮、使鎮定、止痛、減輕體重。從張廣德的四十九式經絡動功對提高人體機能的生理生化和醫學觀察中我們可以發現,通過身體的肢體動作對人體力量、心肺功能和其他身體機能的影響都有一定的規律,肢體動作對身體機能的影響雖然因人而異,但其差值極小,其起作用的幅度是由慢—快—趨于穩定,停止后的回落要高于起始值。而興奮劑對身體機能的影響則主要是為了加強、減弱或改變這種一般規律,景俊青在它的文章中表示興奮劑對人體的影響是快速—消失(反作用)的。既然兩種方式的作用效果不同,我們可以大膽的猜想,將運動員身體機能通過各種信息數據化,并運用數學模型將其規律顯示出來,當規律發生突變時,就可以判定運動員的行為出現了異常。
大數據時代象征著數據的收集和處理能力的大幅提高,為使用樣本=總量的調查研究提供了可能,同時可以避免傳統的抽樣調查法所帶來的誤差及忽視信息的可能性。比如日本先進工業技術研究所(Japan’s Advanced Institute of Industrial Technology)的教授越水重臣(Shigeomi Koshimizu)所做的研究就是關于一個人的坐姿。很少有人會認為一個人的坐姿能表現什么信息,但是它真的可以。當一個人坐著的時候,他的身形、姿勢和重量分布都可以量化和數據化。越水重臣和他的工程師團隊通過在汽車座椅下部安裝總共360個壓力傳感器以測量人對椅子施加壓力的方式。把人體屁股特征轉化成了數據,并且用從0~256這個數值范圍對其進行量化,這樣就會產生獨屬于每個乘坐者的精確數據資料。在這個實驗中,這個系統能根據人體對座位的壓力差異識別出乘坐者的身份,準確率高達98%。這項技術或許可以應用于興奮劑的檢測中,即將運動員未使用任何特殊物質時的某個動作數據化,之后的檢測僅需對比數據之間的差值以檢測運動員的體質是否出現不正常的變化。
大數據的精華之處更在于它使用大量看似混亂無關的數據找出各因素間的相關關系而非因果關系,用整體數據發現更真實的關系。數據的價值并不會隨著使用完成而消失,“過時”的數據依舊有其潛在價值。數據的潛在價值有三種最常見的釋放方式:基本再利用、數據集整合和尋找“一分錢兩份貨”。IBM獲得的“觸感技術先導”專利與東京的越水重臣教授對臀部的研究工作具有相同理念。知識產權律師稱那是一塊觸感靈敏的地板,就像一個巨大的智能手機屏幕。其潛在的用途十分廣泛。它能分辨出放置其上的物品。它的基本用途就是適時地開燈和開門。Zeo公司則早已制作出了世界上最大的睡眠活動數據庫,揭示了男性與女性睡眠時快速眼動量的差異。Asthmapolis公司將一個感應器綁定到哮喘病人佩戴的呼吸器上,通過GPS定位,再匯總收集起來的位置數據,可以判斷環境因素(如接近特定的農作物)對哮喘的影響。Fitbit和Jawbone公司讓人們測量他們的體力活動和睡眠。Basis公司用腕帶來監測佩戴者的生命體征,包括其心率和皮膚電傳導率,以此測試他們所承受的壓力。
因此,我們可以嘗試將“觸感技術先導”進行改進,用以興奮劑檢測。興奮劑檢測機構會定期對運動員進行體檢,因此該機構會保存運動員各種身體條件的數據,其中包含當時未檢測出違禁藥品含量,但幾年之后檢測出來的樣本數據。興奮劑作用于人體的特點就是使人身體的某一項機能在短時間內發生較大的改變,而興奮劑所起作用的機能正如上文表2所述的六種機能,將運動員身體機能情況數據化,并記錄各種興奮劑對其機能的影響情況,這樣就可以通過檢測運動員的身體機能是否在正常范圍內來判斷運動員是否采用了異常手段。通過此種方法,可以使興奮劑的檢測不再完全依靠禁藥列表,同時也會提高檢測效率,減少資金消耗。
正如大數據時代的特點,解決是什么而非為什么一樣,興奮劑檢測只需知道運動員是否采用了不正當手段,而不需要知道這種不正當手段具體是什么,只有當運動員對判決提出異議的時候才需要具體檢測該物質是什么。
數據的選擇一定程度上會影響分析的結果。因此在數據的選擇上要注意以下幾個問題:首先,大數據這種研究方法與傳統研究方法的最大區別就在于其收集數據的全面性即樣本等于總體。傳統的興奮劑檢測方法是每隔一段時間對運動員進行一次體檢,比賽中檢驗興奮劑也多是先進行抽樣調查,這樣容易給運動員一種有機可乘的信號,這應該也是興奮劑問題一直存在的主要原因。而大數據所分析的數據一定要全面。正如上文中筆者所提到的,種類繁多的興奮劑的作用效果只有六種,增加肌肉提高力量、增加血紅細胞提高載氧耐力、使興奮、使鎮定、止痛、減輕體重。使用大數據對這個問題進行分析的時候,應該將運動員的這六種機能數據化,這里的數據化即量化,收集和利用興奮劑檢測機構以往的測試數據或定期對運動員的此類數據進行統計整理。
其次是數據的混雜性。過去人們利用小數據(抽樣調查)時,總會檢驗數據準確性,還會通過檢驗剔除“無效”數據,大數據技術在信息的選擇上顛覆了這一觀點,在收集數據過程中將數據的全面性作為最重要的一點。因此在對運動員的身體機能數據進行收集時,時間間隔應盡可能縮短,間隔也應有其不確定性,甚至在技術允許的情況下可以每天收集運動員的數據,由于這些數據的測量難度系數特別低,有的甚至可以通過收集或小型的電子設備直接測量,并且數據的上傳也十分便利,相信在技術上是允許的。其次,數據的收集應包含運動員傷病等異常情況下的收集,以便獲取更全面的信息。
最后,大數據的精華部分正在于它尋找的是一種相關性而非因果性。因此這些數據不僅應包括運動員的身體方面的數據,還應包括精神方面的數據。在維克托·邁爾-舍恩伯格的大數據時代一書中就提到了將人類的情感數據化的技術,因此收集運動員因比賽、傷病、生活等原因而產生的對其身體機能的影響數據化更可以全面認識運動員身體的一般規律,只有這樣,當運動員采用非正常手段時,身體機能的改變就可以通過數據展示出來,達到讓數據說話的目的。
運用大數據進行興奮劑檢測雖然可以克服檢測的滯后性和繁瑣性的缺點,但由于其只解決是什么而非為什么的特點,該種方法并不能檢測出具體的造成興奮的物質,因此當必要時刻,還需要輔佐傳統的興奮劑檢測手段。另外,一些新聞媒體機構曾利用運動員的以往成績推算當前成績,然后判斷運動員是否使用了非正常手段的做法是不科學的,也并非是正確的利用了大數據技術,原因有二,一是其數據量太小,二是只采用過去的成績一種因素進行推斷不符合大數據的數據混雜性和樣本等于總體的特點。
[1]維克托·邁爾-舍恩伯格.大數據時代[M].杭州:浙江人民出版社,2016.
[2]李衛東.興奮劑檢測方法的研究進展[J].廣州體育學院學報,2012(3):38-44.
[3]譚進.興奮劑的種類、毒性和副作用[J].成都體育學院學報,2014(3):89-94.
[4]張廣德.四十九式經絡動功對提高人體機能的生理生化和醫學觀察[J].北京體育學報,1988(2):60-71.
[5]景俊青.興奮劑對人體的損害和中醫藥的良性保護作用探討[J].陜西中醫,2007(28):7.
G80
A
2095-2813(2017)10(c)-0241-03
10.16655/j.cnki.2095-2813.2017.30.241
張景香(1992,3—),女,漢族,河北邯鄲人,研究生,研究方向:體育經濟與管理。