鐘熾輝 梁自領 陳少彬 葉群弟 何子毅 郭鵬豪 陳慶愷



【摘要】?目的?通過挖掘某市獻血者的基本信息,轉化為“可視化”的人口學特征,為制訂個性化的獻血者招募策略提供參考依據。方法?整理2018年1月至2020年6月共125 459名血液檢測合格的獻血者信息,將不同年齡、性別、職業、獻血次數和獻血地點等數據轉化為“可視化”的圖表加以分析。結果?125 459名合格的獻血者中,男性與女性獻血者在年齡分布上不同(P<0.01),重復獻血者在34~42歲年齡段的比例最高;不同職業的獻血者以普通員工的比例最高,且“80后”的普通員工最多;該市各行政區域的獻血人數不同,其中水鄉片區最少,獻血者主要分布在濱海片區、城區片區、東南部片區及松山湖片區,獻血1次的普通員工最多。結論?“可視化”圖表分析可直觀明了概括該市獻血人群的基本特點,通過對獻血者不同特征指標分析,為挖掘“潛在獻血者”和制訂個性化精準招募對策提供直觀的參考依據。
【關鍵詞】?獻血者;可視化;人口學特征;熱力圖
中圖分類號:R193.3???文獻標志碼:A???DOI:10.3969/j.issn.1003-1383.2021.02.008
【Abstract】?Objective?To provide reference for the development of personalized blood donor recruitment strategy by mining the basic information of blood donors in a city and transforming it into visualized demographic characteristics. Methods?From January 2018 to June 2020, the information of 125 459 blood donors who passed the blood test were collected, and the data of different ages, genders, occupations, blood donation times and blood donation locations were transformed into visualized charts for analysis. Results?Among 125 459 qualified blood donors, male and female donors were different in age distribution (P < 0.05). Repeated donors had the highest proportion in the age group from 34 to 42 years. Ordinary employees had the highest proportion in the donors of different occupations, and most of them were the post-80s. The number of blood donations were different among different administrative areas in this city. Among them, blood donors in Shuixiang area was the least. Donors were mainly distributed in coastal area, urban area, southeast area, and Songshan Lake area, and ordinary employees who donated blood once were the most. Conclusion?Visualized chart analysis can intuitively summarize the basic characteristics of donors in this city. Through the analysis of different characteristic indicators of blood donors, it can provides an intuitive reference for mining potential blood donors and formulating personalized and precise recruitment strategies.
【Key words】?blood donors; visualization; demographic characteristics; thermodynamic diagrams
“可視化”在現代化的大數據信息技術轉化成果中應用廣泛[1]。近年來,綜合分析采供血過程中形成的大量數據并進行整理,從中找出有意義的指標,轉化為“可視化”的圖形或指標已成為大型血站數據分析和應用的發展趨勢。本站利用大數據分析等手段在制訂獻血者精準招募策略方面有一定基礎,但應用效果還需加強。為了掌握不同類型獻血者的基本特征,提高獻血者的招募效率,解決季節性、結構性和緊急性的供血緊張問題,利用數據分析和圖表制作技術分析了2018年以來血液檢測合格的獻血者在年齡、性別、職業、獻血次數及獻血地點等方面的特征,直觀地顯示分析結果,為制訂個性化的招募策略提供參考,現將結果報道如下。
1?對象與方法
研究對象?選取本站2018年1月至2020年6月血液檢測結果為“合格”的獻血者125 459名,其中男性78 939人, 平均年齡(35.81±9.15)歲,女性46 520人,平均年齡(33.88±9.27)歲。
1.2?資料來源?通過“現代血站信息管理系統 SHINOW 9.0”查詢該部分獻血者的基本數據信息,包括年齡、性別、職業、獻血次數和獻血地點等。
1.3?方法?采用SPSS 19.0軟件統計描述性分析不同年齡、性別、職業、獻血次數和獻血地點等數據特征;可視化圖表(熱力圖)制作采用Microsoft Office Excel軟件的色階進行制作(紅色表示獻血人數最大值,黃色表示50%中間值,綠色表示獻血人數最小值);不同組間分布的比較采用Kolmogorov-Smirnov秩和檢驗,檢驗水準:α=0.05,雙側檢驗。
2?結??果2.1?2018~2020年獻血者的年齡及性別特征?125 459名合格獻血者(其中初次獻血者64 087人,重復獻血者61 372人)性別和年齡的分布情況不同(Z=0.590,P<0.01),分別在22~24歲和31~42歲年齡段出現了峰值,見圖1;初次獻血者年齡峰值出現在21~24歲年齡段,見圖2;而重復獻血者的年齡峰值則出現34~42歲年齡段,見圖3。
2.2?不同性別、年齡、職業、獻血地點和不同獻血次數的熱力圖分布?按不同職業和年齡段分布顯示,男、女性獻血者主要以“80后”的普通員工為主(紅色部分),“90后”的普通員工次之;在學生群體中,“90后”的獻血者居多;不同性別獻血者在不同職業的分布差異無統計學意義(Z=0.300,P=0.759),見圖4;不同職業的獻血者在不同獻血地點的分布仍然以普通員工為主(紅色部分),但不同性別獻血者在獻血地點的分布差異無統計學意義(Z=0.500,P=0.474),見圖5;按職業和性別分類,不同職業的初次和重復獻血者人數分布不同,但均以普通員工的人數最多(紅色部分),不同性別的獻血者,其獻血次數的分布差異無統計學意義(Z=0.429,P=0.153),見圖6。
3?討??論
采供血作為無償獻血主要業務工作,在工作中產生大量的原始數據或資料。這些數據資料包括了獻血者與血站業務相關的各類信息,這些數據的結構復雜、信息量大、產生和疊加速度快,具有一定的潛在利用價值,但目前國內尚未大規模地進行針對性的研究和利用,也沒有建立一種標準的數據模型。國內血站的信息管理系統多種多樣,造成數據結構和類型的復雜化,使得全國血站的大數據分析應用較難鋪開。可視化分析是近年來興起的利用人類視覺感知能力,交互式探索的方式來分析數據的一種手段,可以在大規模、高維度且信息密度稀疏的數據分析過程中融入人的認知能力[2]。它通過一定的算法或模型進行聚類分析、數據挖掘和結果輸出圖形的呈現,為決策者提供直接的參考依據[3~4]。因此,如何通過數據可視化技術對獻血者的信息進行分析和應用,是開展無償獻血者精準招募的一種應用趨勢,具有很好的研究價值。本研究嘗試利用一段時間內的無償獻血者的人口學信息,進行數據的分類和比較,制作簡單的柱狀圖和熱力圖,直觀地呈現出獻血者的基本特征,為本地區制訂無償獻血者的精準招募策略提供參考信息。有研究表明,熱力圖可視化分析方法能實時對監測數據進行分析,得到對應數據的實時分布情況,能更形象、快速、直觀地展示宏觀的變化趨勢[5]。
從圖1、圖2、圖3的數據結構及分布趨勢來看,不同性別和年齡的獻血者分布情況不同,圖1包括了本研究所選擇的所有獻血者年齡及性別的特征信息,在22~24歲和31~42歲年齡段出現了兩個峰值;圖2、圖3則顯示初次獻血者和重復獻血者的年齡峰值則分別出現在21~24歲和34~42歲,說明了初次獻血者以年輕人為主,而重復獻血者以青壯年為主,出現了年齡結構化不平衡的現象,提示了在年輕的重復獻血者招募方面存在較大的提升空間,需要格外重視,要充分挖掘年輕獻血者的潛力,特別是注意新增獻血者隊伍特征的分析[6],以促進重復獻血者隊伍的年輕化和不斷壯大。圖4顯示:不同性別、職業和年齡段分布的獻血者,以“80后”的普通員工為主,“90后”的普通員工次之;在學生獻血者群體中,以“90后”為主。隨著近年來無償獻血進企業、進高校、進社區工作的穩步推進,企業員工及高校學生已成為我市無償獻血的主力軍,每年的獻血人數占全市獻血總人數50%以上,是需要高度重視的兩個群體。從圖5、6可以看出,本地區的重復獻血者比例(48.92%)略低于初次獻血者比例(51.08%),不同獻血區域和不同職業的分布也有所不同,在本市各行政區域內,水鄉片區的獻血者人數最少,獻血者主要分布在濱海片區、城區片區、東南部片區及松山湖片區,獻血1次的普通員工最多,初次獻血者和重復獻血者均以普通員工為主,說明了我市在獻血者招募方面存在區域發展不平衡的情況,這可能與本地區的經濟發展和社會人口結構因素有關[7]。
因此,不同的年齡段、不同職業、不同行政區域均是目前本地區獻血者構成差異的重要因素,這提示我們,在無償獻血工作中,應當創新宣傳模式,拓寬宣傳途徑,營造良好的社會氛圍,根據不同職業、不同的群體特點制訂針對性的招募策略,為獻血者提供優質服務,除了鞏固發展好濱海片區、城區片區、東南部片區及松山湖片區獻血者隊伍的以外,還可以針對性的為水鄉片區制訂適宜的招募方式,并把全市“90后”及“00后”年輕獻血者作為提升重復獻血率的重點招募的對象,最大限度減少獻血者流失,保留獻血者[8]。
綜上,初步探討大數據分析和可視化方法在無償獻血者招募中的應用,通過“可視化”圖表分析可直觀明了概括本市合格獻血人群的基本特點及存在的問題,通過對獻血者不同特征指標分析,可以為挖掘“潛在獻血者”和制訂個性化精準招募對策提供直觀的參考依據。不足之處是僅分析了血液檢測合格的獻血者人群,有待今后對全部獻血者進行可視化研究。
參 考 文 獻
[1]姜趙,謝曉偉.基于Python的數據可視化應用與研究[J].科學技術創新,2020(30):88-89.
[2] ?張雨薇.基于學生行為的成績變化可視化分析與研究[D].成都:電子科技大學,2020.
[3] ?劉立斌.大數據的研究及其應用[J].江蘇通信,2017,33(4):63-65.
[4] ?蔡江輝,楊雨晴.大數據分析及處理綜述[J].太原科技大學學報,2020,41(6):417-424.
[5] ?詹顯軍,裴濤濤,周濟兵.基于熱力圖的地鐵車站變形可視化分析[J].現代隧道技術,2020,57(1):65-69.
[6] ?林彩霞,孔福仙,馮晴,等.新增成分獻血人群獻血行為特征分析及有效保留[J].中國輸血雜志,2018,31(7):782-784.
[7] ?杜志威,李郇.基于人口變化的東莞城鎮增長與收縮特征和機制研究[J].地理科學,2018,38(11):1837-1846.
[8] ?褚曉凌.福州地區獻血者重復獻血行為特性研究[J].中國輸血雜志,2020,33(9):956-959.
(收稿日期:2020-11-18?修回日期:2021-01-31)
(編輯:梁明佩)