程 純
(安徽大學經濟學院 安徽 合肥 230039)
近年來,關于80、90后加入脫發大軍、佛系養生等網絡熱詞層出不窮,身邊越來越多的人開始苦惱于如何堅守發際線,這也為各種防脫發產品的熱銷提供了寶貴的商機。據阿里健康聯合阿里數據發布的《拯救脫發趣味白皮書》顯示,在2017年購買植發、護發產品的消費者中,90后以36.1%的占比即將趕超38.5%占比的80后,成為有脫發煩惱的主力軍。由此可見,未來防脫發商品銷售的市場前景一片大好。
隨著Web技術和移動端應用的普及,越來越多消費者傾向于線上消費。這使得淘寶等電商平臺中含有大量的可用信息,阿里巴巴團隊也基于NLP技術開發了一系列的應用場景[5],如商品標題的查詢、語料庫建設、評論情感分析等。本文將主要研究對象設定為商品標題,相關的研究主要集中在短文本分析領域,常用的方法包括TF-IDF、Word2vec、神經網絡等[1]-[4]。Python語言的天然優勢幫助我們輕松獲取目標數據,同時圍繞其展開做進一步的數據分析。
本文的分析目標包括:(一)分析防脫發產品標題中的高頻關鍵字;(二)分析商品的銷量區間分布和價格區間分布;(三)分析高頻關鍵字與商品價格和銷量的關系;(四)分析商家的地域分布情況。
通過Python爬蟲獲得淘寶網以“脫發”為關鍵字的共2369條原始數據集,每件商品包括5項商品屬性:商品標題(title)、售價(price)、銷量(sales)、店鋪名稱(shop)和店鋪地址(location)。由于在淘寶上購買處方藥需要提交需求后才可購買,因此商品頁不顯示銷量信息,sales列含有部分缺失值。
另外,在銷量屬性中,很多爬取下來的數據形式諸如:7.5萬+人付款,需要將其轉換為整型數據75000。店鋪地址屬性中,多為省份+城市的組合形式,考慮到后續分析僅保留省份。基于以上需求做數據清洗,得到2171條商品信息,另存為新的數據集。

圖1 防脫發商品價格區間柱狀圖

圖2 防脫發商品銷量區間餅圖
首先分析全體防脫發商品的價格區間和銷量區間,瀏覽數據集后按照分布情況人工劃分區間,然后對數據集進行切分、統計和排序,生成圖1和圖2。從圖1中可以看出,定價在51-100區間的商品最多,大部分商品售價在200元以內。也有價格低于20元的商品,對于其功效筆者持懷疑態度。另外,高于1000元的商品多為淘寶平臺提供的一些植發、脫發檢測等服務。
就全體防脫發商品銷量而言,銷量在一百內的最多,占比約74%。且爆款較少,銷量過萬的商品一共僅有7款,占比僅為0.3%。
通過分析價格與銷量的關系,可以幫助賣家更好地為商品定價。使用Pandas自動分區功能將全部商品價格劃分為10個分區,對每個分區內的銷量求平均值。

圖3 防脫發商品價格分區與平均銷量柱狀圖
圖3表明定價在59-69區間的商品平均銷量最高,銷量最好的商品定價集中在60-90區間。說明消費者在選購商品時并非完全考慮價格因素,而是結合產品功能、品牌、口碑等多方面因素。對于防脫發產品而言,好的功效意味著較高的成本,價格低廉的商品似乎不太讓人信服。合適的價格加上切實的功效才是吸引消費者的關鍵。
使用jieba內置詞典對商品標題列進行分詞,同時根據實際情況更新停用詞表,禁用“包郵”、“官網”、“現貨”等高頻詞匯,便于之后的分析。基于TextRank 算法對每條商品標題進行關鍵詞抽取,顯示排行前50的詞頻。利用得到的詞頻列表繪制詞云圖,輸出結果如圖4所示。

圖4 防脫發商品標題Top50詞云圖
從整體來看商家在編輯商品名稱時通常直擊消費者要害,“增發”、“生發”等詞匯十分醒目且目標明確。“生姜”、“植物”、“草本”等商品特征也位列榜上,說明大家在選購防脫發產品時往往也會考慮到商品成分,以天然取材為成分導向的商品更得人心。此外,海外廠家也試圖在中國市場分一杯羹,“進口”、“日本”、“韓國”等詞匯預示著防脫發產品市場的競爭激烈性。
從詞頻列表中取最高頻的20個關鍵詞,其在一定程度上代表了商品特征。遍歷所有商品標題看其是否包含選出的20個關鍵詞,若包含則將該商品的銷量/價格數據放在關鍵詞的value中。統計后對每個關鍵詞的value求平均值,再根據平均銷量排序得圖5、6。

圖5 商品特征與平均銷量Top20

圖6 商品特征與平均售價Top20
“止癢”、“去屑”、“控油”等基本洗護功能平均銷量最高,“增發”、“發際”、“增長”等功能次之。說明消費者在選購防脫發產品時首先看重其基礎功能,商家列出的強功效有一定增色效果。專業的種植、植發服務售價最高,“脂溢性”、“修復”、“產后”等具有特定功效的產品售價也較基礎功能產品高。即大家如果真有脫發困擾,不要貪圖便宜購買一般商品,建議尋求專業治療。

圖7 前兩千商家數量全國分布圖

圖8 前兩千商家平均銷量全國分布圖
對比圖7和圖8,可以發現沿海省份在防脫發商品賣家中名列前茅,廣東省更是一枝獨秀,浙江區居第二;說明沿海省份是我國防脫發產品的主要生產和出品商。但在平均銷量方面,較圖7的商家數量分布有了大規模洗牌:廣東省依然高居榜首,而湖北賣家的業績似乎也表現不俗;四川、吉林、云南等省份也進入消費者視野。假設賣家所在地就是商品的原料供給地,筆者不由猜測:以上省份會不會擁有某些特殊的成分優勢?或是其他的地理因素?這還有待進一步探究。
通過以上數據分析,筆者得到了一些有趣的結論:
(1)絕大部分商品的售價在300件以內,定價在60至90元區間的商品最受消費者歡迎。總體來看爆款商品較少,多數商品銷量平平。
(2)商品標題方面,商家在取名時通常言簡意賅,目標明確;而消費者在選購防脫發商品時多選擇基礎功能商品,對于商家吹噓的強功效不完全相信。
(3)沿海省份為我國防脫發產品的主要生產和出品商。除廣東省外,湖北、四川、吉林等內陸省份在商品銷量方面同樣表現不俗。
綜合以上分析結果,當筆者面對一位即將進入市場的防脫發商品賣家時,將建議他設置商品標題為“基礎功能+加強功效”組合,同時重視商品本身的性能;定價方面,結合具體成本將價格設置在60-90元區間。最后,建議他在初期確定商品配方時去廣東、湖北、四川、吉林等省份做下調研,這樣也許會使其商品更加暢銷。