栗 巍,樊重俊,許 康
(上海理工大學(xué) 管理學(xué)院,上海 200093)
航空運(yùn)輸業(yè)的收入主要由航空收入與非航空收入構(gòu)成,行業(yè)內(nèi)各大公司在收入結(jié)構(gòu)調(diào)整上,都在努力向提高非航空收入轉(zhuǎn)變。在非航業(yè)務(wù)、如零售、餐飲、休閑等方面,均需進(jìn)一步推動(dòng)其朝著更加精細(xì)化的方向發(fā)展,加之全國(guó)經(jīng)濟(jì)保持增長(zhǎng),航空運(yùn)輸業(yè)企業(yè)所在地的經(jīng)濟(jì)對(duì)其非航業(yè)務(wù)的影響也較為顯著,居民生活水平提高對(duì)其零售等業(yè)務(wù)有著積極的促進(jìn)作用。因此,積極利用機(jī)場(chǎng)所帶來(lái)的高客流量,實(shí)現(xiàn)非航收入的高附加值,從而優(yōu)化公司整體收入結(jié)構(gòu)是十分重要的發(fā)展方式。
相對(duì)于美國(guó)等發(fā)達(dá)國(guó)家在航空運(yùn)輸業(yè)的產(chǎn)業(yè)投入結(jié)構(gòu)對(duì)比,國(guó)內(nèi)航空運(yùn)輸業(yè)極大依賴第二產(chǎn)業(yè)。因此,基于本國(guó)國(guó)情,國(guó)內(nèi)航空運(yùn)輸業(yè)在餐飲、零售等第三產(chǎn)業(yè)相關(guān)方面做出突破和改變來(lái)促進(jìn)非航收入是更為現(xiàn)實(shí)的。對(duì)此,抖音的推薦算法思路是一種值得研究的好方法。抖音的推薦算法結(jié)合用戶偏好、社交關(guān)系、公共議題、場(chǎng)景、差異化和平臺(tái)優(yōu)先級(jí)等6個(gè)方面將內(nèi)容精準(zhǔn)推送給用戶。推薦算法中基于用戶信息與數(shù)據(jù)的協(xié)同過(guò)濾機(jī)制又將頭部流量池的內(nèi)容精準(zhǔn)推薦給用戶,幫助抖音提高新用戶留存率。其算法核心在于協(xié)同過(guò)濾,目的在于挖掘用戶潛在興趣,提高用戶粘性。用戶潛在興趣轉(zhuǎn)化與用戶留存率提高的這樣一種運(yùn)行模式與航空運(yùn)輸業(yè)中伴隨的高凈值客流量具有較高契合度。
此外,疫情的不利影響以及近年來(lái)國(guó)內(nèi)航空運(yùn)輸業(yè)內(nèi)部成本偏高、融資結(jié)構(gòu)單一、利潤(rùn)率低等因素,對(duì)整體航空運(yùn)輸業(yè)產(chǎn)生了較大的不良影響,根據(jù)自身優(yōu)勢(shì)設(shè)置合理的運(yùn)營(yíng)模式至關(guān)重要。而隨著數(shù)字技術(shù)的快速發(fā)展,智慧機(jī)場(chǎng)建設(shè)進(jìn)度加快,智慧商業(yè)和全渠道數(shù)字化營(yíng)銷的運(yùn)營(yíng)模式逐步成為適合行業(yè)內(nèi)大部分企業(yè)的發(fā)展方向。因此,蘊(yùn)含數(shù)字智慧的電商運(yùn)營(yíng)模式逐步被航空運(yùn)輸領(lǐng)域的各大企業(yè)所重視。從將推薦算法應(yīng)用推向新高度的抖音興趣電商直播模式來(lái)看,2020年初僅有海南航空一家相關(guān)航空運(yùn)輸公司進(jìn)行了初步嘗試,到目前已有超過(guò)十余家相關(guān)公司涉足其中,其中包括海南美蘭機(jī)場(chǎng)、南方航空等大體量的公司。內(nèi)容促進(jìn)購(gòu)買欲是吸引各大航空運(yùn)輸公司入駐的根本原因,也是抖音電商的最大優(yōu)勢(shì),究其本質(zhì)還是推薦算法的應(yīng)用。
推薦算法在第三方電商平臺(tái)上的應(yīng)用已經(jīng)十分成熟,但智能推薦算法在航空運(yùn)輸業(yè)電商業(yè)務(wù)中的應(yīng)用還在不斷發(fā)展中。如抖音這類第三方電商平臺(tái),是當(dāng)下推薦算法在航空運(yùn)輸業(yè)應(yīng)用的雛形,航空運(yùn)輸業(yè)應(yīng)用第三方電商平臺(tái)的推薦算法,可有效提高非航收入。但對(duì)于本身具備較多優(yōu)質(zhì)流量的航空運(yùn)輸業(yè)來(lái)說(shuō),第三方平臺(tái)存在一些問(wèn)題,是電商業(yè)務(wù)發(fā)展的巨大桎梏:
(1)僅僅是平臺(tái)中的一個(gè)商鋪,缺乏較多的自主控制權(quán)。
(2)流量掌握在第三方平臺(tái)手中,一旦停止推廣投入,用戶量將大幅下降。
(3)不能得到詳細(xì)用戶數(shù)據(jù),不利于用戶營(yíng)銷分析,用戶忠誠(chéng)度相對(duì)較低。
因此,航空運(yùn)輸業(yè)發(fā)展具備推薦算法的自建電商平臺(tái),是未來(lái)打通自有商品零售與平臺(tái)自有優(yōu)質(zhì)流量間通道的重要途徑。但在自建電商平臺(tái)不成熟情況下,平臺(tái)只能起到廣告作用,發(fā)展自建電商平臺(tái)還需結(jié)合自身優(yōu)勢(shì)進(jìn)一步借鑒第三方平臺(tái)的經(jīng)驗(yàn)。
航空運(yùn)輸業(yè)自建電商平臺(tái)初期,自有的優(yōu)質(zhì)線下流量無(wú)法即時(shí)轉(zhuǎn)換到線上平臺(tái)。為了分析智能推薦算法在航空運(yùn)輸業(yè)電商業(yè)務(wù)中的具體應(yīng)用,同時(shí)基于航空運(yùn)輸業(yè)電商零售業(yè)務(wù)具有的商品單價(jià)高、商品種類少而集中、平臺(tái)流量多且優(yōu)質(zhì)等行業(yè)特性,應(yīng)用神經(jīng)協(xié)同過(guò)濾推薦算法框架NeuMF(Neural Matrix Factorization)對(duì)小樣本進(jìn)行分析,從而大致反映整體應(yīng)用情況。
神經(jīng)矩陣分解模型NeuMF,由廣義矩陣分解(Generalized Matrix Factorization,GMF)與多層感知機(jī)(Multilayer Perceptron,MLP)相結(jié)合得到,是協(xié)同過(guò)濾算法結(jié)合神經(jīng)網(wǎng)絡(luò)的智能化推薦算法。在NeuMF中,用戶和項(xiàng)目的稀疏向量分別通過(guò)GMF與MLP的embeding層,映射得到對(duì)應(yīng)的隱式向量。GMF將自身中的隱式向量做哈達(dá)瑪積運(yùn)算得到交互特征,MLP則通過(guò)感知機(jī)訓(xùn)練得到交互特征。在輸出前將GMF與MLP的交互特征進(jìn)行級(jí)聯(lián),再經(jīng)過(guò)一層感知機(jī)的加權(quán)運(yùn)算,最后通過(guò)函數(shù)得到一個(gè)0~1之間的預(yù)測(cè)分?jǐn)?shù),來(lái)表示用戶與物品間的相似度,基于此相似度進(jìn)行推薦。其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

圖1 NeuMF神經(jīng)協(xié)同過(guò)濾算法網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 NeuMF neural collaborative filtering algorithm network structure
本文通過(guò)問(wèn)卷調(diào)查,獲取了687份有效問(wèn)卷。問(wèn)卷內(nèi)容包括年齡、性別、乘機(jī)次數(shù)、乘機(jī)目的、候機(jī)行為傾向、機(jī)場(chǎng)電商平臺(tái)使用傾向等6個(gè)基礎(chǔ)問(wèn)題,用于分析問(wèn)卷分布的合理性。20個(gè)商品購(gòu)買傾向的打分問(wèn)題,用于調(diào)查購(gòu)物類別傾向,作為后續(xù)實(shí)驗(yàn)數(shù)據(jù)。問(wèn)卷主要獲取了共計(jì)5 181個(gè)打分?jǐn)?shù)據(jù)。
樣本數(shù)據(jù)量的合理性根據(jù)10倍法則來(lái)確定,即模型需要超出其自由度10倍的數(shù)據(jù)量進(jìn)行運(yùn)算。此處的自由度是影響模型輸出的參數(shù),數(shù)據(jù)集包含20類商品,自由度為20。通過(guò)687名調(diào)查對(duì)象得到了5 181條用戶與商品類目的評(píng)分交互數(shù)據(jù)。數(shù)據(jù)量已遠(yuǎn)高于NeuMF模型自由度的10倍,因此數(shù)據(jù)樣本的數(shù)量符合模型基本要求。同時(shí),對(duì)于航空運(yùn)輸業(yè)中已篩選的優(yōu)質(zhì)流量來(lái)說(shuō),通過(guò)少部分的數(shù)據(jù)就能夠?qū)θ诌M(jìn)行相對(duì)準(zhǔn)確的反映。數(shù)據(jù)整理結(jié)果見(jiàn)表1。

表1 數(shù)據(jù)集組成Tab.1 Composition of the data set
在NeuMF模型中進(jìn)行訓(xùn)練的問(wèn)卷數(shù)據(jù),還要對(duì)其做后續(xù)的整理和分類,從而獲得訓(xùn)練集、測(cè)試集、負(fù)例集。訓(xùn)練集和測(cè)試集中含有用戶序號(hào)、商品序號(hào)、打分三列數(shù)據(jù),負(fù)例集從測(cè)試集中將用戶序號(hào)和商品序號(hào)提取出來(lái),并在后面加上10類未與該用戶交互過(guò)的商品序號(hào)。通過(guò)3個(gè)分類好的數(shù)據(jù)集組成完整的數(shù)據(jù)集數(shù)據(jù)結(jié)構(gòu),如圖2所示。

圖2 數(shù)據(jù)集結(jié)構(gòu)Fig.2 The structure of the dataset
對(duì)NeuMF模型在數(shù)據(jù)集上訓(xùn)練的評(píng)價(jià),選用常見(jiàn)的命中率(Hits Ratio,)和歸一化折損累計(jì)增益(Normalized Discounted Cumulative Gain,)。
Top-K推薦算法(前項(xiàng)推薦算法)是從用戶交互過(guò)與未交互過(guò)的個(gè)商品中,得到一個(gè)含有個(gè)商品的推薦列表。在測(cè)試中,從該列表中取得交互過(guò)的商品即為推薦成功。
表示在模型計(jì)算得到的推薦列表內(nèi),包含測(cè)試集中個(gè)數(shù)的占比。就是按預(yù)測(cè)分?jǐn)?shù)大小,對(duì)負(fù)例集中的項(xiàng)進(jìn)行排序,取前個(gè)商品進(jìn)行推薦,形成推薦列表,再計(jì)算全部測(cè)試集中對(duì)應(yīng)在推薦列表中的個(gè)數(shù)與測(cè)試集中總數(shù)的比值,屬于召回率的評(píng)價(jià)指標(biāo)。用來(lái)評(píng)價(jià)推薦表的準(zhǔn)確度和質(zhì)量,數(shù)值介于01之間。其值越大,表明推薦的測(cè)試商品在推薦列表中的位置越靠前、評(píng)分越高,推薦效果越好。
在本例中,由于數(shù)據(jù)集的限制,每個(gè)用戶未交互過(guò)的負(fù)例最大數(shù)僅為10,限制了負(fù)例的數(shù)量。因此,在較小負(fù)例數(shù)量中,值的少量增大會(huì)導(dǎo)致與的明顯提高。在問(wèn)卷數(shù)據(jù)集中,取不同值的與指標(biāo)如圖3所示。

圖3 不同K值(推薦數(shù)量)下評(píng)價(jià)指標(biāo)變化曲線Fig.3 Changes of evaluation indicators under different K values
由圖3中可見(jiàn),與隨值的增大而顯著提升。但在本例實(shí)驗(yàn)中,值大小對(duì)與具有不同的意義。等價(jià)于從負(fù)例集的11個(gè)商品中推薦個(gè)商品,其中包含測(cè)試商品的概率與測(cè)試商品在個(gè)商品中的排名效果用與來(lái)描述。當(dāng)值較小時(shí),相比隨機(jī)概率(從11個(gè)負(fù)例中隨機(jī)抽取個(gè)商品,測(cè)試商品在個(gè)中的概率)優(yōu)勢(shì)越明顯,越能反映指標(biāo)。當(dāng)值越大時(shí),推薦列表包含的商品越多,越能反映指標(biāo)。
@與@在本例實(shí)驗(yàn)的小樣本問(wèn)卷數(shù)據(jù)中表現(xiàn)較好,說(shuō)明在行業(yè)特性的局限下,即使是在發(fā)展自建平臺(tái)初期,針對(duì)用戶數(shù)據(jù)與商品數(shù)據(jù)較少的情況下,NeuMF等智能推薦算法也能夠?qū)τ脩暨M(jìn)行高效推薦,發(fā)掘用戶消費(fèi)興趣、促進(jìn)購(gòu)買成交,從而增加電商業(yè)務(wù)的整體營(yíng)收。
在進(jìn)行了模型訓(xùn)練、指標(biāo)評(píng)估等詳盡分析后,為了實(shí)證模型的實(shí)用性與有效性,隨機(jī)抽取5名用戶,根據(jù)先前的訓(xùn)練模型對(duì)這5名用戶推薦20類商品中的6類,并與這些用戶的實(shí)際交互商品進(jìn)行對(duì)比,觀察其推薦的準(zhǔn)確率和質(zhì)量。5名用戶的推薦實(shí)例情況見(jiàn)表2。

表2 5名隨機(jī)用戶推薦實(shí)例Tab.2 Five random users recommendation examples
對(duì)選取的5名用戶做Top-6推薦,分別輸出了5名用戶的推薦列表。從表2中可以看出,最低的用戶6個(gè)推薦中命中了3個(gè),最高的用戶6個(gè)推薦全部命中,說(shuō)明實(shí)際推薦過(guò)程中推薦準(zhǔn)確性較高。此外,從排序上來(lái)看,與實(shí)際交互情況有所差異,存在未交互過(guò)的商品排名比交互過(guò)的商品還高,說(shuō)明推薦的質(zhì)量有待提高。造成該問(wèn)題的主要原因是數(shù)據(jù)集較小,在數(shù)據(jù)集不斷增大后,該問(wèn)題能夠得到緩解。
在推薦列表中未交互過(guò)的商品,就是通過(guò)模型訓(xùn)練得出的對(duì)用戶存在興趣的推薦,說(shuō)明了推薦的有效性。綜上,NeuMF神經(jīng)協(xié)同過(guò)濾推薦系統(tǒng)對(duì)航空運(yùn)輸業(yè)自建電商平臺(tái)初期用戶的實(shí)際推薦過(guò)程是有效合理的。
NeuMF這類智能算法在自建電商平臺(tái)的合理性應(yīng)用,將為航空運(yùn)輸業(yè)在非航收入的提升上帶來(lái)巨大助力,同時(shí)自建電商平臺(tái)的以下優(yōu)勢(shì)將進(jìn)一步加強(qiáng)航空運(yùn)輸業(yè)本身所在平臺(tái)的優(yōu)勢(shì):
(1)平臺(tái)獨(dú)立,具備獨(dú)立域名;商場(chǎng)個(gè)性化、細(xì)分化特征明顯;平臺(tái)的推廣與普及將增加公司品牌價(jià)值;沒(méi)有中間商賺差價(jià)。
(2)利用社交電商、內(nèi)容創(chuàng)作的思路,能夠獲取更多更廣的私域流量。通過(guò)對(duì)這些私域流量的經(jīng)營(yíng),獲取更高的價(jià)值,進(jìn)一步加強(qiáng)自身平臺(tái)優(yōu)質(zhì)流量?jī)?yōu)勢(shì)。
(3)用戶數(shù)據(jù)由自身絕對(duì)掌握。通過(guò)分析用戶行為,實(shí)現(xiàn)針對(duì)性的推廣與服務(wù),提高自有用戶粘性,增加自有流量轉(zhuǎn)化率。
航空運(yùn)輸業(yè)收入多元化趨勢(shì)勢(shì)在必行,智能推薦算法等數(shù)字化技術(shù)的融入為其多元化方式帶來(lái)更多的可能。本文基于航空運(yùn)輸業(yè)發(fā)展電商業(yè)務(wù)的趨勢(shì),融入當(dāng)下時(shí)興的智能推薦算法,提出了應(yīng)用自建電商平臺(tái)結(jié)合智能推薦算法在航空運(yùn)輸業(yè)中應(yīng)用的設(shè)想,并通過(guò)數(shù)據(jù)收集、整理形成規(guī)范數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),初步驗(yàn)證了智能推薦算法結(jié)合自建電商平臺(tái)在航空運(yùn)輸領(lǐng)域中應(yīng)用的合理性。提出的這一模式將充分發(fā)揮航空運(yùn)輸業(yè)平臺(tái)本身具備的有效流量?jī)?yōu)勢(shì)。