鄭 新
(閩南理工學院信息管理學院,福建石獅362700)
隨著電子商務平臺的發展,我國的在線交易呈激增式發展。根據2019年《第44次中國互聯網絡發展狀況統計報告》,截至2019年6月,我國網絡購物用戶規模達6.39億,較2018年底增加2871萬,占網民整體的74.8%[1]。同時,跨境電子商務的進口額也持續增長。可見,通過電商進行的在線消費行為已經成為我國主要的消費形式之一。因此,對用戶在線消費行為的分析和研究具有重要意義。
在此背景下,利用電商平臺的交易數據對消費者的消費行為進行預測并據預測結果進行產品推薦成為重點研究領域。在國外,對用戶消費行為的分析和建模工作開始于20世紀末,但是由于當時數據量小、數據收集方法單一、設備計算能力有限等原因,對消費者行為的建模一直處于停滯狀態。21世紀以來,隨著網絡技術的不斷完善和消費行為數據的持續累積,各電商逐步將用戶行為建模應用到國際商品推薦系統中。對消費者的行為分析的關鍵問題主要有:1)大量的數據收集問題;2)大量的數據標記問題;3)概念漂移問題;4)行為預測的計算負責度問題[2]。圍繞上述4個關鍵問題,Benevenuto F等通過采集大量數據獲取了網站的拓撲結構,從而得出了社交網絡與用戶行為之間的關聯關系;分析網站點擊數中的http請求,建立Session及點擊數等參數[3]。Fabian Abel提出利用分析微博的發布內容進行用戶形象刻畫,從而實現對該用戶的新聞推薦功能[4]。文獻[5]依據Facebook的數據分析了用戶的喜好。國內也有很多學者開展了基于消費數據的用戶行為分析工作。例如,文獻[6]提出了基于貝葉斯方法的用戶消費行為建模和預測,文獻[7]提出了一種基于改進型k-means算法的用戶消費行為分析方法,文獻[8-9]提出了基于深度學習的用戶消費行為預測方法,文獻[10]對用戶偏好進行了建模并根據建模結果對用戶進行相應的產品推薦工作,文獻[11]通過分析用戶的系列消費行為對用戶進行推薦。
(2)對照品溶液的制備:取黃芪甲苷對照品 適量,精密稱定,置25 mL量瓶中,加甲醇溶解并稀釋至刻度,制成含黃芪甲苷495.5 μg/mL對照品溶液。
但是,目前的推薦方法沒有綜合分析購物者各類消費行為對用戶消費量的影響,例如不同的消費行為對用戶消費量的影響:購物者的購物渠道對用戶消費量的影響、用戶瀏覽的數據對用戶消費量的影響、用戶購物時使用的設備對用戶消費量的影響、用戶購物時的地理位置對對用戶消費量的影響、用戶的購物時間對用戶消費量的影響等。本文為了解決上述問題,利用Gstore消費行為數據中的用戶消費行為對用戶消費量的影響進行分析。
病例1 男性,79歲。因“持續上腹疼痛伴氣促11 d”入院 ,外院診斷“AP”,但治療后癥狀改善不明顯而轉入我院。入院后檢查,患者血清胰酶升高超過正常值3倍,并有膽囊結石,但腹部體征不明顯,胰腺影像改變與患者呼吸道癥狀和低氧血癥不相符,隨即行胸部增強CT(CECT)檢查,結果提示右側肺血管內血栓形成(圖1),修正診斷為肺栓塞,予溶栓抗凝治療后癥狀改善。
以上主要介紹了Gstore的數據結構格式,本文的模型和實驗結果都是基于上述數據結構所得出的結論。
在進行分區管理時一般將區域劃分為3級。1級分區主要是依據行政管理進行劃區;2級分區主要是1級分區中漏損嚴重區域,包括供水只限、用水大戶等;3級分區一般為層疊式的,為上層分區中流入的。在DMA分區中要考慮的因素眾多,如自然邊界、地形差異、調度運行、壓力管理、管網現狀和用戶結構等[4]。DMA分區計量管理的內容主要包括:DMA邊界確定、管網水力模型建立、管網信息調研、用水用戶調查、規劃分析語DMA邊界確定、壓力控制和優化調度分析等。DMA檢測漏損的具體技術流程如圖2所示。
用戶在購買和選擇商品的時候會產生一系列的行為和數據指紋,主要包括用戶在谷歌商店的唯一標識符(Full Visitor Id)、用戶進入谷歌商店的途徑(Channel Grouping)、用戶在谷歌商店的瀏覽數據、用戶訪問谷歌商店所使用的設備、訪問谷歌商店的用戶的地理信息、用戶單次訪問谷歌商店的標識符、是否關心社會、會話信息的集合、信息源、會話標識、會話次數、會話開始時間等信息。數據各字段的詳細介紹如表1所示。
定性選擇模型是指從2個或者更多個離散的選項中做選擇的過程。經典的離散選擇模型主要有Logistic Regression(LR)和Probit Regression(PR)。這2種模型是通過計算選擇某個產品的概率來確定推薦結果的。定性選擇模型主要用于社會計算、市場營銷、心理學等領域。在產品推薦方面,主要工作包括基于用戶偏好的興趣點選擇[12]和用戶選擇餐館的偏好預測[13]等。
本節主要介紹用戶消費行為分析的場景和數據集特點,然后給出模型部分使用的一些基本概念和原理。
本節根據第3節的設計目標對實驗結果進行了分析和總結,主要有實驗設置和實驗結果分析等,主要分析了不同的參數對消費量的影響。圖5展示了不同的操作系統對消費量的影響,其中使用Chrome購物的消費者最多,占69.08%;使用safri購物的消費者占20.04%;利用firefox進行消費的用戶占3.77%。
在線預測模型是指在線實時預測用戶的消費行為,從而為用戶提供相似度較高的推薦產品,以提高電商網站的經濟效益。這些方案通常都是利用大量的電商實際銷售數據和用戶的瀏覽數據進行特征提取,從而準確預測用戶未來行為的[14-16]。目前,該類工作是消費者行為分析的主流模型,主要方法有邏輯回歸模型[17]、梯度提升決策樹模型[15]、基于社交網絡的相關模型[18]等。
其中,Channel Grouping的主要類別有"Organ?ic Search","Paid Search","Referral","affilicates","Direct"等關鍵字,分別表示普通搜索、平板搜索、鏈接搜索、機構搜索、直接訪問;Date表示的是訪問時間,格式為年月日,例如“20160902”;device指消費行為所使用的終端設備,主要包括瀏覽器類型、瀏覽器版本、操作系統、操作系統版本、是否是移動設備、設備分辨率等信息。其中device信息的格式為json格式,圖1是device數據結構的一個例子。

圖1 device數據結構實例
其中,geoNetwork表示用戶訪問時使用的地理信息,主要包括用戶所在的洲、國家、區域、城市及經緯度等信息。圖2是geoNetwork的一個實例。
其中,trafficSource只本次會話的信息源,主要用來表示本次會話來自哪些廣告投放商。圖3是trafficSource的一個實例。

圖2 geoNetwork數據結構實例

圖3 trafficSource數據結構實例
圖6展示了通過不同渠道進入商城的購物情況,其中通過原始搜索進行購買的成交量最高,占總成交量的42.99%;通過社交網站進入商城的占24.39%;直接進入商城的占15.42%;通過推薦進入商城的占11.89%;通過平板搜索進入商城的占2.55%。
目前,根據電商的交易數據預測消費者的方法主要分為兩種,分別是定性選擇模型和在線購買預測模型。其研究現狀分別如下。
為了根據GStore的數據總結消費者的綜合購物行為,本節設計了購物行為分析流程,其總體架構如圖4所示。由圖4可知,消費者購物行為分析流程主要有JSON數據格式解析,消費行為數據加載,數據預處理,不同消費數據對消費行為的影響分析,以及消費者收入預測等。其中,分析不同的消費數據對消費行為的影響主要包括瀏覽器的使用對消費行為的影響、不同的搜索模式對消費行為的影響、不同的操作系統對消費行為的影響、不同的設備類型對消費行為的影響、消費者所在的地區對消費行為的影響等幾個方面。
其中,解析JSON格式的數據主要是對"de?vice","geoNetwork","totals","trafficSource"等 4 個數據結構的解析,引入數據集主要是第2節中介紹的數據形式,其中數據集的結構為63 290行54列,數據預處理主要處理一些缺失的數據,主要是找到缺失數據的比例,以及缺失字段名稱等。分析不同的參數對消費行為的影響,主要是根據這些參數預測消費者的消費行為,從而利用消費者的消費行為對消費者的收入進行預測分析。

圖4 總體設計
(2)購房人對商品房買賣合同解除權的行使。對于尚未履行完畢的商品房買賣合同,進入破產程序后,購房人可依據《破產法》第18條規定,向管理人提出解除合同的催告,如管理人在收到該催告之日起30日內未答復對方當事人的,視為解除合同。通常情形下,在破產案件受理時,往往已經存在房地產企業延期交房等違約事實,因此,購房人還享有《合同法》上的解除權。合同解除后,購房者可依照《破產法》將其對債務人享有的返還購房款債權或損害賠償請求權向管理人進行債權申報。

圖5 不同的瀏覽器對消費量的影響
其中,totals表示本次操作次數的匯總,主要包括訪問次數、點擊次數、訪問的頁面數等信息,這些數據也是JSON格式,{"visits":"1","hits":"3","pa?geviews":"3","newVisits":"1"}是其中的一個實例。
圖7展示了不同操作系統對消費量的影響,其中通過windows系統進行交易的占38.75%,通過Macintosh進入商城的占28.04%,通過android進入商城的占14.15%,通過iOS成交的占11.75%,通過linux進入商城的占3.91%。
神像高一丈,身體由整塊的白玉雕鑿而成,雙翼則是用青碧色的翡翠雕刻。一束月光從神殿頂部預留的天窗直射而下,打在神像上,令神像的身體泛起柔柔的白芒,雙翼青光流轉,仿佛隨時都要振翅沖天。
圖8展示了不同的設備對成交量的影響,其中通過電腦成交的占73.5%,通過移動設備成交的占23.12%,通過小型移動設備的成交量占3.38%。

圖6 不同的搜索渠道對消費量的影響

圖7 不同的操作系統對消費量的影響

圖8 不同的設備類型對消費量的影響
圖9展示了不同的地區對消費產生的影響,其中北美的消費者占44.18%,東南亞的消費者占8.29%,北歐的消費者占6.73%,南亞的消費者占6.33%,西歐的消費者占6.23%。
We also found that approximately 10% of the obese and overweight hospitalized patients were undernourished and that the risk of malnutrition was present in more than one-third of the obese and overweight gastroenterological patients, with rates that reached 80%in > 65-year-old obese inpatients.

圖9 不同的地區對消費量的影響
本文分析了Gstore消費數據,根據消費數據綜合分析了用戶的消費行為,并對用戶的不同消費行為對消費者消費量的影響進行分析,包括使用不同的瀏覽器對用戶消費量的影響、使用不同的搜索模式對用戶消費量的影響、使用不同的操作系統對用戶消費量的影響、使用不同的設備類型對用戶消費量的影響、消費者所在的地區對用戶消費量的影響等,可以為谷歌商店的推廣策略提供依據。