李佳珂,曾清清
(1.海南大學旅游學院,海南海口570228;2.聊城大學計算機學院,山東聊城252059)
隨著經濟不斷發展,旅游業不斷活躍,人們在享受旅游帶來的樂趣的同時,不得不承受高昂旅游住宿費用。近年來,依托云計算和物聯網平臺,共享經濟得到不斷推進和發展。作為共享經濟和旅游業的融合產物,共享住宿也逐漸成為人們關注的熱點。據統計,2017年“十一”黃金周,不少旅游者住宿到共享住宿平臺提供的房間。據近年來《中國共享經濟發展年度報告》結果顯示,中國共享住宿業交易額在2020年達到225億元,在全部住宿業客房收入占比達到6.7%。圖1 展示了2015—2020 年中國共享住宿市場規模變化趨勢。圖2 顯示了2016—2020 年中國共享住宿收入占全國住宿業客房收入比重變化趨勢。由圖可見,2018—2019 年是共享住宿市場熱潮時期,之后共享住宿發展趨向平緩,2020年受新冠肺炎疫情影響,共享住宿市場進入寒冬季。為打破這種僵局,2020 年7 月,發改委等13部門印發的《關于支持新業態新模式健康發展激活消費市場帶動擴大就業的意見》,明確提出鼓勵共享住宿,發展生活消費新方式,至此,鼓勵發展“共享住宿”首次寫入政府文件。

圖1 中國共享住宿市場規模變化趨勢

圖2 中國共享住宿占全國住宿業客房收入比重變化趨勢
文獻[1]以共享短租平臺小豬短租網站的房源數據為例,分析了共享短租平臺供給者端的房源及房東特征。該文獻分析指出規模化的房東的定價往往高于離散化的房東,另外,共享房源的定價還會受到包括房源位置、配套設施、交通方便性、二手房房價等諸多因素的影響。文獻[2]以Airbnb 與攜程平臺為例,對共享與傳統住宿平臺價值創造因素進行分析。文獻[3]則從政府被動反應、政府主動引導和政府與平臺合作三種不同監管機制出發,分析了城市共享住宿監管的路徑、機制和措施。文獻[4]則以Airbnb 共享住宿為研究對象,借助空間分析工具,對上海市2010—2019年期間共享住宿位置空間變化進行過了分析,并針對道路密度、經濟水平、房源供給、服務群體與空間集聚等因素進行了加權回歸分析和研究。文獻[5]分析了Airb‐nb在共享住宿領域里的商業模式創新及其面臨的業績計量難題。文獻[6]以Airbnb北京地區的在線短租數據為分析對象,研究了房源定價合理性對房源熱度的影響關系。文獻[7]2010—2019年北京市Airbnb數據為基礎,運用GIS空間分析和空間變差函數方法進行時空演變及集聚特征進行分析。文獻[8]則運用TRIZ 理論模型,提出了共享住宿標準體系的構建過程及體系框架。文獻[9]從小豬短租平臺上爬取的北京、上海、廣州和深圳等地的6953 條有效房源數據,揭示了房客可持續消費行為的影響機制,為提升共享經濟中消費者的可持續消費行為提供新思路。文獻[10]針對共享住宿文獻進行綜述分析,指出2012—2015 年為萌芽階段,2016—2019 年為發展階段。文獻[11]則對共享住宿中信任的概念、信任的類型、信任研究的理論基礎,以及房客、房東視角下信任建立的前因變量、信任的對象和結果變量的剖析。文獻[12]則分析了共享住宿發展的信任、監管兩個維度,房東、游客、產品和平臺四個方面的因素等對共享住宿的影響,探討了包括案例分析歸納、深度訪談、文本分析、內容分析、結構方程模型、特征價格模型、最小二乘法、固定效應回歸模型等研究方法。文獻[13]則圍繞如何正確引導共享經濟健康發展中應對道德風險的挑戰,以愛彼迎為單案例進行研究。
民宿日益成為旅游過程中非常重要的一環,然而,很多旅客對于民宿還不是非常熟悉,導致民宿住宿量還不是很高,通過網站搜索可以看到北京某地的民宿信息如圖3所示。隨著民宿的不斷發展,結合共享經濟的推進,共享民宿已經成為民宿經濟的重要分支。

圖3 民宿信息搜索圖
Airbnb 是共享住宿的先驅,其核心思想是采用點對點(peer-to-peer)住宿模式。通過把房東的空余房間與旅行者的住宿需求建立聯系,實現了共享住宿,促進了旅游住宿的新發展。自2008 年成立以來,Airb‐nb 已經成為覆蓋全球190 多個國家和地區、涵蓋81000多個城市的全球共享住宿平臺。2015年Airbnb引入中國,并迅速發展。
Airbnb 數據針對每個房源主要分為6個板塊,即房源詳情、評價信息、可訂日期、房源位置、旅客須知、房東信息。具體如下:
1) 房源詳情:房源名稱、臥室數量、床數、衛生間類型和數量、最多容納旅客數量等;
2)評價信息:房源收到的評論總數、房源旅客的如實評價信息等;
3)可訂日期:房源最早可預訂日期、房源最少入住天數、房源最多入住天數等;
4) 房源位置:房源所在省份、城市,所在經緯度,周邊配套公交、地鐵、交通信息等;
5)旅客須知:房源對旅客入住的基本要求、取消預訂政策和交易提示、是否禁止攜帶寵物入住等;
6) 房東信息:房東的名字、聯系方式、房東是否為超贊房東、房東收到的總評論數、房東自我介紹等。
表1 給出了Airbnb 平臺上北京某地共享住宿房源的關鍵信息。圖4展示了Airbnb網站展示的北京共享住宿數據。圖5展示了中國香港共享住宿部分數據和比率分析。由上述圖表可見,相對于民宿信息搜索結果,Airbnb 共享住宿平臺發布的數據更為詳細和穩定。

圖4 Airbnb網站展示的北京共享住宿數據

圖5 中國香港共享住宿數據展示(部分)

表1 Airbnb數據示例
本文采用LocalSpace Viewer 進行地圖標記。LocalSpace Viewer是一款集成多種在線地圖資源,包括百度地圖、天地圖、影像、標注。該軟件特點是瀏覽速度快、支持載入天地圖影像、騰訊影像等多家影像數據、支持載入天地圖地圖、標注、道路標注等。以中國香港共享民宿為例,地圖標記的具體步驟如下:
第一步,先從Airbnb 網站(http://insideairbnb.com/get-thedata.html)下載中國香港共享民宿的數據,找出其中的listings.csv文件;
第二步,打開listings.csv 文件,找到經度緯度對應的列,如圖6所示。需要注意的是,經緯度數據每一行的位置有時候不一致,需要調整位置;

圖6 中國香港共享住宿數據展示(部分)
第三步,復制每個共享住宿的經緯度數據到一個單獨的Excel文件,比如Hongkong.xlsx;
第四步,打開LocalSpace Viewer 軟件,選擇工具箱菜單中的“Excel轉KML”工具如圖7所示,彈出對話框如圖8所示;

圖7 Excel轉KML工具示意圖
第五步,在圖8對話框中,選擇“打開XLS”,選擇Hongkong.xlsx,選擇經緯度列的編號,然后選擇生成點,生成KML 文件,顯示結果如圖9所示。

圖8 Excel轉KML工具對話框圖

圖9 中國香港部分共享住宿標記圖
網絡爬蟲(又稱為網頁蜘蛛、網絡機器人、網頁追逐者),是一種按照一定的規則,自動地抓取Internet 網信息的Python 程序或者腳本。通過適當設置需要爬取的特征,網絡爬蟲可以獲得有效信息。本文通過下載Airbnb網絡爬蟲,爬取了北京共享住宿網站的信息,爬取過程如圖10所示。通過爬取數據,獲得每個共享住宿的有效信息字段,包括價格、浴室數量、臥室數量、床的數量、網址、可住旅客數量、所在城市、緯度、經度、評分、評論數量、具體評價信息、星級、附加服務信息等。

圖10 Airbnb網絡爬蟲爬取過程圖
經過20小時的爬取,獲得5543條共享住宿信息,上述信息保存在Excel 表格中,通過導入LocalSpace Viewer 進行地圖標記,結果如圖11所示。

圖11 北京部分共享住宿標記圖
需要指出的是,Airbnb網站提供了部分城市的共享住宿地圖標記圖,但國內僅限于北京、上海、中國香港三地,其他城市Airbnb分布圖可以通過本文的方法進行地圖標記。
共享住宿信任值是一個非常關鍵的變量,影響了旅客的選擇,一般來說信任值受到多個變量的影響[14-17],如表2所示。

表2 影響共享住宿信任機制的關鍵變量及其含義
因變量作為信任的重要載體,體現了房客對不同房源的信任度的高低。信任水平高,房客與房東之間更容易建立信任關系。因此,隨著共享經濟不斷發展,信任值越來越體現其重要性。
回歸樹法是一種比較有效的信任值因素分析方法。具體步驟包括:
1)采用網絡爬蟲爬取某地區共享住宿房源的信息,信任相關的要素包括臥室數量、床位數量、最大可容納人數、總評論數、同類房源平均評論數、差評率等;
2)計算實際收到的評論數量與同類房源平均評論數的差異率作為信任的替代變量;
3)建立若干個回歸樹模型,模型篩選出對信任水平造成影響的主要因素、作用方向、作用強度信息;
4)分析回歸樹各級節點,分析出某個信任因素對信任水平的影響度。
與信任機制相關的其他方法還有很多,主要有:
1)核密度估計
核密度估計主要用于房源點位數據的空間聚集度分析,即共享住宿房源在空間擴散的距離衰減規律。
2)空間自相關
空間自相關主要用于分析地理位置相近的不同共享住宿房源,描述分析其相關度。莫蘭指數是一種評價空間自相關的系數,其含義是用于判別空間是否存在自相關。
空間自相關方法分為全局自相關和局部自相關兩類[4]。

式中:Id為全局相關莫蘭指數;Ii為局部區域自相關性;n為所研究房源的數量;Xi、Xj為區域i、j的共享住宿房源密度;wij為空間權重矩陣;S2為區域觀測值方差[4]。
本文針對共享住宿Airbnb 平臺的數據進行分析,采用Py‐thon 網絡爬蟲進行數據爬取,之后采用LocalSpace Viewer 進行地圖標記,方便對Airbnb 數據進行展示。另一方面,針對共享住宿信任機制,以Airbnb數據分析結果為基礎,分析了回歸樹、空間相關性等方法。