張坤 李春林 張津沂



[摘 ? ?要]根據凝視理論,圖片在一定程度上反映了游客在旅游目的地的感知偏好和行為特征。然而,對圖片大數據進行視覺內容分析的旅游研究,由于技術限制仍處于廣泛探索階段。文章以北京入境游客為研究對象,引入計算機視覺領域的場景識別模型,對2004—2013年游客在社交媒體網站Flickr上分享的36 595張照片進行視覺內容識別與分類,并按照旅游基本活動“食、住、行、游、購、娛”的框架將機器識別出的103類場景進行篩選,最終將游客照片劃分為10種主類別28種子類別。基于數據結果,文章對北京入境游客的整體感知特征及行為足跡的時空演變進行了分析。在實踐方面,研究結果為旅游目的地管理部門制定針對性的空間發展和市場政策提供了依據。在理論方法方面,研究拓展了計算機視覺技術和圖片大數據在旅游領域的應用范疇。
[關鍵詞]圖片大數據;深度學習;游客感知;游客行為;時空演變
[中圖分類號]F59
[文獻標識碼]A
[文章編號]1002-5006(2020)08-0061-10
Doi: 10.19765/j.cnki.1002-5006.2020.08.012
引言
理解游客在旅游目的地的感知和行為是有效促進旅游目的地發展的重要前提[1],也是旅游目的地研究的重要議題。對于游客而言,照片起著記錄和回憶其旅行經歷的作用[2],其以微妙又明顯的方式傳遞了游客對目的地的感知,同時也是反映游客在旅游目的地行為的重要依據[3-4]。隨著社交媒體平臺的不斷發展,將游客分享照片的視覺表征作為研究資料進行內容歸納和頻次分析,已經成為探索游客感知和行為的重要研究方法[5-7]。另外,從數據特征來說,圖片作為用戶生成內容的重要部分,不僅包含有豐富的可視化內容,同時還攜帶大量的時空信息[8],是開展旅游研究的一項重要數據來源[4, 9]。受視覺內容分析技術的局限,目前關于游客感知和行為的圖片研究,多是通過人工逐個識別實現,一次性能夠分析的圖片數量往往比較有限[10]。近些年,隨著計算機技術領域的不斷突破,計算機視覺與圖片處理技術使得對大體量的圖片內容進行識別變得可行。類似的研究在旅游目的地領域已有少量探索,但從目前的研究深度上看,仍是需要不斷探索的一個方向。
本研究以北京為例,通過應用計算機視覺領域的深度學習模型,對Flickr網站中提取的圖片大數據進行視覺內容分析,試圖拓展圖片大數據分析技術在旅游領域的應用范疇。具體研究目標包括兩個方面:第一方面是探索入境游客對北京旅游目的地的感知特征及其演變過程;第二方面為結合圖片的地理坐標信息,解讀游客在旅游目的地的行為特征及時空演變過程。
1 研究綜述
1.1 圖片與旅游目的地研究
1992年,英國社會學家John Urry提出“游客凝視”(tourist gaze)理論[11],游客凝視重點關注的是游客對目的地的視覺感知[8]。其提出的“表征圈循環”(hermeneutic circle of representation)理論認為,照片能夠反映旅游目的地形象,旅游者拍攝的照片與旅游目的地形象密不可分,它們共同構成一個自我強化的“表征”[12-14]。由于旅游圖片攜帶豐富的視覺表征信息與非視覺信息[15],且其反映游客對旅游目的地形象的感知[16],對旅游目的地形象構建有重要的作用[17],游客分享在網絡上的圖片成為旅游目的地研究的重要視點[10, 18]。目前,借助旅游圖片數據開展的旅游目的地研究主要集中于兩個方向:一是通過解讀圖片的視覺內容分析游客在旅游目的地的感知,服務于旅游目的地形象優化與改善;二是分析游客的行為模式,即利用圖片的地理信息分析游客在旅游目的地活動的時空及演變特征,應用于旅游目的地空間發展。
1.1.1 ? ?圖片與游客感知
Stepchenkova和Zhan指出游客攝影照片是分析旅游者對旅游地感知的一個良好途徑[10];Pan等認為照片記錄了當時的現實并反映了拍照者的內心活動,旅游照片成為一種可以研究和識別游客對目的地感知的透鏡[19]。研究過程方面,戴光全和陳欣按照拍攝對象將游客攝影照片分為人物類、景觀類、場景類和特寫類,以獲取游客在旅游目的地的行為與感知偏好[20]。Donaire等按照空間類型將照片拍攝題材分為自然景觀、人工景觀、物質文化和旅游設施4類,對游客感知偏好進行了研究[3]。Nikjoo等在研究了赴伊朗旅游的游客在社交媒體上分享的照片,將旅游圖片分為沒有人、只有旅游者、只有東道主,以及旅游者和東道主,分析了游客在主客互動方面的感知偏好[21]。
整體而言,目前這一類型的研究主要通過內容分析法、符號分析法等方法,提取旅游照片的視覺內容,并按照一定的分類方法進行特征研究,其中,分類方法是這類研究的關鍵。具體研究過程為,首先通過分類識別出照片的主題和目的地屬性,其次對其頻率、共現、聚類以及照片傳達出的視覺信息和潛在內容進行分析,進而獲取游客對目的地的感知偏好和行為特征。
1.1.2 ? ?圖片與游客行為
基于圖片的游客行為研究,主要集中于游客核心活動區域(area of interesting,AOI)及時空演變兩個方面[22-25]。Hu等利用從Flickr網站中獲取的關于紐約、巴黎、倫敦等6個城市從2004—2014年的數據,借助圖片附帶的地理坐標、文字標簽、主題等文字信息,對游客核心活動區域及演變進行了系統分析[26]。Vu等利用馬爾科夫鏈對游客在旅游目的地核心區域之間的空間移動模式進行了識別[27]。Zhou等基于計算機云平臺,將Flickr中的地理標記圖片信息與區域信息一一對應,并且對標簽進行信息分類和研究,建立主題旅游目的地熱點區域識別系統,分析熱門旅游地旅游者的偏好變化,包括熱門景點的遷移變化和照片喜好變化,為宏觀管理提供決策依據[28]。Bilhante等通過Wekipedia和Flickr采集游客熱門活動地點(places of interesting,POI)和地理信息圖片,以此作為數據基礎分析游客偏好,通過建立日程和旅游路線軌跡算法,構建基于游客日程的旅游線路推薦模型,并在3個城市的實驗中取得較為成功的效果[29]。Stepchenkova和Zhan采集秘魯的Flickr地理信息圖片,對圖片進行分類,并且通過分析圖片構成區別和地理位置分布,研究旅游者對秘魯的感知和評價[10]。
總結發現,基于地理坐標圖片數據的研究涵蓋了旅游目的地形象構成要素、旅游目的地空間結構模式和旅游目的地演化過程及規律幾方面[24, 30]。借助地理信息系統工具進行分析是主要做法,包括兩類分析維度,第一是以地理指數(Moran、LISA等)為指標,對空間進行“聚集、分散”分析以探索旅游目的地熱門區域[3, 27];第二是借助時空追蹤工具對游客的旅游線路和行為軌跡進行總結和比較[29]。
1.2 基于計算機視覺技術的旅游圖片大數據研究
計算機視覺技術是模擬人類視覺的一項重要工具,主要通過對收集到的圖片進行分析理解從而輸出圖片相關信息[31]。與人工識別相比,計算機視覺技術能夠憑借機器語言的優勢實現對大體量圖片數據的內容分析。基于這項技術,一系列基于圖片內容識別的研究已經被成功探索,并被廣泛應用到醫學、安防、無人駕駛、地理學和城市空間分析規劃等領域。
在旅游領域,借助計算機視覺領域的深度學習模型進行視覺表征層面的旅游研究,處于起步階段,仍有很大的空間需要探索[32-34]。如,Zhang等利用計算機深度學習技術,對來自Flickr的照片進行識別和統計分析,比較了不同國家游客的行為和感知差異[32]。鄧寧等選取Flickr上中國港澳臺地區、英國和美國旅游者拍攝的北京圖片中的附帶文本信息作為研究素材,采用計算機深度學習算法從認知和情感兩個層面分析圖片表征內容,比較了不同來源地游客在北京旅游目的地形象感知方面的異同[35]。
綜合來說,圖片承載著豐富的游客活動信息,對研究游客對旅游目的地的感知偏好和時空演變有重要意義[23]。隨著計算機視覺技術的不斷發展,借助機器學習的優勢對照片進行內容分析成為當前旅游研究的熱點,但如何有效結合不同議題開展研究還存在一定的探索空間。
2 研究過程、數據與方法
2.1 研究步驟
本研究將“游客感知”及“游客行為”作為關注點,通過圖片大數據的“視覺、時間、空間”3個方面數據信息,揭示“游客在旅游目的地的感知特征以及演變規律”和“游客行為的空間特征及其演變規律”,為旅游目的地發展提供借鑒。其中,圖片視覺內容和時間信息,用于支持游客在旅游目的地感知特征以及演變規律的分析;圖片時間、空間信息用于支持游客行為特征及演變規律分析。具體的數據處理與分析過程分為4個步驟:(1)數據獲取與凈化,(2)圖片大數據視覺內容分析,(3)基于視覺內容分析結果的分類,(4)時空演變分析。
2.2 數據獲取與凈化
本研究使用的數據來自YFCC100M(Yahoo Flickr Creative Commons 100 Million)數據集。YFCC100M是雅虎公司在2014年發布的公開圖片數據集,收錄了從2004年到2014年用戶上傳到Flickr網站中的接近1億張照片附屬信息。其中,包括Flickr用戶ID(Uid)、照片拍照時間以及上傳時間、拍攝地點、圖片的標簽、主題、描述以及圖片下載鏈接等內容[36]。本研究主要選取了4種類型的信息用于開展下一步的系統分析工作,包括:(1)Pid與Uid,用于識別照片數量以及用戶歸屬地信息;(2)拍攝時間,主要用于從時間角度分析游客感知和行為趨勢變化;(3)照片的經緯度位置,主要用于對游客足跡點的空間分布進行分析;(4)下載鏈接,主要用于獲取原照片對照片進行視覺內容的分析。
數據獲取和篩選的過程包括:首先,依據圖片的地理坐標信息提取出Flickr YFCC 100M數據庫中位于北京行政邊界內的照片信息,共144 968條。其次,通過調用應用程序接口(application programming interface,API)數據,對用戶的歸屬地信息進行追溯,共獲取到36 595條入境游客圖片信息。另外需要說明的是,由于YFCC100M數據庫中2014年的照片數據只到3月份,故本研究將時間跨度設定在2004—2013年,共計10年。
2.3 圖片大數據視覺內容分析
在計算機視覺領域,深度學習在近年來迅速發展并取得了一定的成果,在圖片識別與分類領域產生了許多深度學習模型,本研究所應用的為場景識別模型,該模型采用了He等在2015年提出的殘差神經網絡(ResNet)[37](圖1)。與其他架構相比,該深度學習架構具有強大的表征能力,具有高召回率與高精度,召回率達到90%,錯誤識別率為0.1%。
通過執行場景識別深度學習模型,北京入境游客的每張旅游圖片將獲得一個場景特征的標簽,輸出的結果共包括103類場景類別。
2.4 基于視覺內容分析結果的分類
圖像內容的分類標準對旅游研究起著導向性的作用。因此根據旅游場景內容之間的關聯程度將輸出的103類場景歸納為6個大類,10個二級子類(表1)。6個大類為食、住、行、游、購、娛,10個子類包括美食感知、居住感知、交通感知、建筑感知、動物感知、文化感知、植物感知、自然風光感知、購物感知以及娛樂感知。為了突出場景的代表性,同時減少數據偏差(模型錯誤識別率為0.1%),研究選取了照片數大于100的場景進行研究,共計30類場景。另外,在照片數大于100的場景中,藍天以及陰天多數情況是由于作為面積較大的背景而被識別。為了減少計算機視覺模型對實際主題的識別偏差,本研究將藍天和陰天兩個場景刪除。按照代表性和相關性兩個原則綜合對103類場景進行篩選分析,共選出了28類與旅游相關的場景,共計25 281條照片數據開展后續的研究。
2.5 時空演變分析
本研究用于空間分析的方法主要包括全局莫蘭指數、漁網分割、密度分析和點的時序追蹤。全局莫蘭指數(Morans I)是衡量空間自相關程度比較常用的指數類型,利用莫蘭指數,能夠反映空間中所有數據的相關性,從而展示空間的整體聚散程度。Morans I >0表示空間正相關性,其值越大,空間相關性越明顯。Morans I<0表示空間負相關性,其值越小,空間差異越大,Morans I=0,空間呈隨機性,用于反映旅游目的地景點片區游客的聚散情況。點的時序追蹤可以根據游客拍攝圖片的時間追蹤游客的行為足跡。將漁網分割(fishnet)和密度分析結合可以將游客在研究區域的足跡熱點有效可視化[38-39]。
3 數據結果
3.1 北京入境游客感知特征及演變規律
3.1.1 ? ?北京入境游客感知特征
根據場景的分類方法,對北京的入境游客感知偏好進行整體分析。和“游”相關的活動占據了旅游圖片的90%,另外美食與出行分別占到5%與3%,娛樂、購物以及居住則比較少,這反映出游客在拍攝旅游圖片時更多傾向于拍攝觀光游覽相關的場景(圖2)。對占主要地位的“游”子類進行統計分析,“游”相關的各種感知場景中,建筑感知的數量最多,占到總數的63%,為核心感知類型;自然風光感知、植物感知以及文化感知的差異不大,動物感知的照片數量較少。
對5類不同的“游”感知子類進行分析得出,建筑感知中的中式古建筑數量最多,占據了建筑感知的90%,說明對于入境游客而言,北京古建筑(如故宮、天壇、頤和園等)是最主要的吸引物,這也符合北京旅游吸引物的主要特征。但以舞臺和文字為代表的非物質文化類感知相對較弱,說明北京在京劇等舞臺表演方面的文化旅游市場仍具一定發展潛力。對于自然風光感知而言,夜景與山峰分別占到圖片數的38%與35%,說明從入境游客感知角度,夜景與山峰是北京比較典型的風光類吸引物;對于文化感知而言,舞臺與文字照片數量差別不大,分別占圖片總數的58%與42%;對于植物感知而言,綠植場景有關的圖片數量最多,占到圖片數的80%。對于動物類感知而言,圖片全部為和熊貓有關的場景圖片,這說明從入境游客感知角度,熊貓作為中國旅游形象的代表,形成了較高的吸引力。
3.1.2 ? ?北京入境游客感知的演變規律
根據圖片附帶的時間信息以及深度學習模型識別的輸出結果,得出游客10年間對北京旅游目的地感知偏好的演變過程。圖3展示了10年間入境游客感知類別的年際變化,其中,圖3(a)展示的是10年間各種感知類型照片總數的年際變化,圖3(b)展示的是10年間各種感知類型占比的年際變化。
具體得出以下結論:(1)2004—2005年所有感知類型的照片數量均不多,2005年之后照片數量明顯增多,部分原因是Flickr平臺建立之初用戶使用尚不普通;(2)在游覽觀光活動的各種感知類型中,建筑感知始終是游覽觀光活動的主體;(3)建筑感知的年際變化大,動物感知的年際變化小;(4)2011年之后建筑感知照片比例減少,其他感知照片比例增加,說明旅游目的地的市場吸引物趨于多元化。
3.2 北京入境游客行為的點-線-網演變規律
本小節數據結果通過三部分的內容呈現,分別為北京入境游客足跡熱點區域演變過程,北京入境游客行為的線路演變和入境游客行為的空間網絡結構演變。3部分的內容以“點-線-網”的層次逐步遞進。
3.2.1 ? ?北京入境游客足跡熱點區域演變過程
利用ArcGIS軟件的創建漁網功能將北京行政范圍劃分成5 km×5 km大小的網格,統計每個網格中所分布的游客足跡點及有足跡點分布的網格數量,并將圖層導入Geoda中進行全局莫蘭指數分析,數據結果顯示莫蘭指數逐年增加(表2),說明同一景點片區游客聚集程度不斷增加,即旅游目的地景區吸引力不斷增強。另外,游客足跡點所涉空間范圍數據顯示,游客游覽范圍在2008—2009年最大,覆蓋到北京總面積的30.16%,可見奧運會對當年的旅游拉動效果明顯。同時,游客足跡覆蓋范圍圖(圖4)顯示,2006—2007年,北京市旅游目的地的活躍范圍在各個方向均顯著擴大,北京北部山區因自然文化資源基礎較好,優先和中心城區產生連接,北京南部地區旅游資源相對較為薄弱,以從中心城區向外逐漸延伸為主,且發展方向不穩定。
3.2.2 ? ?北京入境游客行為的線路演變規律
根據時間屬性對游客游覽點進行追蹤,獲取游客旅游線路數據。數據顯示:(1)北京六環以內旅游線路數量由疏變密,同時高聚集范圍由中心區域向外圍擴散;(2)六環以外遠郊地區,旅游線路在不同時間段向不同方向進行擴散。
具體來看(圖5),六環以內2004—2005年城市區域高聚集度線路除在二環以內分布外,西北頤和園、圓明園等是最主要的線路方向,說明這一階段入境市場的吸引物主要為傳統型世界文化遺產景區景點。之后,伴隨北部奧林匹克公園及東北部798創意藝術片區等的生長成熟,旅游線路高密度區向北部和東北部擴散,最終形成了以中心城區為原點向西北、北、東北3個方向等距擴散的路線結構,同時內部的線路更為緊密和多元。
六環以外遠郊地區,以長城為主要吸引物的旅游線路始終是主要擴散方向,且線路聚集程度不斷增加,其中,以北偏西的八達嶺、居庸關長城,北偏東的慕田峪長城線路最為聚集。2008—2009年遠郊高聚集度路線擴散方向最為密集,除以長城為特色的傳統成熟路線外,西南爨底下村和靈山景區相結合的旅游線路發展明顯,這一階段歷史村鎮成為入境旅游新的吸引物。2010—2011年和2012—2013年,遠郊高聚集度路線的擴散方向有所減少,高聚集線路向傳統景區八達嶺、十三陵路線回歸,遠郊次聚集度線路以北京周口店猿人遺址、盧溝橋片區、爨底下村片區、古北水鎮司馬臺長城片區為代表。值得注意的是,西南部靈山片區旅游線路呈孤島型,說明靈山片區因距城區較遠多為單點式旅游。
3.2.3 ? ?北京入境游客行為的空間網絡結構演變
對照“點-線-網-面”的空間構成,抽象化繪制北京旅游目的地層級結構時空演變圖(圖6)。其中,點元素為參照游客聚集點抽離出的不同聚集級別的景區;線元素為參照游客足跡路徑分布抽離出的不同聚集級別的旅游線路;網為由點、線元素交織的網絡系統;面為點、線、網共同組成的3類面狀區域(核心區、次核心區、邊緣區)。
具體來看,2004—2005年,北京旅游市場規模相對較小,主要聚集在核心區域,次核心區及邊緣區域景點片區級別相對較低,游客的空間流動主要在中心城區的有限節點,周邊景點的吸引力不足,空間流向不均衡。2006—2007年,較高聚集的景點片區增多,旅游市場不僅集中在中心城區,次核心區的順義、昌平發展軸線迅速增多。2008—2009年,北京奧運會的舉辦整體顯著提升了旅游目的地的吸引力,旅游目的地的空間結構快速生長,形成了從核心區到次核心區,再到邊緣區的逐級放射式擴展態勢。這一階段邊緣區景點片區吸引力在核心區的協同帶動作用下也有所增強,從整體上來看,開始形成較為均衡的目的地層級。2010—2011年,旅游目的地整體層級結構有所回縮,可以看出大型體育賽事對旅游目的地的影響時效性較短,核心區和次核心區重新成為接待游客的主要片區。2012—2013年,旅游目的地層級結構呈現回縮后的再度理性發展,形成了從中心到邊緣擴散趨勢穩定,擴散方向較為均衡,全方位、多層次、有重點的旅游目的地層級結構。
總體上看,北京市旅游目的地層級結構的時空演變由一個關聯度較低、孤立發展的稀疏網絡,首先發展成為彼此聯系但相對不平衡的網絡體系,再逐步向相互關聯、層級間均衡化的網絡模式演化,這也總結并印證了城市型旅游目的地的空間發展基本規律。
4 結論與建議
4.1 旅游目的地發展與市場建設
結合北京入境游客的感知和行為空間演變規律,本文有以下幾個方面可以為旅游目的地發展和市場建設提供借鑒:
第一,在保持傳統古建的歷史文化吸引力的前提下,豐富北京旅游吸引物的多元性。利用游客對于京劇、夜景場景的感知偏好,加強京劇、夜景產品相關的旅游公共服務體系建設;利用熊貓對入境游客的吸引力,開發更多熊貓相關主題產品。
第二,文化藝術創意區、國際大型活動賽場、自然和人文結合的特色村鎮,是北京旅游發展近幾年更新生長以保持旅游吸引力的代表,同時也表明了近年來旅游市場需求的新變化。未來城市型旅游目的地應密切關注游客旅游消費新動向,適時推出新型多元的旅游景區景點。
第三,經典線路的打造對旅游目的地空間發展尤為重要,以北京為例,長城、十三陵作為經典旅游線路在10年間一直保持著較高的吸引力,并逐步帶動了北京北部郊區旅游的整體發展。在景區從無到有、從有到優的生長過程中,應及時識別、并合理結合周邊已成熟景區的經驗,宣傳打造獨具特色的旅游線路,實現片區旅游吸引力的捆綁提升,促進新開發景區的逐漸成熟。
4.2 圖片和計算機視覺技術在旅游目的地研究中的優勢和不足
圖片大數據和計算機視覺技術是本研究的創新點。社交媒體圖片大數據的優點包括,用戶信息和時空信息的可捕捉性、視覺識別內容的豐富性,以及不同類別信息交互的可能性。如,游客感知和行為可以與人口統計、地理信息充分結合,和以往基于文本大數據的旅游目的地感知研究相比,可以更為精準地實現不同感知主題的時空可視化分析。計算機視覺技術方面,對于圖片量較大的數據,計算機視覺技術可以在較短的時間內完成工作任務。相對傳統的人工識別,節約了較多的人力成本。對于本研究具體使用的場景識別深度學習模型,其為揭示旅游目的地游客的感知和行為提供了豐富的證據和信息。作為初步的嘗試,本研究為跨學科技術“計算機視覺”在旅游研究中的廣泛應用打開了一扇門。
首先,圖片大數據和計算機視覺技術的不足也較為明顯。數據方面,本研究以Flickr網站上共享的照片作為數據源,由于Flickr在世界各國的普及程度各不相同,這一定程度影響了研究的結果。其次,對于計算機視覺技術,本研究選擇采用的場景識別模型輸出的103類場景是確定的,盡管對輸出的場景偏差進行了篩選修正,但不能完全忽視場景類別的有限性對游客感知偏好詮釋能力的影響,尤其是關于文化屬性的感知偏好。和以往基于文本大數據的旅游目的地形象研究文獻相比,本研究中機器學習模型僅識別出舞臺和文字兩類和文化相關的圖片,雖然數據結果更為具體和精確,但文本大數據可析出的和文化相關的類別更為深入和廣泛。
盡管圖片大數據和計算機視覺存在一定的局限,但不可否認的是,多來源的圖文大數據融合、社交媒體大數據和非網絡數據的融合是未來旅游研究的趨勢之一。同時,隨著人工智能技術的不斷優化,以及旅游學科和跨學科之間合作的深化,研究問題驅動下的旅游大數據研究將更加成熟。
參考文獻(References)
[1] MIAH S J, VU H Q, GAMMACK J, et al. A big data analytics method for tourist behaviour analysis[J]. Information & Management, 2017, 54(6): 771-785.
[2] TUNG V W S, RITCHIE J R B. Exploring the essence of memorable tourism experiences[J]. Annals of Tourism Research, 2011, 38(4): 1367-1386.
[3] DONAIRE J A, CAMPRUB? R, GAL? N. Tourist clusters from Flickr travel photography[J]. Tourism Management Perspectives, 2014, 11: 26-33.
[4] ALBERS P C, JAMES W R. Travel photography: A methodological approach[J]. Annals of Tourism Research, 1988, 15(1): 134-158.
[5] LI J, XU L, TANG L, et al. Big data in tourism research: A literature review[J]. Tourism Management, 2018, 68: 301-323.
[6] VECCHIO P D, MELE G, NDOU V, et al. Creating value from social big data: Implications for smart tourism destinations[J]. Information Processing & Management, 2018, 54(5): 847-860.
[7] XIANG Z, DU Q, MA Y, et al. A comparative analysis of major online review platforms: Implications for social media analytics in hospitality and tourism[J]. Tourism Management, 2017, 58: 51-65.
[8] URRY J, LARSEN J. The Tourist Gaze 3.0 [M]. Thousand Oaks: SAGE Publications, 2011: 155-188.
[9] EDENSOR T. Staging tourism: Tourists as performers[J]. Annals of Tourism Research, 2000, 27(2): 322-344.
[10] STEPCHENKOVA S, ZHAN F. Visual destination images of Peru: Comparative content analysis of DMO and user-generated photography[J]. Tourism Management, 2013, 36: 590-601.
[11] 劉丹萍. 旅游凝視: 從福柯到厄里[J]. 旅游學刊, 2007, 22(6): 91-95. [LIU Danping. Tourist gaze: From Foucault to Urry[J]. Tourism Tribune, 2007, 22(6): 91-95. ]
[12] 董慧云. 基于社交網絡圖片元數據分析的旅游目的地形象測量研究[D]. 北京: 北京第二外國語學院, 2017. [DONG Huiyun. Research on Tourism Destination Image Measurement Based on Social Network Photos Metadata [D]. Beijing: Beijing International Studies University, 2017. ]
[13] 黃燕, 趙振斌, 褚玉杰, 等. 互聯網時代的旅游地視覺表征: 多元建構與循環[J]. 旅游學刊, 2015, 30(6): 91-101. [HUANG Yan, ZHAO Zhenbin, CHU Yujie, et al. The visual representation of tourism destinations in the internet era: Multiple constructions and circulations[J]. Tourism Tribune, 2015, 30(6): 91-101. ]
[14] JENKINS O. Photography and travel brochures: The circle of representation[J]. Tourism Geographies, 2003, 5(3): 305-328.
[15] BALOMENOU N, GARROD B. Photographs in tourism research: Prejudice, power, performance and participant-generated images[J]. Tourism Management, 2019, 70: 201-217.
[16] LI S, SCOTT N, WALTERS G. Current and potential methods for measuring emotion in tourism experiences: A review[J]. Current Issues in Tourism, 2015, 18(9): 805-827.
[17] HUNT J. D. Image as a factor in tourism development[J]. Tourism Recreation Research, 2016, 13(3): 1-7.
[18] 吳佩諭, 黃遠水. 旅游照片的符號屬性對旅游意向的影響研究——以微信朋友圈旅游照片為例[J]. 資源開發與市場, 2019, 35(7): 993-1000. [WU Peiyu, HUANG Yuanshui. Study on influence of symbolic attributes of travel photos on travel intention — Taking travel photos of WeChat friends circle as an example[J]. Resource Development & Market, 2019, 35(7): 993-1000. ]
[19] PAN S, LEE J, TSAI H. Travel photos: Motivations, image dimensions, and affective qualities of places[J]. Tourism Management, 2014, 40: 59-69.
[20] 戴光全, 陳欣. 旅游者攝影心理初探——基于旅游照片的內容分析[J]. 旅游學刊, 2009, 24(7): 71-77. [DAI Guangquan, CHEN Xin. An initial discussion about tourists photographic psychology—Based on the content analysis of tourist photos[J]. Tourism Tribune, 2009, 24(7): 71-77. ]
[21] NIKJOO A, BAKHSHI H. The presence of tourists and residents in shared travel photos[J]. Tourism Management, 2019, 70: 89-98.
[22] CAI G, LEE K, LEE I. Itinerary recommender system with semantic trajectory pattern mining from geo-tagged photos[J]. Expert Systems with Applications, 2018, 94: 32-40.
[23] BATISTA E SILVA F, MAR?N HERRERA M A, ROSINA K, et al. Analysing spatiotemporal patterns of tourism in Europe at high-resolution with conventional and big data sources[J]. Tourism Management, 2018, 68: 101-115.
[24] CHUA A, SERVILLO L, MARCHEGGIANI E, et al. Mapping Cilento: Using geotagged social media data to characterize tourist flows in southern Italy[J]. Tourism Management, 2016, 57: 295-310.
[25] GARC?A-PALOMARES J C, GUTI?RREZ J, M?NGUEZ C. Identification of tourist hot spots based on social networks: A comparative analysis of European metropolises using photo-sharing services and GIS[J]. Applied Geography, 2015, 63: 408-417.
[26] HU Y, GAO S, JANOWICZ K, et al. Extracting and understanding urban areas of interest using geotagged photos[J]. Computers, Environment and Urban Systems, 2015, 54: 240-254.
[27] VU H Q, LI G, LAW R, et al. Exploring the travel behaviors of inbound tourists to Hong Kong using geotagged photos[J]. Tourism Management, 2015, 46: 222-232.
[28] ZHOU X, XU C, KIMMONS B. Detecting tourism destinations using scalable geospatial analysis based on cloud computing platform[J]. Computers, Environment and Urban Systems, 2015, 54: 144-153.
[29] BRILHANTE I R, MACEDO J A, NARDINI F M, et al. On planning sightseeing tours with TripBuilder[J]. Information Processing & Management, 2015, 51(2): 1-15.
[30] SUN Y, FAN H, BAKILLAH M, et al. Road-based travel recommendation using geo-tagged images[J]. Computers Environment & Urban Systems, 2015, 53: 110-122.
[31] BARIK D, MONDAL M. Object identification for computer vision using image segmentation[J]. 2010 2nd International Conference on Education Technology and Computer, 2010(2): 170-172.
[32] ZHANG K, CHEN Y, LI C. Discovering the tourists behaviors and perceptions in a tourism destination by analyzing photos visual content with a computer deep learning model: The case of Beijing[J]. Tourism Management, 2019, 75: 595-608.
[33] ZHANG K, CHEN D, LI C. How are tourists different? — Reading geo-tagged photos through a deep learning model[J]. Journal of Quality Assurance in Hospitality & Tourism, 2020, 21(2): 234-243.
[34] DENG N, LI R. Feeling a destination through the “right” photos: A machine learning model for DMOs photo selection[J]. Tourism Management, 2018, 65: 267-278.
[35] 鄧寧, 劉耀芳, 牛宇, 等. 不同來源地旅游者對北京目的地形象感知差異——基于深度學習的Flickr圖片分析[J]. 資源科學, 2019, 41(3): 416-429. [DENG Ning, LIU Yaofang, NIU Yu, et al. Different perceptions of Beijings destination images from tourists — An analysis of Flickr photos based on deep learning method[J]. Resources Science, 2019, 41(3) : 416-429. ]
[36] SHAMMA D A, SHAMMA D A, FRIEDLAND G, et al. YFCC100M: The new data in multimedia research[J]. Communications of the ACM, 2016, 59(2): 64-73.
[37] HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition [C]// Proceedings of the ?IEEE Conference on Computer Vision and Pattern Recognition, 2016: 770-778.
[38] 馬林兵, 魏慧麗, 曹小曙. 基于FCD數據的城市有效路網密度評價——以廣州荔灣區和越秀區為例[J]. 地理研究, 2015, 34(3): 541-554. [MA Linbing, WEI Huili, CAO Xiaoshu. Evaluating the valid density of road network in urban based on FCD — Case of Liwan and Yuexiu distric in Guangzhou city[J]. Geographical Research, 2015, 34(3): 541-554. ]
[39] 禹文豪, 艾廷華. 核密度估計法支持下的網絡空間POI點可視化與分析[J]. 測繪學報, 2015, 44(1): 82-90. [YU Wenhao, Ai Tinghua. The visualization and analysis of POI features under network space supported by kernel density estimation[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(1): 82-90. ]
Abstract: Analyzing user-generated content (UGC) has become an essential mean for DMOs (destination management organizations) to enhance the tourists experience in destinations. At present, UGC-based tourism research is still text centered. The tourists behavior of taking photos is to establish a relationship among traveling companions, scenes, and tourism destination. The Photo can be regarded as an important data source for tourism research. Tourists photos contain not only the visual content about the destination, but also much other information related to the photos, e. g. , geographical location and shooting time, which is of great significance for the research about tourist behavior, tourism recommendation, and tourism marketing. Due to the technological limitations of extensive visual content analysis, most of the visual content analysis was conducted manually in previous studies. Recently, with the technological breakthrough in the field of computer vision, it is quite possible to process massive visual data through a machine learning approach. Several prior pieces of research have been explored in the field of tourism research; it still holds a great potential to explore and contribute to this prevalent issue. Taking Beijing as an example, this study applied a deep learning model in the field of computer vision - scene understanding to recognize the visual content of inbound tourists photos on Flickr. Two objectives were obtained; the first one is the inbound tourists preferences and behavior in Beijing; the other is the evolution of tourists preferences and behaviors. The conducting process of this study is described as followed. Firstly, it applied the deep learning model of scene recognition, which is used to recognize the visual content of tourists photos. As the output, 103 scenes were identified. Secondly, according to the correlation between the tourism scenes, the 103 scenes were induced into six categories and ten sub-categories. Six significant categories included food, commendation, transportation, sightseeing, shopping, and entertainment. Ten sub-categories included food perception, living perception, traffic perception, building perception, animal perception, plant perception, natural scenery perception, shopping perception, and entertainment perception. In the next step, data statistics, Moran index, fishnet/ density analysis, and route tracking tools were carried out for analyzing tourists perception /preference and behavior. The main results of the study contained: (1) the overall characteristics of the inbound tourists preference and perception; (2) the evolution process of tourists perception and preference about Beijing; (3) the spatial evolution of tourists itineraries; (4) the changing spatial structure of Beijing as a tourism destination. Theoretically, this study explored the feasibility of interdisciplinary technology in tourism research. Practically, this research provided references for DMOs to formulate development and management policies.
Keywords: big pictorial data; deep learning; tourists perception; tourists behavior; spatio-temporal evolution
[責任編輯:劉 ? ?魯;責任校對:王 ? ?婧]