王晨雨 常雪松 潘運(yùn)偉 董宇恒 王彬汕
古典園林的服務(wù)對象在當(dāng)代發(fā)生了顯著變化,從歷史上為少數(shù)達(dá)官顯貴服務(wù)變成為當(dāng)代為人民大眾服務(wù)。由于服務(wù)對象發(fā)生變化,所以知名園林景區(qū)在高峰期發(fā)生擁堵?lián)頂D的現(xiàn)象屢見不鮮。頤和園是中國古典園林的杰出代表,是北京古都文化旅游的核心景區(qū)之一,目前也存在高峰超載、客流時(shí)空分布不均等問題。本文以網(wǎng)絡(luò)大數(shù)據(jù)為基礎(chǔ),揭示了頤和園游人空間分布特點(diǎn)和游線組織特征:第一,頤和園游人分布呈現(xiàn)北多南少,東多西少的特點(diǎn);第二,游人線路組織主要有5條,其中北宮門——佛香閣——東宮門一線比例最大;第三,北宮門與佛香閣,長廊西與石舫,南湖島與十七孔橋三組景點(diǎn)的關(guān)聯(lián)度最大。
頤和園是中國古典園林的杰出代表,坐落在北京西郊,占地約290 hm2,是三山五園的核心組成部分。頤和園2017年接待1 700萬人次游人(含免票游人),是北京接待游人最多的景區(qū)。如此大的客流給頤和園的游人管理帶來極大壓力。一是高峰超載,小長假和黃金周期間日均接待游人量一般超過12萬人次,遠(yuǎn)遠(yuǎn)超過《頤和園總體規(guī)劃》所核定的日容量6.1萬人次游人量。二是時(shí)空分布不均,突出表現(xiàn)為北多南少,東多西少,同時(shí)核心景點(diǎn)游人超載,給遺產(chǎn)保護(hù)帶來比較大的隱患。
目前,學(xué)術(shù)界對頤和園的客流不平衡問題的關(guān)注較少。黃瀟婷(2009)研究了頤和園六類客流流向,但對游人的時(shí)空分布特點(diǎn)研究不足。她還以GPS追蹤調(diào)查的數(shù)據(jù)為基礎(chǔ),比較了其與傳統(tǒng)的活動日志調(diào)查方法的利弊。黎巎(2014)運(yùn)用Agent模型探索頤和園全園客流預(yù)測與調(diào)控的方法。本文結(jié)合《頤和園風(fēng)景區(qū)總體規(guī)劃》編制工作,重點(diǎn)介紹在頤和園中運(yùn)用大數(shù)據(jù)研究客流的技術(shù)方法和主要結(jié)論。
(一)數(shù)據(jù)來源
以全網(wǎng)游記數(shù)據(jù)為基礎(chǔ),包括攜程、馬蜂窩、去哪兒、同程、窮游和貓途鷹等旅游網(wǎng)站抓取頤和園相關(guān)的游記文本素材,得到50 00余篇游記,共約300萬字文本素材。
(二)技術(shù)流程
技術(shù)流程步驟包括數(shù)據(jù)抓取、數(shù)據(jù)清洗、軌跡抽取和軌跡分析幾個部分。
1.數(shù)據(jù)抓取
利用八爪魚等網(wǎng)頁爬蟲工具獲取頤和園游記數(shù)據(jù)。首先了解每個游記網(wǎng)站的網(wǎng)頁結(jié)構(gòu),利用XPath導(dǎo)航找準(zhǔn)網(wǎng)頁中的標(biāo)題、正文和其它結(jié)構(gòu)化數(shù)據(jù)的節(jié)點(diǎn)位置,并在爬蟲軟件中設(shè)置自動翻頁、列表循環(huán)、詳細(xì)頁進(jìn)入、文本定位和數(shù)據(jù)抓取等流程,通過Ajax(主要用于頁面的異步加載)、休眠時(shí)間和特殊錨點(diǎn)定位等動作調(diào)試流程無誤后,進(jìn)行頤和園游記數(shù)據(jù)的自動采集和抓取。
2.數(shù)據(jù)清洗
對游記文本數(shù)據(jù)進(jìn)行本地篩選處理。刪除重復(fù)內(nèi)容,刪除按照正則表達(dá)式抽取出的網(wǎng)站模板和廣告等無效數(shù)據(jù),刪除過短或純符號等無意義素材,最后共得到的5 000余篇(即5 000余條行程),共約300萬字游記素材,保存為純文本格式文件。
3.軌跡抽取
利用excel進(jìn)行軌跡抽取。將已經(jīng)掌握的全部頤和園景點(diǎn)和停留節(jié)點(diǎn)作為行內(nèi)容,將每一條行程作為列內(nèi)容,利用find函數(shù)查找每個節(jié)點(diǎn)是否出現(xiàn)在每條行程中,以及出現(xiàn)的具體字節(jié)位置,根據(jù)出現(xiàn)的字節(jié)位置進(jìn)行排序構(gòu)成單條行程中的游人軌跡。對5000條行程進(jìn)行相同操作,形成5 000條游人軌跡。如圖1所示。
4.軌跡分析
以客流軌跡線路圖為基礎(chǔ),對客流軌跡進(jìn)行聚類分析、軌跡密度分析、關(guān)聯(lián)力分析。其中,聚類分析可獲取游人的主要游線,軌跡密度分析能夠反映游人的空間分布特點(diǎn),關(guān)聯(lián)力分析可以揭示兩兩景點(diǎn)之間的聯(lián)系強(qiáng)度。
(一)客流軌跡
通過聚類分析,排除明顯不合理的線路“噪音”后,共得出5條主要線路如下。
線路1:東宮門—長廊—佛香閣—萬壽山—蘇州街—北宮門。
線路2:北宮門—蘇州街—萬壽山—佛香閣—石舫—仁壽殿—十七孔橋—新建宮門。
線路3:新建宮門—南湖島—石舫—長廊—仁壽殿—東宮門。
線路4:東宮門—長廊—石舫—長廊—東宮門。
線路5:南如意門—南湖島—文昌院—長廊—佛香閣—北宮門。
游人主要線路見圖1。

從客流軌跡反映的情況來看,主要有如下各個特點(diǎn):線路1是游人選擇最多的游線,其次為線路4;經(jīng)過西堤、山后地區(qū)的游覽線路比較少;游人出入口主要集中在北宮門、東宮門,新建宮門、南如意門次之。這些特點(diǎn)出現(xiàn)的主要原因在于地鐵4號線在北宮門設(shè)站,北京觀光三線的終點(diǎn)站也位于北宮門。東宮門是頤和園正門,一般游人會選擇東宮門出入頤和園,另外東宮門外有公交場站和停車場,游人來此也比較方便,因此,從東宮門出入的游人較多。新建宮門距離頤和園核心景點(diǎn)南湖島較近,因此,也有不少游人選擇從新建宮門出入。從南如意門出入的游人主要來自于長河、昆玉河游船的游人。
(二)客流密度
從客流軌跡密度來看,主要呈現(xiàn)如下幾個特點(diǎn)。
首先,頤和園客流整體呈現(xiàn)北密南疏,東多西少的特點(diǎn)。客流軌跡密度見圖2。

其次,圖2中的線路1是游人最多的一條線路,即北宮門—蘇州街—佛香閣—長廊—東宮門。
最后,所有游線都經(jīng)過長廊一線,這也是造成長廊旅游高峰期較為擁堵的重要原因。除此之外,當(dāng)?shù)氐臒衢T景點(diǎn)還有南湖島、玉瀾堂、東宮門等,在旅游旺季,過大的游客量給文物和遺產(chǎn)保護(hù)帶來較大壓力。
(三)景點(diǎn)關(guān)聯(lián)度
關(guān)聯(lián)景點(diǎn)反映的是游人線路組織過程中的景點(diǎn)聯(lián)系強(qiáng)度特征。從圖3反映的情況來看,主要有3組關(guān)聯(lián)度比較密切的景群,分別是北宮門—佛香閣、長廊西—石舫、南湖島—十七孔橋。此外,北宮門—石舫、北宮門—長廊西、北宮門—東宮門和新建宮門—十七孔橋等景點(diǎn)的聯(lián)系度也比較緊密。
景點(diǎn)間聯(lián)系越緊密,2個景點(diǎn)間聚集的游人密度就越高,基于微博數(shù)據(jù)所作的游人熱力圖也直接證明了這點(diǎn)(圖4)。上述3組關(guān)聯(lián)度比較強(qiáng)烈的景點(diǎn),極易在旅游高峰期形成擁堵,需要相關(guān)人員在實(shí)際管理中妥善應(yīng)對,以保障旅游安全和遺產(chǎn)安全。

本文以網(wǎng)絡(luò)大數(shù)據(jù)為基礎(chǔ),揭示了頤和園游人空間分布特點(diǎn)和游線組織特征。作為一種新的技術(shù)方法,網(wǎng)絡(luò)大數(shù)據(jù)技術(shù)具有數(shù)據(jù)開放、展示直觀、費(fèi)用低廉等優(yōu)點(diǎn),能夠有效展示游人分布特征和游線組織形式,無論在古典園林規(guī)劃設(shè)計(jì),還是在園林和公園管理方面都具有非常重大的意義。在古典園林規(guī)劃設(shè)計(jì)方面,其分析結(jié)果能夠?yàn)榭臻g和線路調(diào)整提供支撐;在園林和公園管理方面,能夠促進(jìn)古典園林和公園管理升級,從而提高游人的游覽品質(zhì)。
網(wǎng)絡(luò)大數(shù)據(jù)在揭示游人空間部分方面具有一定優(yōu)勢,通過頤和園的案例可知,其也呈現(xiàn)出較好的效果。其不足之處在于以下幾點(diǎn)。第一,數(shù)據(jù)的有效性問題。目前一些旅游網(wǎng)站上存在營銷“軟文”的現(xiàn)象,即不是真實(shí)的游人所寫的文章,這部分?jǐn)?shù)據(jù)會對結(jié)果產(chǎn)生影響,但影響到何種程度還有待于進(jìn)一步研究。第二,網(wǎng)絡(luò)大數(shù)據(jù)雖能夠比較好地反映空間方面的特征,但不能反映時(shí)間特征,未來人們可以結(jié)合手機(jī)信令的實(shí)時(shí)數(shù)據(jù)進(jìn)行進(jìn)一步優(yōu)化。
(作者單位:北京清華同衡規(guī)劃設(shè)計(jì)研究院有限公司旅游與風(fēng)景區(qū)規(guī)劃所)