張佳琳
旅行是心靈的閱讀,而閱讀是心靈的旅行。近年旅游景區景點紛紛開設免費的游客書吧,提供旅游閱讀服務。從實際應用看,由于現場旅游閱讀服務受到場地設置、圖書/信息資源、服務人員與時間的限制,受眾面有限,游客使用率與滿意度不高;另一方面,移動旅游閱讀隨著移動互聯網高速發展,為游客在旅游過程中進行“隨時隨地隨心隨意”閱讀提供便利。2019年《中國旅游發展報告》顯示,77.4%游客經常通過移動互聯網在旅游過程中進行閱讀;而移動互聯網中的相關閱讀資源數量巨大,游客難以有效的處理與使用,僅21.5%游客對移動互聯網中的閱讀服務表示滿意,因此旅游閱讀的精準化和個性化已成為旅游信息服務的必然要求。依托移動互聯網中豐富的游客信息與旅游場景,推薦“適合、需要、實用”的閱讀資源成為圖書與旅游學界的研究熱點[1]。
基于上述需求,研究人員為提供精準的閱讀資源開展一系列游客-讀者畫像和旅游信息場景探索工作,重點研究基于游客端多源數據融合的游客行為感知、游客需求理解以及閱讀-旅游匹配計算等方面的內容,主要思路與方法是運用信息情報采集技術,通過旅游環境中的通信服務器盡可能地采集游客數據,繪制游客畫像,并通過該畫像完成一定的旅游閱讀服務或管理操作,如推薦服務、征信管理,而處理特定場景的服務器往往獨立完成上述任務,缺少與其他服務器的信息互動與協作[2]。周亞等基于游記進行了游客畫像繪制工作,發現孤立的信息服務器難以發現游客的閱讀需求規律與潛在興趣[3]。張佳琳設計一個非中心結構的游客數據服務發現系統,證明同一游客所處的不同情緒以及情景間存在一定的聯系,為閱讀推薦提供了需求依據[4]。Larbi Kzaz等[5]、Guneshwari Nemad 等[6]研 究 同 一 歸 屬“旅游-閱讀”場景的局部信息融合模式與算法,其成果證明了即使是有限的場景序列融合,也能夠為游客畫像提供更為深入的信息。Robert P等[7]、Jitha P B等[8]通過研究局部場景序列的關鍵子序列搜索算法證明:孤立的場景系統是移動互聯網信息孤島的根源所在,必須研究“旅游-閱讀”場景間信息交互的機制與協議。Mehrbakhsh Nilash等[9]通過局部場景融合,發掘了游客軌跡以及閱讀場景中若干強相關場景的共有特征,并以此為依據,預測了游客的部分閱讀需求發展;證明全景畫像模型必須突破碎片式場景管理的禁錮,才能獲得更為精準和全面的閱讀需求信 息。Priyanka B Tiwar 等[10]、Yohei Kurata等[11]指出場景融合的應用前景廣闊,如不同歸屬的場景進行融合可以預測游客的下一閱讀場景,從而進行閱讀等多方面的推薦。Thuy Ngoc Nguyen等[12]研究基于中心服務器模式,局部實現社交網絡物理定位,為閱讀環境建模提供了基礎信息。Huang Yu等[13]構建中心服務式的游客畫像管理系統,通過旅游場景與游客信息需求匹配來進行精準閱讀推廣。Annika Hinze等[14]通過移動互聯網信息傳播建模發現:一方面中心服務器已成為移動場景信息處理與閱讀信息傳導的性能瓶頸;另一方面移動游客端的存儲與計算資源閑置比例很高。Daniel Herzog等[15]嘗試采用智能終端代替中心服務器執行部分畫像信息管理任務的解決方案,證明了游客畫像信息處理遷移至游客端的可行性,同時發現可以由游客端承載孤立場景信息,實現場景間信息傳導。上述研究受到當前移動網絡游客畫像模型及相關旅游閱讀方法的禁錮,存在以下問題:(1)孤立的情景或場景難以完整描繪游客感知到的全景,且當前的移動互聯網服務器領域尚缺少中心信息融合平臺,難以實踐上述旅游閱讀推薦算法與模型;(2)游客畫像與旅游閱讀場景呈現單向信息流動,游客畫像難于向場景進行反饋,旅游閱讀場景難于實現自我刻畫與表述;(3)旅游閱讀場景間缺少信息互動橋梁,孤立的場景難以隨周邊環境同步更新。基于上述問題,本研究提出基于移動軌跡融合的旅游閱讀推薦服務模型TRMTF(Travel Reading information recommendation model based on Mobile Trajectory Fusion)模型,利用游客智能終端生成旅游閱讀場景信息(面板類數據),并將這些場景信息作為游客畫像與游客軌跡節點的刻畫依據,最終通過移動軌跡(場景)融入等算法在公共圖書館等部門的服務器端生成旅游信息空間,為游客提供閱讀推薦服務,從而使“全民閱讀”服務全面融入旅游領域。
本研究在前期成果[4]中構建了較完整的旅游場景與游客畫像信息模型,但在實際應用中發現:孤立的場景信息難以為旅游閱讀推薦提供充分與準確的支撐數據;因此本研究將這兩種信息進一步融入全景軌跡節點模型,并將其作為閱讀推薦工作的數據基礎。軌跡節點(帶有時間、用戶特征等標簽的場景)是包含有關游客授權管理的所有自身相關信息以及管理操作的高級信息對象。每一個全景軌跡節點最終將在用戶終端中以信息對象形式存在,并可以在多個終端間進行信息同步和無縫遷移。基于前期研究的經驗與成果,全景軌跡節點模型將采用樹型分層結構;每個模型包括如下內容:第一是全景軌跡節點/從屬對象標識,即用戶在移動互聯網中的唯一軌跡標識,而所有全景軌跡節點在該標識之下構成一棵信息樹,連接樹根節點到節點路徑上,所有從屬對象節點的標識構成全景畫像模型中某個信息描述對象的標識。第二是處理畫像的語法,即畫像模型描述、解釋或執行這些對象的代碼以及規范,主要包含對象類型、對象獲取方式、對象狀態以及對象標識。第三是采取基本編碼法生成的對象編碼。基于上述總體設計方案,結合前期成果,進行畫像模型的詳細設計與構建,目前設計的全景軌跡節點中,從屬對象的屬性部分表述為:<對象類型與標識,信息類型,獲取方式,對象狀態>四元組。在語法項目中增加了自解釋操作部分,可以表述為:<對象類型與標識,解釋代碼,更新代碼>。兩部分相輔相成,通過解釋代碼對屬性部分信息進行自適應解釋,并分離和提取用戶特征與興趣信息,能夠滿足目前主流移動互聯網用戶管理與服務系統的需要。該原型還具有一定的自收斂性,在擴展時不會占用過多存儲空間,適合移動環境的終端應用。為保證該模型的通用性,本研究遵照國際旅游信息協會建議稿設計了全景畫像模型中的從屬對象,共分為4類12個明細組:(1)場景類,包含個體場景、自然場景、社交場景、興趣場景與行為場景5個明細組;(2)系統類,包含系統、接口2個明細組;(3)信息交換類,包括地址轉換、信息交互2個明細組;(4)管理類,包括本地管理、遷移、更新3個明細組。在完成上述對象與操作的詳細設計與代碼實施后,通過前期工作中構建的仿真實驗系統與移動互聯網用戶數據集,對全景軌跡節點模型進行驗證,重點考查用戶信息覆蓋度、完整性、統一性、全面性與適用性,詳見圖1。
基于移動軌跡的旅游閱讀資源推薦流程見圖2。

圖1 軌跡節點模型與數據結構圖

圖2 模型結構與推薦流程圖
定義U(Unit)是某一場景內(通常是某一地區或景點的閱讀服務機構,如公共圖書館)服務器轄域內游客畫像的群體狀態集。定義W(will)為游客的意愿集合。客戶端內的場景信息定義為:

其中的局部視圖(s,p)∈S,由此可以對某個游客全景畫像中的5個場景明細組進行信息包絡操作。在游客全景畫像應用過程中,其局部場景視圖s可以結合所在場景的閱讀意愿集合,通過畫像內部5個場景明細組的狀態變遷,并通過添加時間戳形成客戶端中的軌道節點信息,從而一方面對當前服務器中的旅游閱讀場景進行刻畫,一方面記錄游客的旅游及相關行為變遷。從前期成果[4]來看,該方案的簡化版能較為準確地刻畫游客與旅游閱讀場景的特征,而且結構簡單高效,如進一步進行性能升級與功能擴展,后續閱讀推薦算法處理應更為快速有效,在不過分占用客戶端資源的情況下,實現較為精準和全面的移動軌跡模型管理與旅游閱讀資源推薦應用。
第一階段是個體游客軌跡節點更新與管理。在該階段中,客戶端根據游客所在場景,生成其個體的、微觀的游客場景視圖,并從中抽取個體場景、自然場景、社交場景、興趣場景與行為場景明細組所需匯總信息,記錄在個體游客的全景(閱讀需求)場景模型中,待游客畫像發生遷移后,再對上述場景信息進行融合成軌道節點,一方面存儲在游客畫像中。以經典旅游閱讀場景為例,此時全景畫像能夠提供用戶的景區類型喜好、景色偏好等信息,從而為推薦服務提供其閱讀需求。另一方面客戶端將記錄游客經歷過的景區明細場景,為后續相關軌道刻畫生成奠定了閱讀推薦基礎,并在一定程度上解決了旅游閱讀場景與軌道信息共享的問題。
第二階段是軌道的融合與更新。該階段中,一旦軌道節點攜帶者進入下一個信息場景,此時旅游閱讀推薦服務器將根據其提供的軌道節點信息,生成一個局部的軌道融合視圖;無論游客是否產生相關操作,其軌道的特征與游客閱讀需求信息,及其場景明細組數據,都將傳遞給服務器,一方面對游客軌道進行持續深入、多維度的刻畫;另一方面將游客軌道中包含的其他軌道節點信息傳遞給當前旅游閱讀場景,從而豐富與細化其中的信息。
第三階段是游客軌道信息的閱讀推薦應用。在該階段中,旅游閱讀推薦服務器從客戶端中獲取所需的軌道信息,并將其與存儲在服務器中的閱讀場景特征(可以是公共圖書館的電子圖書信息、特色景點的典故信息等)進行匹配,以匹配結果為依據提供個性化旅游閱讀推薦服務,如電子圖書推薦、景點典故提醒、游記精準應答;也可提供這些信息給閱讀推廣部門而實現精準讀者管理,如游客需求聚類、旅游景區特征提取。
作為旅游閱讀推薦服務的基礎工作,游客移動軌跡信息融合的難點在于:移動互聯網中閱讀推薦服務器的場景特征信息如何融合生成游客的閱讀需求與偏好特征信息,而游客的閱讀需求與偏好特征信息又如何反饋優化旅游閱讀場景的特征信息。因此,本模型采用的算法將眾多游客畫像中蘊含的局部場景視圖(即獨立游客視角下的局部閱讀場景視圖),結合自身的畫像特征,以迭代融合的方式,一方面為閱讀推薦服務器提供場景信息更新的依據;另一方面汲取旅游閱讀場景信息,最終融合生成精細化的自身畫像。詳細的算法分為軌跡(場景)融入(畫像)與畫像融入(場景)兩個子算法。
(1)軌跡融入子算法,其實現描述如下:
Step1:根據游客特征,對其需要融入的軌跡(場景面板數據)進行融入前的預處理,公式為:

其中,(1)式里的S 為游客畫像中的特征信息;而V是軌跡節點(場景)集合{v1,v2,…,vc},其中的vi是游客畫像特征wi集合中的中心矢量,其中的權重值m∈(1,∞),而A是一個正定矩陣,當A=I時,可以定義dij為場景與期望的歐式距離,可得:
Step2:進一步對軌跡預處理后的游客畫像進行調整,建立以(2)式為約束的融入方法,而(2)式中的u為正數。基于此,待融入軌跡(場景)的無約束調節函數為:

對公式(2)進行極值化處理,要求:

由(3)式得到:

此時(5)式代入(4)式,可得:

進一步可得:

Step3:實際處理過程中發現,存在dij=0的情形,所以進一步對?j定義與Ij與

此時,如果Ij=Φ,則可得:

但若:Ij≠Φ,則?i∈Ij,將定義有:sij=0,切而?J(S,V)/?vi=0,設定:

基于此,可得:

此時游客畫像特征通過軌跡信息的融入得到更新,從而使畫像更為清晰與精準。
(2)畫像融入(軌跡)子算法,該步驟將通過畫像信息的融入,使得軌跡(場景)最自身的刻畫更為精準,實現軌跡融合的雙向優化,其實現描述如下:
Step1:畫像融入的初始化,該步驟將在更新信息超限(旅游閱讀推薦服務器采集的畫像信息超過20%)時進行,將通過配置程序設定自動計數器c(2≤c≤N)、軌跡標識counter,初始化軌跡矩陣A以及誤差閾值ε>0。
Step2:虛擬化(內存導入)軌跡融入子算法中定義的:游客畫像特征信息S(0),這一序列中包含了先后到達的游客畫像,而uij是畫像信息S里的元素;處理計數器初始化,可得:counter=0。
Step3:對S(counter)中的進行畫像融入(場景):

Step4:對后續的游客進行進一步融入,處理S(counter)之后,虛擬S(counter+1)(j=1-N);并引入Ij和此時,將通過臨時寄存器xj實現下一步融合,即:Ij=Φ。如公式(9)所述,將否則,可得:
Step5:通過范數判定法對更新后的S(counter)與S(counter+1)進行對比;如果說明二者對軌跡的反饋強度已經非常小了,則退出融入;否則計數加1,從Step2繼續迭代。
為將旅游閱讀信息資源推薦給匹配度較高的游客,本研究設計了游客側驅動的閱讀推薦算法。該算法以動態的游客畫像為基礎,主動獲取游客的閱讀需求畫像,通過軌跡融合生成的閱讀需求特征,從旅游信息資源空間中發現獲得精準信息供給的總體方向,并通過逐步求精,和伙伴信息修正的方式,定位和獲取所需的旅游信息。下文闡述旅游信息資源的優閱讀推薦算法。
Step1:首先根據游客閱讀需求與畫像特征,對其在旅游信息資源空間中的初始位置進行偽隨機化設置,可得:

Step2:根據游客既往的閱讀需求強度、旅游閱讀需求差異度、旅游區域特征等畫像信息,生成其搜索旅游信息資源空間的大致方向以及步長等參數。

Step3:根據前兩個步驟中設定的方位與步長等參數,生成游客閱讀需求與旅游信息資源集合中點距離(Dist)值,進一步生成游客在當前旅游信息集合的信息資源密度獲取概率(S)。

Step4:將游客的信息獲取概率(Si)通過需求-信息匹配函數,生成該游客在所在空間(當前所在位置)的感覺值(Smelli)。

Step5:通過迭代,對查找當前旅游信息資源集合中感覺值最佳的游客。

Step6:保存需求-信息匹配最佳值,及x、y位置,并將游客群體的閱讀需求等信息與其進行擬合。

Step7:進一步進行迭優化,即再一次進行Step2~5,并判斷游客的感覺值是否得到了提升;如果是,進入Step6執行,反之進入下一步。
Step8:當無法繼續提升游客感覺值時,說明游客在這一旅游信息資源空間中搜索已經逼近其閱讀需求度最高的信息,此時可以抽取其步長范圍之內的信息資源,通過旅游閱讀推薦服務器發布給該游客或相關游客團體。
需要說明的是:由于旅游的群體形式多樣,本研究的初衷是盡可能地將閱讀推薦服務覆蓋到所有的形式,同時為了節省系統的開銷,在實際項目中的設計是包含了對畫像自相似團體(如家庭團體、自由組合團體、拼團)的閱讀推薦,這樣對團體內成員僅需進行一個旅游讀者畫像和相關場景的處理即可,能夠節省服務器開銷。
TRMTF模型的實際效能在后續的實驗中得到檢驗。實驗數據來自于中國計算機學會CCF提供的游客軌跡數據集,該數據集共包括2,107名游客在35 個旅游場景中的活動軌跡信息共計38萬余條。限于實驗人員人數(共54人)及處理服務器(聯想SR550)的實際容量,本研究從中隨機抽取200名游客及其旅游軌跡涉及的12個旅游場景涉及的4.7萬條信息進行對比實驗。實驗中的閱讀信息資源由哈爾濱商業大學圖書館提供,包含與12個旅游場景相關的232冊電子圖書,和1,802項旅游閱讀材料(其選擇依據為:與上述12個場景中的內容相關,能夠被poi解析工具析出其中文本,方便閱讀推薦模型檢索并推薦)。實驗人員為50名哈爾濱商業大學電子商務專業本科生,由每名學生操控8名虛擬游客的虛擬旅游活動,并根據虛擬游客的個體屬性特征模擬其旅游活動。
虛擬游客共分為2組,A實驗組所在虛擬場景采用TRMTF旅游推薦模型與算法,B實驗組所在虛擬場景采用美國北卡羅來納大學研制的移動旅游信息推薦模型MTRM(Mobile Tourism information Recommendaiton Model)與相同的游客進行實驗[8],其中MTRM模型基于分布式游客信息交換機制,游客通過朋友圈進行信息交互,并主動過濾Facebook等社交媒體推送的信息。根據前人實驗[5,7],本研究選取游客畫像標簽數、場景(軌跡節點)標簽數等面板化指標,以及游客(閱讀)覆蓋度、閱讀推薦準確度兩項序列化性能指標來衡量兩種模型的效能。
如表1所示,TRMTF模型的最終面板性能指標(各游客與各服務器的平均值)均超過了MTRM 模型,其中部分指標超過后者50%以上,說明TRMTF模型的游客閱讀需求與旅游閱讀場景刻畫能力遠超過MTRM模型,能夠為旅游信息資源推薦提供良好的數據基礎。

表1 兩種模型的面板指標對比表
游客(閱讀)覆蓋度指標的計算方法是:游客(閱讀)覆蓋度=某區域中實際閱讀了兩個推薦資源的游客數/該區域中被推薦信息的游客數(以%計量)。如圖3所示,A實驗組(基于TRMTF模型)在10個監測周期中的平均游客(閱讀)覆蓋度、峰值游客(閱讀)覆蓋度,超過B 實驗組的相關指標,充分體現了TRMTF模型及其關鍵算法通過移動軌跡融合技術,在游客行為特征與閱讀需求挖掘方面取得了較大的優勢。

圖3 游客(閱讀)覆蓋度對比
閱讀推薦準確度指標的計算方法是:閱讀推薦準確度=某區域中推薦給游客并且被游客接受的閱讀資源數/該區域中被推薦的閱讀資源總數(以%計量)。如圖4所示,A實驗組(基于TRMTF模型)在10個監測周期中的平均閱讀推薦精度、峰值閱讀推薦精度,超過了B 實驗組的對應指標。這一對比說明TRMTF模型能夠較好地挖掘游客閱讀需求與旅游閱讀場景(信息資源)的特征,并實現高精度的雙向匹配,從而大大地提高了旅游閱讀推薦的精度。

圖4 閱讀推薦精確度對比
TRMTF模型的旅游閱讀推薦服務微觀實例見圖5,呈現了隨機抽取的一名虛擬游客(編號:TE-0057)的移動軌跡與推薦閱讀信息的變遷。下文概述具體閱讀推薦過程。

圖5 旅游閱讀推薦實例
Step1:讀者(虛擬游客)的移動軌跡初始化,為節省計算資源,從讀者的畫像中生成其初始狀態,其初始狀態中包含閱讀推薦特征詞(古跡、傳統、美食)。
Step2:讀者移動軌跡節點啟動更新,不斷根據讀者的場景視圖變動情況,完成個體場景、自然場景、社交場景、興趣場景與行為場景明細組等信息的匯總,生成并更新軌跡節點中的信息。由于讀者(虛擬游客)TE-0057的社交信息中出現了“博物館”“遺址”等信息,并在小吃店等場景中滯留時間較長,其軌跡節點得到了更新,其中的閱讀推薦特征詞“古跡”與“美食”被加強。
Step3:虛擬游客客戶端一旦發現軌道節點攜帶者進入下一個場景時,將告知該場景中的旅游閱讀推薦服務器,根據其提供的軌道節點信息,為其生成一個局部的軌道融合視圖,信息合并結果,添加了“風味小吃”閱讀特征詞。
Step4:旅游閱讀推薦服務器從客戶端中獲取所需的軌道信息,并將其與存儲在服務器中的閱讀資源(本次實驗采用的是圖書館提供的區域環境、景點典故、網絡游記等信息)進行匹配,以“古跡”“美食”“風味小吃”等關鍵詞匹配結果為依據,提供個性化旅游閱讀推薦服務。
本文針對現有旅游閱讀推薦算法與模型的不足,提出了一種基于移動軌道融合的旅游閱讀推薦解決方案。TRMTF模型在實驗中體現了較高的處理效能與性價比,具有一定的實用價值。限于目前游客端生成游客與場景信息的全面性與準確性,研究尚有不足之處,需要在軌道信息自動持續供給、閱讀軌道節點近似合成等方面進一步深入研究。