苗茹, 袁歡, 周珂*, 張儼娜, 楊陽
(1.河南大學計算機與信息工程學院, 開封 475004; 2.河南省空間信息處理工程研究中心, 開封 475004; 3.河南大學實驗室與設備管理處, 開封 475004)
隨著人們生活質量的提高,旅游消費快速發展,旅游規模越來越大[1],促使旅游信息數據急劇增長。文化與旅游的結合實現了傳統文化的有效傳承和發揚,可以更好地推動國家經濟發展[2]。“四川省文化和旅游資源云”[3]在2020年正式上線,其資源云里共有文化資源271.02萬條,旅游資源數據24.55萬條,文字記錄約4.5億字,照片約300萬張,視頻約1.4萬部。山西省文化旅游資源豐富,其中擁有570個歷史遺跡類,1 198個人文活動類旅游資源和2 644個文化旅游資源單體[4]。研究多元文旅大數據管理技術,對于提升文旅資源管理能力具有重大意義。文旅大數據是利用計算機信息技術,將文化產業與旅游業內多來源、多類型的數據進行收集和加工整理,通過有效分析,科學揭示數據內在發展規律和社會公共價值的一類數據[5]。面對海量的文旅資源數據,對數據的高效管理已經成了亟需解決的問題[6]。林仁狀[7]認為文旅數據研究處于起步階段,數據來源廣泛、雜亂,不同數據源收集方對于數據收集的標準不同,缺乏統一的規范化制定和管理。吳愛云等[8]對吉林省文化旅游資源大數據平臺建設研究中,指出了文旅信息數據尚未整合、數據庫資源利用率不高等管理問題。孫紅蕾[9]對文旅大數據的復雜性、無序性和異構性等問題,將多源異構的數據轉化成結構化的數據,使文旅資源數據得到規范化組織管理。由于數據的來源不同,類型不同,其存儲方式也不盡相同,對不同的數據有不同的組織管理方式。面對多而雜的數據,需要提供一個統一的框架來組織管理這些數據。這個框架不僅要滿足文旅資源數據的離散性地理空間特征和多尺度性,還要使數據得到高效組織。由程承旗等[10]提出的基于2n及整型一維數組的全球經緯度剖分網格(geographical coordinates subdividing grid with one dimension integral coding on 2n-tree,GeoSOT),可以為文旅資源數據的統一組織管理提供可行的解決方案[11]。目前,有許多科學研究者運用GeoSOT剖分網格方法進行了相關領域的研究。金安等[12]針對不同平臺的編碼規則不一致問題,提出了基于GeoSOT剖分網格的編碼方法,試驗驗證并有效地提高編碼的空間數據檢索效率。廖永豐等[13]針對大量的多元災害信息數據,利用GeoSOT剖分網格模型,提出了“空間面片”的方法,解決了災害數據的檢索管理問題。宋樹華等[14]利用GeoSOT剖分網格對不動產單元進行編碼,解決了普通編碼產生的空間位置信息不確定的問題。劉永杰等[15]利用GeoSOT全球剖分網格,構建了一套全國林地數據的編碼模型,解決了多源林地空間數據的統一區位組織和集成管理問題。田方杰等[16]利用GeoSOT全球剖分網格,針對個人照片的數據量增多的問題,提出了結合GeoSOT編碼的一種新的照片標識方法,解決了照片查詢速率慢的問題。
現對海量的文旅資源數據,提出GeoSOT剖分網格方法,利用GeoSOT剖分網格對文旅資源數據編碼,提供一個統一的數據組織管理方法,通過對這些數據的有效管理,提升對文旅資源數據的管理以及檢索效率。
文旅資源所涉及的數據有遙感影像數據、基礎地理數據、文化資源數據、旅游資源數據[17]、文本信息、圖片、視頻數據。這些數據來源廣泛,類型多樣,結構復雜,存儲方式各不相同。
文旅資源數據按照格式可分為柵格數據、矢量數據和報表數據。其中,柵格數據(遙感影像數據)采用影像數據庫進行組織管理;矢量數據(基礎地理空間數據)一般采用標準分幅和行政區劃組織管理;文化資源數據和旅游資源數據等報表類型數據,需要使用關系數據庫進行組織管理;旅游資源圖片和視頻數據采用的是文件形式進行存儲,其他的一些數據用數據庫進行存儲管理。對于不同類型的數據,數據的組織方式不相同,無法達到統一組織管理,增加了檢索時間,降低了檢索效率。GeoSOT剖分網格提供了一個統一的數據組織框架,使各種不同類型的數據得到統一的組織管理,便于數據存儲和檢索。對于遙感影像數據,通過遙感數據覆蓋的空間范圍區域,對該區域進行GeoSOT編碼,建立以該區域位置為主的遙感數據統一組織機制[18]。經過對文旅資源數據的分析,采用GeoSOT剖分網格為數據的統一組織框架,其數據組織方式如圖1所示。

圖1 文旅資源數據組織方式Fig.1 Data organization of cultural and tourism resources
GeoSOT剖分網格是由北京大學程承旗等[19]提出的,是一種等經緯度,嚴格等四叉樹遞歸剖分的網格模型,網格中心點是赤道與0°經線的交點。為了保證能夠使GeoSOT網格實現均分,達到整度、整分和整秒的目的,將地球的經緯度坐標擴展了3次:將第一次的360°×180°擴展成512°×512°,第二次將1°擴展成64′,第三次將1′擴展成64″,如圖2所示。經逐級向下四叉樹剖分,生成32級編碼,其編碼采用一維四進制方式,每一個四進制位代表不同的層級,編碼方式采用Z序順序編碼[18]。第32級的網格尺度大小是1/2 048″×1/2 048″,其在赤道附近的尺度達到1.5 cm。GeoSOT剖分網格能夠實現上至全球,下至厘米級的全球區域覆蓋。不同類型的文旅資源數據,根據目標進行不同的分類組織,采用統一的剖分方案,達到組織管理的目的。

圖2 GeoSOT網格編碼規則式Fig.2 GeoSOT grid coding rules
(1)遙感影像數據剖分。近年來,遙感技術發展迅速,因其高效、大面積觀測和實時的優點[20],多源遙感數據廣泛應用于多種場景中。對一景遙感影像數據,由影像數據的空間分辨率特性,確定GeoSOT的剖分層級。由遙感數據覆蓋GeoSOT剖分面片空間范圍,遙感數據的空間地理坐標對應GeoSOT剖分面片的地理坐標,對遙感數據使用GeoSOT網格剖分面片空間范圍進行“虛擬劃分”[21],將遙感數據映射到GeoSOT剖分面片中,通過GeoSOT剖分網格建立與空間位置的區位聯系。
(2)基礎地理數據剖分。基礎地理數據包含行政區劃等信息,行政區劃關聯經緯度信息和位置信息,根據經緯度信息直接使用GeoSOT剖分網格對其進行組織管理。
(3)報表類型數據剖分。報表類型數據主要是文旅資源信息統計數據,包括文化資源數據,旅游資源數據,文本信息等數據,記錄了文旅資源信息的名稱,用以表示對空間位置的關聯,但是沒有存儲經緯度坐標信息。為了使用GeoSOT模型管理報表數據,需要將報表數據與空間信息進行關聯。《中華人民共和國文物保護法》規定[22],縣級是文物保護的基本統計單位。所以在統計報表數據的字段內,應包含縣級行政區名稱、地理空間范圍經緯度和GeoSOT空間面片編碼。為實現對文旅資源數據統計管理,GeoSOT剖分網格的最小空間尺度必須小于縣級行政區域的空間尺度,才會實現對空間區域的全覆蓋。 如河南省開封市城摞城新鄭門遺址,它的門址平面呈長方形[23],南北長度約160 m,東西寬度約100 m。21級的GeoSOT剖分層級,它的網格尺度大小是32 m,可以實現對該片區域的全覆蓋。所以,可以將GeoSOT模型劃分為21層級,網格覆蓋1″空間范圍,32 m的網格尺度大小完全可以滿足文旅資源數據組織的需要。
(4)音頻、視頻數據剖分。這類數據采用二進制文件的形式存儲在數據庫中,數據庫中通常會存儲這些文件的指針或元數據。為了能使GeoSOT剖分網格管理這類數據,在數據庫中添加GeoSOT字段。
在對文旅資源編碼中,編碼流程如圖3所示。

圖3 GeoSOT編碼流程Fig.3 GeoSOT coding process
由于GeoSOT編碼具有對空間位置的唯一區位標識,使用GeoSOT編碼來標識全球地物的空間范圍。結合GeoSOT的編碼方式和文旅資源編碼要素屬性對文旅資源數據進行統一編碼。在GB/T 18972—2017旅游資源分類、調查與評價[17]中,把旅游資源分為3個層次:主類、亞類和基本類型。
主類分為地文景觀、水域景觀、生物景觀、天象與氣候景觀、建筑與設施、歷史遺跡、旅游購品和人文活動;亞類是旅游資源的第二級目錄,包括實用建筑與核心設施,景觀與小品建筑和物質類文化遺存等。基本類型是按照旅游資源分類標準所劃分的基本單位,是最小的文旅資源分類標準單位,包括建筑遺跡,獨立場所和紀念地與紀念活動場所等。亞類和基本類型按照此分類表進行分類。為了凸顯文化在旅游資源中的價值,突出文旅資源的重要性,同時體現出空間的特點,故選取了與空間有直接關聯的主類:建筑與設施和歷史遺跡,在這兩大類基礎上進行細分,如表1所示,表中前面的數字即為分類代碼。主類作為關鍵屬性、亞類作為次關鍵屬性,確定文旅資源分類面。

表1 文旅資源分類表[17]Table 1 Classification table of cultural and tourism resources[17]
文旅資源數據的編碼由GeoSOT剖分編碼、旅游資源主類代碼、亞類代碼、基本類型代碼、順序碼和校驗碼組成。GeoSOT剖分編碼由21位數字組成,是四進制一維編碼,第一位用字母G表示,代表全球,后面20位數字用四進制數表示,每一位數字代表不同的層級;主類和亞類代碼分別由兩位阿拉伯數字構成,構成代碼為01~99;基本類型代碼由3位數字組成,為001~999,最大值999完全可以覆蓋所有的亞類下的景點;順序碼由4位數字構成,為0001~9999,用于表示基本類型下的資源序列;校驗碼[24]是由一位數字組成,用以檢驗該編碼的正確性,運算規則這樣定義:首先,把每一位編碼轉換成對應的ASCII碼;然后,將轉換后的ASCII碼與自己對應的數字相乘,得到計算碼,將每個計算碼相加求和;最后,再將計算出來的結果與9取余數,得到校驗碼0~9,通過以上的運算步驟,可以得到一位校驗碼。文旅資源編碼示例如圖4所示。

圖4 文旅資源數據編碼示例圖Fig.4 Example diagram of data encoding of cultural and tourism resources
輸入帶有度分秒形式的經緯度,截取每一部分單獨運算,得到GeoSOT編碼,主要代碼如下。
def LngLatSegments(dms): //輸入經緯度
list = re.split(‘[°′″]’,dms)
D = int(list[0].strip(‘ ’))
M = int(list[1].strip(‘ ’))
seconds = float(list[2].strip(‘ ’))
S = int(seconds)
dotSeconds = (seconds-S) * 2048
S11 = int(round(dotSeconds))
half = list[3].strip(‘ ’)
if half ==“S” or half == “W”:
G = 1
elif half == “N” or half ==“E”:
G = 0
else:
print(“輸入經緯度錯誤\n”)
return G<<31|D<<23|M<<17|S<<11|S11
由GeoSOT編碼和主類代碼、亞類代碼、基本類型代碼、順序碼和校驗碼得到整個文旅資源數據的編碼,代碼如下。
for i in range(len(tourism_list)):
a = mainClass_list[i]
print(a)
print(a1)
b = subClass_list[i]
b1 = str(b).split(′:′)[1].split(′″)[1]//得到亞類
c = basicType_list[i]
c1 = str(c).split(′:′)[1].split(′″)[1]//得到基本類型
d = seqCode _list[i]
d1 = str(d).split(′:′)[1].split(′″)[1]//得到順序碼
e = checkCode _list[i]
我們在計算銑刨重鋪措施中相應的車輪碾出痕跡的深度時,運用的是數理統計方法計算重鋪范圍的深度,由此可知,車輪碾壓的痕跡深度RD≥18mm時,可以使用銑刨沖鋪措施。2.2.3 路面結構層中面層的構造技術標準
e1 = str(d).split(′:′)[1].split(′″)[1]//得到校驗碼
Tourism.objects.create(tourismId=totle, mainClass=a1,subClass=b1,basicType=c1,seqCode=d1, checkCode=e1)//往數據庫中存儲每個字段編碼
totle = GeoSOT_Code + a1 + b1 + c1 + d1 + e1//
拼接所有代碼得到文旅資源數據編碼
print(totle)
基于GeoSOT文旅資源的編碼模型,對河南省開封市龍亭區城摞城新鄭門遺址進行編碼研究。城摞城新鄭門遺址中心點的經度坐標:114.317 502,緯度坐標:34.800 066,轉換成度分秒的格式是:114°19′3.007 2″E,34°48′0.237 6″N。它所對應的GeoSOT剖分編碼是G00131003023001100001。該遺址是歷史遺跡,主類代碼為02;是歷史遺跡下的物質類文化遺存,亞類代碼是01;基本類型代碼是001,順序碼是0001,代表基本類型下的資源序列為1;校驗碼為4。因此該遺跡的編碼為G00131003023001100001020100100014。
文旅資源數據傳統管理方式多以文本或記錄的方式,無法將更多的信息進行有機的關聯,通過目標本身所攜帶的位置屬性信息,完成各類數據基于空間信息的一致性編目,可以實現多源數據的有效關聯。其中,空間信息里的基礎地理信息數據主要是提供基礎性數據,作為遙感影像的底圖形式存在,設計各個空間數據圖層的屬性結構[25],包括交通分布圖、水系分布圖和行政區界等基礎性地理數據。數據庫的主要內容如表2所示,文旅資源數據庫表之間的關系如圖5所示。

表2 文旅資源數據庫Table 2 Database of cultural and tourism resources

圖5 文旅資源數據庫表關系圖Fig.5 Table diagram of cultural and tourism resource database
將以上數據存儲在數據庫中,需要在數據庫中進行檢索,檢索流程如圖6所示。

圖6 文旅資源數據在數據庫檢索過程Fig.6 The process of cultural and tourism resource data retrieval in database
文旅資源數據在數據庫進行檢索的過程中,首先使用GeoSOT剖分網格定位到相應的層級,在本文中使用的GeoSOT剖分網格有21級,定位到的空間面片大小是32 m,即所顯示的是一個32 m×32 m的區域。再根據選擇的空間區域范圍,判斷GeoSOT網格是否小于空間范圍。再用空間范圍中心點編碼檢索GeoSOT剖分面片數據表,選擇合適的GeoSOT剖分面片層級。判斷中心點編碼前n位是否與GeoSOT編碼相同,相同即可進入第二次經緯度匹配。
當匹配到經緯度時,輸出相應的GeoSOT編碼,GeoSOT編碼關聯所在空間位置信息表和文旅資源概況表,文旅資源概況表包含遙感影像信息,列表顯示文旅資源的經緯度信息、GeoSOT編碼和信息簡介,影像地圖(圖7)展示該文旅資源所在的位置情況。

圖7 文旅信息記錄截圖Fig.7 Screenshots of cultural travel information recording
根據上述檢索方式,檢索結果如圖7所示。圖7中的列表顯示查詢到的文旅資源數據記錄,同時在查詢結果列表中同步顯示相關數據的部分重要屬性字段。結果表明:GeoSOT編碼既可以關聯文旅屬性信息,也可以關聯空間信息,實現對文旅資源數據的有效組織管理。
采用了GeoSOT剖分網格模型對多元文旅資源數據進行了有效組織管理,解決了文旅資源數據來源廣泛,類型多樣,結構復雜,缺乏統一組織管理的問題。得出如下結論。
(1)GeoSOT是一種剖分網格框架,它將地球劃分成等網格、等尺度,是一種等經緯度,嚴格等四叉樹遞歸剖分的網格模型。GeoSOT能夠為數據提供一個新的組織方式,解決數據組織不統一的問題。
(2)通過對多元文旅資源數據的組織、剖分、編碼和檢索方式的設計,實現了用GeoSOT編碼關聯文旅資源數據,可以正確有效地檢索到文旅資源數據,能夠提供索引需求。
使用GeoSOT剖分網格模型對多元文旅資源數據的統一組織管理進行了研究。但同時也存在一些問題,GeoSOT剖分網格模型會將地球剖分成大量的網格,這可能會導致數據的過度細化,使得存儲和處理大規模數據變得復雜和耗時,下一步將對文旅資源數據的存儲方法進行研究,以其能夠利用最小的存儲空間提供更多的數據存儲,使得數據得到更加有效的管理。