羅 瓊
(凱里學院,貴州·凱里 556011)
地理信息系統(tǒng)(GIS) 起步于20世紀50—60年代,它具有數(shù)據(jù)采集、管理、分析、建模、可視化表達等功能,用于解決復雜的規(guī)劃、管理和決策問題。GIS是人文社會科學研究的一種信息化新方式,已廣泛應(yīng)用在人類學、經(jīng)濟學、歷史學、社會學等學科領(lǐng)域。目前國內(nèi)外均有基于GIS技術(shù)的語言地理信息系統(tǒng)研究,國外研究基于宏觀尺度的居多,國內(nèi)研究有基于宏觀的,也有基于微觀的,國內(nèi)學者張義、張維佳、潘悟云等在歷史方言地理信息系統(tǒng)構(gòu)建和現(xiàn)代方言共時研究方面都取得很多成果;但在小尺度下,對于涉及苗侗地區(qū)村域漢語方言地理信息系統(tǒng)的研究幾乎還沒有出現(xiàn)。
對少數(shù)民族地區(qū)漢語方言資源數(shù)字化工作進行研究,充分挖掘方言資源信息,使其方言資源數(shù)據(jù)標準化、規(guī)范化、系統(tǒng)化,至少具有以下4個方面重要意義:一是為小尺度少數(shù)民族地區(qū)方言地理信息系統(tǒng)建立提供參考;二是為納入大尺度數(shù)字方言地理信息系統(tǒng)做好準備;三是為當?shù)卣块T和管理人員制定語言規(guī)劃提供決策支持;四是為保護和傳承優(yōu)秀的傳統(tǒng)文化資源及弘揚民族文化自信提供有力保障。本研究以黔東南州為研究區(qū),針對村域漢語方言資源信息進行數(shù)字化,建立漢語方言地理信息系統(tǒng),實現(xiàn)方言資源的信息化管理,為當?shù)卣Z言政策制定提供決策支持和服務(wù),同時為融入全國方言地理信息系統(tǒng)平臺乃至全球方言地理信息系統(tǒng)平臺做好準備。
黔東南苗族侗族自治州,地處貴州省東南部,以“原生態(tài)”聞名于世界,境內(nèi)居住著苗、侗、漢、布依、水、瑤、壯、土家等民族,少數(shù)民族人口占總?cè)丝诘?0%有余,其中苗族人口占比超過40%,侗族人口占比超過30%。
系統(tǒng)工作環(huán)境包括硬件環(huán)境配置、軟件環(huán)境配置及圖件資料。硬件配置包含計算機,80G以上硬盤,2G以上內(nèi)存;軟件環(huán)境配置包括開發(fā)環(huán)境(Microsoft Visual Studio2005、MapInfo Professional、MapX4.5、Microsoft Visual C++6.0,Oracle9i) 和運行環(huán)境(Microsoft Visual Studio 2005、Windows 2000 或Windows XP,Oracle9i);圖件資料包括黔東南州行政區(qū)劃圖、地形圖、水系圖、村鎮(zhèn)分布圖等。本系統(tǒng)中所獲取的數(shù)據(jù)主要有以下幾種方式: 一是利用國家基礎(chǔ)信息平臺提供的基礎(chǔ)底圖,經(jīng)過GIS軟件處理獲得;二是漢語方言數(shù)據(jù)來源于王貴生教授專著;三是通過手工在鍵盤上輸入地圖的屬性數(shù)據(jù)和其他圖表資料;四是利用百度地圖開放平臺獲取相關(guān)的地圖數(shù)據(jù)。
MapX 是一款OCX控件產(chǎn)品,屬于美國MapInfo 公司開發(fā),具有強大的地圖分析功能。因為它是一種基于Windows操作系統(tǒng)的標準控件,其兼容性很好,故能在大部分標準的可視化開發(fā)環(huán)境進行應(yīng)用,如Microsoft Visual C++、PowerBuilder等。開發(fā)人員可以選用任一對象語言,利用MapX和其結(jié)合進行二次編程,實現(xiàn)通用GIS工具軟件提供的基本數(shù)據(jù)編輯等功能,同時可以不依賴于MapInfo軟件平臺而單獨運行。
MapX 的空間數(shù)據(jù)結(jié)構(gòu),一方面從橫向來看,采用空間實體和空間索引相結(jié)合的方式。空間實體主要包括點、線、面3種基本類型。點、線、面分別用對應(yīng)的坐標表示;空間索引主要用于快速查詢坐標對應(yīng)的實體及相關(guān)的數(shù)據(jù)。另一方面從縱向看,它是采用分層存放的方式進行,目前分層是較成熟的數(shù)據(jù)組織管理方式。分層能在邏輯上區(qū)別不同要素,從而提高搜索速度,便于數(shù)據(jù)的靈活調(diào)用、管理及更新。
MapX 的顯著特點有5個方面:一是方便制作多種方式的專題地圖,包括直方圖、點密度、范圍圖等;二是方便瀏覽和查詢與地圖對象相連的各類數(shù)據(jù)信息;三是快速加入文本、符號、表格等信息,使地圖內(nèi)容更加豐富、完整;四是可以訪問遠程空間數(shù)據(jù)服務(wù)器,如Oracle9i空間數(shù)據(jù)服務(wù)器擁有強大的查詢處理能力,在數(shù)據(jù)組織的性能方面也特別強,將數(shù)據(jù)上傳到空間數(shù)據(jù)庫引擎中,使應(yīng)用程序的靈活性得到了增強;五是使用FeatureFactory 對象,使得創(chuàng)建、聯(lián)節(jié)或刪除點、線、區(qū)域圖形對象非常方便。
將GIS軟件處理后的數(shù)據(jù)保存為tab 格式文件,對空間數(shù)據(jù)庫進行設(shè)計,而后建立系統(tǒng)數(shù)據(jù)庫;然后在Microsoft Visual Studio2005環(huán)境下用VC++6.0 語言在設(shè)計應(yīng)用程序并調(diào)試。整個流程如圖1所示。

圖1 系統(tǒng)設(shè)計流程圖
GIS 數(shù)據(jù)分為兩大類:一類是與地理對象的空間位置分布有關(guān)的數(shù)據(jù),稱為空間數(shù)據(jù);另一類是地理對象的非空間的屬性信息,比如地理對象的顏色、長度、面積等,稱為屬性數(shù)據(jù)。對于海量的GIS數(shù)據(jù),要實現(xiàn)對它們的高效組織與管理,是GIS日益廣泛應(yīng)用的迫切需求,也是GIS數(shù)據(jù)庫長期研究的主題之一。空間數(shù)據(jù)管理技術(shù)隨著GIS 和數(shù)據(jù)庫技術(shù)的發(fā)展而不斷發(fā)展。目前,數(shù)據(jù)管理的方法主要有5種,包括早期出現(xiàn)的后期逐步被取代的文件管理方式、廣泛應(yīng)用的文件與關(guān)系混合管理方式、比較成熟的全關(guān)系管理方式、面向?qū)ο箨P(guān)系管理方式、對象與關(guān)系數(shù)據(jù)庫管理方式等。采用對象關(guān)系型數(shù)據(jù)庫實現(xiàn)對GIS數(shù)據(jù)的管理,是在RDB和OODB之間權(quán)衡之后選擇的一種折中方案,它是一種較為理想的實現(xiàn)空間數(shù)據(jù)庫的方式。當前,一些國際著名的數(shù)據(jù)庫公司如Oracle、SQL Server都推出了空間數(shù)據(jù)管理工具,本研究采用對象關(guān)系型數(shù)據(jù)庫Oracle Spatial來管理方言資源空間數(shù)據(jù)。
通過資源數(shù)據(jù)的分類編碼,可以實現(xiàn)方言資源數(shù)據(jù)的規(guī)范化。要對數(shù)據(jù)進行有效管理,就必須對數(shù)據(jù)進行分類及其編碼,它是實現(xiàn)信息化的一項重要而基礎(chǔ)的工作。本研究的基礎(chǔ)地理數(shù)據(jù)包含行政區(qū)劃圖、村鎮(zhèn)分布圖、水系圖、地形圖。根據(jù)研究區(qū)域特點,各空間要素圖層代碼由6位組成,從左往右,第1位至第2位用于表達地理基本主題,即用英文單詞的首字母表示;第3位至第5位表達區(qū)域代碼;最后1位用于表達基本點、線、面要素特征,即分別用點P、線L、面S表示。如AD001S,AD(英文名稱第一個單詞的縮寫) 表示行政專題要素,001是黔東南區(qū)域代碼;S表示是面狀要素特征。空間數(shù)據(jù)編碼如表1所示。

表1 空間數(shù)據(jù)編碼
系統(tǒng)中的屬性數(shù)據(jù)編碼包括村鎮(zhèn)編碼和方言屬性數(shù)據(jù)編碼。該系統(tǒng)的村鎮(zhèn)編碼由6位數(shù)組成,前4 位代碼為分幅的圖幅號,后兩位是自然村序列號。根據(jù)地形圖分幅與編號的方法,將研究區(qū)域按經(jīng)差30分,緯差20分劃分成8行6列共48幅圖(研究區(qū)邊界內(nèi)共42幅圖),圖幅按從左至右,從上至下的順序進行編碼,第一幅(左上角) 編號為0101,最后一幅(左下角) 編號為0804。后2位代碼按落入圖幅的村鎮(zhèn)順序自西向東,自北向南依次進行編碼,由于每個圖幅自然村不超過99個,所以編碼范圍為01~99。如自然村編碼為010301,表示為圖幅號是0103幅,即第1行第3列,自然村的序號是1。
對于方言屬性數(shù)據(jù)編碼,由于目前尚沒有方言資源數(shù)據(jù)字典的標準,本文參照已有標準的基礎(chǔ)上,從信息管理的角度建立方言資源的編碼方法與規(guī)則。根據(jù)情境的不同、研究區(qū)漢語方言的特點及所搜集的信息,將研究區(qū)的漢語方言資源信息使用線性分類法,分為3個級別,一級分類對應(yīng)使用情境的類別,有5個類別;二級分類對應(yīng)具體名稱,有45個類別,三級分類是具體對應(yīng)的方言說法,有300條。一級分類考慮到類別不超過100 類,所以采用兩位的碼長,范圍是01~99;二級分類考慮到每類常用口語詞匯不超過1000,因此二級分類每類編碼碼長為3位,范圍是001~999;三級分類考慮到的詞語對應(yīng)的方言說法不超過100種,所以采用兩位的碼長,范圍是01~99。具體編碼如表3所示,方言資源的編碼長共8位,第一位F,是方言拼音的首字母;第2至3位,是一級分類的編號;第4位至第6位,是二級分類的編號;第7 至8位,是三級分類的編號。如F0200103,F(xiàn)表示是方言的編碼;02表示屬于第2類——動植物;001——屬于第2 類中的第1 類——蜻蜓;03——表明屬于蜻蜓中的第3類,即蜻蜓方言里的第3 種方言說法。

表3 漢語方言資源分類表
屬性數(shù)據(jù)庫的表結(jié)構(gòu)如表2、表4、表5所示,表2 與表5通過方言編號進行關(guān)聯(lián),表4與表5通過語句編號進行關(guān)聯(lián);當用戶點擊圖上任一點時,即可聯(lián)結(jié)到相應(yīng)的方言信息。

表2 村鎮(zhèn)數(shù)據(jù)表結(jié)構(gòu)

表4 常用語句表結(jié)構(gòu)

表5 方言表結(jié)構(gòu)
Oracle 公司是全球知名的數(shù)據(jù)庫服務(wù)商,Oracle Spatial 是其開發(fā)的空間數(shù)據(jù)管理模塊,該模塊具備強大的數(shù)據(jù)存儲和編輯等功能,同時提供優(yōu)秀的空間索引機制,解決了傳統(tǒng)空間數(shù)據(jù)庫展現(xiàn)出來的種種問題。通過Oracle Spatial加載的每一個地圖,是以表的形式來進行存儲的,每一個表是一組文件,一類是ID或IND索引文件,即索引機制生成的相關(guān)文件;另一類是TAB數(shù)據(jù)文件、DAT 文件、MAP文件,即用來存儲地圖屬性特征數(shù)據(jù)和關(guān)鍵空間信息描述。將tab格式文件的地圖數(shù)據(jù)導入到服務(wù)器端的Oracle Spatial中,數(shù)據(jù)上傳工具采用Mapinfo公司的數(shù)據(jù)轉(zhuǎn)化工具Easyloader。
系統(tǒng)應(yīng)用GIS技術(shù),把研究區(qū)的空間信息(區(qū)域)、人、方言資源(語言) 信息三者信息整合起來,為方言資源的保護和數(shù)字化工作提供服務(wù)和參考。根據(jù)需求,系統(tǒng)的功能總體框架圖如圖2所示。

圖2 系統(tǒng)功能總體框架圖
系統(tǒng)的7大主要功能簡述如下:
第一,地圖加載。系統(tǒng)可以實現(xiàn)任何區(qū)域資源地圖tab格式及mws格式文件的加載。如行政區(qū)劃圖、水系圖、地形圖、點位圖等;如選擇地圖加載選項卡,選擇要導入的tab數(shù)據(jù)所在的位置,點擊確定,就可以把所需要的數(shù)據(jù)加載到系統(tǒng)中,進行顯示。
第二,地圖基本功能。在系統(tǒng)中,地圖的管理模式使用了分層結(jié)構(gòu)進行組織,對可以自由實現(xiàn)對任一地圖的縮放、漫游、全圖等操作,也可以對圖層進行顯示或者隱藏。如對于點位圖,可以在左邊區(qū)域的圖層框里點擊左鍵,就可以打上勾或者取消勾,圖層就能顯示或者隱藏;也可以通過放大、縮小等按鈕對地圖進行查看,以便了解局部或全局的地圖信息。
第三,信息查詢功能。系統(tǒng)提供從屬性到圖形的查詢和圖形到屬性的查詢。如從屬性查圖形,若你想知道黔東南有哪些地方的人把“熱水”說成“Lai水”,那你就選擇方言中的“l(fā)ai水”選項,可以準確又快速顯示出說“Lai水”的區(qū)域位置;再如從圖形查屬性,點擊圖上任何1個點位,都可以查到該位置的人們常用語句的方言說法。
第四,經(jīng)緯度顯示功能。系統(tǒng)提供較準確的經(jīng)緯度的顯示功能,便于進行定位跟蹤及與其他系統(tǒng)集成應(yīng)用。如融合相關(guān)的語音資料、視頻資料,實現(xiàn)服務(wù)和系統(tǒng)功能的無縫對接。
第五,三維顯示。通過地形圖創(chuàng)建的數(shù)字高程模型,及顯示的方言分區(qū)圖,實現(xiàn)方言區(qū)域差異的三維顯示。從圖上可以看到地形對方言的影響,河流北岸與南岸,山脈的東邊與西邊,人們的方言對同一種事物叫法都不一樣,具有明顯的差異。如在苗嶺的北坡和南坡, 陽河的上游與下游,人們對西紅柿的說法都存在明顯的不同。
第六,報表輸出功能及生成專題圖功能。根據(jù)實際需要,系統(tǒng)可以輸出相關(guān)的表格。如常見生活語句方言與普通話對照表、方言對應(yīng)區(qū)域表等。也可以制作專題地圖。如對于每一個詞匯,可以制作方言分布圖;也可以通過用戶類別合并,生成黔東南方言分區(qū)圖。
第七,系統(tǒng)數(shù)據(jù)維護功能。由于地域不同,漢語方言信息量表現(xiàn)出大又非常復雜的特點,因此在現(xiàn)有數(shù)據(jù)庫的建成基礎(chǔ)上,基礎(chǔ)資料仍需要不斷補充和豐富。因此本系統(tǒng)具有一定的開放性,系統(tǒng)管理員以及擁有權(quán)限的用戶,可以對各類信息數(shù)據(jù)進行增加、修改、更新、刪除等操作,從而實現(xiàn)方言信息的不斷擴充和完善,并獲取更多更完整的數(shù)據(jù),更好地做好方言數(shù)字化工作,以便保護和傳承好漢語方言資源和地方文化。
系統(tǒng)采用Windows2007為操作系統(tǒng)平臺,以O(shè)racle Spatial 作為GIS數(shù)據(jù)服務(wù)器,通過Mapx+VC編寫程序來實現(xiàn)方言資源的信息化和數(shù)字化管理。
根據(jù)方言的特性及其在區(qū)域差異中的表現(xiàn),本文利用MapX及相關(guān)技術(shù)將人、方言及區(qū)域整合信息起來,利用Oracle Spatial空間數(shù)據(jù)處理模塊支持的Object-Relational Model模型,使用“一張表模式”,就能存儲和管理漢語方言資源的空間數(shù)據(jù)和屬性數(shù)據(jù),極大方便了系統(tǒng)的數(shù)據(jù)操作。同時借助Microsoft Visual C++6.0語言和MapInfo公司開發(fā)的MapX控件產(chǎn)品進行二次開發(fā)實現(xiàn)方言資源管理,有效將人、方言及區(qū)域三方信息聯(lián)結(jié)起來,建立漢語方言地理信息系統(tǒng),從而為相關(guān)部分和人員提供空間數(shù)據(jù)和屬性數(shù)據(jù)的瀏覽、查詢、分析、制圖等功能,為制定語言政策和語言規(guī)劃提供相應(yīng)的技術(shù)支持,對苗侗地區(qū)方言的數(shù)字化尤其是漢語方言的數(shù)字化工作和漢語方言文化的保護將產(chǎn)生積極的影響。由于小尺度下地方方言原始數(shù)據(jù)獲取的工作量非常大,目前系統(tǒng)的村域方言數(shù)據(jù)有限,還有待進一步更新和完善;隨著數(shù)據(jù)的豐富和增加,系統(tǒng)的功能仍需進一步對技術(shù)進行改善,使其更加有利于地方方言資源的保護、開發(fā)、利用及可持續(xù)發(fā)展的需要。