施國良,潘奕慧,謝澤宇,楊漢鈺
(河海大學商學院,江蘇 南京 211100)
在國際河流研究領域,俄勒岡州立大學創建的國際河流水爭端數據庫(TFDD)是針對所有國際河流建立的數據集合,包括多種針對性的數據集:涉水條約的數據集(IFTD)、流域風險事件數據集(IWED)、流域組織數據集(RBO),以及仍在不斷建設中的GIS空間數據分布。此外,還包括對國際河流流域氣候特征、地貌、植被數、灌溉面積、水利工程等數據的權威統計[1]。在我國國家圖書館總書庫中檢索“國際河流”,有《國際河流大詞典》《國際河流水域使用的決議》《國際河流航行規章》等22部年鑒工具書詞條記錄。但是筆者發現這些數據的詞與詞之間,概念與概念之間缺乏較為系統的分類和關系定義。
分面分類法是構建領域詞表的一種方法,它能在知識組織的基礎上,實現不同主題之間的相關關聯,從而體現概念與概念之間的關系。用分面分類法來對國際河流爭端事件數據集進行分面分類詞表的開發,也就是說用分面分類表的方法定義國際河流領域中的概念與概念之間的用詞關系,提高檢索效率[2]。
從國際法意義上說,河流爭端是指兩個或兩個以上國家圍繞國際河流的使用和管理發生的爭議,核心是國際河流的主權以及主權權利的爭議。具體表現為水域劃界、水量分配、水源利用和水污染等方面的問題。對于流域國來說,國際河流不僅與本國的淡水資源量密切相關,還會與其他的利益因素結合在一起。河流爭端是指因某條國際河流的淡水資源而引發的國家間的政治、法律、事實爭執等[3]。在對俄勒岡州立大學的國際跨界河流水爭端數據庫中所記載的7 100條河流爭端事件數據進行系統地分析后,筆者發現上下游國家對國際河流主權的不同主張是爭端產生的主要原因。
語義Web是現有Web的擴展。重視領域詞表所發揮的日益重要的作用,可推動語義Web的發展,從而推動計算機與人的協同發展。從本質上來看,傳統的分類法大多數是線性的,無法準確地反映出事物的多向屬性。而分面分類的結構體系是“分面—亞面—類目”,是由各分面內類目之間的組配來表達主題。分面分類表有兩個明顯的特征:每一個測試對象屬于每一個面;每一個測試對象只能在每一個面的一個子節點上找到一個對應關系[4]。
分面分類表在部分領域已經得以應用,在部分網站上有運用分面分類表的知識,來幫助目標客戶或信息檢索者找到他們想要的信息[4]。一方面,這樣的嘗試和進步相對于之前單純的檢索而言是有進步的,但是另一方面,他們直接用分面分類表來做導航頁,并沒有完全遵循分面分類的核心思想,可能會導致分類定義不準確,容易產生誤檢或漏檢的情況。
聯合國及各國政府頒布了許多針對國際河流爭端的法律法規,許多著名學者對該領域不斷加深研究。通過談判與合作的方式來解決國際河流爭端的問題,也與當今世界和平發展的主題密切相關。由于爭端事件涉及的國際河流流域管理與合作等專業術語與實物很多,用分面分析的方法對國際河流爭端事件領域的概念關系進行定義,有利于未來圖書館、政府部門、企業等機構以及專家更好地對該領域信息進行組織與檢索。
在國際河流領域,中國國家圖書館現有館藏資源里目前沒有找到較完善的相關分類資源,其一般被附屬在水利相關資料里被提出,所以沒有被細化。得到的分面分類表之前收集的專業術語原始數據可以用作編寫該領域主題詞表的原始數據與參考;同時,分面分類表的應用和提出有利于推動該領域的智能化發展;在信息組織與檢索方面,圖書館可以根據分面分類詞表優化國際河流方面相關書籍的網站導航與檢索,從而實現精準查找。還可以根據詞表對國際河流爭端方面的書籍進行分類和編號;水利管理部門等組織機構可以根據分面分類詞表優化內部網站檢索,從而實現科學分類和保存資料。
筆者主要運用分面分類法,構建出國際河流爭端事件的分面分類詞表框架,確定爭端事件的分面,實現初步構建分面分類詞表,為最終實現該領域真正意義上的語義檢索奠定基礎。
領域詞表的構建與研究的常用方法有[5]:①手動構建:通過專家調研和文獻查找等方法確定概念間的關系;②半自動構建:通過現有的領域主題詞表來輔助領域詞表的構建。
筆者采用的是手動構建與半自動構建相結合的方法,參考《國際河流大詞典》《國際河流水域使用的決議》(以名詞解釋定義為主,為接下來的定義與分類做鋪墊)。半自動構建保證了術語收集的相對完整性。同時,參考手動構建的方法,主要是通過訪談向專家咨詢河流概念與概念的詞間表達是否正確,或者將我們列出的面和屬性通過郵件發給專家確認是否恰當。爭端事件面中有哪些屬性詞是需要補充或者修改的。
首先采取文獻查詢的方法,篩選出與國際河流爭端事件相關的專業術語和詞匯,對爭端事件分類與概念范圍的定義;然后將原始數據發給研究國際河流領域的專家,由于參考的原始詞表出版年份距離2018年較為久遠,為了編寫出與時俱進的分面分類表,從新興詞匯和新興方向入手顯得尤為重要。
專家訪談的問題主要包括:對于有爭議的術語應該怎么做;國際河流領域的新學科研究方向、新的時事熱點、新政策、近年來熱點詞匯等。再對匯總出來的專業術語和詞匯在原有的分類基礎上進行調整,從專家角度和目標用戶的角度出發,將需求和實用性回歸第一位,結合有關構建領域分面分類詞表的文獻,構建出客觀實用的分面分類詞表[6]。
圖1為分面分類概念圖。

圖1 分面分類概念圖
圖1顯示:
a. 綜合《國際河流大詞典》、流域爭端數據庫中的流域組織數據集和涉水條約數據集(主要參考專業術語的定義和含義),從而得到初始數據,包括:爭端事件的時間、河流名稱、所涉及的國家列表、國家數量、爭端事件的嚴重程度以及對該爭端事件的簡述;
b. 將初始數據按照敘詞表中的關系列成Excel表格;
c. 通過專家訪談和表格中的原始數據對詞表中的關系和分類進行調整,并定義概念和詞間關系;
d. 根據概念與詞間關系進行分面分析,構建分面分類框架[7];
e. 通過專家二次訪談,對分面分類框架進行調整,重新測試,從而形成最終的分面分類詞表。
3.3.1 客觀數據支撐
本文運用的客觀數據主要包括:
a. 綜合俄勒岡州立大學創建的國際河流水爭端數據庫(TFDD)中針對所有國際河流建立的數據集合(主要參考專業術語的定義和含義),從而得到初始數據;
b. 參考中國國家圖書館資源,搜索國際河流所得到的相關數據,作為劃分國際河流爭端事件領域詞表的前期基礎,使得到的結果具有科學性和系統性。
3.3.2 二次數據收集
a. 第一次收集數據的目的在于:獲取國際跨界河流爭端領域的基本術語與明確概念間的關系和補充新興詞語(因為大多數詞表為專業詞匯,出版年份早,無法涵蓋新興詞語和學科方向);
b. 第二次數據收集的目的在于:完善初步形成的分面分類詞表(由主題詞表、專家意見和分面分類對象列表數據共同得出)。
簡單來說,第一次數據收集是獲得原始數據,并對其進行歸類和整理,從而初步定義概念與概念間的關系,構建分面分類詞表的框架;第二次收集是在初步構建分面分類詞表框架后,對各分面的收集,可以將其看作是分面分類詞表的完善。
最后初步確定與國際河流爭端事件領域相關的概念與概念間的初步關系。表1展示了部分爭端河流最終所注入海洋的概念之間關系。

表1 爭端河流最終所注入海洋的概念之間關系(部分)
對象列表是由所建設的國際河流爭端事件分面分類詞表的目標受益群體決定的[8]。該領域的分面分類詞表使用的主要對象為:
a. 跨國公司和國際非政府組織;
b. 國際河流流域國政府辦公室、水利管理部門以及相關流域規劃部門;
c. 圖書館和領域學者;
d. 社會企業和其他機構組織等。
對檢索數據進行分類統計,結合相關數據與對比,我們暫時把面初步確定為:河流、時間、爭端起因、所屬地區、涉及組織、解決方式6個面。面的概念如下:
a. 河流:發生爭端事件的國際河流;
b. 時間:爭端事件發生的時間;
c. 爭端起因:包括水量、水質、自然災害、基礎設施建設、農業、旅游業、航運;
d. 所屬地區:爭端事件發生的政區;
e. 涉及組織:包括行政性國際委員會、仲裁當局、流域當局、機構、流域委員會、理事會、合伙人機制;
f. 解決方式:包括談判協商、威脅使用武力、小規模使用武力、全面戰爭。
因為構建該領域分面分類詞表的直接目的是給水利部門、圖書館、企業等機構的管理人員使用,所以需要從用戶的角度出發,充分了解該領域內的目標用戶的查找習慣與歸納方式等,從而構建出更具有實用意義的分面分類詞表[8]。從該角度出發,在二次專家訪談中著重詢問以下問題:
a. 從事的具體職務與國際河流領域重合的地方;
b. 國際河流爭端事件的分面分類詞表對信息組織與檢索的意義;
c. 如果要進行查詢相關知識或者從事相關研究,一般需要什么樣的數據支持;
d. 一般常用的獲取數據的方法與途徑;
e. 工作所在組織如何對信息或資料進行定義、劃分和儲存[9];
f. 如果想在導航處點擊進入查找想要的資料,一般會選擇哪一個面為主要的篩選條件(即面的重點排序)。
初步整理好的國際河流爭端事件分面分類框架如圖2所示。

圖2 分面分類框架
采訪專家的問題不是憑空想象出來的,而是在對主題面進行劃分和組織的過程中出現的,在對專家采訪之前,要對主題面進行劃分和組織,在這個過程中會發現許多待解決的問題[10]:
a. 整理的分類應該如何歸納提煉成主題面的子面;
b. 主題面的各個焦點是否相互排斥;
c. 是否列出了關于主題面的所有焦點;
d. 歸納的子面用詞是否專業且易理解。
這些問題需要對于國際河流爭端的知識了解和掌握達到一定程度的專家才能夠解答,所以需要羅列出這些問題,請求專家幫助解答和給出建議。
3.6.1 河流面
據統計,在全球范圍內,目前共有200多條國際河流,其中亞洲有57條,非洲有59條,歐洲有69條,北美洲有40條,中南美洲有38條。在這200多條河流中,有發源于德國西部,流經奧地利、塞爾維亞、羅馬尼亞等9個國家的多瑙河;有21條流經國家數較多(超過4個),如湄公河、尼日爾河、尼羅河、剛果河、亞馬孫河、萊茵河、恒河等;其中還有148條流經兩個國家;有31條流經3個國家,如流經中國、印度和巴基斯坦的印度河[11]。這些河流由于支流數目多、分布廣且水資源量大,都是具有一定爭端性的國際河流。
根據河流的屬性,我們在其面下設置發源地、所在地區、最終注入、維度帶、流經國家數、流域面積、流程、所屬水系、支流數量、河道特征10個亞面。
3.6.2 時間面
根據流域爭端事件數據集中的時間數據記錄,爭端事件的記載是從1948—2008年。因此。我們在時間面下設置20世紀50年代、60年代、70年代、80年代、90年代和21世紀00年代6個亞面。
3.6.3 爭端起因面
國際河流爭端的產生和持續發酵受到很多方面的影響,無論是在國際層面還是國家層面上都與流域國的政治、經濟方面有密切的聯系[12],其中處于河流上游的流域國在河流的開發和使用當中處于主導地位,如果上游國家只顧自己的開發利用,不積極推進河流的治理、不與處于中下游的國家構建合作機制,或者沒有建立形成統一的管理機構,則必然會導致國際河流爭端問題的產生,使之成為國家間沖突的重要起因[13]。
河流的污染問題是流域國之間產生沖突最常見的起因,比如:1986年萊茵河化工廠污染事件;2000年羅馬尼亞金礦氰化物泄漏事件;2005年我國的松花江水污染事件等等。流域水體會因為人們的各種生產活動而產生物質介入,發生物理、化學、生物等方面的變化,使國際河流水體的利用價值大大降低甚至喪失,嚴重破壞水域生態環境[14]。
流域國沒有把握好對河流生態和環境功能的兼顧,造成水域生態的破壞,波及其他流域國,也是產生沖突的常見起因[15]。比如:湄公河干流水電站的建設頻繁惹起爭議;匈牙利與斯洛伐克之間的多瑙河水壩案;老撾水電站坍塌導致近千人無家可歸等等。流域國在各自流域內的水壩、水電站等基礎設施建設對河流生態環境的不利影響是不可避免的,對水資源的使用及管理不當會導致開發過度,大壩的設計存在風險且預警系統不足必然會導致悲劇的發生。
通過對爭端事件數據集中數據的分析總結,筆者在爭端起因面下設置水量、水質、自然災害、基礎設施建設、農業、旅游業、航運7個亞面。
3.6.4 所屬地區面
該面下設置流域爭端事件數據集中每一條記錄所指的爭端事件發生所在的政區,這些政區構成的亞面下的類目集合組成爭端事件的所屬地區面。
3.6.5 涉及組織面
為了符合流域整體開發趨勢和可持續發展的理念,國際河流流域組織致力于管理流域國之間的全部或者部分永久型共享淡水資源,涉及能履行各種職能的組織類型。確保公平合理的原則,國際河流流域組織的水規劃專家組必須根據流域的整體規劃來制定共享水資源的分配規劃[16]。通常要根據流域的背景和歷史,以及流域成員國授權的機構來確定流域組織的法律框架及章程。按照重要性依次為:首先是數據交換以及技術執行方面的任務;其次是協商職責、沒有決策權的國家制度上的補充;最后最重要的是決策職責,表明成員國為了共享水資源組織的利益而對部分主權的讓渡[17]。
根據研究現有的、已經成功運行的國際河流流域組織類型,在該面下設行政性國際委員會、仲裁當局、流域當局、機構、流域委員會、理事會、合伙人機制7個亞面。
3.6.6 解決方式面
國際河流開發與管理的主線是水資源的合理利用,而其中最為關鍵的因素就是關于河流水資源的分配問題,同時這也是解決國際河流爭端的核心。而河流流域國國家間的關系不同,對產生何種爭端也具有直接且重要的影響[18]。國家間關系若處于友好狀態,彼此有戰略方面的合作,那么可以通過商議談判、簽訂條約來處理水資源方面的問題,雙方一般不會發生武裝沖突。比如2005年由于中國境內的化工廠發生爆炸而引起的水污染,由黑龍江流入俄羅斯境內,中俄雙方立即采取應對措施,加強進一步合作,有效地解決了問題。所以由于國際河流爭端問題而引發的武力沖突往往發生在處于非友好狀態的國家之間,甚至會導致問題被不斷地擴大,遲遲得不到解決[18]。比如在約旦河流域,河流問題由于民族矛盾、邊界糾紛、領土爭端等因素引起的以色列和阿拉伯之間的武裝沖突,一直危及著中東地區的和平[19]。
當今世界的主題是和平與發展,我們主張通過和平談判、簽訂條約等方式來解決國際河流的爭端問題。流域國應當結合政治、經濟、法律、外交、科技等各個方面并且采取多種形式、一步步推進的合作方法來處理爭端問題。國際河流問題如果長期得不到有效緩解或解決,就可能會引發不同規模的武裝沖突[20]。筆者在解決方式面下設置談判協商、威脅使用武力、小規模使用武力、全面戰爭4個亞面。
本文用分面分類的方法來定義國際河流爭端事件數據集和相關資料中概念與概念之間的關系,規范用詞,提高檢索效率,同時降低誤檢率和漏檢率。
a. 隨著人工智能的發展和語義網的深入研究,領域詞表會受到越來越多的重視,以解決詞間異構的問題,本文的研究在一定程度上可以促進國際河流領域的智能化發展;
b. 在行業專家、水利機構等參與的情況下構建出的分面分類詞表框架,為構建完整的國際河流爭端事件詞表奠定了基礎;
c. 結合專家訪談和文獻查找在各個分面下所設置的亞面和類目可以用于實踐。
本文研究的局限性在于,由于河流爭端事件的分面分類框架是手動構建,可能會存在筆者沒有考慮到的方面,對各個面和屬性概括得不全面;專家對于訪談問題回答的主觀性以及我們對概念術語的不規范表達也是不可避免的。
分面分類法在情報檢索領域中的應用比較多,將分面分類詞表運用到語義檢索的領域本體的構建過程中,這是未來一個很好的研究方向。領域詞表作為該領域研究的一部分,可以在一定程度上推動領域本體的發展。筆者接下來將在構建分面分類詞表的基礎上,運用分面思想在信息組織方面的優勢來構建領域本體,以進一步提高國際河流爭端領域知識的復用和共享水平。后續筆者還將嘗試基于分面思想進一步開發分面導航檢索系統。