通拉嘎
(泉州師范學院圖書館 福建 泉州 362000)
高校圖書館建設服務于地方和本校需求的特色數據資源,成為了現代圖書館轉型與發展的一個突破口。泉州師范學院是地方性本科院校,有“中國社科院文化研究中心閩南文化研究基地”等2個國家級閩南文化學術平臺,中國現當代文學等4個省級重點學科,因此,建設閩南方言在線詞典等特色數據庫是學校發展的需要,也是國家級基地、重點學科發展的需要。
閩南方言的數據加工已有一些研究成果,不過方言在線詞典的成果較為少見,國家語委開展的國家語言資源有聲數據庫收錄的詞有固定性及局限性;福建省圖書館建設的閩南文化專題數據庫有關方言的論述較少;臺灣學術界建設了臺文華文線上辭典、臺灣閩南語常用詞辭典、臺文語料庫,不過臺灣閩南話與內地閩南方言有較為明顯的差異,無法直接移植。閩南方言的數字化建設還無法滿足廣大用戶使用與研究閩南方言的需求。
本文重點闡述了閩南方言在線詞典的建設,詳細分析特色數據庫的建設需求及其過程,以此為例,探索圖書館特色信息服務的顯性特征。
保護與傳承閩南方言,將其詞匯數字化、電子化,是我們研究的目標。我們以周長輯的《閩南方言大詞典》為主要參考,制訂閩南方言規范詞表,以“閩南方言在線詞典管理系統”為用戶提供檢索、統計、分析等服務。在線詞典目前以廈門、泉州、漳州三市中心市區,如廈門市思明區、泉州市鯉城區、漳州市薌城區的閩南方言讀音為主體內容。如是三市所屬縣市特有的語音或特征詞,將標注具體縣市,予以錄音。詞典以一詞一符一聲為基本的資源類型,既有方言字標注、拼音標注、國際音標標注,又有方言代表區的口語錄音。在線詞典的建成形態是集字查詢、詞查詢為一體,可不斷擴充與完善的閩南方言有聲資源集成。
高校圖書館建設特色數據資源,首先要確定用戶群和用戶的使用需求,才能在教學科研與實踐中發揮深層次服務職能,這是數據資源建設的前期工作。
2.1.1 閩南文化基地及學科建設需要
泉州師范學院的閩南文化研究起步較早,1996年建立泉州學研究所,2011年獲批南音碩士點,已形成閩南方言與閩南思想文化等6個學術團隊,“中國社科院文化研究中心閩南文化研究基地”和“臺盟中央閩南文化交流研究基地”等2個國家級基地分別于2013年11月、2014年3月落戶我校。泉州師范學院中國現當代文學學科2006年被評為福建省新辦本科院校的重點學科,研究重心之一是海外華文文學特別是東南亞海外華文研究,之二是閩南文化與閩臺戲曲研究。圖書館以閩南文化研究基地為依托,積極為基地與學科發展進行資源開發及服務,這既是圖書館深化信息服務的需求,也是學科建設需要。
2.1.2 閩南文化發展需要
閩南文化是以閩南方言為外在特征的世界各地閩南人在傳承中華文化的基礎上發展形成的具有共同的思維意識、共同的風俗習慣和共同的生活方式的區域性文化[1]。閩南方言主要分布于福建、臺灣、廣東及東南亞,充分保留了上古及中古漢語的許多特征,被稱為“語言的活化石”,是極為珍貴的語言資料及文化遺產。語言是文化的載體,是文化的展示平臺,方言不僅是一種社會現象,也是一種文化現象,方言與文化相輔相成,相互促進,因而從國家戰略高度推動閩南方言的特色數據資源建設,既有利于閩南文化的傳承與保護,也有利于促進閩南文化資源的持續性發展。
2.1.3 海峽兩岸溝通交流及建設“21世紀海上絲綢之路”的需要
閩南文化與閩南方言是連接海峽兩岸的重要紐帶,臺灣島上基本通行著類似于漳州腔和泉州腔的閩南話,閩南方言始終是臺灣人民主要的交際工具。特別是今天,大陸與臺灣的經濟、文化交流更加密切,閩南方言在線詞典的建設將為閩臺及海外華人使用與研究閩南方言提供便利,也是構建和諧的閩南社會及增強臺灣同胞凝聚力的保證。習近平總書記在哈薩克斯坦提出了“絲綢之路經濟帶”戰略思想后,又提出中國-東盟命運共同體以及共建“21世紀海上絲綢之路”的戰略構想。泉州是“海上絲綢之路”的起點,是首屆“東亞文化之都”,我們肩負建設“21世紀海上絲綢之路”的使命,研究閩南地區的語言及文化,對推進海絲戰略構想,建設“絲綢之路經濟帶”意義深遠。
采用目前最為成熟、穩定、安全的PHP+MYSQL開發框架,結合XML、AJAX等主流技術進行開發實現,使系統具有可擴展性、穩定實用的特點,提供系統配置、詞條維護、分類管理、文件管理、權限管理、多路徑檢索、統計分析等多項功能,全面滿足詞典建設的管理需求。特色資源系統采用多層結構,每層的功能相對獨立,每層之間留有標準接口,不但可以保證系統的可擴展性、靈活性與開放性,同時也能方便地進行系統接入與管理。
閩南方言的電子化需要涉及文白異讀、訓讀、不同字形詞形、語流音變等問題,這給數據的規范化建設帶來一些困難。我們首先建立方言規范詞表,讓文白異讀及訓讀擁有可操作性標準,爭取覆蓋閩南方言用字的各類語言現象。使用現行規范字,有本字一律用本字,無本字可用同音或近音詞替代,方言訓讀字另表“訓”以示與詞語的聯系與區別,有音無字,即無法用適合的同音或近音詞表示的詞,可以用方框代替[2]。詞的文白異讀需要標注“文”“白”,白讀在前,文讀在后。接著確定數據加工規范,讓詞條有統一的格式,錄音統一用“wav”格式,以北京語言大學的BYLY進行錄音,國際音標統一采用Ipa Pan New國際音標輸入法,使各類數據有統一化格式,便于檢索加工與重復使用。我們將征求方言學者的意見,參考《閩南方言大詞典》,確立閩南方言規范詞表及數據加工規范。
閩南方言在線詞典中的數據包括方言特有詞、普通話與方言對應詞、方言詞錄音等,具體的數據資源如圖1。
挖掘《閩南方言大詞典》中的詞類知識,標注詞的讀音、釋義,并附例句及錄音,語料的記錄方面,不僅邊聽邊記,還要邊聽邊錄,記音錄音同步完成。記音方面,遵循紙本詞典已有詞形,追加方言中的其他寫法;錄音以廈門、泉州、漳州三市中心市區,如廈門市思明區、泉州市鯉城區、漳州市薌城區的閩南方言讀音為主體內容,三市所屬縣市特有的語音或特征詞,需標注具體縣市[3]。之后,對詞的記音及國際音標拼寫進行一致性檢查,對噪音進行消音,對不合格錄音剔除并進行補錄,對收集到的所有信息進行篩選、查重及過濾,嚴格審核,依次存儲于閩南方言在線詞典數據庫中。
以一詞一符一聲為基本的資源類型,將收集到的詞類知識以確定的檢索知識體系、索引知識體系進行著錄,給相關知識做標引,將其分類存儲,以國際音標輸入法詳細標注詞義,標注所屬閩南方言片區;錄制方言代表區的例詞例句,附與相關字詞。在線詞典的建設遵循一定的順序,首先將閩南方言特有詞信息化,第二步著錄普通話閩南方言對音詞,第三步進行例詞例句的錄音。
在線詞典的功能直接決定著詞典的可用性,詞典提供的功能越多,可發揮的作用也越大。不過如何給用戶呈現詞典信息,也是詞典建設必須考慮到的問題。作為在線有聲詞典,不僅有基本的信息查詢與系統設置功能,還有其他個性化的服務功能。
2.7.1 信息查詢功能
采集在線詞典各類信息資源,將數據導入到管理系統中,提供開放式數據添加和修改的功能,提供檢索、統計、查詢等服務,字查詢實現方言筆畫查詢、拼音查詢、國際音標查詢等功能,詞查詢提供分類索引、方言筆畫查詢、拼音查詢、國際音標查詢等功能,整個檢索界面還提供簡單查詢和高級查詢功能,爭取為方言用戶提供最便利、最直接的信息推送,系統默認的查詢輸入方式為中文簡體。
2.7.2 系統設置功能
系統設置功能是對詞典界面所提供的功能進行必要的調配。閩南方言在線詞典設計之初,即考慮到各個層面使用者的需要,設置了系統的界面、文字、錄音,設計了系統的顯示界面、查詢界面;設定了文字的默認字體、簡方言轉換、字體的大小與顏色;設置了錄音的朗讀按鈕、例詞例句的朗讀、錄音的音量頻率。
2.7.3 發音功能
發音是現代電子詞典的重要特征之一,閩南方言在線詞典的例詞例句均附發音功能,廈門、泉州、漳州各有一個基本對照音,以備用戶對照基本音,研究閩南各地的語音及其變化。
2.7.4 詞匯聯想功能 詞匯的聯想不僅有益于用戶對詞匯的多方面深入理解,而且還對社會文化的認同有意義。閩南方言在線詞典部分詞提供一定的詞匯聯想功能,以同義詞(或近義詞)的意義及用法相互聯系,當查詢詞時,在線詞典即提供相關同義詞(或近義詞)的意義及用法,以方便用戶對語義及用法的理解,更深入地理解語言背后隱藏的文化。
服務地方文化、開展特色服務是圖書館信息服務的重點方向之一。各地方高校以“服務社會”、“為本地區服務”為目標,不斷深化服務的內容與形式,力求為地方經濟提供有針對性的深層次服務。不少地方高校以學校重點學科為基礎,結合當地的經濟社會發展特點,進行特色數據庫資源建設。閩南方言在線詞典即是結合閩南方言區的文化特色,服務于本校重點學科,服務于閩南文化研究的特色數據資源建設成果。以下是我們在高校圖書館地方特色資源庫建設及信息服務方面的思考。
閩南方言在線詞典建設立足于語言自身特色,將文白異讀、連讀音變、訓讀同音等現象充分考慮進特色數據庫建設中,高校圖書館信息服務也要立足于所建數據庫的需求,突出專業需要,將技術與資源進行整合,有針對性地解決建設中的難題。
閩南方言在線詞典的建設立足于閩南地區的信息建設需求,立足于學校及基地建設需求,具有較為明確的服務地方、服務高校、服務學科建設的目的。高校圖書館個性化信息服務首先應該立足于地方特色,立足于學校及國家級研究平臺的信息化建設需求,利用豐富的現代科學技術為用戶提供信息資源,以滿足使用群體的知識需求和科研需求,因而具有較為明確的針對性。
閩南方言在線詞典不僅面向于學術研究者,也面向于閩臺各界社會群眾,立足于閩臺交流及海絲經濟帶建設大環境,將數據資源建設放到國家經濟文化建設、國防建設需求的大環境中。圖書館特色信息服務也需立足于社會需求,將數據資源的應用放置到社會、文化、認知的各個層面,使信息服務應用于更為廣闊的社會范疇。
電子在線詞典的建設既滿足廣大用戶對閩南方言的信息需求,又通過用戶的詞頻、互信度、詞類搭配等信息的統計,分析用戶的需求變化,不斷改進詞典,因此,用戶與在線詞典的構建方是相互作用的交互性關系。圖書館信息資源的建設不僅要以滿足用戶需求為己任,同時,通過構建方對用戶的行為、用途、習慣的分析,再進一步調整與深化信息服務的層次,信息服務還呈現交互性特征。
高水平的特色數據資源建設,是服務地方經濟文化建設、服務高校學科建設的平臺,也日益成為圖書館的價值所在,構建特色數據庫是高校圖書館服務學校教學科研的重要手段,是圖書館信息服務發展的必然趨勢。信息服務的深度發展催生了特色數據庫的開發與建設,特色數據庫也促進了信息服務的深化與提高,兩者相輔相成。閩南方言在線詞典建成后,圖書館及閩南文化研究基地應當加大宣傳力度,讓更多用戶了解并使用該項數據資源,同時,用戶的反饋信息也有助于在線詞典的進一步完善,使特色數據資源在信息服務中發揮更大的效益。
[1]林華東.閩南文化:閩南族群的精神家園[M].廈門:廈門大學出版社,2013:2.
[2]中國語言資源有聲數據庫建設領導小組辦公室.中國語言資源有聲數據庫調查手冊 漢語方言[M].北京:商務印書館,2010:26-27.
[3]周長楫.閩南方言大詞典[M].福州:福建人民出版社,2008:5-7.