999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中國少數民族語言信息資源跨語種共享策略研究*

2014-12-31 09:14:18趙生輝西藏民族學院管理學院陜西咸陽712082
圖書館建設 2014年2期
關鍵詞:語言文字國家資源

趙生輝(西藏民族學院管理學院 陜西 咸陽 712082)

中國是統一的多民族國家,多民族、多語言、多文字是我國的基本國情。在信息資源管理領域,除了以國家通用的漢語和漢字作為信息記錄語言之外,民族地區社會實踐和民族事務管理過程中產生的語種各異、類型豐富、功能多樣的少數民族語言信息資源也是我國檔案信息資源的重要組成部分。少數民族語言信息資源跨語種共享是利用信息技術打破語言文字差異帶來的溝通障礙,促進全國各族人民之間的相互理解,實現中華民族多語種信息資源和諧共存的重要舉措。

1 少數民族語言信息資源跨語種共享概述

中國少數民族語言信息資源是指主要內容以我國境內除全國通用的漢語普通話和規范漢字以外、現存的或者曾經存在過的少數民族語言和文字作為信息記錄和表達方式的信息資源[1]。目前,全國55個少數民族當中,除回族、滿族已全部轉用漢語外,其他53個民族都有自己的語言,有些民族內部不同支系還使用著不同的語言;除回族、滿族已不使用自己民族的文字而直接使用漢字外,有29個民族有與自己的語言相一致的文字,由于有的民族使用一種以上的文字,如傣語使用4種文字,景頗族使用兩種文字,所以29個民族共使用54種文字[2]。其中,藏、彝、蒙古、維吾爾、哈薩克、柯爾克孜、朝鮮、傣等民族的傳統文字大都具有數百年的歷史,藏文和彝文甚至已經有1 000多年的歷史。這些少數民族文字具有比較規范的習慣用法,使用范圍較廣,影響也較大。從20世紀80年代開始,我國先后制定發布了上述少數民族語言文字的計算機文字編碼、字型、術語等方面的國家標準,從1993年起研究制定了基于ISO10646多文種平面的中國少數民族文字的編碼字符集標準(Unicode),使得這些文字成為最先具備計算機處理能力的幾種少數民族文字,實現了其計算機編輯、排版和檢索[3]。近年來,以蒙古文、藏文、哈薩克文、維吾爾文、柯爾克孜文、朝鮮文、壯文、彝文等為代表的一系列少數民族語言操作系統、文字處理軟件、辦公自動化系統、編輯出版系統開始在少數民族地區得到應用,少數民族語言信息資源的管理需求也在逐步顯現,而其中最為突出的需求就是少數民族語言信息資源的跨語種共享。

“少數民族語言信息資源跨語種共享”是指在少數民族地區信息管理工作中,通過技術手段和管理手段的綜合應用,使各個少數民族語種信息資源所包含的內容信息具備能夠被全國各民族沒有熟練掌握該語種的人口以較低的成本、較為便捷的方式進行閱讀和理解的能力。該定義的內涵主要體現在以下方面:第一,少數民族語言信息資源跨語種共享強調內容理解層面上的共享,而不是電子數據可訪問性層面的共享[4]。電子數據本身的可訪問性可以借助分布式數據庫來完成,不是本文探討的重點。第二,少數民族語言信息資源跨語種共享強調建立一種大范圍、穩定的共享機制,而不僅僅是滿足個體、臨時性的共享需求。例如,人工翻譯方式也是跨越語言障礙的一種方式,卻不能滿足大范圍、長期性的共享需求,因而不能作為一種全局性的戰略來考慮。第三,少數民族語言信息資源跨語種共享并不是只涉及到少數民族語言問題,由于少數民族語言與國家通用語言之間的緊密聯系,少數民族語言信息資源跨語種共享必然要涉及到國家通用語言文字問題。第四,少數民族語言信息資源跨語種共享需要結合各語言發展現狀進行分類管理。例如,當前主要考慮的是當前使用人口相對較多的蒙古文、藏文、哈薩克文、維吾爾文、柯爾克孜文、朝鮮文、壯文、彝文等語種的信息資源,使用人口較少或者處于瀕危狀態的少數民族語言文字重點考慮的是文化保護問題,而不是共享問題。第五,少數民族語言信息資源跨語種共享的核心是關注少數民族語言信息資源的利用問題,其目標是將少數民族語言信息資源的利用范圍從部分地區、個別群體擴展到全國各族人民。少數民族語言信息資源的可靠性、完整性和可讀性保障需求是進行信息共享的前提條件,其實現方式也不在本文的討論范圍。第六,少數民族語言信息資源跨語種共享能力并不是要求所有少數民族語言信息資源做到完全準確地翻譯,而是根據不同的應用場合區分為不同的精度,如低精度場合只需要了解信息資源的主題和大致內容,高精度共享場合則需要進行準確的翻譯[5]。

跨語種共享是少數民族語言信息資源管理的核心目標之一,其意義主要體現在以下方面:第一,少數民族語言信息資源跨語種共享有利于全國各族人民之間的相互溝通和理解,使得不同民族的人群之間可以通過較為便捷的方式互相了解對方的思想和文化,有助于強化各民族之間的心理聯系,增強中華民族的“向心力”[6]。第二,少數民族語言信息資源跨語種共享有助于少數民族文化的傳播。少數民族語言文字是中華民族的寶貴財富,也是非物質文化遺產的重要內容。少數民族語言信息資源跨語種共享將會為少數民族文化的傳播提供更加廣闊的空間,使少數民族文化在信息技術的支撐下,在更大范圍內得到保護和傳承。第三,少數民族語言信息資源跨語種共享有助于加強我國邊疆民族地區的文化安全。我國少數民族當中有30多個跨境民族,他們與境外同族有共同的語言和文化,少數民族語言信息資源跨語種共享也是爭奪虛擬空間控制權、維護邊疆地區文化安全的重要手段。

2 少數民族語言信息資源跨語種共享的框架和思路

少數民族語言信息資源的利用在本質上是一個認知問題,也就是不同類型的“主體(Object)”如何閱讀和理解不同語言的“客體(Subject)”問題。在這個過程中,可能是“主體”直接完成對“客體”的認知,也有可能是“主體”通過“中介”來完成對“客體”的認知,其關系如圖1所示。

圖1 少數民族語言信息資源跨語種共享的框架

在圖1中,“主體”就是少數民族語言信息資源利用所面對的服務對象,按照少數民族語言信息資源跨語種共享的定義,應當包含全國有信息資源利用需求的各類人群。為了簡化問題,假定熟練掌握某種語言文字的人可以非常容易地理解用這種語言文字作為信息記錄手段的信息資源。這樣,“主體”就可以簡化為熟練掌握各類語言的人。“客體”就是有待被認識的對象,也就是少數民族語言信息資源,根據語種的不同也可以分為不同的類型。按照所使用的語言符號的不同,少數民族語言信息資源還分語音文件和文本文件兩個大類。目前,少數民族語言信息處理技術的進展主要集中在文字領域,語音識別領域雖然已經開始起步,但是離大規模應用還有較遠的距離,少數民族語言音頻文件和視頻文件的管理還是按照將語音信息著錄為文字信息的方式來實現。因此,少數民族語言信息資源跨語種共享可以暫時簡化為文本信息的共享。“中介”就是在少數民族語言信息資源利用過程中提供跨語種服務的人或者技術系統。將上述體系用二維矩陣形式表達的框架模型如表1所示。

在表1中,矩陣的行代表主體(O)當中所掌握某種語言的群體,列代表客體(S)少數民族語言信息資源用來記錄信息的語言文字。其中,G代表國家通用語言文字,也就是漢語和規范漢字;M1~M8分別代表目前使用人口相對較多的8種少數民族語言,即蒙古文、藏文、哈薩克文、維吾爾文、柯爾克孜文、朝鮮文、壯文和彝文;符號 代表不經過中介可以直接進行認知和理解,其余兩種語言用斜線聯系代表要進行兩者語言的翻譯,如M1/G代表要通過人工翻譯或者機器翻譯將國家通用語言文字的信息資源翻譯成為蒙古文才能被只掌握蒙古文的人群所理解;M2/M1代表需要將蒙古語信息資源翻譯成為藏文以后才能被只掌握藏文的人群所理解。

根據表1所示,提高少數民族語言信息資源跨語種共享程度的思路主要有以下3種類型。

第一,基于主體的策略。基于主體的策略就是通過提高主體掌握少數民族語言文字的能力來擴展少數民族語言信息資源跨語種共享的程度。例如,將表1中的M1改為M1-M2,也就是讓熟悉藏文的群體同時也熟練掌握蒙古文,則M1/M2環節就不需要經過中介而變成直接認知和理解,其符號會變成 。由于大多數人學習語言文字的能力是有限的,不可能熟練掌握較多的語種,因而這種方式在實踐中主要體現在少數民族語言文字和國家通用語言文字兩者的雙語教育,如果每個少數民族群體除了掌握本民族的語言文字以外,同時能夠熟練掌握國家通用語言文字,則表1中的M1/G,M2/G,M3/G,M4/G,M5/G,M6/G,M7/G,M8/G就可以省去,體系信息共享能力得到了提高。目前,雙語教育是我國少數民族地區在基礎教育階段探索出來的成功模式,接受過系統基礎教育的人口都可以同時熟練使用本民族的語言文字和國家通用語言文字。

第二,基于客體的策略。基于客體的策略就是要通過提高客體雙語保存的程度來提高少數民族語言信息資源跨語種共享的程度。例如,如果某一語種的信息資源在保存時同時將與之對應的同一內容另一語種的信息資源同時保存,就可以提高體系的共享能力。例如,藏文信息資源M2在保存時同時將與其內容相同的彝文信息資源M8一同保存,則M8/M2所需要的兩種語言的翻譯就可以省去。在實踐中,多語種同時保存的情況主要體現在少數民族語言信息資源與同一內容的國家通用語言文字版本同時保存,如表1中,如果每一語種少數民族語言信息資源保存的同時也將國家通用語言文字版本保存,則中介環節G / M1,G / M2,G / M3,G / M4,G / M5,G / M6,G / M7,G / M8就可以省去。由于不是所有的少數民族語言信息資源都有國家通用語言文字版本,所以雙語保存除了全文雙語之外,還可以體現為雙語著錄、雙語摘要等形式,也就是說,文件全文采用少數民族語言文字,對其進行著錄的元數據同時采用少數民族文字和國家通用文字。這種情況下的跨語種共享就屬于低精度共享,可以讓不同語種的人群了解到文件的主要內容,但是并沒有提供全文翻譯,要了解到細節內容還需要借助人工機器方式進行全文翻譯。

第三,基于中介的策略。基于中介的策略就要通過壯大人工翻譯隊伍和發展機器翻譯系統的形式提高少數民族語言信息資源的跨語種共享能力。人工翻譯具有精度高的優勢,但是培養高水平翻譯人才需要較長的周期,作為小語種的少數民族語言文字翻譯人才就更加缺乏。少數民族語言文字翻譯人才的成長具有一定的規律性,大多數少數民族語言文字翻譯人才都熟悉國家通用語言文字和某一種少數民族語言文字之間的翻譯,熟悉兩種少數民族語言文字之間翻譯的人才相對較少,因而不是任意兩種少數民族語言文字都能找到高水平的翻譯人員。為了彌補人工翻譯方式的上述不足,利用計算機替代人工進行某些語種之間的跨語種翻譯就是一種解決思路,這就是機器翻譯(Machine Translation)。機器翻譯技術是計算語言學的核心內容,自20世紀起全球不同領域的眾多專家曾經對這一領域進行過探索,并研究出基于規則的方法和基于統計的方法兩種類型的機器翻譯方法,在一些領域取得了一定的成就。由于語言現象本身的復雜性,目前機器翻譯的發展水平與人們的期望還存在非常大的距離。在少數民族語言信息資源跨語種共享中,機器翻譯方法可以應用在低精度共享場合,如利用者只需要通過瀏覽大致了解文件主題和內容,以判定是否符合需要,然后對需要的文件再進行人工翻譯[7]。按照計算語言學發展趨勢,目前雙語機器翻譯所使用的主要是基于雙語對齊語料庫的方法,如要進行藏文和維吾爾文之間的機器翻譯,需要建立“藏文/維吾爾文對齊語料庫”和“維吾爾文/藏文對齊語料庫”,由翻譯系統根據語料庫當中語料的統計規律選擇詞匯并安排語序,實現機器翻譯[8]。要實現表1中所有需要借助中介方式進行的機器翻譯,需要建立的雙語對齊語料庫的數量是相當龐大。為了解決這一問題,可以只建立每一種少數民族語言文字和國家通用語言文字之間的雙語對齊語料庫,借助國家通用語言文字作為中介實現跨語種機器翻譯[9]。這種模式極大地降低了雙語對齊語料庫建設的成本,又可以實現任意兩種語言之間的雙向翻譯,是一種非常科學、合理、有效的解決方案。

3 基于中間語言的少數民族語言信息資源跨語種共享策略

根據對少數民族語言信息資源跨語種共享思路的分析,無論是基于主體的策略、基于客體的策略還是基于中介的策略都與國家通用語言文字的應用具有非常緊密的關系。中國少數民族語言信息資源跨語種共享以國家通用語言文字為中間語言,可以有效地將各種少數民族語言的信息資源聯結成為一個整體,形成“以國家通用語言文字為核心的少數民族語言多語種信息資源共享體系”,極大地提高整體性的跨語種共享能力,基本思路如表2所示。

表2 基于中間語言的少數民族語言信息資源跨語種共享模型

在表2中,“主體”由各個群體只掌握單一語言文字轉變為同時掌握本民族語言文字和國家通用語言文字的雙語狀態,“客體”由只采用一種語言文字轉換為同時進行少數民族語言文字和國家通用語言文字的雙語全文保存或雙語著錄、雙語摘要。從理論上講,如果所有少數民族人口全部掌握了國家通用語言文字或者同時掌握本民族語言文字和國家通用語言文字,與此同時少數民族語言信息資源全部實現了雙語全文保存,則“中介”環節就可以省略,因為所有的人都可以通過國家通用語言文字來理解各個語種的少數民族語言信息資源,中國少數民族語言信息資源之間的“無障礙”溝通和交流就可以實現,除兩語種完全對應的情況下符號是“ ”以外,其他所有原本需要翻譯的情景都增加了一個符號“ ”用來表示可以不借助翻譯直接閱讀和理解。

上述狀況只是一種理想狀態,其要求的狀態在現實中很難同時具備。雙語教育是需要一定時間周期的,而雙語保存也需要大量同時掌握少數民族語言文字和國家通用語言文字的人才,這些都不是短期內能夠解決的。此外,對少數民族語言文字歷史檔案進行數字化加工而形成的信息資源原本就不具有國家通用語言文字版本,已經保存的一些少數民族語言文字檔案資源也沒有雙語著錄。因此,由于某一環節條件的不具備而導致的溝通和交流障礙的情況仍然大量存在,這就需要借助人工翻譯和機器翻譯作為中介手段來輔助完成。其中,實現機器翻譯的關鍵就是要建立各個少數民族語言文字與國家通用語言文字之間的雙語對齊語料庫,以滿足某一語種少數民族語言信息資源與國家通用語言文字的雙向翻譯和任意兩種少數民族語言信息資源之間的翻譯問題。例如,只熟練掌握藏文的少數民族群體如果希望了解蒙古文信息資源的內容,可以借助于機器翻譯系統,先通過蒙古語/漢語對齊語料庫將蒙古文信息資源翻譯成國家通用語言文字,然后再通過漢語/藏語對齊語料庫將國家通用語言文字版本轉換為藏文版本。經過兩次機器翻譯,信息資源的內容與原有內容可能具有一些差異,甚至會在語法上出現很多問題,在一些低精度共享場合這種翻譯質量也能滿足用戶的基本需求[10]。

4 研究結論

綜上所述,中國少數民族語言信息資源跨語種共享的關鍵是要建立起以國家通用語言文字為中間語言的少數民族語言多語種信息資源共享體系,以國家通用語言文字為中介將各語種少數民族語言信息資源聯結為一個整體。這一體系建設的重點有3個方面:第一,繼續加大少數民族地區雙語教育的力度,培養更多的同時掌握少數民族語言和國家通用語言的雙語人才;第二,明確少數民族語言信息資源的“雙語保存”原則,盡可能實現少數民族語言信息資源與其對應的國家通用語言文字版本同時保存,如果沒有國家通用語言文字版本,則應該盡可能進行少數民族語言文字和國家通用語言文字的雙語著錄或雙語摘要;第三,建設少數民族語言文字信息共享基礎設施平臺,通過主要語種少數民族語言文字和國家通用語言文字之間的雙語對齊語料庫體系,實現少數民族語言文字和國家通用語言文字之間的雙向互譯,同時,以國家通用語言文字為中介,實現任意兩種少數民族語言文字之間的雙向機器翻譯。

[1]趙生輝.中國少數民族語言電子文件管理初探[J].檔案學通訊,2011(2):61.

[2]中國少數民族語言文字概況[EB/OL].[2013-07-22].http://www.moe.edu.cn/edoas/website18/level3.jsp?tablename=1266&infoid= 4795.

[3]戴慶廈,許壽椿,高喜奎.中國各民族文字與電腦信息處理[M].北京:中國民族學院出版社,1991:360-377.

[4]周 寧.東方多語種文獻信息處理進展[J].情報科學,1991(5):30-34.

[5]周 寧.東方多語種文獻計算機管理初探[J].武漢大學學報,1992(5):106-111.

[6]劉援朝.電腦的多文種支持技術與我國少數民族傳統文字問題[J].貴州民族研究,2002(4):165-173.

[7]塔 娜.面向跨語言信息檢索的蒙漢語義詞典構建[G]//第三屆全國少數民族青年自然語言信息處理學術研討會論文集.北京:中央民族大學出版社,2002:12-15.

[8]鄭 敏.跨語言信息檢索的理論與實踐[J].情報理論與實踐,2003(3):223-226.

[9]李 新.中國少數民族聲像資源整合與利用芻議[J].圖書館論壇,2006(5):11-14.

[10]李永寧.民族地區多元文化信息庫研究與設計[J].中國電化教育,2011(5):7-12.

猜你喜歡
語言文字國家資源
基礎教育資源展示
語言文字運用題的變與不變
小題精練(四) 語言文字運用
小題精練(三) 語言文字運用
一樣的資源,不一樣的收獲
資源回收
能過兩次新年的國家
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
把國家“租”出去
華人時刊(2017年23期)2017-04-18 11:56:38
奧運會起源于哪個國家?
主站蜘蛛池模板: 91精品免费久久久| 国产精品黑色丝袜的老师| 亚洲精品片911| 亚洲国产成人超福利久久精品| 夜夜操狠狠操| 日韩av在线直播| 国产视频一区二区在线观看 | 色噜噜狠狠狠综合曰曰曰| 国产精品午夜电影| 激情无码视频在线看| 在线国产91| 麻豆AV网站免费进入| 欧美成人综合在线| 中文字幕人成乱码熟女免费| 国产欧美日韩精品综合在线| 麻豆精品在线播放| 免费Aⅴ片在线观看蜜芽Tⅴ| 久久国产免费观看| 欧美日韩在线成人| jizz在线免费播放| 国产主播在线一区| 欧美激情一区二区三区成人| 欧美精品啪啪一区二区三区| 国产国语一级毛片| 亚洲三级视频在线观看| 久久精品丝袜| 久久久精品无码一二三区| 无码高潮喷水专区久久| 国产亚洲欧美日本一二三本道| 在线观看91精品国产剧情免费| 亚瑟天堂久久一区二区影院| 人人91人人澡人人妻人人爽| 97se综合| 精品無碼一區在線觀看 | 日韩欧美成人高清在线观看| 99成人在线观看| 在线欧美日韩国产| 成人精品在线观看| 精品少妇人妻av无码久久| 亚洲高清在线天堂精品| 黄色在线不卡| 特级aaaaaaaaa毛片免费视频| 亚洲日本中文综合在线| 国产成人做受免费视频| 亚洲欧洲国产成人综合不卡| 国产精品综合久久久| 亚洲第一国产综合| 国产在线一区视频| 日本在线免费网站| 67194亚洲无码| 在线免费不卡视频| 永久天堂网Av| 69视频国产| 亚洲成a人片7777| 亚洲欧美日韩中文字幕在线| 国产伦精品一区二区三区视频优播| 国禁国产you女视频网站| 国产精品成人免费视频99| 精品国产香蕉在线播出| 四虎国产在线观看| 在线色国产| 99久久精品免费看国产免费软件 | 亚洲成人黄色在线| 国产精品美女自慰喷水| 日韩精品一区二区深田咏美 | 色噜噜在线观看| 国产精品天干天干在线观看| 99视频在线免费| 成人日韩欧美| 成人亚洲国产| 日本精品视频| 国产精品网曝门免费视频| 综合久久五月天| 欧美日韩国产成人在线观看| 色婷婷电影网| 99精品视频在线观看免费播放| 中文字幕在线一区二区在线| av一区二区三区在线观看| 国产精品对白刺激| 国产午夜福利片在线观看| 久久特级毛片| 国产丝袜91|