崔明明
(中國國家圖書館,北京 100081)
拉丁化(或稱羅馬化)是語言學的一個術語,指將不是拉丁字母(或羅馬字母)形式的拼音文字系統轉換成拉丁文字系統的過程,即將被轉換系統里的非拉丁字符,按照轉寫系統的規則和轉寫表,忠實地將字符(也包括字符的變音符號及單音素雙字符)對號入座地轉寫成轉換系統里的拉丁字符。被轉換系統與轉換系統的字符也可以逆向轉寫[1]。中西方的交流需要語言作為橋梁,漢字拉丁化可以實現西方人對中國文化的了解。
ISSN中國國家中心為連續性資源分配ISSN后,須為每一種連續性資源分別建立相應的書目記錄,這些書目記錄完成后匯集到ISSN國際中心數據庫,供全球用戶檢索利用。ISSN國際中心規定,非羅馬文字的連續性資源ISSN注冊書目記錄應按相應標準轉換成羅馬化文字。非羅馬文字包括中國少數民族語文、日文、韓文等多種文字。本文中的“中文羅馬化”意即“中文普通話羅馬字母拼寫法”。
我國代表周有光先生在1979年的ISO/TC 46會議上提出了《漢語拼音方案》作為國際標準的建議。國際標準ISO-7098是由ISO/TC46“文獻工作”技術委員會制訂的,并于1981年2月份發給各成員團體征求意見。1982年ISO/TC 46會議上正式通過了ISO 7098(文獻工作——中文羅馬字母拼寫法)[2],自此,漢語拼音從中國的國家標準成為了國際標準。
經過技術修改,形成了 ISO 7098(1991)。該版標準解釋了中文普通話羅馬字母拼寫法的原則。中文普通話羅馬字母拼寫法在國際標準中叫做“中文羅馬化”(Chinese Romanization)。 該標準在信息與文獻編目、文獻檢索、博物館等領域發揮了巨大的作用,架起了我國與世界溝通的橋梁。
為便于讀者使用漢語拼音檢索并利用文獻,該標準在全球很多圖書館的中文編目中得到廣泛使用。美國國會圖書館在20世紀末就使用該標準對數萬種中文文獻進行了羅馬化編目。法國國家圖書館及大學圖書館的專家還集中研究漢語分詞連寫問題,試圖規范分詞連寫問題并用于編目實踐中。澳大利亞國家圖書館和德國特里爾大學圖書館也采用該標準對中文文獻進行羅馬化編目。
ISO/TC 46第38屆會議上我國代表馮志偉論述了ISO 7098(1991)的修訂原因,如ISO 7098(1991)中3.6的規定太籠統、不充分,缺乏可操作性。使用者在實際使用漢語拼音來拼寫時,對不同的音節連寫還是分寫,往往兩者兼有,造成轉寫的不一致。要在國際范圍內全面實行漢語拼音分詞連寫,特別需要得到如美國國會圖書館、法國國家圖書館、德國大學圖書館等重要文獻工作部門的支持。在修訂稿中僅提出了在增加有關人名、地名分詞連寫的規則。另外,也提出了修訂稿中列舉的作為參考的詞表不宜太過時、缺乏時代感,應能滿足當前的參考需要[3]。
我國的《漢語拼音方案》成為漢語羅馬化的國際標準,在《漢語拼音方案》的基礎上進一步規定詞的拼寫規范的基本要點形成《正詞法》。正詞法的英語表達為“Orthography”,即“正確拼寫法”之意。漢字的書寫是以“字”為書寫單位,不是以“詞”為書寫單位。《正詞法》規定了用《漢語拼音方案》拼寫現代漢語的規則。該標準的制定原則為:以詞為拼寫單位,并適當考慮語音、語義等因素,同時考慮詞形長短適度[4]。 用漢語拼音來拼寫普通話時,是以詞作為書寫單位,應該分詞連寫,也就使得語言中的表義單位能夠在書面形式上反映出來,閱讀起來比全分或全連更清楚。這是拼音書寫形式與漢字書寫形式的根本區別,反映了詞語的實際結構,以詞為單位來正確地書寫漢語普通話的拼寫法。
依據國家標準 《正詞法》(GB/T 16159-1996)相應拼寫規則,ISSN中國國家中心羅馬化數據庫中的書目記錄轉寫實例有以下幾種情況。
(1)表示一個整體概念的雙音節和三音節結構,連寫。如:
222#0 $aGangtie yanjiu(鋼鐵研究)
222#0 $aTushuguan luntan(圖書館論壇)
(2)四音節以上表示一個整體概念的名稱,按詞(或語節)分開寫,不能按詞(或語節)劃分的,全都連寫。如:
222#0 $a Tushuguanxue yanjiu(圖書館學研究)
222#0 $aZhongguo Shehui Kexueyuan Yanjiushengyuan xuebao(中國社會科學院研究生院學報)
(3)為了便于閱讀和理解,在某些場合可用短橫。如:
222#0 $a Gong-guan shijie(公關世界)
222#0 $aXibei Zheng-Fa Xueyuan xuebao(西北政法學院學報)
(4)名詞與單音節前加成分和單音節后加成分,連寫。如:
222#0 $a Feijinshu kuang(非金屬礦)
222#0 $aYishujia(藝術家)
(5)名詞和后面的方位詞,分寫。但已經成詞的,連寫。如:
222#0 $aHaiwai wenzhai(海外文摘)
(6)漢語人名按姓和名分寫,姓和名的開頭字母大寫,筆名、別名等按姓名寫法處理;已經專名化的稱呼,連寫,開頭大寫。如:
222#0 $aLu Xun yanjiu yuekan(魯迅研究月刊)
222#0 $aKongzi yanjiu(孔子研究)
(7)漢語地名按照中國地名委員會文件(84)字第17號《中國地名漢語拼音字母拼寫規則(漢語地名部分)》的規定拼寫。漢語地名中的專名和通名分寫,每一分寫部分的第一個字母大寫。如:
720##$aBeijing Shi Wujiaju(北京市物價局)
720##$aSichuan Sheng Shehui Kexueyuan(四川省社會科學院)
(8)非漢語人名、地名本著“名從主人”的原則,按照羅馬字母原文書寫;非羅馬字母文字的人名、地名,按照該文字的羅馬字母轉寫法拼寫。如:
222#0 $aMakesi zhuyi yanjiu(馬克思)
222#0 $aWulumuqi Chengren Jiaoyu Xueyuan x uebao(烏魯木齊)
(9)“各”“每”“某”“本”“該”“我”“你”等和后面的名詞或量詞,分寫。 如:
260##$aKunming:$bGai Kan Bianjibu,$c1985-(該刊編輯部)
(10)數詞和量詞,十一到九十九之間的整數,連寫。如:
720##$aErshiyi Shiji Lianhe Chuangxin(Beijing)Yiyao Kexue Yanjiuyuan(二十一世紀)
(11)表示序數的“第”與后面的數詞中間,加短橫。 如:
720##$aHegongyebu Beijing Di-San Yanjiusuo(第三)
(12)虛詞與其他語詞分寫。連詞、結構助詞“的”“地”“得”“之”與其他語詞分寫。 如:
222#0 $aQiche zhi you(汽車之友)
222#0 $aZhonghua jiehe he huxi zazhi(和)
(13)擬聲詞連寫,如:
222#0 $aKapa(咔啪)
語言是在不斷發展的,語言要素中的詞匯又是最活躍、最敏感、最具代表性的。書目記錄中的題名與責任說明項及出版發行項等涵蓋名詞、動詞、數量詞、人名、地名等,轉寫時雖遵循標準規則轉寫,但由于編目員理解上的偏差、或啟用新版標準滯后、或因標準本身修訂造成的轉寫不一致等原因,出現了非規范轉寫與轉寫不一致情況。ISSN中國國家中心書目記錄拉丁化轉寫經歷了30年的發展,為進一步實現正確轉寫、準確轉寫而對一些數據進行梳理與分析,實有必要。
(1)個別記錄仍含韋氏拼音。我們慣稱的韋氏拼音即威妥瑪拼音(Wade–Giles system)[5],也稱作威妥瑪拼法或威瑪式拼音、威氏拼音、威翟式拼音,是一套用于拼寫中文普通話的羅馬拼音系統。1979年以前,威妥瑪拼音廣泛運用于英文標準參考資料與所有有關中國的書籍中。盡管至今為止,絕大多數的威妥瑪拼音應用都已被漢語拼音所取代,但仍有一些地名和機構名稱,沿用威妥瑪拼音拼寫。書目記錄拉丁化轉寫時,除清華大學(Tsinghua University)、北京大學(Peking University)、蘇州大學(Soochow University)、天津(Tientsin)等一些早期用韋氏拼音并沿用至今的地名、機構名稱等專有名詞遵循客觀著錄外,均采用漢語拼音轉寫。以下2個例子,例1是依韋氏拼音轉寫;例2依漢語拼音轉寫,除了變異題名和機構名稱客觀著錄外,其余則用漢語拼音進行轉寫。
例 1:0220#$a0577-9189
2101#$aCh'ing Hua Ta Hsueh Hsueh
Pao
222#0 $aCh'ing Hua Ta Hsueh Hsueh Pao
24613 $aJournal of Tsinghua University
24613 $aQuinghua Daxue Xuebao
24613 $aTrudy Politekhnicheskogo Insti
tuta Chin-Khua
24613 $aTsing Hua Ta Hsueh Hsueh Pao
24613 $aTsing Hua University Journal
例 2:0220#$a1673-9280
222#0 $aQinghua faxue
24510 $aQing hua fa xue.
24611 $aTsinghua Law Journal
24611 $aTsinghua Law Review
260##$aBeijing:$bGai Kan Bianjibu
720##$aQinghua Daxue
720##$aTsinghua University
(2) “陜西”的轉寫。 書目記錄中“Shanxi”和“Shaanxi”的轉寫均有,原因是所依據標準不同。學術界對這個問題有不同看法。中國地名委、教育部和國家出版局出版的《中華地名大詞典》(1998年)以及民政部頒發《中國政區大典》(1999年)則都采用“Shanxi”。國家測繪局編制的《中華人民共和國地名錄》目錄索引中則使用了“Shaanxi”。《漢語拼音正詞法基本規則》起草人之一尹斌庸先生所著《新華拼寫詞典》對“陜西”的拼寫即采用“Shaanxi”,并同時指出僅用于區分省級行政區劃。
1977年,聯合國第三屆地名標準化會議通過了關于 “采用漢語拼音作為中國地名羅馬字母拼法的國際標準”的決議。漢語拼音拼寫必須按照我國法定的羅馬字母拼音方案——《漢語拼音方案》,但“Shaanxi”的拼法顯然違背《漢語拼音方案》的基本法則。“Shaanxi”的拼法唯一作出明確表述的國家標準是 《中文書刊名稱漢語拼音拼寫法》(GB3259-89)規定“某些地名可用中國地名委員會認可的特殊拼法”。如:Shaanxi Ribao(陜西日報)[6]。
(3)“加短橫”問題。 《正詞法》中規定“為了便于閱讀和理解,在某些場合可以用短橫”,如:huan-bao(環保)、gong-guan(公關)、ke-ji(科技)、gang-ao-tai(港澳臺)、shui-ziyuan(水資源)、jiancai(建材)等,而書目記錄中出現的如上詞語有加短橫也有不加短橫的不一致情況。隨著語言發展,“加短橫”在什么情況下使用,在什么情況下不使用,用與不用如何統一?既要保持一致性又要兼顧到閱讀和理解的需要,實現統一還需探討可行性方法。
(4)大小寫。《正詞法》規定漢語地名中的專名和通名分寫,每一分寫部分的第一個字母大寫。如:泰山應轉寫為Tai Shan,而非Taishan。這類轉寫錯誤屬于未嚴格按標準轉寫。
(5)分詞連寫。如“古生物學文摘”轉寫為222#0$aGu shengwuxue wenzhai,屬編目員理解偏差導致的錯誤轉寫,準確轉寫應為222#0$aGushengwuxue wenzhai。
(6)地名轉寫。地名“烏魯木齊”轉寫為Wulumuqi和Urumqi的情況均有,而《正詞法》(2012版)6.2.3規定“非漢語人名、地名的漢字名稱,用漢語拼音拼寫”。因此,這類地名應嚴格按照最新標準轉寫,以保持一致性。
除以上列舉之外還有一些標準中未例舉的和新詞匯需要探討。
連續性資源編目作為知識組織的重要組成部分,在文獻的有序化過程中一直發揮著重要的作用。中文羅馬化書目記錄的轉寫工作需要遵守如下三原則,即:標準化原則,對照相關標準按規范轉寫,對非規范轉寫進行修改;科學化原則,加強語言學學習和研究,必要時請教語言學家,掌握相應學科專業知識;一致性原則,對不一致轉寫進行分析,保持轉寫的一致性。為此,承擔該方面編目工作的人員,要加強語言學相關知識的學習,加強對相關規范和標準的研究,加強在具體工作實踐中的探討,使中文羅馬化書目記錄更加準確、規范。
[1] 羅馬化[EB/OL].[2013-09-07].http://baike.baidu.com/view/1918230.htm?fromId=916866.
[2] ISO 7098文獻工作--中文羅馬字母拼寫法1982-08-01第一版[EB/OL].[2013-09-07].http://www.china-language.gov.cn/wenziguifan/shanghi/028.htm.
[3] 漢語拼音方案 _ 百度百科[EB/OL]].[2013-09-07].http://baike.baidu.com/view/104414.htm.
[4] 《漢語拼音正詞法基本規則》(國家標準)GB/T 16159-1996 [EB/OL].[2013-11-30].http://hi.baidu.com/wmnet/item/e09cea7ca62858326e29f626
[5] 威妥瑪拼音-維基百科 [EB/OL].[2013-09-07].http://zh.wikipedia.org/wiki/%E5%A8%81%E5%A6%A5%E7%91%AA%E6%8B%BC%E9%9F%B3.
[6] 不必為“‘Shanxi’還是‘Shaanxi’”爭論[EB/OL].[2013-11-30].http://www.shyywz.com/jsp/index/show.jsp?id=4010&ne wsType=157.