999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

術語辭書編纂中的元數據設計

2015-06-30 09:33:49全如瑊李蕓
中國科技術語 2015年3期
關鍵詞:質量保證

全如瑊 李蕓

摘要:首先強調了工具書作為用戶尋求科技數據的重要來源。接著指出,要保障工具書的質量,就要求對工具書詞條的知識內容進行控制。多數詞典以形或音作為排序依據,但評價一部工具書的好壞以及是否滿足了讀者查詢知識的需求,概念是其關鍵因素,因為概念是知識的基本單元。為此,文章最后提出了一套面向知識的元數據(knowledgeoriented metadata,KOM)集合。總而言之,對于條目內容的內在管理遠比表面或形式上對文件和工作流的這些外部管理更重要。

關鍵詞:質量保證,面向知識的元數據,對內容的內在管理,知識框架

中圖分類號:H083;N04;H164文章類型:A文獻標識碼:1673-8578(2015)03-0005-09

Abstract: Dictionary and encyclopedia are important sources for scientific and technical data. In order to assure the quality, we need to control the contents of dictionary entry and encyclopedia article. In this article, we proposed a set of knowledgeoriented metadata (KOM) for dictionary and encyclopedia making. We also think that more emphasis should be paid on internal control over knowledge contents than those paid on external management of file and work flow.

Keywords: quality assurance, knowledgeoriented metadata, internal control over content, knowledge framework

一辭書編纂需要現代化的管理方式和手段

辭書可說是歷史最悠久的數據匯編了,古往今來在知識傳播上起的作用也是其他書籍無法比擬的。前人從當時的浩瀚文獻中提煉出精華,以條目的形式為后人打開知識的大門。它首先是提供語言學的資料,如漢字的形、音、義,為讀者進一步閱讀其他書籍提供便利,一般語文詞典(dictionary of common words)都屬此類。再后便是直接提供知識,從普通常識直到專業知識,這主要體現在后來出現的百科全書上。

自然詞典和百科全書的分別遠不止此。例如前者的字頭(head character)和詞目(headword)可有各種詞類,包括各種語法功能詞甚至擬聲詞;字詞條(character or vocabulary entry)要給出字詞的定義和慣用法甚至例句。但百科全書的條頭(heading of article)大多是名詞或名詞組,而這個條頭只是個標引詞,只是利用它們引出一段知識來,同一個百科條目(encyclopedia article)未嘗不可選用其他相關的標引詞。百科條目的內容要廣得多,例如術語條目也可能包括概念演變和百家爭鳴的材料。條頭標引詞還可能是專名(人名、地名、作品名等),借此引出歷史、地理、人文的內容。英語國家多年來強調二者之分,但法語國家一向融合二者。不過英語辭書近年也有融合二者的趨勢,例如英國朗文出版集團于20世紀60年代派專人去法國拉魯斯出版社學習,然后出版了第二版《當代英語詞典》(Longman Modern English Dictionary),書中就包括了1/6的百科條目,內容涉及地理、歷史、生物學等,專名很多。中國歷來受英語辭書影響較大,不過這種“混合型”的辭書也深受歡迎,如《辭海》[1]和《中國百科大詞典》[2]都屬此類。其實,《現代漢語詞典》[3]中也有不少所謂的百科式的知識性條目,只是沒有專名詞條,它也可稱為綜合性詞典(generalpurpose dictionary)。本文探討的對象包括普通詞典、百科全書和這些“混合型”的辭書。

讀者可能對辭書有許多期望,但有3個方面最為人們所關心,即完備性、便檢性、易讀性。

完備性,或稱綜合性(comprehensiveness),涉及辭書是否能滿足廣大讀者的尋檢需求。當然,任何辭書也滿足不了興趣各異、水平不一的廣大讀者的過細需求,所以這里只談粗線條的需求。重要條目是否完備,這稱“宏觀完備性”,設計時一方面要考慮讀者對象和出書宗旨,另一方面要參考詞頻表和下面將要談到的知識框架。義項是否完備,這稱“微觀完備性”,反映了條目的綜合性,設計時也要考慮以上兩個方面。辭書編纂者要考慮到的還有“封閉性”問題,即在一個詞條中用來解釋條頭的話語本身,如有費解處是否另有專條加以解釋。如否,則讀者在相關條目間循條查詢時,仍然會遇到重大漏解的地方。另一種封閉性,是指相互參見是否做到雙向。前者可稱為解釋系統的封閉性,后者則為參見系統的封閉性。

再一個與完備性有關的問題涉及詞源學。一個詞的諸般義項間存在引申、派生等關系,一般辭書多按歷史順序加以排列。不過科技工作者更關心的不是字詞的古代淵源,而是概念的現代演變。特別是在中國,大量科技用詞源自西方,翻譯時選用的漢字詞確切與否?譯文是否丟失什么重要信息?所用漢字詞本身帶來的聯想是否又增添了什么額外的信息?在一本完備的辭書中,這些問題都應得到妥善的交代。

便檢性(accessibility),指是否便于檢索。由漢字的形、音、義三個方面來看,字形檢索可提供唯一的(unique)檢索途徑,在中國出現最早也最發達,已有的檢索系統很多,不過做起來都比較費力費時。借助輔助的音符系統,如注音字母和漢語拼音,很容易利用字音檢索,操作較便利。不過對于古澀的生僻字,讀者根本不知讀音,仍要依賴字形檢索。辭書界近年更重視的是字義檢索。詞條中的種種設置如“近義詞”、“近義詞辨異”、“反義詞”、定義中的“上下位概念”和“分類特征”、語詞的“分類歸屬”、術語的“學科歸屬”,以及百科全書中的“分類目錄”,都是字義檢索手段。多層次的“分析索引”(包括相關索引)使我們能更有效地直接檢索條目內容,“相互參見”則造就了條目之間的直接聯系。而到了現代的電子詞典,超級鏈接(hyperlinking)和全文檢索(full text searching)技術,使我們完全擺脫了過去只能線性地檢索詞頭的單一途徑。endprint

易讀性(readability)的要求異常重要,因為大部分讀者都是外行(包括相對外行,如同屬同一大專業但小專業不同的科技工作者,他們對于所檢字詞正因有不解之處才要進行查詢,只是起步點和一般讀者不同而已)。已有的增進易讀性的措施包括:用俗名代替術語作標引詞;條目中定義和解釋要先行,但行文要由淺入深;釋文中使用舉例法,由簡單、具體且熟知的事例入手,再進入總結性的抽象論斷;添加有助說明的背景材料;避免過多引用其他術語,減少參見其他條目的需要;不回避形式定義和公式、符號的使用,但放在條目后面并充分解釋;使用表格、圖解和圖片說明等。

詞典編纂是個永續的工作,隨著科技的不斷進步,更新是永遠不會終止的,包括個別條目的增補及改寫,甚至框架的更動。現在有了電子版之后,可以做到及時更新。但要滿足上述三項要求,卻有大量工作要做,這才使我們轉而求助于現代化的手段。

二元數據設計提供協助術語辭書編纂的工具

大部分出版單位都購置了計算機和一些常用軟件如數據庫、排版系統等。這些工具的使用減少了手工和紙張工作,確實提高了效率,特別是在許多編輯和出版的操作上。但存儲、檢索、排印,以及對工作流的控制,都只是對數據的外部管理,并無助于保證數據本身的質量,無助于提高詞典和條目的完備性、檢索性和易讀性。我們最關心的還是深入條目內部直接對知識進行管理。

元數據(metadata)是界定和描述數據(data)的數據,目前常作為管理工具,例如用于統一數據格式以利數據交換和共享,用于控制數據工作的工作流以提高效率和消弭疏漏和錯誤等。但我們考慮元數據未嘗不可深入內部作為知識的管理工具。

近幾年,元數據這個題目在國內期刊上出現頻繁,其實這個概念已存在較長時間了。例如世界標準化組織(ISO)第37技術委員會(TC37Terminology)在20世紀90年代(1996年)就已就此撰寫出一個國際標準《ISO 12620:1999 Computer applications in terminology—Data categories, NEQ》[4](中國在1997年也等效采用了這個國際標準,據此發布了國家標準《GB/T 16786 術語工作 計算機應用 數據類目》,此后陸續隨ISO版本修訂,最近的版本是2007年發布的《術語工作 計算機應用 數據類目(GB/T 16786—2007)》[5]),其中的數據類目(data category)就是一種元數據,該標準中,數據類目分為三個類型:術語和與術語相關的數據類目(term and termrelated data categories),這主要涉及語言層面,包括術語的各種表示法,語法、慣用法、語源、術語授權狀態和術語概念關系,等義關系等;描述性數據類目(descriptive data categories),這主要涉及知識層面,包括專業領域和分類體系,定義、說明和語境,概念關系,概念結構,敘詞、關鍵詞和索引詞等;管理性數據類目(administrative data categories),這主要涉及管理層面,包括日期、責任者、語種、排序序列、參見和源文獻等。

結合辭書編纂工作,我們考慮到上述類目中的第二類即描述性數據類目對于辭書編纂更為重要。因為每一特定的知識領域都有其獨特的概念系,也就應有其獨特的元數據集。例如根據經驗,對于介紹“生物(organism)”的條目來講,“結構(structure),功能(function),發育(development),生態和進化(ecology and evolution)”等幾方面的知識應是必須介紹的內容,這幾個類目也就是管理此類條目的元數據。在百科全書界,針對某個領域的一套類目常被稱為該領域的“知識框架”。

這種知識框架對于百科式條目最為重要,不過設計起來常常需要相關學科的專家和術語學專家的共同努力。因為許多術語可能在多門學科里使用,其基本含義相通,但因各科的理解和側重不同或借用和引申的程度不等,以致在定義上有所不同。嚴格說來,它們構成了一套同源術語(cognate terms),只不過因為共性突出所以仍然沿用同一指稱(designation)。對于這些術語,一方面既要指出其共性,另一方面還必須點出其個性(差異)。這時如由單科專家處理,可能考慮不全面,也不易給出概念演變的來龍去脈。

對于社會科學(social sciences)和人文學科(humanities)以及新興領域中的術語,因一時難以或無法取得共識,通常不對其進行標準化。一般說,它們不作為規范性術語學(prescriptive terminology)的研究對象,而要由描述性術語學(descriptive terminology)來處理。在辭書中,一般是采取客觀綜述的方式,將各家見解歸類簡介。其實,即或是已規范的科技術語,也不是僅介紹優先術語(preferred term)和許用術語(admitted term),還要介紹拒用術語(deprecated term)和被取代術語(superseded term)。不過要注明其目前的術語授權狀態(normative authorization status)。這是因為,一方面標準化并非一成不變,一般若發現原定名有不當之處可在定期(一般是5年)復查時加以更改。另一方面,讀者正是因為遇到拒用術語或被取代術語才查閱詞典,如不列出,則等于失去詞典釋疑解惑的功能。因此一般說,詞典都應是描述性的(descriptive),這樣才能滿足讀者的廣泛需求,但詞典卻可通過加注術語授權狀態的方法起到規范(normative)作用。

三面向知識的術語辭書編纂元數據

下面列出部分重要的、有助于深入條目管理知識的元數據名稱。本文主要是說明這些元數據的意義(也即設立它們的理由),并未一一給出元素屬性和元素構成的XML定義(這些機械式的簡單操作留待下一步來做)。同時要聲明,因為不限于詞匯層面,所以這里的“辭書編纂”一詞要超出lexicography(詞典編纂學)的含義。endprint

(一)條目分類

以下分類只是為了分項敘述的方便。因為事實上大量術語先是普通詞語,然后在某個學科中被賦予嚴格定義而成為專科術語。在一段語境中它究竟是作為普通詞語還是作為術語來使用,常要根據使用場合和語境來判斷。而在普通詞典中這兩者可能在詞條中只是作為兩個并列的義項出現,因此同一個詞條可以兼具下面兩種屬性。

普通詞語條目

普通詞語條目主要用于介紹漢字的形、音、義和詞及詞組的釋義,常附慣用法和例句。字頭或詞目可為任意詞類。對釋文的邏輯性要求不如對術語的要求高,常可采用近義詞或例解和比擬等方法解釋,但要求近義詞、用例和比擬對象的熟知度比字頭或詞目為高。一詞多義(一個指稱對應多個概念)時,按一個條含多個義項來處理。

百科條目

一般詞典的百科式詞條同百科全書的條目還有所不同:前者仍遵循詞典傳統,釋文內容緊扣詞目,且同屬一個指稱的不同概念(一詞多義),只作為不同義項處理;后者條頭則僅僅是個標引詞,有更換余地,而在一般百科全書中,一個概念一個條目,對于多義字可以是幾個條目都冠以同一個條頭(有時同一指稱在不同領域代表不同概念,此時可在條頭后加括號,注明所屬領域以示區分)。

術語條目

術語是定義明確的學術用語,只存在于特定的范圍(一定的專業領域)內,因此領域定義是必要成分。百科知識(自然科學、社會科學、人文學科、工程技術等)主要是通過這些條目來介紹的。

專名條目

人名、地名、作品名、歷史事件名等,主要是用來引出地理、歷史、人文等資料。定義主要是描述式的,但特別要指出該名之所以聞名之處。以歷史事件為例,首先要明確時空位置,說明性質,然后交代時空背景、事件經過、事件影響、因果分析和歷史意義(包括不同看法)等。

(二)釋義部分

一般詞條的釋文主要就是釋義和慣用法的介紹,在較長的百科條目中,前面總有一段引言,交代釋義、背景、意義,甚至對全文梗概做一勾畫。條目的質量在很大程度上取決于這一部分撰寫的優劣。

1.解釋(explanation)

在初級詞典中對普通詞語,常采用對釋法或描述說明法來釋義,前者用熟知的同義詞來解釋,后者則直接描述說明,包括用熟知的事物來比擬或舉出熟知的個例幫助讀者類推。對于一些描述主觀感覺的詞語,我們常使用一種發生式的解釋,即告訴讀者在什么客觀條件下可以獲得這種感覺,真正的感覺還要讀者本身去體驗。

2.定義(definition)

對于術語,我們要求嚴格的定義。一般定義多采用內涵定義(intensional definition)中的屬種式定義(generic definition),即指出其上位概念(superordinate concept)以及它與并列概念間的區別特征(delimiting characteristic)。不過要注意,同一事物也可能同時要求多個定義。例如阿司匹林(aspirin)是個有機化合物,因此可根據其化學結構給出化學定義;在藥理上,它是個非甾體抗炎藥(NSAID),據此可以給出藥理學定義;在臨床上,它可用于退熱、鎮痛、抗炎和抗血栓,因此它又分屬于這幾類藥物而得出不同的臨床醫學定義。這些不同的定義正說明它的多維屬性要同時采用不同的概念系來定義。這些定義對應同一客體,可互補共存。事實上,很多高檔詞典和綜合百科全書正是這樣地對客觀事物給出綜合的多維定義。

在概念間,除了屬種這種邏輯關系(logical relation)外,還存在通過客體本身的直接關聯而發生的本體關系(ontological relation),例如生物體和其器官之間、機器和其部件之間的整體-部分關系(partitive relation)。再有就是表示時空相接的序列關系(sequential relation)。不少術語是根據這兩類關系下的定義。

每個條頭都要做概念分析,分解出上位概念和區別特征。這是檢查全詞典封閉性的一個必要步驟。然后再看兩者是否都另有專條交代。此外,為了方便讀者的理解,建議定義中一定要例舉一兩個熟知的下位概念。

3.上位概念(superordinate concept)

在一般詞典中使用的上位概念不見得就是專業分類體系中最鄰近的上位概念。例如在生物分類階梯(門、綱、目、科、屬、種)中為種下定義時,不一定要用屬名作上位概念,一般可選用上面任意一個比較熟知的名稱。例如現代人類的種名是智人,定義時上位概念可選用目名(靈長目)、綱名(哺乳動物綱),甚至亞門名(脊椎動物亞門),但門名(脊索動物門)卻用得很少,因為此名不為人所熟知。但此時需要區別的就不限于同一層次的并列概念,而且上位概念所加的限定詞也要求具有更高的特異性,要足以區分開該上位概念層次以下的一切其他概念。

4.區別特征(delimiting characteristic)

有時定義只包括一個加有限定詞的上位概念但沒有并列概念需要區別,即這個上位概念只有一個下位概念,這時不存在區別特征。

5.下位概念(subordinate concept)

當一個概念的下位概念為數不多,且大多熟知,也可使用外延定義(extensional definition),即列出其全部下位概念。但一般仍推薦內涵定義。

6.操作式定義(operational definition)

對于某些物理量、化學量常采用物理和化學實驗操作來定義,這樣可得出客觀而精確的定量定義,結果有高度可重復性(reproducibility)。其實這種定義并不限于理化范圍,例如用智力量表(intelligence scale)來定出人的智力,也是一種操作式定義。此類定義在實驗科學中使用得很廣泛。不過,使用這種定義時不能僅僅描述操作,例如定義智力測驗時還要說明它的效度(validity),即要說明所得結果為什么能代表智力。endprint

7.單位和量綱(unit and dimension)

對于定量定義來講,一定要給出單位。采用標準單位制推衍出的單位,要附量綱式。

8.語境(context)

這個成分多見于面向詞語的詞典而少見于面向概念的百科全書。一個詞的語境是出現本詞的文本,長度為一個分句至幾句話。在一般辭書中表現為例句,例句也常稱為語境參考(context reference)。語境建立起由語詞到概念再到生活環境或專業領域之間的聯系,但首先它還是聯系了語詞和概念,因此我們有所謂的定義性語境(definitional context)和說明性語境(explicative context)。它們分別包含了全部或部分的概念信息。不過,定義性語境和定義是不同的,后者用的是正式語言,措辭嚴謹,而前者卻是在一個活生生的話語環境中不僅給出概念信息,還提供了有關慣用法和固定搭配的信息。

9.慣用法(usage)

這個成分也是多見于面向詞語的詞典而少見于面向概念的百科全書。慣用法是指一個詞在特定的時間、地理和使用場合(又稱“語域”register)中的用法和頻度。實際上,慣用法不僅教給我們如何去用,而且只有在真正的使用中我們才能對這個詞有更深入的理解。時間上有“古語”“過時”“廢棄”之分;地理上有不同國家(如英美)和不同地區(如中國大陸和臺灣)的分別;使用場合上有技術語域和作坊語域(benchlevel register)等差異。

10.熟知度級別(degree of wellknownness)

人們通常用簡單的熟知事物去解釋復雜的生僻事物。在前面“解釋”和“定義”中都強調要用熟知的事物去比擬,用熟知的個例或下位概念去說明。因此我們只能用熟知度級別較高的字詞來解釋級別較低的字詞,而熟知度最高的字詞必須另用其他方法來釋義。熟知度可用三分法,不求精確。

11.常見誤解(common misconceptions)

辭書釋文的一個重要內容就是澄清常見誤解。因此平時要將各方發現的誤解一一記錄在案,歸類分析其原因,擇其常見典型寫在釋文中。一類最常見的誤解是由下面的多義詞、異義詞和同義詞造成的。

(三)形-音-義關系

在國際標準化組織的協調下,現在各國都在發展術語標準化工作,其目的就是:至少在一個學科之內,力求每個術語都做到單名(mononymic)和單義(monosemic),以利信息的正確交流。但由于歷史的原因,每種語言中都充滿各式各樣的多義詞、異義詞和同義詞,影響著信息的有效交流。從另一方面來講,介紹這些詞有助進一步界定本詞的確切含義。

1.多義詞(polyseme)

同一語種中具有兩個或兩個以上詞義的語詞。例如:

日(太陽)→日(白晝)→日(時間)

多義詞通常是一個詞隨著時間的推移和在人群間的傳播而逐漸獲得了不同的含義,而由非同源并對應不同概念的詞轉而取得相同的形和音的現象則罕見。嚴格由術語學的觀點來看,一個多義詞實際上代表了幾個不同的術語(概念)。目前標準化的做法是在一個專業領域內消除多義詞,要求在每個學科中僅具單義,但在不同的專業領域間允許存在。但一些多義詞是科技界的常用詞,在討論一些普遍的科技問題時保持多義,這就可能導致歧解。參見下面“(四)詞源”部分。

2.同(近)義詞(synonym)

同一語種中表述同一概念的語詞。嚴格講來,完全的同義詞罕見,絕大多數只是概念相近,稱近義詞(near synonym);它們只是在某些語境下可以互換,在其他情況下則不能互換。

3.近義詞辨異(differences between near synonyms)

在近義詞之間存在或多或少的差異,包括概念和慣用法的差異。一般詞條和百科條目的釋義部分常設置這個內容,幫助明確詞義和概念。

4.同形\[和/或\]同音異義詞(homonym)

具有相同字形和/或發音但對應不同概念的語詞。包括下面三種情況:

(1)同形\[異音\]異義詞(homograph) ,如“公差(gōngchā)”和“公差(gōngchāi)”。

(2)同音\[異形\]異義詞(homophone) ,如“樹木”和“數目”。

(3)同形同音異義詞(full homonym) ,如“杜鵑(花名)”和“杜鵑(鳥名)”。

這些異義詞,特別是第3型,極易混淆。第1型和第2型則要看受方是閱讀文字材料還是傾聽語音材料而有所不同。

5.等義程度(degree of equivalence)

兩個語詞間內涵重疊的程度,即外延覆蓋的程度。另有同義程度(degree of synonymy)一詞,但那僅指同一語種內,而此處則包括不同語種間語詞的比較。

6.假等義(false friend)

又稱不等義(nonequivalence)。這又包括兩大類:

(1)假同源詞(false cognates),這只見于同源語種之間,如日語中的“手紙(指信)”不等于漢語中的“手紙”。

(2)假仿造詞(false calques),這見于對譯的兩個語種之間,又稱假外來語翻譯(false loan translation)。在中國現存術語中,這是最應關注的問題。詳見下面“(四)詞源”部分的“2跨語言借用”。

7.反義詞(antonym)

所謂反義包括兩種情況:互補(complement)和對比(contrast)。例如結構主義(structuralism)和功能主義(functionalism)雖為反義,卻因側重不同而可互補而并存。但原子主義(atomism)則否定結構主義,兩者是真正的、互不相容的對比關系。endprint

反義詞常常有助于說明詞義。例如,當我們孤立地見到physical一詞時,還說不上來它指的是什么,只有在上下文中查知同它并列或對比的話語時,才能有個初步的理解。

physical factor & chemical factor——物理因素和化學因素;

physical environment & human environment——自然環境和人類環境;

physical environment & biotic environment——非生物環境和生物環境;

physical network & logical network——物理(實指“實體的”)網絡和邏輯(“形式的”)網絡;

physical diseases & mental disorders——軀體疾病和精神障礙;

physical anthropology & cultural anthropology——體質人類學和文化人類學。

(四)詞源

詞源學不僅追溯、針對既有概念如何聚字成詞來表述此概念(造新詞),還要探討概念的演變。例如中國人遇到不解的詞語時總是根據構詞的字義來推測整詞的含義,這時個人對字義的認識、個人的知識背景等等都會影響對整詞的理解。于是詞語在流傳中就會發生畸變。以上還只是個人因素,如果是把術語由一個學科移植到另一學科,那只能是在概念特征中選取適合目的學科的部分而同時舍棄了不適合的部分。另一方面為了解釋目的學科的現象或為了同目的學科的既有理論相融合,還可能賦予這個術語若干新的特征。這樣就派生出一個同母詞詞義有相當差距的新術語。

除了下述幾種常見的詞源外,還有其他演變途徑,例如通過漢字簡化活動把下面兩個詞合并成了一個多義詞:

幹細胞(stem cell)和乾細胞(dry cell)都被簡化為干細胞。

1.跨學科借用(transdisciplinary borrowing)

大量同源多義術語是由此產生的。例如“運動”一詞先后衍生出下述含義:

(物理學)物體的位置變化;

(體育)出于鍛煉或競賽目的的身體活動;

(一般)政治、文化、生產等方面的群眾性的、大張旗鼓的活動。

2.跨語言借用(translingual borrowing)

在中國,大多數術語是通過翻譯途徑從西方引進的。其中相當一部分采取的是字面翻譯,從而帶來程度不等的不等義現象(nonequivalence)。就以一個常用詞“文化”為例,在現在的學術文章中常被視為英語“culture”一詞的等義詞。“culture”本義為“培養”后引申出“教化”等含義。“culture”一詞現主要指人類個體生后所學到的為群體所共有的、穩定的精神遺產及其物質表現,一般包括:語言、宗教、社會體制、法規、禮儀、風俗、知識、信念、價值觀、工具、技術、文藝創作,等等。而漢語中“文化”兩字則取自古文獻的“文治教化”。這表面看來似乎很恰當,但翻譯過來和使用后我們仍然發現了不等義的地方。例如《文選》中有言:“文化內輯,武功外悠”,這里“文”是作為“武”字的對義語,有“非暴力”的含義。這個含義是英語原文中沒有的。另外,“文”字給中國人的第一個聯想就是“文字”,于是教識字的教員成了“文化教員”,組織群眾掃盲、識字的場所成了“文化館”。這些含義也是原文沒有強調過的。再一方面,同“文化”一詞相聯系的還有“文明(civilization)”一詞,兩者常混同使用。但也有人將兩者對立起來,例如視前者專指精神方面的成就,而后者專指物質方面的成就。而且還應指出,“文明”一詞可作形容詞,我們可以談到“不文明”和“比較文明”,而“文化”則不成。文明與野蠻(或原始)為對義詞,隱含著單線進化論的意味。

有鑒于此,術語學反對字面翻譯,而強調引進概念,再根據概念的精確描述(即定義)重新定名(造新詞)。事實上,一些較好的引進術語其實并不是翻譯,而是新詞,因為它們是根據定義創造出來的。它們大多是偏正詞組,核心詞對應定義中的上位概念,前置定語對應區別特征。

3.母語詞源(etymology of source word)

對于引進的詞語必須追溯母語的詞源,例如一個詞可能是源于拉丁語→法語→英語,那么就應逆序逐級往上追溯。

4.(譯文)方向性(directionality)

指能保證等義性的翻譯方向,當然最好是雙向等義,這出現在兩種語言中術語是一對一對應時。規范性術語學要求,當兩種語言中存在一對多對應時,要保證第一種語言中的唯一術語與第二種語言中的優先術語是雙向等義,而當兩者間存在多對多對應時,要保證兩種語言中的優先術語是雙向等義。因此注明方向性可以幫助我們決定翻譯時是否應該選擇優先術語。

5.新詞(neologism)

在印歐語系國家,早年間的新詞大多是由現代學者采用希臘或拉丁詞根創造的仿古術語。直到近20世紀中葉才出現來自車間或實驗室工作語言的術語,且主要在工程技術方面。現在由俗語轉化而來的術語已越來越多。

在中國,早年間音譯詞不少,后來大多被意譯詞取代。上面介紹過的根據定義利用偏正詞組制造新詞的方式,就是我們推薦的創造新詞的一個很好途徑。

(五)主題詞控制和檢索途徑

在辭書編纂過程中,最重要的就是控制全局。一方面要對全書(特別是條目間的關系)進行宏觀管理,另一方面還要對條目內部進行微觀管理。我們主要是使用主題詞作為主線來管理和控制。不過這里使用的“主題詞”一詞,不要同情報學(information & documentation, I&D)中的“主題詞(subject heading)”混為一談。endprint

再一方面,辭書要保證便檢性,就要為讀者提供足夠的檢索途徑。除了按音序或形序翻閱條頭以外,還包括相互參見和索引(主要見于百科全書)。而索引也不限于按音序或形序來檢索,還可按分類排序,從而為索引帶來一定的系統性。索引還可以分層次,兩個層次之間可以是基于各種概念關系(例如上下級概念的關系)。此外還有所謂關聯索引(related reference),把同某個條目有各種關聯的條目名稱匯總在一起,這種索引異常有用,只是要求制作者必須對全書布局有充分的理解。辭書一般不設為檢索內容使用的目錄,但不排除大條目為便利翻閱而設置的條目內目錄。

1.主題詞表(lists of subject words)

主題詞泛指辭書中一切要求釋義的詞語或術語。

一級主題詞:條目標題;

二級主題詞:大條目內的段落標題;

三級主題詞:段落內主題。

一般詞典中可能只有一級主題詞,二三級主題詞主要見于百科全書。在百科全書中,全部主題詞都是索引詞①。

主題詞表應有多種排序,以反映不同的體系,例如按:音序;形序;分類(見下面“2分類體系”);專名原文等。

2.分類體系(classification system)

傳統的學科分類,體系眾多而且不時在變動,但內容交叉重疊的弊端一直沒有得到徹底的解決。因此我們推薦使用主題標引的分類體系。一個籌劃編纂辭書的學術單位,應及早著手組織術語學專家和多科學者編制分類體系。自上而下和自下而上地反復推敲,同時也可將相對獨立的部分分隔開,一個模塊(module)一個模塊地編制。最后的產品就是上面的按分類組織的三層主題詞表。

3.知識框架(knowledge framework)。

按分類體系組織的、用以安排條目和指導條目撰寫的主題詞表。其中一級主題詞用以安排條目,二三級主題詞用以指導條目撰寫。

4.讀者對象(readership)

出書宗旨的主要內容,是決定全書覆蓋范圍(coverage)和起點高低的重要因素。根據讀者對象,才能確定調查用戶需求的具體范圍。

5.需求分析(needs analysis)

要了解讀者是檢字還是求知;是求學,是工作,還是科研;專業范圍是什么;要單語還是雙語,如為雙語,是單向還是雙向等。

6.專業領域(subject field)

一般詞語有其使用場合,而術語更是只適用于它被定義的領域中,這要一一注明。但另一方面,通過借用和引申,術語總有擴大適用范圍的趨勢。傳統學科間的分界現在越來越模糊,已難據此對術語做出唯一的歸屬。因此我們才推薦情報界使用的主題標引法(見“2分類體系”)。術語界更有人主張:在標注術語條目的專業領域時,盡可能選擇較高級別的、范圍更廣的領域。總之,詞典和百科全書工作者,必須對知識分類有成熟的考慮,能在術語歸類上做到不重疊、不遺漏,使讀者能方便地檢索到所求。

7.條目提綱(article outline)

選擇典型條目,設計有待介紹的二三級主題詞表,用以指導撰寫。

8.相互參見(cross reference)

相關條目間要設條目級的相互參見。在不同條目中的上下位概念間、并列概念間、同義詞間、反義詞間、同源多義詞間,都應設立詞一級的相互參見。這些參見都是雙向的。相互參見提供了條目間的檢索途徑,體現了概念間的網絡結構。保證參見系統的雙向性也就是保證了參見系統的封閉性。

9.索引(index)

在百科全書中,一般都設置索引,索引到三級主題詞。還可設置圖片索引、表格索引、部分外文索引(如果某特類條目都附有外文的話)等。

10.目錄(table of content)

一般辭書不設目錄。但小本、條目為數不多的百科全書,也有使用書前目錄的。而百科全書的大條目中,也可設置段落目錄。

(六)質量評價

質量評價是必要的元數據,它幫助我們決定材料的取舍和是否需要進一步的補充和修正工作。而且質量評價工作應是隨時隨地進行的,不能等待臨出書前再進行。全面質量管理(TQC)是關鍵。評價內容主要包括:

1.完備性

內容包括兩個層次:一個是復審原定的分類體系和知識框架是否完備,近期學術是否有新進展,是否有重大歷史事件出現等,這主要是靠專家評審和補充;一個是核對成書是否符合知識框架,這后一工作可以靠計算機來完成。

2.封閉性

解釋系統封閉性——檢查條目定義中的上位概念和區別特征中的詞語或術語是否見于主題詞表;

參見系統封閉性——檢查相互參見是否雙向;檢查索引詞是否覆蓋了全部主題詞。這個封閉性同時也代表了便檢性。

3.可靠性(reliability)

包括檢查材料是否屬實,推理是否合乎邏輯等科學性的問題。這要由專家來審查和糾正。

4.易讀性

最好的測試就是找典型讀者試讀。

5.條目評注(comments)

各方對逐個條目的總體評價。

6.讀者反饋(readers feedback)

搜集讀者反饋是項極其重要的、永續性的工作,因為用戶中藏龍臥虎,根據軟件開發的經驗,用戶提供的幫助常常大于專家。新版雖說還需時日,但新版的預備工作是無時無刻不在進行中的。對讀者反饋的應答可能馬上就可實施。

四結語

在術語辭書編纂過程中,元數據的設計是最基礎的準備工作,是協助辭書編纂的有力工具,對元數據的各項內容進行填充和更新是貫穿始終的,也將是影響辭書質量的關鍵。然而,以往的文獻,包括筆者以前的相關文章[6]多從技術層面對已有的詞典數據進行元數據的設計,使用某種標記語言加以命名、說明和標注,討論其各種細節和工程實現等,屬于數據處理的層次,以外部管理為主要目的。本文則是從內在的知識層面論述了詞典和百科全書在內的工具書所需的元數據應如何設計,提出了一套面向知識的辭書編纂元數據集合,屬于知識管理的層次,從而在更高、更宏觀的層次上全面描述了辭書的元數據集合。

注釋

① 在《不列顛百科全書》詳編的大條目中,由編輯發掘出隱式主題并將其顯式化寫為旁注,印在頁旁空白上,稱為書簽(bookmark)。不過,對于一般辭書,不推薦這種做法。

參考文獻

[1] 上海辭書出版社編委會.辭海[M].上海:上海辭書出版社,1999年.

[2] 中國大百科全書出版社編委會. 中國百科大辭典[M].北京:中國大百科全書出版社,2005.

[3] 中國社會科學院語言所詞典編輯室. 現代漢語詞典[M].5版.北京:商務印書館,2005.

[4] 國際標準化組織. ISO 12620:1996 Computer applications in terminology — Data categories[S]. 1996.

[5] 中華人民共和國國家質量監督檢驗檢疫總局,中國國家標準化管理委員會. (GBT 16786—2007)術語工作 計算機應用 數據類目[S],北京:中國標準出版社,2008.

[6] Li Y, Fu A P. Designing Metadata for Chinese Dictionary Entries[J]. Data Science Journal, 2007(6): 853-856.endprint

猜你喜歡
質量保證
田灣核電站運行階段質量保證分級管理
田灣核電站運行階段質量保證分級管理
焊接技能評定過程中的質量保證要求
美國ASME規范NCA分卷與我國《核電廠質量保證安全規定》的差異研究
基于風險分析的軟件質量保證過程研究
關于如何做好水質環境監測的質量保證研究
銀行軟件開發項目質量保證方法研究及應用
軟件質量保證與測試課程的課程思政建設
計算機教育(2020年5期)2020-07-24 08:53:14
環境應急監測工作中的質量保證與質量控制
宇航用塑封器件質量保證方案研究
主站蜘蛛池模板: 日韩毛片基地| 久久a毛片| 欧美在线综合视频| 欧洲成人免费视频| 久久毛片基地| 亚洲久悠悠色悠在线播放| a级毛片视频免费观看| 114级毛片免费观看| 欧美综合中文字幕久久| 操美女免费网站| 国产一级在线播放| 一级成人欧美一区在线观看| 亚洲国产av无码综合原创国产| 91网址在线播放| 91高清在线视频| 免费看美女自慰的网站| 国产丝袜一区二区三区视频免下载| 激情综合网址| 中文无码精品a∨在线观看| 国产精品久久久精品三级| 伊人精品成人久久综合| 国产打屁股免费区网站| 免费国产小视频在线观看| 亚洲水蜜桃久久综合网站| 亚洲欧美另类日本| 中文字幕免费播放| 亚洲丝袜中文字幕| 国产欧美日韩91| 成人福利在线看| 四虎国产在线观看| 真实国产乱子伦高清| 91精品国产无线乱码在线| 亚洲国产成人自拍| 久久国产拍爱| 久草网视频在线| 国产第二十一页| 亚洲日本中文字幕乱码中文 | 国产亚洲高清视频| 亚洲精品视频免费| 欧美亚洲第一页| 亚洲无码在线午夜电影| 99国产在线视频| 91成人在线观看| 毛片免费试看| 欧美成人午夜视频| 国产成人亚洲精品无码电影| 久久亚洲综合伊人| 天天色综合4| 女人18毛片久久| 在线看片免费人成视久网下载| 国产一区二区精品高清在线观看 | 日本在线国产| 国产美女精品一区二区| 国产主播福利在线观看| 国国产a国产片免费麻豆| 又黄又湿又爽的视频| 重口调教一区二区视频| 中文字幕日韩视频欧美一区| 日本免费高清一区| 中文无码精品A∨在线观看不卡| 2021国产在线视频| 国产精品深爱在线| 亚洲国产系列| 自拍偷拍欧美日韩| 亚洲国产天堂久久综合226114| 无码一区中文字幕| 99久久亚洲精品影院| 热九九精品| 一级片免费网站| 免费欧美一级| 久久综合AV免费观看| 亚洲精品无码久久毛片波多野吉| 亚洲天堂精品在线观看| 一本大道无码高清| 亚洲欧美不卡中文字幕| 亚洲国产精品成人久久综合影院| 内射人妻无套中出无码| 欧美在线伊人| 亚洲天堂伊人| 亚洲人成亚洲精品| 天天综合色网| 中文字幕一区二区人妻电影|