詹姆斯·庫(kù)姆斯 艾蘭·瑞尼爾 史蒂芬·德羅斯 王曉光 李夢(mèng)琳 劉晶

[摘 要] 標(biāo)記事務(wù)影響著學(xué)者們對(duì)思考與寫(xiě)作系統(tǒng)的采納使用。程序性標(biāo)記和表示性標(biāo)記會(huì)阻礙這一進(jìn)程的發(fā)展,描述性標(biāo)記則通過(guò)簡(jiǎn)化機(jī)械性任務(wù),讓學(xué)者們將注意力集中于內(nèi)容上的做法,以加快這一進(jìn)程。
[關(guān)鍵詞] 標(biāo)記 學(xué)術(shù)文本 文獻(xiàn) 標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言
[中圖分類(lèi)號(hào)] G231 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1009-5853 (2016) 06-0009-08
[Abstract] Markup practices can affect the move toward systems that support scholars in the process of thinking and writing. Whereas procedural and presentational markup systems retard that movement, descriptive markup systems accelerate the pace by simplifying mechanical tasks and allowing the authors to focus their attention on the content.
[Key words] Markup Scholarly text Document SGML
8 文檔可移植性的可選方案
目前文檔可移植性有四種方案,但它們僅提供了部分解決方案。這些可供選擇的方案包括:
(1)作者對(duì)自己的作品進(jìn)行排版并提供完稿復(fù)本;
(2)作者提交與設(shè)備獨(dú)立的頁(yè)面描述文件,比如附言;
(3)作者提交打印輸出文件,出版商使用光符閱讀器(OCRs)將其轉(zhuǎn)換成電子形式;
(4)作者發(fā)送無(wú)描述性標(biāo)記的源文件,出版商用專(zhuān)門(mén)的工具來(lái)轉(zhuǎn)換標(biāo)記。
第一種選擇方案里,作者過(guò)多地參與作品的描述過(guò)程,這使他們不能將注意力集中于作者這個(gè)角色。這個(gè)過(guò)程存在許多嚴(yán)重問(wèn)題。首先,需要明確的是,排版是一項(xiàng)技術(shù)活,諸如字體、字形和字號(hào),行距、加粗、字距、色框、手稿正面、手稿反面、字符間距、分散對(duì)齊等這些概念,以及專(zhuān)業(yè)設(shè)計(jì)師的所有設(shè)備都需要進(jìn)行專(zhuān)門(mén)的培訓(xùn)。其次,大部分排版程序需要編程技術(shù)或者大量的人工參與。非技術(shù)性的問(wèn)題甚至可能會(huì)有更重要的意義。出版商的排版規(guī)范通常存在許多不足。這些不足往往通過(guò)與專(zhuān)業(yè)人員的長(zhǎng)期合作才能解決。因此,作者需要花費(fèi)大量的時(shí)間和精力來(lái)明確排版規(guī)范和重置類(lèi)型。再次,與專(zhuān)業(yè)排版人員一樣,作者排版可能需要對(duì)不是根據(jù)出版商規(guī)范和出版商評(píng)估費(fèi)用來(lái)設(shè)置的任何事務(wù)負(fù)經(jīng)濟(jì)上的責(zé)任。最后,作者排版會(huì)受限于緊迫的生產(chǎn)周期,這個(gè)周期會(huì)干擾他們的教學(xué)、學(xué)術(shù)、管理計(jì)劃。
文檔可移植性的第二種方案——提供頁(yè)面描述文件——仍然讓作者受限于大部分排版問(wèn)題。為了準(zhǔn)備頁(yè)面描述文件,作者必須有完整的排版規(guī)范,以及確保他們的文件與規(guī)范相符合。
第三種方案——提交用OCRs進(jìn)行閱讀的打印文件——這能使作者擺脫一些排版問(wèn)題,但是這并不能很好地改善生產(chǎn)流程。盡管OCRs正在變得更快以及更加精準(zhǔn),但它們的價(jià)格仍然昂貴且容易出錯(cuò)。因操作人員介入的需要,校對(duì)在生產(chǎn)環(huán)節(jié)被淘汰的可能性很小。此外,OCRs限制了從打印輸出生成標(biāo)記文件的能力。現(xiàn)在的系統(tǒng)能生成一些程序性標(biāo)記,但不能區(qū)分比如定理和公理,或者甚至不能區(qū)分章和小節(jié)。因此,OCRs生成文件仍然需要受過(guò)培訓(xùn)的人員來(lái)識(shí)別和編碼文本元素(需要注意的還有,就算是經(jīng)過(guò)訓(xùn)練的操作員,也不會(huì)做諸如公理和定理這樣復(fù)雜的區(qū)分)。當(dāng)字符識(shí)別的問(wèn)題被解決,我們可以期望OCRs生產(chǎn)商再集中到元素識(shí)別的問(wèn)題上。但是,沒(méi)有精確的編碼,文本元素的自動(dòng)識(shí)別將是一項(xiàng)充滿(mǎn)隨意性的任務(wù)。而且,當(dāng)知識(shí)已經(jīng)能夠很輕易地被記錄在源文件中時(shí),開(kāi)發(fā)系統(tǒng)來(lái)恢復(fù)被遺棄的知識(shí)是一件極其浪費(fèi)資源的事情。
最后,普遍觀點(diǎn)認(rèn)為,出版商能使用專(zhuān)門(mén)的工具將作者的源文件轉(zhuǎn)換成他們自己的格式。比如,據(jù)出版系統(tǒng)希爾伯德報(bào)告[20,pp.37-38] 所述:“ Shaffstal 通信/轉(zhuǎn)換系統(tǒng)已經(jīng)逐漸成為一種先進(jìn)的工具,幾乎能夠處理接口域出現(xiàn)的任何問(wèn)題。” 但是在Shaffstall 5000 XT 的測(cè)試中,記者試圖處理來(lái)自MacWrite 2、MacWrite 4.2、PageMaker、ReadySetGo和Microsoft Word的文件。他們發(fā)現(xiàn)系統(tǒng)能很好地處理MacWrite 2 文件,但是不能很好地處理其他的文件,因?yàn)椤斑@些程序使用不同的方式處理數(shù)據(jù)”。 很明顯,每個(gè)程序的每個(gè)新版本都會(huì)危及系統(tǒng)的實(shí)用性。此外,這些系統(tǒng)并沒(méi)有提供必要的元素識(shí)別;它們只是簡(jiǎn)單地生成了帶有基本程序標(biāo)記的源文件。專(zhuān)業(yè)人員仍然需要辨別每一種元素類(lèi)型。最終,文件很可能會(huì)再次遭到破壞1。
SGML最近甚至被描述性標(biāo)記的支持者批判2。批評(píng)者認(rèn)為SGML對(duì)作者和系統(tǒng)開(kāi)發(fā)者來(lái)說(shuō)過(guò)于復(fù)雜。但是,Datalogics已經(jīng)證實(shí)了復(fù)雜的SGML工具可以進(jìn)一步開(kāi)發(fā),以及SGML文檔創(chuàng)建是一個(gè)直觀的過(guò)程。同樣地,SoftQuad為Macintosh生產(chǎn)了一款A(yù)AP文本處理器。Sobemap有一款SGML語(yǔ)法分析程序,都能同時(shí)在Microsoft Windows和UNIX下運(yùn)行。
這些產(chǎn)品具有代表性,但發(fā)展得并不徹底,只是剛剛開(kāi)始。美國(guó)國(guó)防部每年在它所倡議的基于SGML的電腦輔助后勤支援系統(tǒng)(CALS)上投資大約200億美元。其他各種大型政府機(jī)構(gòu),比如美國(guó)國(guó)稅局正在投資SGML。一些私營(yíng)組織,如McGraw-Hill計(jì)劃在不久的將來(lái)徹底轉(zhuǎn)換它們的系統(tǒng)。一些開(kāi)發(fā)商不滿(mǎn)這種壓力,尤其是來(lái)自政府的壓力[19,p.25]。然而,以上提到的早期成功還是會(huì)引領(lǐng)發(fā)展,可以預(yù)見(jiàn),未來(lái)的阻力還很大。
最后,SGML因其缺乏對(duì)數(shù)學(xué)、圖形和表格材料的支持而受到質(zhì)疑和批判。但是SGML有元語(yǔ)言屬性,美國(guó)出版商協(xié)會(huì)(AAP)已經(jīng)證實(shí)了SGML應(yīng)用程序能夠支持?jǐn)?shù)學(xué)和表格材料。我們有理由相信,這一標(biāo)準(zhǔn)可以通過(guò)描述性標(biāo)記和引用標(biāo)記來(lái)支持圖形。
9 文檔可移植性不依賴(lài)于標(biāo)準(zhǔn)
我們認(rèn)為,并不需要等待SGML成為主流。我們已經(jīng)說(shuō)明,描述性標(biāo)記遠(yuǎn)遠(yuǎn)優(yōu)于表示性標(biāo)記和程序性標(biāo)記。描述性標(biāo)記的優(yōu)越性并不在于它正在成為一種標(biāo)準(zhǔn);相反地,描述性標(biāo)記是標(biāo)準(zhǔn)的基礎(chǔ),因?yàn)樗兄^(guò)其他形式標(biāo)記的內(nèi)在優(yōu)勢(shì)3。
已經(jīng)轉(zhuǎn)換為使用描述性標(biāo)記的人們已經(jīng)在享受一些顯現(xiàn)出來(lái)的好處。我們已經(jīng)把發(fā)表在布朗大學(xué)時(shí)事通訊的文章的源文件發(fā)送給了巴塞羅那大學(xué),那里對(duì)源文件的加工處理可以不經(jīng)修改。布朗大學(xué)出版的學(xué)術(shù)期刊,比如《NOVEL: A Forum on Fiction and Philosophy and Phenomenological Research》在排版過(guò)程中使用了描述性標(biāo)記,而且正在準(zhǔn)備接受以電子方式提交文件。我們可以預(yù)見(jiàn)越來(lái)越多的學(xué)術(shù)期刊出版商在認(rèn)識(shí)到這可以大大節(jié)約管理和制備成本的時(shí)候會(huì)進(jìn)行轉(zhuǎn)型。最終,行業(yè)標(biāo)準(zhǔn)將會(huì)加速向描述性標(biāo)記轉(zhuǎn)換4。
文檔的可移植性確實(shí)可以大大地減少成本和勞動(dòng)力方面的損耗。但是文檔可移植性無(wú)法滿(mǎn)足同事間共享文檔的需要,也不能完全解決生產(chǎn)過(guò)程中存在的問(wèn)題。正如美國(guó)出版商協(xié)會(huì)(AAP)認(rèn)為,描述性標(biāo)記提供了針對(duì)建立文檔移植的最完整和最有效的解決方法。當(dāng)SGML成為一種行業(yè)標(biāo)準(zhǔn),描述性標(biāo)記能夠立即帶來(lái)許多優(yōu)勢(shì),而且如果必要的話,那些被描述性編碼的文檔可以很容易地進(jìn)行更新。
10 認(rèn)知需求的最小化
10.1 基本理論
所有文檔標(biāo)記都要執(zhí)行以下三個(gè)步驟5。
(1)元素識(shí)別。指識(shí)別當(dāng)前元素的特定類(lèi)型——段落,引用,腳注等。
(2)選擇標(biāo)記。指確定適用于(1)中所識(shí)別的元素類(lèi)型的標(biāo)記。
(3)執(zhí)行標(biāo)記。指對(duì)元素進(jìn)行標(biāo)記。
最好的標(biāo)記技術(shù)僅需要做最少的認(rèn)知處理(其他條件不變)。我們相信步驟(1)和步驟(3)是可以被忽略的。第一個(gè)步驟是元素識(shí)別,這對(duì)于所有形式的標(biāo)記都是一樣的:比如在使用描述性標(biāo)記時(shí),或在使用其他形式的標(biāo)記時(shí),我們都沒(méi)有先驗(yàn)理論來(lái)假設(shè)一個(gè)作者識(shí)別出一個(gè)實(shí)體為腳注。第三個(gè)步驟執(zhí)行標(biāo)記最受關(guān)注,它帶來(lái)的結(jié)果是各種形式的“按鍵輸入最小化”和選擇接口(比如下拉菜單)。但是同樣地,我們沒(méi)有先驗(yàn)理論來(lái)相信標(biāo)記的一種形式比另一種更容易進(jìn)行優(yōu)化6。簡(jiǎn)單地來(lái)看標(biāo)記的選擇,它表明描述性標(biāo)記比表示性標(biāo)記或程序性標(biāo)記需要更少的認(rèn)知。這些差別如圖2所示。
10.2 表示性標(biāo)記
在表示性標(biāo)記方案下,標(biāo)記的選擇需要作者為元素類(lèi)型選擇一組印刷表示規(guī)范,接著還要確定一些替代方案7。印刷規(guī)范與文本元素之間的關(guān)系具有隨意性和不穩(wěn)定性,這增加了標(biāo)記選擇過(guò)程的復(fù)雜性。我們已經(jīng)討論了因表示性標(biāo)記規(guī)范不穩(wěn)定性而產(chǎn)生的維護(hù)問(wèn)題。比如說(shuō)當(dāng)美國(guó)現(xiàn)代語(yǔ)言學(xué)會(huì)(MLA)改變了其長(zhǎng)引用的規(guī)范時(shí),作者不僅必須更新他們的文件,還必須重新學(xué)習(xí)標(biāo)記,這勢(shì)必要經(jīng)歷一小段混亂時(shí)期。
更為重要的是,表示性標(biāo)記的隨意性不支持循環(huán)以及創(chuàng)建多種選擇方案的情況。高頻元素,如段落,可能不存在大規(guī)模循環(huán)問(wèn)題;但是比較少出現(xiàn)的元素,如引用,則需要遵循特定的樣式規(guī)范。同樣地,像段落這樣只有很少選擇方案的元素,通常不需要進(jìn)行太多的思考(盡管你可能會(huì)在判斷文件是個(gè)人信件還是商業(yè)信函上搖擺不定,由此判斷段落是否應(yīng)該通過(guò)空行或縮進(jìn)來(lái)進(jìn)行標(biāo)記)。但是,隨著文本格式化程序和打印設(shè)備靈活性的提高,像章節(jié)這樣更高級(jí)別的元素,其選擇方案的數(shù)量迅速增加。最具靈活性的出版商,聘請(qǐng)專(zhuān)業(yè)設(shè)計(jì)師來(lái)選擇表示性標(biāo)記。但是作者必須自己決定如何對(duì)元素進(jìn)行標(biāo)記,這可能會(huì)花費(fèi)很多時(shí)間來(lái)不停調(diào)整字體和空行。
在對(duì)文本元素的標(biāo)記進(jìn)行最初的選擇之后,人們自然會(huì)期望整個(gè)標(biāo)記過(guò)程可以大大地簡(jiǎn)化。然而有作者反映,他們自身的記憶能力限制,需要經(jīng)常回顧文檔來(lái)看他們之前是如何對(duì)某一種元素類(lèi)型進(jìn)行格式化的。此外,他們很可能在處理文檔的過(guò)程中改變對(duì)于標(biāo)記的想法,從而中斷標(biāo)記過(guò)程,并對(duì)先前選擇的元素重新格式化。
10.3 程序性標(biāo)記
對(duì)程序性標(biāo)記方案來(lái)說(shuō),標(biāo)記的選擇更為復(fù)雜。首先,作者需要執(zhí)行表示性標(biāo)記同樣需要進(jìn)行的標(biāo)記選擇。然后作者要確定目標(biāo)文本格式化程序所需的程序性標(biāo)記,來(lái)創(chuàng)建選定的表示性標(biāo)記。使用程序性標(biāo)記的作者在其工作場(chǎng)所要保持程序文檔與樣式指南一致。
10.4 描述性標(biāo)記
描述性標(biāo)記將標(biāo)記選擇過(guò)程簡(jiǎn)化為一個(gè)單一步驟,很自然地略去了元素識(shí)別這一步驟。一旦作者確定了元素類(lèi)型,通過(guò)選擇能為當(dāng)前元素類(lèi)型縮寫(xiě)自然語(yǔ)言名稱(chēng)的標(biāo)識(shí)符就能簡(jiǎn)單地確定適當(dāng)?shù)臉?biāo)記。事實(shí)上,自然語(yǔ)言名稱(chēng)可以用于標(biāo)識(shí)符,并且經(jīng)常用于比較少出現(xiàn)的元素,如“地址”。例如“詩(shī)歌引用”的縮寫(xiě)PQ只是達(dá)到了按鍵輸入最小化的效果。
此外,使用標(biāo)準(zhǔn)詞綴進(jìn)行標(biāo)記的這一規(guī)范,只是被選擇用來(lái)啟動(dòng)元素,這對(duì)于終止一種元素類(lèi)型的標(biāo)記選擇(在必要時(shí))是不起作用的。例如,一旦作者選擇
描述性標(biāo)記比正常語(yǔ)言處理還要多一些元素識(shí)別的必要,由此將認(rèn)知需求達(dá)到最小化。盡管文本元素與其自然語(yǔ)言名稱(chēng)之間的關(guān)系存在隨意性,但是名稱(chēng)和描述性標(biāo)記之間的關(guān)系不是任意的。比如一個(gè)段落的標(biāo)簽可能是p或者para,但不會(huì)是sk或address。此外,元素名稱(chēng)和描述性標(biāo)記之間的關(guān)系是穩(wěn)定的。美國(guó)現(xiàn)代語(yǔ)言學(xué)會(huì)(MLA)可以每天修改其樣式表,但是長(zhǎng)引用的描述性標(biāo)記依然為<1q>。作者不僅不需要修改他們的標(biāo)記,他們也不需要為每一種樣式的變化而學(xué)習(xí)新的標(biāo)記。因此,寫(xiě)作過(guò)程無(wú)需因遵從樣式表而被打斷,作者也無(wú)需回顧文檔來(lái)看已經(jīng)格式化了的特定元素類(lèi)型。事實(shí)上,他們完全擺脫了格式化問(wèn)題。
盡管作者普遍相信集成的編輯格式化程序能通過(guò)消除標(biāo)記的需求來(lái)簡(jiǎn)化文檔的開(kāi)發(fā),但是我們的分析不僅顯示了這種應(yīng)用程序需要標(biāo)記,還顯示了標(biāo)記為目前最流行的系統(tǒng)所需,其需求性大大超過(guò)了描述性標(biāo)記。不管這個(gè)還需進(jìn)一步處理的分析結(jié)果是否詳細(xì)準(zhǔn)確,都應(yīng)該明白以下兩點(diǎn):(1)程序性標(biāo)記選擇之前需要進(jìn)行表示性標(biāo)記選擇;(2)由于標(biāo)簽和元素名稱(chēng)之間的關(guān)系具有穩(wěn)定性和非任意性,描述性標(biāo)記的選擇比其他標(biāo)記形式需要更少的認(rèn)知能力。最后,表示性標(biāo)記所需要的額外認(rèn)知過(guò)程會(huì)浪費(fèi)本可以應(yīng)用于文檔內(nèi)容的精力,最終甚至可能造成寫(xiě)作過(guò)程的長(zhǎng)期中止。
11 內(nèi)容導(dǎo)向
描述性標(biāo)記更為微妙的一個(gè)優(yōu)勢(shì)在于,它支持作者關(guān)注文檔的結(jié)構(gòu)和內(nèi)容。表示性標(biāo)記和程序性標(biāo)記往往將作者的注意力集中于物理表示9。
當(dāng)文檔增加了描述性標(biāo)記,其邏輯結(jié)構(gòu)會(huì)更加清晰明確。例如,標(biāo)準(zhǔn)標(biāo)簽集中包含“標(biāo)題”標(biāo)簽,如
不同于描述性標(biāo)記,表示性標(biāo)記和程序性標(biāo)記不能支持作者開(kāi)發(fā)文檔結(jié)構(gòu),更糟糕的是,它們偏離了文檔內(nèi)容。正如我們已經(jīng)討論過(guò)的,元素識(shí)別作為標(biāo)記文檔的第一步,對(duì)所有形式的標(biāo)記都是一樣的。第二步標(biāo)記選擇,總是需要一些額外的精力,但是描述性標(biāo)記將這種精力集中于文檔中的元素及其作用。表示性標(biāo)記將作者的注意力轉(zhuǎn)向排版規(guī)范和樣式表。程序性標(biāo)記甚至脫離文檔,使之朝著特定的標(biāo)記轉(zhuǎn)換,這需要用專(zhuān)門(mén)的文本格式化程序來(lái)產(chǎn)生選定的表示性標(biāo)記。
還有很多細(xì)節(jié),我們?cè)谶@里不能詳細(xì)地闡述。但是讀者應(yīng)該記住,我們的論證主要集中于標(biāo)記選擇的過(guò)程。我們注意到它可能會(huì)如執(zhí)行描述性標(biāo)記一般,同樣輕松地執(zhí)行復(fù)雜的表示性標(biāo)記或程序性標(biāo)記。換句話說(shuō),任何形式的標(biāo)記都可以簡(jiǎn)化到一個(gè)單一的編輯操作。相反地,一個(gè)糟糕的界面可能讓描述性標(biāo)記的執(zhí)行變得難以理解和令人分心。
此外,我們有點(diǎn)拐彎抹角地提出作者考慮的問(wèn)題。我們?cè)?jīng)簡(jiǎn)單地認(rèn)為,顯示描述性標(biāo)記的界面可以幫助作者更加專(zhuān)注于內(nèi)容和結(jié)構(gòu)。這一想法顯然過(guò)于簡(jiǎn)單化。首先,并不是所有的標(biāo)記都提供了重要的結(jié)構(gòu)信息,或者更好地提供了當(dāng)時(shí)對(duì)作者重要的信息。其次,即使是描述性標(biāo)記,也可以變得很密集,導(dǎo)致文本模糊難懂。再次,作者或許希望可以在任何特定時(shí)間看到列舉在列表中的項(xiàng)目,而不是描述性標(biāo)記。最后,我們不得不得出結(jié)論,查看格式和內(nèi)容定位之間沒(méi)有簡(jiǎn)單的聯(lián)系。一個(gè)理想的系統(tǒng)要能為作者提供選擇不同視圖文件的能力,并且它應(yīng)該可以顯示一些文本元素的標(biāo)記以及為其他人隱藏標(biāo)記。
12 寫(xiě)作輔助功能與特殊加工處理
使用描述性標(biāo)記來(lái)識(shí)別文檔的邏輯元素,不僅簡(jiǎn)化了組成、維護(hù)、協(xié)作和出版流程,還使作者能夠應(yīng)用各種不同的寫(xiě)作輔助工具。如果文本處理要實(shí)現(xiàn)最初的目標(biāo),大力協(xié)助學(xué)術(shù)寫(xiě)作,且不僅僅致力于提高打字輸入,那么這種功能必須充分利用。
沒(méi)有描述性標(biāo)記提供的結(jié)構(gòu)識(shí)別,文本就是簡(jiǎn)單一個(gè)“可以從文檔分析中推導(dǎo)出來(lái)的無(wú)特定形式的字符串”[18,p.68],而電腦完全不適合這個(gè)推論。添加內(nèi)容描述性標(biāo)記可以將這種無(wú)特定形式的字符串轉(zhuǎn)化為文本元素的結(jié)構(gòu)化數(shù)據(jù)庫(kù),使學(xué)者能夠有選擇性和系統(tǒng)性地處理那些元素。通過(guò)標(biāo)記選擇性處理文本元素的兩個(gè)寫(xiě)作輔助功能是多視圖(alternative views)和結(jié)構(gòu)導(dǎo)向編輯(structure-oriented editing)。
13 文檔的其他視圖
如果一個(gè)文檔要進(jìn)行描述性標(biāo)記,那么在編輯器中顯示的文本元素可以通過(guò)參照識(shí)別這些元素的標(biāo)記在全文范圍進(jìn)行指定。例如,人們可以指定所有的塊引用在視圖中隱藏。以前兩個(gè)句子之間會(huì)有較大的行距,現(xiàn)在可能只有一個(gè)顯示隱藏行數(shù)的標(biāo)記,或者如果用戶(hù)喜歡,可以根本不用標(biāo)記:句子一句接著一句,彼此相鄰。同樣地,所有的腳注,或所有注釋?zhuān)蚰骋惶囟?lèi)的所有注釋——比如說(shuō)所有關(guān)于翻譯的注釋?zhuān)伎梢酝ㄟ^(guò)注釋器而非作者被隱藏起來(lái)。通過(guò)這種方式,當(dāng)前感興趣的文本部分會(huì)備受關(guān)注,但是不感興趣的可以隱藏。當(dāng)然,在編輯過(guò)程的任何一個(gè)步驟,隱藏的文本可以被立即且有選擇地公開(kāi)用于查看。
更加專(zhuān)業(yè)的視圖也同樣有用,它不僅僅是對(duì)一般的寫(xiě)作和編輯有效,而且能通過(guò)細(xì)微的調(diào)整以協(xié)助學(xué)者思考手頭上特定的項(xiàng)目或主題。這里舉個(gè)具體的例子。本文的一位作者寫(xiě)了一篇關(guān)于認(rèn)知邏輯的文章。他的論文中包含文本元素標(biāo)記,如原語(yǔ)(用于標(biāo)記明確引入了公理系統(tǒng)原始術(shù)語(yǔ)的文本),定義(界定系統(tǒng)的定義),公理(系統(tǒng)的公理),以及定理(遵循公理的命題)。利用這種標(biāo)記的編輯工具保留著文檔中每個(gè)公理元素的當(dāng)前列表。這份列表在編輯時(shí)——有時(shí)會(huì)顯示在并行的編輯窗口——可以進(jìn)行快速查詢(xún),也可以自動(dòng)更新,還可作為附件進(jìn)行打印。列表中的公理元素可能按照種類(lèi)進(jìn)行隨意地分類(lèi)和審核——原語(yǔ)、公理、定義、定理——不管它們的排列順序。除了對(duì)開(kāi)發(fā)系統(tǒng)里公理元素當(dāng)前地位簡(jiǎn)單地提供一個(gè)快速參考,這個(gè)工具還被用于系統(tǒng)間的比較(其公理元素的分類(lèi)總結(jié)放進(jìn)了相鄰的窗口)以及探索元素之間的關(guān)系。類(lèi)似的技術(shù)也可以應(yīng)用于其他學(xué)科。
這些查看策略有效性的一個(gè)原因是用于比較的文本相關(guān)章節(jié)是簡(jiǎn)單并列的;另一個(gè)是這些域的定向重排——這是因?yàn)橐环菸臋n經(jīng)常選擇的修辭結(jié)構(gòu)決定了文本元素的敘事順序,但這并不是作者關(guān)于主題思考的最好順序。在這兩種情況下,編輯工具使用描述性標(biāo)記來(lái)克服在寫(xiě)作環(huán)境中由預(yù)期的修辭形式的表象需求所強(qiáng)加的限制。這種類(lèi)型的輔助功能正是一位學(xué)者期望從電腦中獲得的。
這里正在實(shí)現(xiàn)的是不能用傳統(tǒng)學(xué)術(shù)工具來(lái)有效進(jìn)行的:已經(jīng)由某些內(nèi)容相關(guān)屬性指定的文本的分散部分,被迅速地進(jìn)行了比較和編輯。使用像紙一樣的傳統(tǒng)書(shū)寫(xiě)媒介時(shí),只有在文章中費(fèi)力地細(xì)查、刪減和重排,才能達(dá)到現(xiàn)在同樣的效果;即使那樣,出現(xiàn)錯(cuò)誤的可能性還很大。這種傳統(tǒng)的人工方法所需要的時(shí)間和精力限制了作者努力重排的數(shù)目,并且讓更多實(shí)驗(yàn)重組特別不切實(shí)際。使用計(jì)算機(jī)輔助方法時(shí),一切都力求在時(shí)間和精力上消耗最小的成本,每一個(gè)直覺(jué)都能立即進(jìn)行探索,查看策略可以根據(jù)每次試驗(yàn)的結(jié)果來(lái)逐步地細(xì)化。所有這些技術(shù)都需要描述性標(biāo)記所提供的結(jié)構(gòu)化信息;沒(méi)有它的話,比起使用鉛筆、紙和剪刀的時(shí)代,計(jì)算機(jī)學(xué)家們現(xiàn)在的狀況也好不了太多。
盡管許多作者認(rèn)為一份文件不同視圖的價(jià)值可以體現(xiàn)在其作為一種智力工具;但令人吃驚的是,很少學(xué)者利用了這些特性10。部分問(wèn)題體現(xiàn)在用于顯示和編輯不同視圖文件的能力被看成是一種特定的實(shí)驗(yàn)文本處理系統(tǒng)的功能,而不是文本處理的一般策略。但是,通過(guò)簡(jiǎn)單地使用描述性標(biāo)記方案和一個(gè)通用的可編程編輯器,任何學(xué)者都可以立即著手使用這些工具11。
14 構(gòu)建框架和結(jié)構(gòu)導(dǎo)向的編輯
其他視圖的一個(gè)特殊例子如圖3所示。文檔有一個(gè)自然的層級(jí)結(jié)構(gòu):章有節(jié),節(jié)有小節(jié),再到句子、單詞和字母等等。如果文檔的各部分如此標(biāo)記,那么操作通用編輯器就是一件容易的事情,只顯示章節(jié)標(biāo)題,為學(xué)者提供一個(gè)作品大綱。此外,由于章節(jié)標(biāo)記被鍵入到了章節(jié)層級(jí)里,作者可以輕易地使大綱窗口以任意所需要的細(xì)節(jié)深度來(lái)顯示大綱,細(xì)節(jié)深度層次最低的是全文,或者是有注釋和替代版本的文本。“縮放”功能可以控制細(xì)節(jié)連續(xù)層級(jí)的逐層隱藏和展現(xiàn)。當(dāng)文檔顯示在大綱視圖里時(shí),你可以使用編輯工具來(lái)移動(dòng)文檔的層級(jí)組件,還可以對(duì)文檔整體結(jié)構(gòu)做相應(yīng)的調(diào)整。例如,有人可能會(huì)將一個(gè)章節(jié),連同其所有嵌套的小節(jié)和文本,直接移動(dòng)到另一章節(jié)。或者,有人會(huì)將文本的一部分從第三層級(jí)上調(diào)至第二層級(jí),并且對(duì)其嵌套的小節(jié)標(biāo)題的深度標(biāo)記做相應(yīng)調(diào)整。目前文本處理理論家們已經(jīng)廣泛向業(yè)界推薦使用這種方式對(duì)文本的自然層級(jí)結(jié)構(gòu)進(jìn)行調(diào)整 。最近,盡管有一批功能強(qiáng)大的框架應(yīng)用再次上市,但這些產(chǎn)品大多是專(zhuān)門(mén)的應(yīng)用程序,而不是基于描述性標(biāo)記的一般實(shí)現(xiàn)策略。
圖3 描述性標(biāo)記的框架
這種策略通過(guò)描述性標(biāo)記形成了一種優(yōu)秀的編輯設(shè)計(jì)樣式:結(jié)構(gòu)導(dǎo)向編輯。描述性標(biāo)記允許編輯操作的對(duì)象不僅僅是字符、單詞和線,還有實(shí)在的文本元素符號(hào)、在特定標(biāo)記標(biāo)簽范圍內(nèi)的文本域。例如,你可以執(zhí)行“刪除這條腳注”或“移動(dòng)這條引用”的操作。結(jié)構(gòu)導(dǎo)向的編輯使作者能夠在適合其作者身份的抽象層面上處理文檔;其他形式的編輯需要對(duì)線位移、行號(hào)和標(biāo)志域進(jìn)行調(diào)節(jié)。因此,結(jié)構(gòu)導(dǎo)向編輯可以最大限度地減少認(rèn)知需求,以幫助作者關(guān)注內(nèi)容。
寫(xiě)作輔助屬性,如文檔的替代視圖和結(jié)構(gòu)導(dǎo)向編輯,致力于大大提高學(xué)術(shù)創(chuàng)作環(huán)境下的時(shí)效性和生產(chǎn)力。這些功能的實(shí)現(xiàn)很大程度上依賴(lài)于描述性標(biāo)記。使用其他類(lèi)型標(biāo)記的文本處理,使過(guò)時(shí)的技術(shù)和戰(zhàn)略將繼續(xù)主導(dǎo)計(jì)算機(jī)輔助的文檔工作。
15 結(jié) 論
描述性標(biāo)記解決了學(xué)者在文檔開(kāi)發(fā)中面臨的許多問(wèn)題。第一,簡(jiǎn)化了標(biāo)記文本的過(guò)程,因?yàn)樽髡叩年P(guān)注重點(diǎn)集中于文本內(nèi)容,而不需操作計(jì)算機(jī)程序,也無(wú)需擔(dān)心文本副本的排版印刷問(wèn)題。第二,維護(hù)問(wèn)題簡(jiǎn)化到文檔文件外部一些容易識(shí)別的位置;樣式的變化更新是容易的,文檔也不容易遭到破壞。第三,美國(guó)出版商協(xié)會(huì)(APP)已經(jīng)認(rèn)可,描述性標(biāo)記為建立行業(yè)標(biāo)準(zhǔn)提供了最好的方法。文檔可移植性使作者能夠與同事共享文件,并且大大降低了出版成本。第四,在描述性標(biāo)記文檔中,作者提供了語(yǔ)義信息和語(yǔ)用信息,這對(duì)于諸如文檔替代視圖和結(jié)構(gòu)導(dǎo)向編輯之類(lèi)的輔助是必要的。如果沒(méi)有描述性標(biāo)記,只有那些格式不兼容的專(zhuān)用系統(tǒng)為僅僅一部分學(xué)者提供功能支持。
最后,應(yīng)該明確的是,描述性標(biāo)記不只是有競(jìng)爭(zhēng)力的標(biāo)記系統(tǒng)的最好方法;它還是所能想到的最好方法。目前,兩方面的因素制約著人們接受描述性標(biāo)記。一是作者希望保留熟悉的技術(shù)和操作,二是開(kāi)發(fā)人員使用專(zhuān)有格式將用戶(hù)鎖定在自己的產(chǎn)品里。但是,由于描述性標(biāo)記配備有標(biāo)記系統(tǒng)一般性理論中的基本概念,作者能很快意識(shí)到描述性標(biāo)記的優(yōu)越性。伴隨著這種意識(shí)的擴(kuò)散,我們有望在學(xué)術(shù)計(jì)算的質(zhì)量上獲得顯著提升。
參考文獻(xiàn)
注:本文沒(méi)有引用參考文獻(xiàn)[6][8][29][32] 。
[1]Alexander. G.B. Computer aids for authors and editors: A natural extension of word processing and typesetting? Seybold Rep. Publ. Syst. 13, 10 (Feb. 13. 1984), 3-21
[2]American National Standards Institute. Information Processing-Text and Office Systems-Standard Generalized Markup Language (SGML). IS0 8879-1986 (E), ANSI, New York. 1986. (First edition: Oct. 15.1986)
[3]Association for Computing Machinery. Proceedings of thy ACM SIGPLAN-SIGOA Symposium on Text Manipulation. ACM. New York, 1981
[4]Association of American Publishers. Electronic Manuscript Project: Task 1 Report. Aspen Systems, Rockville. Md., 1984
[5]Association of American Publishers. Standard for Electronic Manuscript Preparation and Markup. Electronic Manuscript Series. Association of American Publishers. Washington, D.C., Feb. 1986
[6]Association of American Publishers. Authors Guide to Electronic Manuscript Preparation and Markup. Electronic Manuscript Series. Association of American Publishers. Washington. D.C., May 1986
[7]DS.
[8]Beach, R., and Stone. M. Graphical style-Towards high quality illustrations. In SIGGRAPH 83 Conference Proceedings. ACM, New York. 1983, pp. 127-135
[9]Bush. V. As we may think. Atl. Mon. 176. 1 (July 1945). 101-108
[10]Carmody, S., Cross. W., Nelson, T.H., Rice, D., and van Dam, A. A hypertext editing system for the /360. In Pertinent Concepts in Computer Graphics. M. Faiman and J. Nievergelt. Eds. University of Illinois Press, Urbana. Ill., 1969, pp. 291-330
[11]Chamberlin. D.D., et al. JANUS: An interactive system for document composition. In Proceedings of the ACM SIGPLAN-SIGOA Symposium on Text Manipulation (Portland, Oreg., June 9-10). ACM. New York. 1981, pp. 82-91
[12]Coombs. J.H. Information management system for scholars. Tech. Memo. TM 69-2, Computer Center. Brown Univ., Providence. R.I., Dec. 1986
[13]Coombs, J.H., Scott, A.M., Landow, G.P., and Sanders, A.A., Eds. A Pre-Raphaelite Friendship: The Correspondence of William Holman Hunt and John Lucas Tupper. UMI Research Press, Ann Arbor, Mich., 1986
[14]Corda, U., and Facchetti, G. Concept browser: A system for interactive creation of dynamic documentation. In Text Processing and Document Manipulation, J.C. van Vliet, Ed. Cambridge University Press. Cambridge. Mass., 1986, pp. 233-245
[15]Drucker. P.F. Management: Tasks, Responsibilities, Practices. Harper and Row. New York. 1973
[16]Engelbart, D.C., and English, W.K. A research center for augmenting human intellect. In Proceedings of the AFIPS Fall Joint Computer Conference (San Francisco, Calif., Dec. 9-11). AFIPS Press, Reston. Va., 1968. pp. 395-410
[17]Engelbart. D.C., Watson, R.W., and Norton, J.C. The augmented knowledge workship. In Proceedings of the National Computer Conference (New York, June 4-8). AFIPS Press, Reston, Va., 1973,pp. 9-2 1
[18]Goldfarb. C.F. A generalized approach to document markup. In Proceedings of the ACM SIGPLAN-SIGOA Symposium on Text Manipulation (Portland. Oreg., June 9-10). ACM, New York. 1981, pp. 68-73. (Adapted as “Annex A. Introduction to generalized markup” in [2])
[19]Integration and pagination: Long documents, proposals, books. Seybold Rep. Publ. Syst. 16. 16 (Apr. 27, 1987), 21-27
[20]Interfaces, media converters and OCR devices. Seybold Rep. Publ. Syst. 15. 18 (June 2, 1986),34-39
[21]Lamport, L. LATEX Users Guide and Reference Manual. Addison-Wesley. Reading, Mass., 1986
[22]Mamrak, S.A., Kaelbling. M.I., Nicholas, C.K., and Share, M. A software architecture for supporting the exchange of electronic manuscripts. Commun. ACM 30, 5 (May 1987), 408-414
[23]Meyrowitz, N., and van Dam, A. Interactive editing systems: Parts I and II. ACM Comput. Surv. 14. 3 (Sept. 1982), 321-415
[24]Modern Language Association. MLA Handbook. MLA, New York. 1977
[25]Modern Language Association. MLA Handbook. MLA, New York. 1984
[26]Nelson. T.H. Getting it out of our system. In Information Retrieval: A Critical Review. G. Schecter, Ed. Thompson, Washington, D.C., 1967.pp. 191-210
[27]Nelson. T.H. Comput. Libr. (1974)
[28]Nelson. T.H. Literary Machines, Nelson. Nashville. Term., 1981
[29]Nievergelt. J., Coray. G., Nicoud. J.D., and Shaw. A.C., Eds. Document Preparation Systems. North-Holland. Amsterdam. 1982
[30]Reid, B.K. A high-level approach to computer document formatting. In Proceedings of the 7th Annual ACM Symposium on Programming Languages (Las Vegas. Nev., June). ACM, New York. 1980. pp. 24-30
[31]Trigg. R.H., and Weiser. M. TEXTNET: A network-based approach to text handling. ACM Trans. Off. Inf. Syst. 4. 1 (Jan. 1986). l-23
[32]Van Dam, A., and Rice. D.E. On-line text editing: A survey. ACM Comput. Surv. 3. 3 (Sept. 1971),93-114
[33]Yankelovich. N., Meyrowitz. N., and van Dam. A. Reading and writing the electronic book. Computer 18, 10 (Oct. 1985), 15-30
(收稿日期:2016-04-10)