東華大學 李晶潔 龐 楊
提 要: 本文基于JDEST語料庫,探討特征性句干的型式結構與話語功能的分布特征。研究表明,特征性句干是學術寫作的構建基石,具有一定程度的規約性,可包括7類主要型式結構,人稱主語結構、非人稱主語結構、It前置結構、存在句式、As前置結構、Wh-詞結構、以及其他;實施26類典型學術話語功能,其中語篇導向功能15類、參與者導向功能6類及研究導向功能5類。此外,特征性句干的使用高度依賴于局部文本環境,由環境內各種不同性質的共選合力生成,是形式、意義與語境的制衡結果。
短語學已成為獨立的語言學學科(Granger & Paquot 2008: 27),其研究對象涵蓋廣泛,包括搭配、擴展意義單位、程式語、詞束、多詞單位等豐富內容。各類短語實體的性質、特征、提取方法各不相同,是從不同角度對短語學本質的探析。
句干(sentence stem)是一類特殊的小句級別的短語單位,它包含主謂結構,是句子的核心。句干曾在心理學研究中頗受關注,經常用于句子補全實驗(sentence completion task),即研究者依據場景設計不同類型的句干讓受試者填補句干之后內容,以此來分析被試在語言認知活動中的信息處理方式或對被試做人格評估(如Booth & Happé 2010; Kircher et al. 2001; Joyce & Piper 1998等)。雖然句子補全實驗的內部差異很大,但都有一個共性發現: 即很多句干對其后續命題內容有一定的預見性,而且這種預見性并非來自句干中的個別單詞,而是句干作為整體產生的效應。可惜的是,句干在心理學研究中多被視為實驗手段,未有明確定義,各研究者也因對其認知不同,選用的句干形式大相徑庭。通過查閱相關文獻,我們發現心理實驗中的句干更像是句子的開啟語,明確始于句首但結束的位置卻因具體研究而異,例如Thetypicaltherapysessionwill be(Joyce & Piper 1998)的謂語部分只給出了意義較模糊的willbe,而Youcan go hunting with a knife and(Booth & Happé 2010)則包括明確的謂語動詞和方式狀語。
對句干的系統研究源自語言學領域。Pawley & Syder(1983)最早提出詞匯化句干的概念,將其定義為“結構與詞匯內容均固定或半固定的小句級別的短語單位”(同上: 191-192)。該研究首啟了小句級別短語單位研究。然而,語言實體的詞匯化呈連續統態勢,詞匯化和非詞匯化之間并無明確界限,完全固定的詞組只是詞匯化過程中的極端例子。例如,在學術寫作中asnotedabove的出現頻率很高,據Google Scholar統計,超過182萬篇論文使用了該序列,但即便如此,asnotedabove也并非完全詞匯化,其變體形式包括aswasnotedabove, aswenotedearlier,aspreviouslynoted,asnotedearlier等,正是這些數量龐大的部分詞匯化句干在學術寫作中起到了重要作用。基于實證研究,Granger & Paquot(2008)提出篇章句干的概念,并將其定義為“由主語和動詞構成、用于實現篇章功能的常規化句子片段”(同上: 44),但Granger & Paquot僅給出了篇章句干的定義,并未對其進行具體研究。張樂和李晶潔(2012)借助平行語料庫技術提取篇章句干,但過程涉及大量人工,不適合應用于大規模的句干研究。李晶潔和衛乃興(2017)發現句干具有多功能性質,除篇章功能之外,還可實施人際功能和概念功能。故此提出了功能句干的概念,將其定義為“學術英語文本中復現的包含主謂結構的連續詞匯-語法序列,具有一定范圍的形式變體,聯結于特征性(characteristic)話語功能”(同上: 59),但該研究只討論了功能句干的自動提取方法,并未對句干的功能性做細致描述。
在英語教學領域,已有研究表明句干匱乏是制約學生英語流利寫作和獨立寫作的重要因素。Flowerdew & Li(2007)在調查中國理工科研究生的英語論文抄襲情況時發現,中國學生的語言借鑒(language re-use)遠超出了程式語和專業術語的范圍,很多借鑒的語言都是小句級別的框架語表達。其中受訪的10名被試更是明確表示,他們會在寫作之前閱讀相關論文,并從中摘抄其認為“好的”且“有用的”詞語表達,建立所謂的“潛在語言素材庫”(同上: 449),這其中便不乏大量的句干式序列,如Inthisarticle/Inthispaper/Herewereport...,Thisfigurerevealsthat...,Figure2depictsthe...,Infigure1,theobservedtorquereversaleventisreproducedby....,ThefitshowninFigure1correspondsto...,等等(同上: 449-457)。細心的學生還會標明句干的具體功能,如ThefitshowninFigure1correspondsto可用于解釋數據。我們姑且不論學生的這種借鑒行為是否構成抄襲,但至少說明一點,此類句干對學生的論文寫作有益,且從某種程度上,已然成為論文寫作的必需資源。可惜的是,我們的學生對于此類資源的學習和積累甚少,才會不得不摘錄、借鑒他人文章中出現的句干。這是連學生自己都意識到的問題,更應引起我們語言研究者和教師的關注。
綜上所述,句干是句子構建的核心,而句子是構成語篇的基本單位。很多句干表現出強烈的學術語域特征,是論文寫作的規約表達,更是學術語篇典型意義和功能的啟動語,本文將此類句干稱為“特征性句干”(characteristic sentence stem),重點描述其結構與功能特征。特征性句干可實施多種話語功能,盡管研究內容紛繁多樣,但句干的使用卻具有因循性特征。掌握這些句干,新手作者的論文寫作就會事半功倍。因此,特征性句干研究不僅是對現有短語學研究的一種補充,還可以為非英語本族語者和新手作者提供框架式詞語表達,優化其寫作行為,具有學術英語教學價值。
JDEST學術英語語料庫是國內首個專門用途語料庫,擴展后的庫容為6 831 693形符,詞匯總量為208 410類符。該庫共涵蓋40個學科領域,分別為15個社會科學學科和25個自然科學學科,其文本語料均已更新至2000年左右發表的國際學術期刊的研究論文。JDEST不僅包括廣泛的學科領域,而且文本元信息標注也十分詳細,因此本文使用該語料庫作為特征性句干研究的數據源。語料構成與基本數據詳見表1。

表1. JDEST語料庫的總體統計數據
本文采用自行研制的短語序列提取方法(見Wei & Li 2013),對賦碼的JDEST語料庫進行數據檢索,并設計識別特征性句干的量化參數標準。數據處理與分析按照以下三個步驟進行:
首先,使用我們新開發的句干識別方法,自動提取JDEST語料庫中所有長度為2—7詞的特征性句干。該方法包括五個主要步驟,即詞性賦碼、切詞、形式識別、典型性計算和閾值設定。其中典型性計算是提取方法的核心,我們共設定三個參數標準來判斷句干的典型性,分別為頻數閾值(F≥5)、內部黏著力(MI≥3)和文本分布域(D≥3)。頻數參數用于初步判斷待抽取的句干是否為學術文本的復現表達;內部黏著力參數從序列內部的構成單詞著眼,計算句干出現的顯著程度;分布域參數則用于篩除文章分布過于集中的句干。只有同時滿足這三個標準,即累計頻數不低于5次,新MI值不低于3,以及至少在3篇文本中出現的句干,才會被最終確定為特征性句干。具體算法參見李晶潔和衛乃興(2017: 202-214)。
然后,通過機助人工的方式,創建特征性句干的“學術話語功能數據庫”。該庫功能強大,不僅記錄所有特征性句干的結構、頻數、分布信息以及話語功能,還建立句干與文本的直接關聯,記錄每個句干每次出現的文本位置和所在句子信息等。圖1顯示該數據庫的數據存儲結構(以As前置句干為例),“學術話語功能數據庫”包括兩部分內容。第一部分記錄特征性句干的詞性碼、內部黏著力和頻數信息,如ascanbeseenin后面的[‘IN_ MD_VB_ VBN_IN’, 4.2484, 25](圖1);第二部分針對每個句干,給出其在語料庫中每一次出現的上下文語境。對于頻數較高的句干,系統會以詞語索引行的形式集中展示句干出現的局部語境。研究者可參照第二部分的索引行信息來判斷該句干的主要學術話語功能。
第三,參照Hyland(2008)的話語功能模型,將特征性句干劃分為研究導向(research-oriented)、語篇導向(text-oriented)和參與者導向(participant-oriented)三大功能類別。每類導向功能下設多個子功能(詳見第4章)。在話語功能認定的過程中,我們發現部分特征性句干可執行多項功能。例如,句干itcanbeconcludedthat既可用于實施“總結”功能,其中的can又可表達“可能性”的立場功能。為方便之后的短語型式識別和數據統計,對于此類句干,我們只認定其最直觀、最突出的話語功能,如上述句干最終被認定為主要實施“總結”功能。
第四,基于“學術話語功能數據庫”,概括每個子功能下最頻繁出現的短語型式。具體而言,我們將句干置于局部文本環境中,即詞語索引展示的句干左右兩邊較大的微觀語境,觀察其左右兩邊的共現詞語和結構,初步概括句干的型式特征,再將初選型式放至更多的詞語索引環境中修正,直至最終確定句干的短語型式,并找尋對應的句干實例。
內容1:
{…….
‘ascanbeseenin’: [‘IN_ MD_VB_ VBN_IN’, 4.2484, 25],
‘as described above’: [‘IN_VBN_IN’, 5.1252, 46],
‘as discussed in section’: [‘IN_ VBN_IN_NN’, 5.0498, 14],
‘as I have argued’: [‘IN_ PRP_VBP_VBN’, 5.2533, 5],
‘as illustrated in’: [‘IN_VBN_IN’, 5.1270, 90],
‘as indicated above’: [‘IN_VBN_IN’, 6.3956, 9],
‘as is evident from’: [‘IN_VBZ_JJ_IN’, 5.4380, 5],
‘as is often the case’: [‘IN_VBZ_RB_DT_NN’, 6.3862, 10],
‘as is the case with’: [‘IN_VBZ_DT_NN_IN’, 6.2074, 21],
‘as is well known’: [‘IN_VBZ_RB_VBN’, 3.4133, 6],
……}
內容2:
{…….
‘ascanbeseenin’:
[‘As can be seen inthe figure, the generalized gamma distribution represents well the observed data in comparison with the Rayleigh distribution, particularly for large rolling amplitudes.’,
‘Although,as can be seen inthe upper panel of Figure 1, associations between hostility and values for social threat and anger were slightly larger for Worst compared to Usual Self, the hostility x target interaction was not statistically significant, multivariate F(1, 436) = 1.96, p > .16.’,
……],
‘as described above’:
[‘We note that the latter relationship justifies Venkatraman and Bravman’s explanation for the deviation between their Al data and the prediction of Eq. (2)as described above. ’,
‘To complete the synthesis of these tetraenols, the upper dienophyllic units were addedas described above. ’,
……],
……}
圖1. “學術話語功能數據庫”的原始態數據示例
按照上述步驟,本文從JDEST中提取出5 002條不同的特征性句干,是為類符數,共有84 010 條使用實例,是為形符數。這些序列在學術文本中高頻出現,是不可或缺的特征性功能的實現手段,對應于具體的話語功能,如itisalsoworthnotingthat(提醒讀者注意),theseresultsareconsistentwith(分析數據),therearealimitednumberofstudies(指出研究空白),itisforthisreasonthat(推理)等。按照主語類型及句式結構特征,我們將特征性句干分為如下類別: 人稱主語結構(如wearenotconcernedwith,wecanconcludethat等)、非人稱主語結構(如efforthasbeenmade,studiesareneededtodetermine等)、It前置結構(如itcanbeconcludedthat,itisfairtosaythat等)、存在句式(如thereisevidencetosuggest,thereisnoreasontobelieve等)、As前置結構(如asoutlinedin,asstatedabove等)、Wh-詞結構(如whatitmeanstobe,whatweknowabout等)、以及其他(包括祈使句、狀語從句等結構)(如tosaytheleast,ifpossible等)。表2顯示特征性句干的主要結構類別及頻數。

表2. 特征性句干的結構特征及分布信息
非人稱主語、人稱主語和It前置結構的句干數量較多,無論形符數還是類符數都遠多于其他結構。其中,人稱主語和It前置結構的句干復現度較高(即形符數/類符數),均達到16,表示平均每個句干在學術文本中循環使用超過16次。如此高的數值說明,這兩類句干已經凝練成為高度程式化的學術表達。人稱主語結構中以第一人稱代詞主語(即we和I)居多,共16 708 例,占人稱主語總數的53.01%。It前置句干的形符數為15 716,也十分高頻。傳統觀點認為,軟科學領域的論文具有較強的作者顯現度,而硬科學則相反(Hyland 2009: 14)。本節以第一人稱代詞句干(用we/I-句干表示)和It前置句干為例,比較兩類句干在硬科學和軟科學文本中的頻數分布,(1)基于維基百科全書上的學科分類,我們抽取了JDEST中23個屬性明顯的學科文本組成兩大科學領域: 自然科學和工程學為一組,稱之為硬科學,包括12個學科;人文社科領域為另一組,稱為軟科學,包含11個學科。其他學科的屬性較為模糊,不易確定學科分類,故不予考慮,如農學、生態學、圖書館學、環境科學等。以調查硬科學和軟科學領域中的作者顯現度。數據結果如圖2所示。

圖2. It前置句干(左圖)和we/I句干(右圖)的頻數分布
圖2中,It前置句干的數據分布顯示于左圖,we/I-句干于右圖。方框代表硬科學領域,圓圈代表軟科學領域。X軸代表累計文本容量,即文本的單詞總數,Y軸代表句干的累計頻數。表3為T檢驗數據。先以左圖為例,圖中方框的分布略高于圓圈,表示硬科學領域論文中It前置句干的使用頻數略多于軟科學領域;而表3的T檢驗數據顯示,P=0.143>0.05(顯著性水平),說明這種“略多”不具備統計學上的顯著意義。換言之,盡管在此次取樣中It前置句干在硬科學文本中使用偏多,但其總體分布在兩大學科領域中卻無明顯差異。然而,右圖中的圓圈分布明顯高于方框,說明we/I-句干在軟學科領域的使用比在硬學科中頻繁,T檢驗數據更進一步說明這種差異具有顯著性(P<0.001<0.05)。這一結果表明,盡管硬科學論文也表現出一定的作者參與度,但至少在2000年左右發表的學術論文中,軟科學論文中we/I-句干的使用頻率仍明顯高于硬科學。而另一方面,It前置句干在兩大科學領域中的分布頻數卻極為相近,這說明無論是軟科學還是硬科學,研究者都會同樣使用It前置結構表述命題和態度,以突顯研究結果的客觀性。

表3. 硬科學和軟科學頻數分布的T檢驗數據
本文所說的學術話語功能(academic discourse function)是指學術語篇的特征性意義或功能;它高度依賴于所發生的局部文本環境。研究發現,特征性句干總是與周邊語境中的共現詞語交互作用以實現某一功能,形式相近的句干發生于不同語境,可能實施不同的話語功能。比如wenotethat是數學論文的常見表達,通常搭配表示“原因或條件”的狀語(如And,for|T|=2,wenotethat[equation] ...),用于指明作者在某種條件下注意到的現象或進行的邏輯推導。雖然類似表達在軟科學文本中也常出現,但通常搭配情態動詞(如weshould/mustnotethat)用于提醒讀者注意其后命題,實現作者/讀者互動。兩者雖然形式相近,但用于不同學科文本中或當周邊語境的搭配詞發生變化時,其話語功能也大相徑庭;而形式不同的句干發生于相同語境,則可能表達同一功能,如短語型式AC I/we MODAL V(如inthispaper,weintendto)和This PAPER Vs(如thispaper/studyaimsto)雖然形式不同,但在實施“宣布研究特征”的功能時卻是對等的互逆結構(Swales 1990: 160)。因此,縝密觀察局部文本環境、概括共現型式是將特征性句干與話語功能連結的關鍵環節。
語料庫提供的詞語索引是我們觀察、概括序列型式和功能的便捷工具,我們將句干置于局部文本環境中,即詞語索引所展示的句干左右兩邊的微觀語境,觀察句干的搭配詞語和所在的句式結構,概括其共選型式特征,并基于語義最終確定句干的學術話語功能。我們初步確定了特征性句干主要實施的26類學術話語功能。其中,過程/行動表述、狀態說明、實體/概念表述、屬性/特征說明、及時空定位側重于客觀命題意義的表達,屬于研究導向;確定性/可能性標識、意圖/能力標識、重要性/必要性標識、引起讀者注意標識、評判/態度標識、指令側重于主觀態度意義的表達,是參與者導向;而呈述觀點/事實、援引、篇章內部指示、呈述發現/結果、宣布研究特征、邏輯關系標識、信息來源標識、聚焦、總結、比較/對比、推理、提出質疑、舉例、闡述方法/步驟,以及界定則側重篇章信息的組織,是語篇導向。表4顯示各話語功能的頻數信息,按照形符數降序排列。

表4. 學術話語功能的頻數分布信息
由表4可見,語篇導向的學術話語功能是三類功能導向中的最大類別,包含15類不同的話語功能,囊括的句干數為34 558例(形符數),占特征性句干總頻數的41.14%,將近半數。從語篇構成的角度看,15類話語功能可包含兩類不同的語言資源,體現了學術作者的不同寫作策略。其中,呈述觀點/事實、呈述發現/結果、闡述方法/步驟、宣布研究特征、聚焦、總結、推理、提出質疑、舉例以及界定(共計10類)為一類。此類話語功能常用于組織和啟動命題,在提示命題開始的同時將其定位,揭示該命題所述內容在整個研究或文本中的位置和作用。從此種意義上講,此類話語功能就像錨點一樣,將一個個命題有理有序地固定于學術語篇中,是為“定位研究”類話語功能。而另一組話語功能,包括援引、篇章內部指示、邏輯關系標識、信息來源標識以及比較/對比(5類),則主要用于關聯命題,或指向文本內部的其他命題,以揭示命題內容之間的邏輯關系,或指向文本外部,指明當前命題與其他文本之間的聯系。此類話語功能就好似隱形的線一般將文本內容關聯貫通,使語篇內部成分之間,以及不同語篇之間相互呼應,為“關聯研究”類話語功能。
數據顯示,“定位研究”類話語功能的種類比“關聯研究”類話語功能豐富,其下句干的數量也是“關聯研究”類的1.6倍(21 286/13 272)。在所有“定位研究”類話語功能中,“宣布研究特征”的主謂搭配特征最為明顯,我們歸納如下: 其一,PAPER類名詞(包括article,thesis等)傾向于和研究行為類動詞共選形成句干,如thispaperdescribes,thispaperexamines等。其二,STUDY類名詞(包括research,project,program等)多與表示主旨、目標、結果意義的動詞詞組共選,描述研究目標及方法特征,如thisresearchfocusedon,thisstudyisdesignedto等。其三,PURPOSE類名詞(包括objective,aim等)與be 動詞結構共選,指明研究目標,如thepurposeofthisstudywas/isto,theobjectiveisto等。總體而言,“宣布研究特征”句干具有較突出的共選行為,其搭配型式包括數量有限的詞匯與語法變體,以及隨之衍生出的序列變體被稱為規范(norm)句干的聚合平行序列。例如,前兩類共選型式在學術文本中出現頻數很高,可被視為“宣布研究特征”的規范句干(Swales 1990: 160),而其聚合平行變體PREPweV(如inthispaper,weintendto),盡管出現頻數不如兩者高,卻實現著與其相同的功能,也是學術寫作重要的可選資源。新手作者可靈活調用上述句干以啟動“宣布研究特征”的話語功能,并根據語境選擇合適的句干及變體,可在較大程度上提高語言表述的流暢性與適切性。
學術論文的功能不僅在于實現知識的建構,也是確認和協商學科內部社會關系的重要途徑,因此參與者導向的話語功能是學術作者常用的話語策略,用于表達作者的態度和立場,或與讀者進行互動。本文概括了6類參與者導向的話語功能: 確定性/可能性標識、意圖/能力標識、重要性/必要性標識、提醒標識、評判/態度標識以及指令,其涵蓋的句干數量為33 485例,占特征性句干總數的39.86%(見表4)。
參照Hyland的學術語篇互動模型(2005: 177),我們將參與者導向的話語功能分成兩類: 確定性/可能性標識、重要性/必要性標識、意圖/能力標識和評判/態度標識為“立場”類,而提醒標識和指令為“介入”類。立場是一種文本“聲音”,是學術作者浸入其作品并在文中展示其態度、觀點、判斷、承諾的話語功能。作者表達立場的方式可以是明顯的,即作者亮明身份,將其個人權威直接烙印在論據上,如weexpectthat(意圖標識),weareinterestedin(態度標識)等;也可以是隱晦的,即作者將自己藏匿于文本中,用看似客觀的語言形式來傳遞其觀點,如itishardlysurprisingthat(評判標識),itisclearfromfig. #that(確定性標識)等。介入則聚焦于讀者。作者通過介入資源建立與讀者之間的適當關系,引導其參與文中命題的論證過程,從而影響讀者對所述命題、觀點等的解讀,如weshouldnotethat(提醒標識),letus(指令)等。與面對面交流不同,學術語篇是一種特殊的面向讀者的“獨白式”對話,既要突出作者本人的學術立場和觀點,又要營造和諧的對話空間,潛移默化地影響、說服讀者。參與者導向的話語功能句干恰好可以為新手作者提供此類便捷資源,幫助其在論文寫作中實施積極有效、且易于被讀者接受的話語功能有力發聲、推進研究。
“確定性/可能性標識”是最高頻的參與者導向的學術話語功能,用于表明作者對所述命題或事件成真的可能性判斷。數據顯示,此類句干通常與局部文本環境中的其他詞語交互作用,共同實現“確定性/可能性”評判,表現出對微觀語境的高度依賴。例如,我們發現itispossiblethat,itislikelythat等“可能性”句干的后接從句中經常出現情態動詞(如Itispossiblethatstressreversalswouldnotoccurandthefatigueproblemwouldbeentirelyacademic.)。很大程度上,此類句干與從句中的情態動詞,尤其是will,would,may和can形成擴展搭配,實施“可能性”的立場話語功能,其共現頻率之高,值得引起我們英語教學者與研究者的關注。
研究導向的學術話語功能是三類功能導向的最小類別,下設5類話語功能: 過程/行動表述、狀態說明、實體/概念表述、屬性/特征說明和時空定位,其下句干數量為14 144例,僅占特征性句干總數的16.85%(詳見表4)。
總體而言,研究導向句干的詞匯重復率很低,平均每個句干在語料庫中僅出現10.42次(14 144/1 358),遠低于其他兩類話語功能句干: 語篇導向句干平均每詞出現18.5次(34 558/1 868),而參與者導向句干平均每詞出現20.12次(33 485/1 664)。我們認為,產生此種現象是因為研究導向句干的功能復雜性和學術語篇的高信息密度特點所致。功能上,研究導向的話語功能句干用于傳遞命題信息,同時表述研究內容、發現、對象、實驗、乃至其他涉及的客觀事物、群體等,從而實現豐富多樣的命題和指稱意義。為實現諸多此類功能,研究導向句干的用詞和結構不可能單一化。換言之,功能的多樣性決定了其形式的復雜性。紛繁多樣的研究內容要求學術作者在有限篇幅內展示大量與研究相關的命題信息,而作為表述命題內容的核心組塊,研究導向句干也需要靈活變化,以準確描述多樣化的研究內容與結果。
然而需要說明的是,雖然與其他兩類功能導向句干相比,研究導向句干的用詞變化性較大,詞匯重復率總體較低,但仍有一些句干在語料庫中高頻出現,顯示出一定的規約性,如activitywasmeasured,algorithmisused,correlationswerecalculated, #oftheparticipantswere,differenceis(not)statisticallysignificant,childrenwerepresentedwith,informationisavailable,等等。這些高頻句干多為“過程/行動表述”類句干,具有較強的學術語域特征,通常出現在“闡述研究方法”或“分析數據”的章節中。可見,學術研究的具體內容雖然繁雜多樣,但研究者使用的研究方法卻相對集中,自然對生成結果的表述也會有相通之處。例如,心理學、語言學和教育學是相近的學科領域,雖然其下研究形形色色,但都常涉及對人做實驗,因此句干activitywasmeasured,participantswereinstructedto,childrenwerepresentedwith,studentswereaskedto等在三個學科的論文中均高頻出現,且都是被動形式。這些句干的使用與研究對象本身并無直接關系,而是因為研究者使用了相似的研究方法。這也說明相近學科領域的研究者對科學研究方法的認知是相似的,而作為推進研究的主體框架結構,這些學科的研究導向句干也會表現出一定的規約性和因循性。
本文概括與描述了特征性句干在學術文本中的典型結構與話語功能特征。本次研究共提取出5 002個不同的特征性句干,合計使用84 010次。結構上,特征性句干包括人稱主語、非人稱主語、It前置結構、存在句式、As前置結構、Wh-詞結構等主要類別。其中,非人稱主語、人稱主語和It前置結構的句干數量最多。傳統觀點認為,軟科學領域的論文具有較強的作者顯現度,而硬科學則相反。本文以we/I-句干和It前置句干為例,比較了兩類句干在硬科學和軟科學領域論文中的使用情況。結果顯示,軟科學的確比硬科學更多使用we/I-句干,但卻和硬科學同樣頻繁地使用It前置句干。
特征性句干的使用高度依賴于局部文本環境,是環境內各種不同性質的共選合力產生的結果,實施特征性的學術話語功能。研究表明,特征性句干密切關聯于26類學術話語功能,并在很大程度上,與具體的話語功能形成明確的形式意義配對。某種意義上,話語功能是特征性句干在具體語境中的用法體現,對應于具體的句干形式,指向形式與意義的共選。例如前文所述,在執行“宣布研究特征”的話語功能時,PAPER類名詞傾向于和“研究行為類”動詞搭配形成句干(如thispaperdescribes),而STUDY類名詞卻多與表示主旨、目標、結果意義的動詞組成句干(如thisstudyisdesignedto)。可見,句干形式的選擇與意義表達緊密相關,在學術語篇中,特征性句干的意義邊界相對清楚,不僅更易于我們觀察形式和意義的關系,而且詞語選擇的微妙差異更能突顯意義表達的精致性。
特征性句干是學術文本中典型意義的啟動語和框架語,掌握此類句干,學生的論文寫作會事半功倍,但困難在于這些句干有別于傳統意義上的固定或半固定詞組,學生很難從現有的字典或教科書中找到對它們的解釋及具體用法的介紹。因此,我們希望本研究提取的學術話語功能句干及其功能分類,能夠幫助新手作者更加自如流暢地表述研究內容。此外,特征性句干還可為課程設計者和教師提供新的視角和方法去組織材料、設計教學內容,對學術英語教學提供直接助益。但毋庸諱言,本文只是對特征性句干的初始研究,對句干的功能識別也存在一定主觀性。在后續研究中,我們將嘗試建立學術話語功能的客觀認定標準,進一步優化對句干的型式與功能描述。同時,我們還將繼續改進特征性句干的計算和提取方法,以提高提取結果的準確率和召回率。