999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

儒學(xué)海外傳播的探索性數(shù)據(jù)分析

2017-01-17 05:22:07秦洪武
當(dāng)代外語研究 2016年6期
關(guān)鍵詞:可視化文本情感

秦洪武 孔 蕾

(曲阜師范大學(xué),曲阜,273165)

儒學(xué)海外傳播的探索性數(shù)據(jù)分析

秦洪武 孔 蕾

(曲阜師范大學(xué),曲阜,273165)

儒學(xué)是中國文化的主體,儒學(xué)海外傳播是中國文化走出去戰(zhàn)略的重要組成部分。儒學(xué)海外傳播源遠流長,內(nèi)容和形式日新月異,但海外傳播對策的針對性有待增強,傳播效果有待提高。鑒于此,有必要使用科學(xué)有效的方法對儒學(xué)海外傳播的歷時進程進行系統(tǒng)梳理和分析。本文探討儒學(xué)海外傳播數(shù)據(jù)庫的創(chuàng)建和應(yīng)用,探索此類數(shù)據(jù)的挖掘和描述方法。研究認為,隨著文本數(shù)據(jù)挖掘技術(shù)日益成熟,我們可以從儒學(xué)海外傳播數(shù)據(jù)中獲得多維、多層面的傳播信息。這將為科學(xué)制定中國文化走出去戰(zhàn)略提供更有力的數(shù)據(jù)支持。

儒學(xué)海外傳播,數(shù)據(jù)庫,數(shù)據(jù)挖掘

1.引言

接受方引入中國文化大致經(jīng)歷了三個階段:從夢境般贊美(馬可·波羅,13~14世紀(jì)),到現(xiàn)實中國描述(西方傳教士,16~18世紀(jì)),再到蔑視和扭曲中國文化(18世紀(jì)后)(Spencer 1998;Robinson 2009)。Robinson(2009)認為,中華文明總是被描述成“他者”,一種與西方對立的文明。從這個角度看,西人引入中國文化意在尋找異質(zhì)的“他者”以反襯自身的優(yōu)越感。那么,這是否是西方傳播儒學(xué)一以貫之的真實目的?這個問題目前還無法得到明確的回答。

推介方主動輸出漢語文化主要出現(xiàn)于20世紀(jì)。黃友義認為,我們在國際市場上是弱勢;文化地位處于弱勢就只有主動出擊、主動推介(鮑曉英2013)。這種自覺地、主動地推介始于民國時期,當(dāng)時已有部分中國文學(xué)和哲學(xué)著作的外譯;受政治因素影響,新中國建立后的前30年,以政治、法律、文獻類文本的外譯和傳播為主;1980年后外譯內(nèi)容變得豐富,品種更多。而在當(dāng)下,有越來越多對外傳播文本開始直接由英語母語者直接撰寫。

提升中國文化話語權(quán)即提升中國文化在海外受納的能力。但投入高成效低的問題突出,爭取國際文化話語權(quán)的努力收效不彰。這一狀況的成因復(fù)雜。從接受角度看,主要原因是我們對海外受眾接受中國文化的方式缺少充分的了解,無法有的放矢地傳播中國文化。

當(dāng)代中華文化海外傳播研究有三個重點領(lǐng)域。一是接受環(huán)境,二是目標(biāo)讀者的閱讀取向,三是傳播方式(何明星2013;高方、許鈞2010;張朝意2015)。我們已經(jīng)在第一和第二個領(lǐng)域做了不少工作,但迄今為止的研究多基于數(shù)量極為有限的典型史實,在此基礎(chǔ)上進行的研究容易過度解釋。事實上,不關(guān)注文本,就無法關(guān)照思想和觀念的形成過程,也就無法真正反映儒學(xué)文化在海外傳播的真實狀況。

需要指出,迄今為止,我們的對外傳播研究大多關(guān)注翻譯文本的接受狀況,但對主動引入型的接受研究不夠。而事實上,后者更具傳播的普遍性,也更有價值,需要我們著力去分析和了解。要充分了解中國文化海外接受的狀況,需要盡可能充足的數(shù)據(jù)。過去,受技術(shù)限制,我們無法獲得和處理大量的相關(guān)數(shù)據(jù),與文化傳播相關(guān)的決策多憑主觀判斷。在信息技術(shù)不斷發(fā)展和日益完善的今天,我們已經(jīng)有能力大量挖掘數(shù)據(jù),為政策的制定和實施提供支持。本文探討該類數(shù)據(jù)庫的設(shè)計,探索傳播數(shù)據(jù)的處理原則和方法,探討相關(guān)數(shù)據(jù)的可視化問題并報告初步的發(fā)現(xiàn)。

2.儒學(xué)海外傳播數(shù)據(jù)建設(shè):必要性和可行性

長期以來,我們關(guān)注如何接受外來文化,重視自身文化在海外受納的范圍和廣度,但極少關(guān)注受納端表述中國文化的方式和途徑。這使得我們始終無法對受納方的文化接受環(huán)境、讀者閱讀取向和主要的傳播方式做深入、系統(tǒng)的研究,當(dāng)然也無法了解中國文化海外接受的真實狀態(tài)(張春柏2015)。更值得注意的是,我們大多是在不充分分析和了解海外接受狀況的狀態(tài)下制定文化海外傳播對策的,這在一定程度上降低了中國文化海外傳播的成效。為應(yīng)對這一狀況,我們建立儒學(xué)海外傳播數(shù)據(jù)庫,嘗試深入海外儒學(xué)研究文本之中,深度挖掘數(shù)據(jù),探尋海外接受儒學(xué)的方式并描述此類傳播話語的模式、趨向和熱點。知己知彼,才能講好中國故事,提升中國文化海外傳播的效果。

海外儒學(xué)研究數(shù)據(jù)庫能夠提供大量的文本數(shù)據(jù),經(jīng)過數(shù)據(jù)過濾、統(tǒng)計,能提供與儒學(xué)海外傳播相關(guān)的各種信息。其可行性表現(xiàn)在以下幾個方面:首先,儒學(xué)海外傳播文本數(shù)據(jù)獲取方便、快捷,可以通過互聯(lián)網(wǎng)存取主要圖書數(shù)據(jù)資源;其次,數(shù)據(jù)的轉(zhuǎn)換和存儲方便,不能機讀的數(shù)據(jù)可以通過各種識別軟件變?yōu)榭蓹C讀資料,而且存儲方式多樣,簡單的純文本語料存儲幾乎不受限制;此外,當(dāng)代的信息檢索技術(shù)日臻成熟,能夠為我們高效提取數(shù)據(jù),發(fā)揮數(shù)據(jù)在研究和決策中的支撐作用。

儒學(xué)海外傳播數(shù)據(jù)庫建成后能為我國制定文化走出去戰(zhàn)略提供關(guān)鍵數(shù)據(jù)支持,也能為學(xué)術(shù)研究提供第一手資料。在全球化迅猛發(fā)展的今天,信息交換便捷高效,儒學(xué)海外數(shù)據(jù)庫的建設(shè)擁有充分的數(shù)據(jù)來源。因此,從技術(shù)和數(shù)據(jù)來源上看,建設(shè)儒學(xué)海外傳播數(shù)據(jù)庫適逢其時。

3.數(shù)據(jù)庫設(shè)計

數(shù)據(jù)的獲取:通過網(wǎng)絡(luò)搜集、Google Books、chroniclingamerica、NowCorpus等多種來源獲得以孔子和儒學(xué)為關(guān)鍵詞的索引,根據(jù)索引獲取相關(guān)文本,不限量地收集17世紀(jì)以來以英語為媒介傳播的海外儒學(xué)研究樣本,建立海外儒學(xué)研究數(shù)據(jù)庫(1000萬詞)。該數(shù)據(jù)庫將用于觀察和分析海外儒學(xué)研究焦點和偏好的歷時變化,并發(fā)現(xiàn)可能存在的趨勢或傾向。同時,我們還創(chuàng)建和使用了對比文本庫,即漢語儒學(xué)研究文本數(shù)據(jù)庫。該數(shù)據(jù)庫將用于和儒學(xué)海外傳播數(shù)據(jù)進行類比,發(fā)現(xiàn)儒學(xué)海外傳播的熱點或偏好。

根據(jù)研究需要,本研究為語料樣本添加篇頭元數(shù)據(jù)(時間、國別、母語文化、社會意識形態(tài)、宗教信仰、體裁等),以方便按特定條件檢索和提取信息。研究還建設(shè)檢索平臺,支持多層面的文本數(shù)據(jù)分析。除具備普通檢索功能外,該平臺還嵌入可視化研究熱點描述引擎,并提供節(jié)點詞搭配信息。

4.數(shù)據(jù)庫的處理:原則和方法

與儒學(xué)海外傳播相關(guān)的有個體概念,如“仁”、“義”,這些概念均屬儒學(xué)核心概念。大多數(shù)儒學(xué)核心概念都有很多種漢語和外語表達方式,如“中庸”這個概念在英語里可能的表達方式有“Chung yung| zhong yong|zhongyong|Doctrine of the Mean|中庸|中”。要檢索相關(guān)的概念,就需要多次檢索,這會嚴(yán)重影響提取效率。為此,我們考慮將同一概念的不同形式統(tǒng)一賦碼,如賦碼為“ZHYONG”。

根據(jù)這一思路,我們對儒學(xué)相關(guān)概念進行了標(biāo)注和分類,并在此基礎(chǔ)上建立了儒學(xué)雙語術(shù)語表。根據(jù)在海外傳播時使用的實際狀況,區(qū)分以下九類概念:

文集(TXT)、文學(xué)語言符號(LLS)、學(xué)派(GAS)、地理歷史事件(GHE)、朝代官員(DTR)、儒學(xué)思想(CNP)、人物生平(BEN)、宇宙神話(ACM)、建筑藝術(shù)(AAI)。

每類概念下包含多種概念,如 CNP中包含“XINF(信)、XINGN(性)、YIC(易)”這些儒學(xué)思想與概念。儒學(xué)研究雙語術(shù)語如表1所示。

表1 儒學(xué)概念英漢語對譯示例

基于這一概念分類,對文本實施語義標(biāo)注,編寫賦碼程序,以便于儒學(xué)研究信息的提取、分類和描述。程序使用的替換代碼如下:

MYMline=~s/(i|righteousness|rightness| byi|yi|righteousness|justice|rightness |義|義)/MYM1 CNP YIR/g;

我們可以借助于這一工具把“義”這個概念的各種表達形式(英語和漢語)統(tǒng)一編碼為YIR和它的上義概念CNP。這樣標(biāo)注有助于我們獲得各類概念可靠的頻率信息,方便后續(xù)的統(tǒng)計和分析。

標(biāo)注之后的工作是從儒學(xué)海外傳播文本中提取和分析數(shù)據(jù)。我們使用目前廣泛使用的數(shù)據(jù)挖掘手段分析數(shù)據(jù)。主要工具有文本特征比較(stylo)、情感和主觀性分析(sentiment)、一致樹(consensus tree)分析。相關(guān)數(shù)據(jù)可以數(shù)字形式表達,但本項研究更側(cè)重數(shù)據(jù)的可視化,因為后者能更直觀地判斷和搜尋研究問題。

5.探討數(shù)據(jù)可視化探索

5.1 數(shù)字?jǐn)?shù)據(jù)的挖掘

本文對數(shù)據(jù)的處理采用兩種方式:一是數(shù)字型數(shù)據(jù)的呈現(xiàn);二是數(shù)據(jù)的可視化。有些數(shù)字型數(shù)據(jù)本身就能明確顯示異同,這時只需使用數(shù)字表達;如果數(shù)字太多無法觀察,則考慮使用可視化手段呈現(xiàn)。常見的數(shù)字類數(shù)據(jù)有以下幾種。

搭配類:下面呈現(xiàn)的是Confucius和virtue兩個節(jié)點詞在給定儒學(xué)傳播文獻中的搭配信息(為節(jié)省篇幅,只呈現(xiàn)部分信息)。從表 2可以看出,與Confucius搭配的信息有意義,即孔子的生平(ben)、孔子周游列國和仕途(duke,state,minister)以及孔子的言語(asked,advice,said)。而與virtue搭配的詞沒有明顯的信息點,這提示我們,目前狀況下,可以在給定語料范圍內(nèi)放棄對virtue的探討。

表2 Confucius和virtue兩個節(jié)點詞的搭配信息

還有一類數(shù)字?jǐn)?shù)據(jù)可以使用,也可以不用。如下面呈現(xiàn)的是給定語料庫中的前20個最高頻詞。需要說明的是,數(shù)據(jù)挖掘產(chǎn)生的詞頻表和一般語料統(tǒng)計的詞頻表不完全一樣。數(shù)據(jù)挖掘更傾向于使用停詞(stopwords),剔除功能詞或者語法詞,只呈現(xiàn)實義詞,如表3所示。

表3 語料庫中的前20個最高頻詞

Chinese Chinese 160

為節(jié)省篇幅,這里只呈現(xiàn)了前20個最高頻詞中的九個詞,這種呈現(xiàn)本身比較直觀,能夠說明給定語料中孔子的生平和儒學(xué)思想等主體內(nèi)容。當(dāng)然,如果需要,這些數(shù)據(jù)也可以通過柱形圖來呈現(xiàn),有關(guān)內(nèi)容見5.2節(jié)。

5.2 數(shù)據(jù)的可視化

5.2.1 詞云的使用

詞云又稱標(biāo)簽云(tag cloud),它以可見的、直觀的方式表達文本數(shù)據(jù)。詞(或標(biāo)簽)多為單個詞,其重要性通常以字號或顏色來表達。這種呈現(xiàn)方式非常有用,能快速捕捉到探索對象和范圍中最重要的項目。本文采用的詞云中,項目字體的大小代表該項目出現(xiàn)的頻次,頻次的大小在左側(cè)的最高頻詞柱形圖中有體現(xiàn)(見圖1)。

圖1 1730~1740的詞云(右側(cè))和最高頻20詞(左側(cè))

5.2.2 情感分析的使用

情感分析是利用既有的情感詞表匹配給定文本中相應(yīng)的情感詞,并依據(jù)頻率,采用貝葉斯算法進行情感歸類(Naive Bayes Classification Algorithm),得到情感傾向的計算結(jié)果。目前使用的情感分析包將情感分為“喜(joy)、怒(anger)、恐懼(fear)、悲傷(sadness)、驚訝(surprise)、厭惡(disgust)、未知(unknown)”等幾個域。同時,我們也使用該分析包分析了主觀極性分析,涉及積極、消極和中性情感。該分析以文本中的自然段為計算單位,如圖2所示。

如圖2所示,下半部分窗口顯示被分析的對象,即編號為1的段落。上半部分表格的第一行顯示的是編號為1的段落中各類情感的得分。得分明顯高者占優(yōu)勢,即最后一列顯示該段的情感的最終屬性。亦即第一段的情感基調(diào)為joy。

表4是段落的情感計算結(jié)果:數(shù)字讀為第n段; NA指沒有明確賦值,詞云圖中沒有明確賦值的詞分布在unknown區(qū)塊(見圖2)。

另一種呈現(xiàn)方式是情感分布圖。情感分布圖來自表4的情感傾向運算結(jié)果。該結(jié)果最終呈現(xiàn)的可視性分布特征如圖3所示。

表4 對1730-1740子庫中各自然段的情感分析結(jié)果

圖3 情感傾向可視性分布特征

情感分布圖顯示,除去無法確定的情感歸屬,可以確定情感歸屬的六類情感中,joy類情感最多,其次為anger,而fear、sadness、surprise頻率很低。圖3表明,1730~1740年這一段時間西方儒學(xué)研究者所持的情感態(tài)度主流是joy,是積極的。

與情感分布相關(guān)但更宏觀的分類是主觀性分布圖。主觀性分布圖來自附錄1的主觀極性運算結(jié)果。極性運算只涉及積極、中性、消極態(tài)度,該結(jié)果最終呈現(xiàn)的可視性分布特征如下:

圖4顯示,儒學(xué)海外傳播1730~1740年文獻子庫統(tǒng)計結(jié)果傾向于認定西方對儒學(xué)思想的基本態(tài)度是正面的,負面態(tài)度幾乎可以不計。這一態(tài)度表達方式顯然有助于我們直觀觀察西方儒學(xué)傳播在態(tài)度上的整體狀況。

情感分析最直觀的方式是情感詞的可視化。情感詞是調(diào)用sentiment中的classify_sentiment函數(shù)。該函數(shù)將文本進行情感分類(包括anger,disgust,fear,joy,sadness,surprise)。使用的貝葉斯分類工具已根據(jù)Carlo Strapparava&Alessandro Valitutti所做的情感詞表上訓(xùn)練過。比如,idolatry和idols這兩個詞不一定只涉及一類情感,它們可能涉及多類情感。

圖4 主觀態(tài)度可視性分布圖

表5 idolatry和idols的情感特征分布

值較高的更可能以相對大的字體呈現(xiàn),如idolatry;涉及多類的更可能在相關(guān)類的邊界放置,如idols。

圖5 儒學(xué)海外傳播1730~1740年文獻子庫中情感詞的分布狀況

不同時期的情感分析結(jié)果可以用來比較和分析。如圖6所反映的是1900~2000年西方儒學(xué)傳播文本中的情感分布狀況。

圖6 儒學(xué)海外傳播1990~2000年文獻子庫中情感詞的分布狀況

通過圖5和圖6詞云對比,可明顯看出西方儒學(xué)傳播在不同時代呈現(xiàn)情感詞使用的變化。比如圖6多出了一個情感類別disgust(厭惡);圖6在joy類情感詞使用上更為豐富,顯示對孔子和儒學(xué)的正面評價日趨充分,而fear類詞的使用要少于圖5,似乎表明隨著交流的日益頻繁,隨著對儒學(xué)和中國文化的了解日益加深,西方對孔子和儒學(xué)陌生和恐懼感在日漸減少,負面評價也在減少。我們可能無法從詞云圖上做出充分的描述和解釋,但詞云圖確實可以幫助我們找到有意義的研究問題,并帶著這個問題回到文本之中作更深入的探索。

5.2.3 一致樹分析

一致樹便于總結(jié)兩個或兩個以上的樹(tree)之間的一致性。我們使用這一計算功能觀察儒學(xué)海外傳播中的英語原創(chuàng)文本和英語翻譯文本(只選用《論語》的十個譯本)之間可能存在的關(guān)系。由于這些文本之間存在的一致性可能較弱,我們使用的是“多數(shù)即為一致的”分析(majority rule consensus)。納入一致樹分析的有16個樣本,其中屬于英語撰寫的儒學(xué)研究文獻有六個,前綴為”KZHW_”。《論語》的譯本有十個,前綴為“l(fā)unyu_”。樣本如下:

在數(shù)據(jù)分析和數(shù)據(jù)挖掘的過程中,我們往往需要了解個體間的異同,由此評價個體間的相似性并嘗試分類。要實現(xiàn)這一目的,最常見的數(shù)據(jù)分析是相關(guān)分析,以及數(shù)據(jù)挖掘中的分類和聚類算法。

為了方便下面的解釋和舉例,先設(shè)定我們要比較X個體和Y個體間的差異,它們都包含了N個維的特征,這里是100~10000個最常用詞的詞頻特征,即X=(x1,x2,x3,… xn),Y=(y1,y2,y3,…yn)。通過距離度量來衡量兩者的差異。

距離度量(Distance)用于衡量個體在空間上存在的距離,距離越遠說明個體間的差異越大。Stylo使用的是常見的歐幾里得距離 (Euclidean Distance),衡量多維中各個點之間的絕對距離。公式如下:

數(shù)據(jù)剔除(CULLING)不預(yù)設(shè)一個詞在給定文本中出現(xiàn)的比例(如20指列入計算的某個詞在20%的給定文本中出現(xiàn)過),但按照詞在 0、20%、40%、60%、80%、100%的樣本中的出現(xiàn)比例累計,并得到距離值之和。數(shù)值越大說明距離越遠。以這種方式進行計算會產(chǎn)生很多計算結(jié)果,呈現(xiàn)的部分結(jié)果見附錄3。可視的計算結(jié)果為圖7的帶狀一致樹圖。

圖7 帶狀一致樹圖

如圖 7所示,兩個《論語》英譯本,即 lunyu_ ESlingerlandLunyu2003和lunyu_GHMINGS1898與英語原創(chuàng)儒學(xué)傳播樣本在用詞特征上存在較強的一致性。換言之,兩個譯本在用詞上更貼近英語原創(chuàng)儒學(xué)傳播文本;這一判斷在附錄2的數(shù)值上也有清晰的表達:這兩個文本(分別標(biāo)示為第一列中的11和 12)和英語原創(chuàng)儒學(xué)傳播文本(第一行中的1~6)的對應(yīng)值明顯低于《論語》英譯文本(第一行中7、8、9、10、13、14、15、16)。這一預(yù)測可以幫助我們將研究焦點鎖定為這兩個譯本的語言特征,為下一步的分析提供可靠的線索和依據(jù)。

6.結(jié)語

在信息化時代,對數(shù)據(jù)的挖掘是獲取有效信息、促進社會發(fā)展的重要途徑。數(shù)據(jù)挖掘支持探索性研究,而這類研究可以避開先入之見,更利于捕捉有意義的研究問題。從這個意義上說,本文探討的數(shù)據(jù)分析可以成為儒學(xué)海外傳播研究中研究問題的來源。若賦碼得當(dāng)、分類清晰,儒學(xué)海外傳播數(shù)據(jù)的可視化完全可以實現(xiàn),也具有強大的數(shù)據(jù)支持功能。

本文將數(shù)據(jù)分析的對象聚焦于文本內(nèi)容,借此探索儒學(xué)海外研究中經(jīng)由其他手段無法獲得的有價值的研究對象。比如,通過基于頻率的可視化數(shù)據(jù)可以直觀觀察儒學(xué)思想在域外傳播的偏好、態(tài)度、儒學(xué)文化在另一文化中生存的過程、儒學(xué)在另一文化中的主要傳播方式,等等。這些數(shù)據(jù)的挖掘并不基于推測,也不基于特定假設(shè),而是基于數(shù)據(jù)內(nèi)部的相對突出程度。這種探索性描述可以幫助我們找到真正有價值的研究問題。

無充分?jǐn)?shù)據(jù)支持,信息注定是片面的。對信息的充分描述是充分解釋的前提。數(shù)據(jù)挖掘可為充分描寫提供更大的可能性。有了可靠的描寫手段和工具,我們就有望基于可靠的數(shù)據(jù),有針對性地制定文化走出去戰(zhàn)略,并在對外翻譯時更多關(guān)注翻譯策略使用的文化意義,增強文化傳播效應(yīng)。

當(dāng)然,本文探討的數(shù)據(jù)可視化更強調(diào)它在研究中的輔助作用,可視化本身不是研究的目的。但合理運用這一手段便于我們在更大范圍內(nèi)捕捉有實質(zhì)意義的研究問題,為相關(guān)研究提供有力的數(shù)據(jù)支持,成就更具理論價值和應(yīng)用價值的學(xué)術(shù)研究。

Robinson,K.2009.The other pole of human existence:Western representations of China between the 13th and 18th centuries[J].Cross-sections(Volume V):57-63.

Spencer,D.1998.The Chan’s Great Continent:China in Western Mind[M].New York:W.W.Norton&Company.

鮑曉英.2013.中國文化“走出去”之譯介模式探索——中國外文局副局長兼總編輯黃友義訪談錄[J].中國翻譯(05):62-65.

高方、許鈞.2010.現(xiàn)狀、問題與建議—─關(guān)于中國文學(xué)走出去的思考[J].中國翻譯(06):5-9.

何明星.2013.中國文化對外翻譯出版60年[J].出版發(fā)行研究(6):28-31.

張朝意.2015.建設(shè)具有中國特色的對外話語體系的戰(zhàn)略思考[J].對外傳播(10):53-55.

張春柏.2015.如何講述中國故事:全球化背景下中國文學(xué)的外譯問題[J].外語教學(xué)理論與實踐(4):9-14.

附錄1 主觀極性計算結(jié)果(子庫的前20段,共242段)

>class_pol POS NEG POS/NEG BEST_FIT[1,] 89.76 42.82 2.10 positive[2,] 1.03 0.45 2.32 positive[3,] 108.03 71.30 1.52 neutral[4,] 1.03 0.45 2.32 positive[5,] 66.51 0.45 149.30 positive[6,] 1.03 0.45 2.32 positive[7,] 56.67 17.81 3.18 positive[8,] 1.03 0.45 2.32 positive[9,] 138.34 60.19 2.30 positive

[10,] 33.42 44.21 0.76 negative[11,] 1.03 0.45 2.32 positive[12,] 97.51 60.88 1.60 neutral[13,] 1.03 0.45 2.32 positive[14,] 1.03 0.45 2.32 positive[15,] 49.62 44.21 1.12 neutral[16,] 1.03 0.45 2.32 positive[17,] 75.64 26.84 2.82 positive[18,] 1.03 0.45 2.32 positive[19,] 32.73 35.18 0.93 negative[20,] 1.03 0.45 2.32 positive

附錄2 一致樹分析文本之間的歐幾里得距離表(2-gram;culling@100;available features(words):211; MFW used:100 160;distance_table_4900mfw_0c)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 0.00 1.25 1.37 1.02 1.13 1.06 2.65 2.32 2.86 2.10 1.33 1.70 2.66 2.36 2.67 3.08 2 1.25 0.00 1.02 1.21 1.27 1.22 2.84 2.54 3.06 2.33 1.53 1.87 2.85 2.49 2.86 3.27 3 1.37 1.02 0.00 1.26 1.32 1.32 2.92 2.65 3.14 2.46 1.64 1.96 2.93 2.58 2.96 3.37 4 1.02 1.21 1.26 0.00 0.74 0.64 2.59 2.21 2.77 1.97 1.06 1.58 2.60 2.27 2.57 3.01 5 1.13 1.27 1.32 0.74 0.00 0.59 2.62 2.21 2.77 2.01 0.99 1.65 2.63 2.25 2.54 3.02 6 1.06 1.22 1.32 0.64 0.59 0.00 2.55 2.13 2.70 1.94 0.91 1.52 2.56 2.19 2.49 2.96 7 2.65 2.84 2.92 2.59 2.62 2.55 0.00 1.51 1.14 2.88 2.11 2.68 0.07 1.34 1.36 1.57 8 2.32 2.54 2.65 2.21 2.21 2.13 1.51 0.00 1.62 2.46 1.74 2.38 1.52 1.52 1.54 1.83 9 2.86 3.06 3.14 2.77 2.77 2.70 1.14 1.62 0.00 3.01 2.21 2.84 1.13 1.40 1.33 1.66 10 2.10 2.33 2.46 1.97 2.01 1.94 2.88 2.46 3.01 0.00 2.02 2.21 2.88 2.67 2.87 3.14 11 1.33 1.53 1.64 1.06 0.99 0.91 2.11 1.74 2.21 2.02 0.00 1.69 2.12 1.73 1.99 2.52 12 1.70 1.87 1.96 1.58 1.65 1.52 2.68 2.38 2.84 2.21 1.69 0.00 2.68 2.48 2.75 3.06 13 2.66 2.85 2.93 2.60 2.63 2.56 0.07 1.52 1.13 2.88 2.12 2.68 0.00 1.34 1.36 1.56 14 2.36 2.49 2.58 2.27 2.25 2.19 1.34 1.52 1.40 2.67 1.73 2.48 1.34 0.00 1.40 1.78 15 2.67 2.86 2.96 2.57 2.54 2.49 1.36 1.54 1.33 2.87 1.99 2.75 1.36 1.40 0.00 1.65 16 3.08 3.27 3.37 3.01 3.02 2.96 1.57 1.83 1.66 3.14 2.52 3.06 1.56 1.78 1.65 0.00

表中數(shù)字分別代表以下樣本:1.KZHW_1690;2.KZHW_1730-40;3.KZHW_1750-60;4.KZHW_1950;5.KZHW_1990-2000;6.KZHW_2010;7.lunyu_A.Waley1938;8.lunyu_C.Muller19902015;9.lunyu_DJLiuLunyu1979;10.lunyu_EPoundLunyu1951;11.lunyu_ ESlingerlandLunyu2003;12.lunyu_GHMINGS1898;13.lunyu_J.Legge1861;14.lunyu_JZHuangLunyu1997;15.lunyu_RAmesLunyu1998; 16.lunyu_YCXuLunyu2005

(責(zé)任編輯 鄧夢寒)

H319

A

1674-8921-(2016)06-0023-07

10.3969/j.issn.1674-8921.2016.06.005

秦洪武,曲阜師范大學(xué)外國語學(xué)院教授、博士生導(dǎo)師。主要研究方向為英漢語對比與翻譯、語料庫語言學(xué)。電子郵箱:qinhongwu@163.com

孔蕾,曲阜師范大學(xué)外國語學(xué)院副教授、碩士生導(dǎo)師,曲阜師范大學(xué)“中國語言文學(xué)”博士后站研究人員。主要研究方向為英漢語對比與翻譯、二語習(xí)得。電子郵箱:skytkong@163.com

猜你喜歡
可視化文本情感
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
如何在情感中自我成長,保持獨立
基于CGAL和OpenGL的海底地形三維可視化
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
主站蜘蛛池模板: 在线视频一区二区三区不卡| 国产男女免费完整版视频| 国产乱子伦手机在线| 干中文字幕| 中文字幕 91| 日韩午夜福利在线观看| 欧美成人精品在线| 无码一区18禁| 99热线精品大全在线观看| 欧美综合成人| …亚洲 欧洲 另类 春色| 精品无码一区二区三区在线视频| 国产熟睡乱子伦视频网站| aⅴ免费在线观看| 日韩欧美国产精品| 久久婷婷五月综合色一区二区| 色老二精品视频在线观看| 精品国产电影久久九九| 中文字幕永久视频| 国产毛片基地| 自慰网址在线观看| 67194亚洲无码| 亚洲无码日韩一区| 久久综合色视频| 亚洲国产成人精品无码区性色| 日韩高清中文字幕| 国产黄网永久免费| 欧美一级片在线| 久久精品视频一| 亚洲一区波多野结衣二区三区| 人妻一本久道久久综合久久鬼色| 日韩A∨精品日韩精品无码| 国产精品大尺度尺度视频| 青青网在线国产| 欧洲成人在线观看| 欧美在线网| 天天摸夜夜操| 中文字幕 欧美日韩| 免费看av在线网站网址| 在线观看无码av免费不卡网站| 成人综合在线观看| 精品久久久久久成人AV| 亚洲成人黄色网址| 日本久久网站| 国产波多野结衣中文在线播放| 亚洲欧美色中文字幕| 91精品专区| 久久综合伊人77777| 伊伊人成亚洲综合人网7777| 天天躁夜夜躁狠狠躁躁88| 国产91精品最新在线播放| 国产喷水视频| 亚洲中文制服丝袜欧美精品| 日韩在线视频网站| 性色一区| 91激情视频| 爆操波多野结衣| 毛片手机在线看| 日本午夜三级| 99热这里只有成人精品国产| av在线5g无码天天| 久久综合亚洲色一区二区三区| 亚洲成人在线免费观看| 一级全免费视频播放| 97视频在线观看免费视频| 国产在线无码一区二区三区| 日本一区二区不卡视频| 中文字幕乱码中文乱码51精品| 国产乱人免费视频| 国产中文在线亚洲精品官网| 国产精品播放| 日本不卡免费高清视频| 国内精品久久久久久久久久影视| 欧美伦理一区| 国产色婷婷| 国产SUV精品一区二区6| 色综合激情网| 欧美在线观看不卡| 国产欧美精品专区一区二区| 亚洲日韩每日更新| 精品福利视频导航| 国产成人久久综合777777麻豆|