陶晨 魯佳亮 蘇淼 周赳



摘要: 為解決新時代背景下絲綢文化蛻變的數理實證問題,文章針對絲綢文化特點構建其文化特征體系。利用互聯網采集的大數據進行絲綢文化特征體系的填充,采用人工歸類與類屬計算相結合的方法,對特征詞的綜合上下文性質進行量化,解決模糊特征的歸類問題;應用該文化特征體系,結合特征詞頻率統計方法,考察絲綢文化的特征分布及其新時代內涵;通過在時間軸上跟蹤文化特征分布的變化,揭示絲綢文化演進的失衡區間和“三分段”模式,并分析失衡區間中的拐點現象及其成因。通過將大數據采集和計量方法與傳統文化特征體系無縫銜接,研究以數理實證方式展示了絲綢文化的內涵升級和結構重組,有助于深入理解“一帶一路”影響下傳統文化的現實狀態和發展方向。
關鍵詞: 絲綢;一帶一路;文化計算;文化特征;特征詞;詞頻
中圖分類號: TS101.1;G202 文獻標志碼: A 文章編號: 10017003(2020)12007406
引用頁碼: 121112 DOI: 10.3969/j.issn.1001-7003.2020.12.012(篇序)
Interpretation of silk culture evolution in the new era through big data
TAO Chen1, LU Jialiang2, SU Miao2, ZHOU Jiu3
(1.College of Textile and Garment, Shaoxing University, Shaoxing 312000, China; 2.International Silk Institute, Zhejiang Sci-Tech University,Hangzhou 310018, China; 3.Silk and Fashion Culture Research Center of Zhejiang Province, Hangzhou 310018, China)
Abstract: To solve the issue of mathematical empiricism on silk culture transmutation in the new era, a culture feature system was built for silk culture features. The silk culture feature system was then filled with big data collected from the Internet. Combined with manual classification and generic calculation, the integrated contextual characters of the feature words were quantified to solve the classification problem of fuzzy features. The feature distribution of silk culture and its connotation in the new era were investigated by applying the culture feature system and combining the statistical method of the frequency of feature words. The unbalanced interval of silk culture evolution and its "three-section" pattern were revealed through tracking the changes in the culture feature distribution on the timer shaft. Meanwhile, the yielding point in the unbalanced interval and the cause of its formation were also analyzed. By seamless connection of the big data collection and measuring techniques with conventional culture feature system, this study manifested the connotation upgrading and structural reorganization of the silk culture in an empirical way, which helps understand the actual state and development direction of traditional culture under the influence t of the Belt and Road initiative.
Key words: silk; the Belt and Road; culture computation; culture feature; feature word; word frequency
絲綢在中華文明史中歷盡精雕細琢、數千年而不輟,成為國人文化自信的重要來源。近十年來中國絲綢文化進入嶄新的發展時期,期間發生的一些重大社會歷史事件,特別是“一帶一路”倡議的提出,推動了中國絲綢文化的加速演化,由此帶來的文化結構的重組與內涵升級,造成絲綢文化的一次重要蛻變。評估新時期絲綢文化的變遷,是傳統文化傳承和揚棄的前提條件,也是衡量“一帶一路”社會影響力的重要途徑。國內已有許多學者探討“一帶一路”背景下傳統文化的演變和跨越式發展,如討論絲綢文化的復興[1]、新時期文化共同體的形成[2]、新絲路歷史文化遺產的保護策略[3]、絲綢文化傳播與經濟發展的互動關系[4]等。該類研究采取社會調查、資料整理和觀點討論的傳統方法,具有如下兩個特點:第一,論證多于實證,主要采用思辨、討論的方式,提出愿景或對策,而少有數據實證或評估;第二,定性而非定量,僅闡述“有什么”而不能回答“有多少”。隨著人工智能和大數據的不斷深入,近年來文化研究領域呈現出明顯的數據密集特點,在研究目標上又產生了更高的數量化需求,跨學科的“文化計算”應運而生[5]。文化計算起源于哈佛大學的Aiden和Michel對谷歌數字圖書數據進行的研究[6],其通過海量文本中單詞或人名隨時間變化的頻率,推導出了一些重要歷史文化事件和趨勢,證明了利用大數據處理手段提取文化特征并進行量化分析的可行性。邵培仁[7]等對詞頻方法用于文化基因的提取做了探索,提出了利用文化計算方法進行中華文化基因庫建設的構想;龔為綱等[8]講通過大數據詞頻分析,結合關系網絡與語義情感,考察了海上絲綢之路中絲綢產品的貿易格局和文化影響力;Correia等[9]考察不同語言中各種動物名稱的頻率分布,通過實時監測物種文化可見度的變化,揭示了公眾環保意識的縱深演化;Kozlowski等[10]利用詞向量模型研究社會階級結構,發現了社會階級的形成與轉化隨宏觀經濟波動而周期性改變的規律。毫無疑問,文化計算給文化研究帶來了全新的方法和工具,但其構建的指標和模型難以與傳統研究接軌,成為其引起學術界爭議的主要原因之一[11]。本研究從傳統思維出發進行絲綢文化特征體系的構建,利用大數據方法對該體系進行特征填充、量化分析與展示,通過傳統研究思路在文化計算方法上的貫徹與落實,以數理實證方式揭示“一帶一路”倡議影響下絲綢文化的蛻變與重生。
1 文化數據采集
傳統上,針對某一文化對象的語料文本可以通過人工方式從書籍、報紙、電視、網絡等媒體上搜集,當積累的語料達到一定的規模,能夠基本覆蓋人們在這一對象上產生的所有觀點及言論,即形成了與該文化對象相關的語料庫。但人工方式的數據采集耗時耗力,且在文化對象快速演變的信息時代,難以保證數據的時效性,因而逐漸讓位于基于互聯網的自動化采集方式。目前,在自動采集技術中主題網絡爬蟲技術[12]的使用最為廣泛,其通過計算目標資源的主題相關度,優先采集相關度高的文本資源,可在短時間內實現高效的數據采集。
本研究將“絲綢”作為主題詞,以新浪、網易、搜狐、騰訊四大國內門戶網站為起點,利用主題網絡爬蟲進行多線程大規模文本采集,將網頁時間戳賦予相應文本對象的時間屬性,共爬取20 943個網站的682 120個有效網頁,獲取文本89 285兆字節,時間上涵蓋2008—2019年共12年形成絲綢文化的大數據,如圖1所示。
構成絲綢文化大數據的文本需要進行預處理,以便析出以詞語為載體的文化特征[13]。預處理的過程主要包括分詞[14]和停用詞過濾[15]兩個步驟。分詞是中文文本處理的特有技術,由于不存在類似英文句子中單詞之間的空格,從中文句子中提取詞語要借助分詞技術,該技術通過統計字與字相鄰共現的概率計算成詞的可信度,從而進行中文詞語的分割。分詞完成后,文本轉變為詞語集合。此時的集合中含有一定數量的弱特征,它們主要表現為一些動詞、形容詞、量詞、連詞、介詞、語氣詞等意義不大的非實體詞語,稱為“停用詞”。可借助中文停用詞表對該詞語集合進行過濾,以去除其中的弱特征、保留強特征。其中的示例文本通過分詞和停用詞過濾的處理,成為可供進一步統計和分析的特征詞序列。
2 特征體系構建
何謂“文化”,國內外尚無精確、一致的看法,但東西方辭典或百科中一個較為共同的認識是:文化涵蓋人類創造的所有物質財富和精神財富。中國絲綢在數千年傳承與發展中產生了極其多樣的品種、技藝、工具,在物質實踐的同時也積累了豐富的情感、觀念,并深刻地影響了民族個性和民族心理的形成。在物質性和精神性之外,絲綢文化另一個不容忽視的總體特征是它的社會交流性。圍繞絲綢展開的社會交流實踐,培育了特定的社會群體、社會階層及相應的社會生活方式、行為模式、習慣等,成為絲綢文化不可或缺的一部分。
根據中國著名學者錢穆先生關于文化階層的觀點[16],本研究將絲綢文化特征劃分為“物質”(向物的)、“社會”(向人的)和“精神”(向心的)三大基本門類,對絲綢文化大數據中的特征詞逐一進行判斷與歸類;與此同時,對三大基本門類進一步細分,形成絲綢文化特征的體系,如圖2所示。
大多數特征詞可經人為判斷后歸入三大基本門類中的一類,但存在少數模糊特征詞其內涵不甚明了,即便有經驗的研究人員也不能輕易決定其類屬,具體包括“漢服”“耕織”“孝帛”等特征詞。例如,在絲綢文化語境中,特征詞“漢服”究竟是在闡釋一種傳統服飾的材質、形制、款式等物質性要素,還是敘述其在社會習俗、禮儀等方面的角色和功能,又或是傳達一種儒雅、包容的傳統價值觀念,必得弄清這一問題方能在歸類時決定該特征詞的去向。受模糊文本分類思想[17]的啟發,本研究將這一思路運用到詞語層面上,通過考察模糊特征詞的上下文綜合性質來確定其類屬。
根本上,一個特征詞的內涵由它的綜合上下文決定。文化大數據中每個特征詞序列,構成該特征詞的可能出現一個或多個場合;該特征詞在所有場合中的上下文,構成它的綜合上下文。假定采集到的文化大數據是完備的,即場合是充分的,則一個特征詞在特定文化語境中的涵義必然是由其綜合上下文規定的。這一觀點可具體闡釋為三條:1)所有場合中的上下文共同規定一個特征詞的涵義;2)在一個給定的場合,目標特征詞之外的所有其他特征詞,共同規定該目標詞在該場合中的涵義;3)在一個給定的場合,各個特征詞對目標特征詞之規定性的貢獻,隨著相對距離的增加而減少。
基于上述思路,本研究通過分析其綜合上下文來判斷一個特征詞的類屬。在對文本大數據統計句子長度的基礎上,本研究采用了長度為8的上下文窗口,如圖3所示。圖3所示的特征詞序列,給出特征詞“漢服”出現的一個場合,其上下文由序列中除“漢服”之外的所有其他特征詞共同構成。一個序列中可能包含數千特征詞,在實際操作中只能考慮一定窗口范圍內的特征詞的影響,該窗口范圍稱為上下文窗口,上下文窗口是上下文的實踐簡化形式。由于詞義的影響力主要集中在句子內部,因而句子長度(指平均條件下構成一個句子的有效特征詞個數)可作為上下文窗口大小的參考。
圖3亦給出了除目標詞以外的各個特征詞的類屬(X代表“物質”、Y代表“社會”、Z代表“精神”),及其與目標詞的相對距離。在該窗口中,特征詞“漢服”的類屬(以C表示)可表示為其上下文類屬的合成,如式(1)得出:
上述公式具有一般性,可將某一特征詞在一定窗口中的類屬表示為一個向量,其中x、y、z分別為“物質”“社會”“精神”三個類屬上的分量,n為上下文窗口尺寸,xi、yi、zi分別為第i個特征詞的類屬三分量,di為第i個特征詞與目標特征詞的間隔距離。值得注意的是,對于圖3所示的情況,序列中的除目標詞之外的特征詞類屬均由人為判斷而確定;凡由人為判斷直接確定的,其類屬三分量可視為其中一個值為1、另兩個值為0,如特征詞“華夏”類屬為[0,1,0]、“思想”類屬為[0,0,1]、“自然”類屬為[1,0,0]。此外,如式(2)得出:
進一步地,該特征詞在綜合上下文中的類屬(以C表示)為其在各個場合下計算得到的類屬向量的均值,如式(3)得出:
式中:Ci代表該特征詞在第i個場合下按式(1)計算得到的類屬向量,k為該特征詞在文化大數據中出現的次數即場合數。
考慮到式(2),不難看出綜合類屬向量C的模長為1,即:
至此,式(1)(3)將人為判斷而確定的特征詞類屬和通過計算得到的類屬統一起來并實現量化描述,所有特征詞類屬均可由三維空間中的綜合類屬向量表征,類屬向量的模長為1,如圖4所示。
對于基本門類之下子類的特征詞歸類,亦采取與三大基本門類歸類相似的方法,即先通過人工分類解決絕大部分特征詞的去向,再根據上下文綜合性質計算少數模糊特征的類屬向量。最終,所有特征詞得以填充或量化分配到圖2所示的絲綢文化特征體系中,形成該體系的實體框架。在實際應用中,本研究考察該框架中文化特征的分布,跟蹤文化演進的過程,得出新時代背景下絲綢文化蛻變的軌跡。
3 特征分布分析
3.1 總體分布
在絲綢文化大數據中,本研究利用文本對象的時間標簽過濾出最新的數據,反映絲綢文化的當下狀態。對2019年數據中的所有特征詞出現的頻率進行統計,結合特征詞的綜合類屬性質,依據式(5)計算物質、社會、精神三方面的文化特征比例(分別以RX、RY、RZ表示)。
式中:Ci為第i個特征詞的綜合類屬向量,fi為第i個特征詞出現的頻率,m為特征詞個數,系數λ∑mi=1Ci[1,0,0]Tfi用以確保結果在0~1。
通過計算,結果如圖5(a)所示。
從圖5(a)可見,絲綢文化中社會性特征所占比例最高為44.0%,其次是物質性特征,再次是精神性特征。“絲綢”的本意表明其物質性,中國古代先民養蠶、剝繭、抽絲、織綢,創造了豐富的物質性文化。絲綢文化的社會性與精神性特征,應是以物質性特征為基礎的,從物質性文化中衍生而來。而當下社會性特征比重凸顯,暗示了目前絲綢文化主要在政治、經濟、科學與文藝等社會領域發揮其功能。
類似地,可計算三大基礎門類下各個子類的文化特征比例。圖5(b)給出了物質性特征內部的子類分布,主要為“技藝”“題材”和“產品”三類特征所占據,其中“技藝”特征占比最高,達到44.9%。這表明,在其物質性方面絲綢文化主要是一種技藝文化,絲綢文化中的技術和藝術成分是其物質傳承的核心。“技藝”特征中排名前五的特征詞依次為“提花”“間色”“精練”“色織”“緙絲”。
圖5(c)顯示社會性特征內部的子類比例結構,可見其中“國政”“經貿”二類比重最大。中國絲綢文化在社會經濟與貿易方面的浸潤早有傳統,典型例子如古代絲綢之路上發生的跨地區貿易交流。然而文化特征在“國政”方向上的側重,展現了當下絲綢文化引人注目的新風貌。“國政”特征中排名前十的特征詞依次為“一帶一路”“發展”“和平”“復興”“對外開放”“多極化”“區域合作”“平等互利”“援助”“海防”,涉及外交、國防、對外經濟政策、國際形勢與格局等多個方面。這些特征詞的出現為絲綢文化注入了新的時代內涵。
圖5(d)給出精神性特征中“情感”與“理念”的比例關系,二者基本各占一半。在數千年的勞動實踐中,國人對于絲綢積累的深厚情感可被一些特征詞昭示,如“自豪”“崇拜”“難忘”“決心”“屈辱”等。更值得注意的是,當前的絲綢文化飽含情感卻不流于形色,它也容納了等量的理性成分,這從“理念”特征中排名前五的特征詞“發展觀”“與時俱進”“和而不同”“中庸”“婦女解放”上可以看出。“情感”和“理念”特征共同構筑絲綢文化的精神內涵,前者暗示了絲綢文化發展的內在動力,后者則預示了絲綢文化發展的方向和趨勢。
3.2 演進過程
為進一步厘清近年來絲綢文化的發展脈絡,本研究在絲綢文化特征體系下展開動態過程分析。計算2008—2019年的文化特征比例結構,并在時間軸上進行考察,如圖6所示。
3.2.1 “三分段”模式
圖6(a)給出了從2008—2019年絲綢文化三大基本特征的演變過程,發現在2012—2016年存在一個明顯的失衡區(灰色區域所示)。在進入該區域之前,絲綢文化的物質性、社會性和精神性特征顯示為平緩的曲線,基本保持穩定;在該區域內部,三大特征的比重發生了急劇變化;在離開該區域后,三大特征的曲線又趨向平緩,形成了新的平衡結構。存在于該區域兩端的兩個平衡結構,有著迥異的文化特征構成。舊平衡結構是以物質性特征為主導,代表了傳統絲綢文化;新平衡結構以社會性特征為主導,代表“一帶一路”背景下的新絲綢文化。這種從舊結構到新結構的演變過程,造成了時間軸上特征分布的“三分段”模式,即“平衡-失衡-新平衡”的演變模式。
物質性特征總體是下降的,然而其內部亦發生了舊結構破滅和新結構形成的演化,如圖6(b)所示。“三分段”模式在物質性特征的演化上仍然成立,其失衡區間顯示為大約2011—2017年內。在此區間之前基本是“產品”和“技藝”特征共同主導,此區間之后“技藝”特征比重則大幅超越。
社會性特征總體上上升,其內部變化如圖6(c)所示,主要表現為“國政”和“經貿”特征的交疊與演動。其失衡區間約為2012—2017年,此前由“經貿”特征主導,此后“國政”特征比重反超,基本上二者共同主導。
圖6(d)顯示精神性特征的變化較為復雜,經歷了“先下降、后上升、總體水平略有提高”的變化過程。在其內部,失衡區間顯示約為2011—2017年,此前為“情感”特征主導,此后則基本由“情感”“理念”特征各占一半。
總之,無論三大基本特征或其內部,都存在明顯的“三分段”模式,且失衡區時間點相當吻合。這表明絲綢文化在特定時間區間上受到“一帶一路”這一重大社會歷史事件確定的、持恒的影響,因此完成了文化結構的重組。從失衡區的一端到另一端,絲綢文化演進的總趨勢是:其一,物質性特征式微,社會性特征不斷凸顯;其二,從產品文化向技藝文化過渡;其三,在國家政策與國際格局方面的內涵不斷豐富;其四,絲綢文化中的理性成分上升、感性成分下降。
3.2.2 拐點現象
圖6顯示的失衡區對應2011—2017年的時間范圍,進一步考察發現該區域中并非單調的,而是存在拐點。如圖6(a)中物質性特征在2012—2013年呈上升,2014—2016年呈下降趨勢;圖6(b)中“產品”特征在2011—2013年呈上升,2014—2017年呈下降趨勢;圖6(c)中“經貿”特征在2012—2013年呈上升,2014—2017年呈下降趨勢。
總之,存在上升與下降兩種演動趨勢,將失衡區分割為兩部分,前一部分約對應2011—2013年(稱為“前失衡區”),后一部分約對應2014—2017年(稱為“后失衡區”)。這表明絲綢文化特征結構在相應區間中受到兩股不同力量的影響,且后一股力量在一定程度上扭轉了前一股力量造成的影響,并將自身效果放大,最終穿過失衡區形成新的穩定結構。
考慮“一帶一路”倡議提出的時間點為2013年9月,這與后失衡區的起點吻合,從而也證明前失衡區的特征演動應是由另一種影響因素所造成。通過梳理2011、2012年絲綢文化和產業大事件,可發現導致“產品”“經貿”特征攀升的最大可能,是2011年9月“杭州絲綢”國家地理標志的產生。特征詞“杭州”在時間軸上的詞頻變化可反映這一事件的影響力,如圖7所示。
圖7表明,特征詞“杭州”的詞頻在2008—2019年持續上升,其中在前失衡區對應的2011—2103年(灰色區域)有一次大幅攀升。在前失衡區內部,“產品”“經貿”特征的比例與特征詞“杭州”是正相關的,而在此區間之后二者不再表現出相關性。由此可推斷,各類特征在前失衡區的變化是由“杭州絲綢”國家地理標志這一事件推動,而在后失衡區的變化則主要受到“一帶一路”倡議的巨大影響力。
4 結 論
本研究通過爬蟲技術進行互聯網大規模信息采集和處理,形成了較為完整的絲綢文化大數據。利用綜合上下文對大數據中的特征詞涵義進行量化,通過類屬計算解決了模糊特征的歸類問題,完成了絲綢文化特征體系的填充,建立了絲綢文化特征的實體框架,從物質性、社會性和精神性三方面較為全面地覆蓋了絲綢文化的整體內涵。從絲綢文化特征的實體框架中,本研究在特征詞頻率統計的基礎上,分析了絲綢文化的特征分布及其背后的新時代內涵,并進一步考察了絲綢文化在時間軸上演進的過程,揭示了絲綢文化演進中的失衡現象和“三分段”模式。應用該框架進行數據實證的結果表明,絲綢文化在“一帶一路”背景下完成了一次內涵升級和結構重組,并達成了新的平衡狀態。
參考文獻:
[1]李希光. “一帶一路”文化建設與絲綢之路文化復興[J]. 新聞與傳播, 2015(6): 24-26.
LI Xiguang. Cultural construction and cultural revival of the silk road under the Belt and Road Initiative[J]. Journalism & Communication, 2015(6): 24-26.
[2]傅才武, 嚴星柔. 論建設21世紀中華民族文化共同體[J]. 華中師范大學學報(人文社會科學版), 2016(5): 63-74.
FU Caiwu, YAN Xingrou. On the construction of Chinese national culture community in the 21th century[J]. Journal of Central China Normal University(Humanities and Social Sciences Edition), 2016(5): 63-74.
[3]李丕宇. “一帶一路”背景下“絲綢之路”歷史文化遺產研究的雙向視域[J]. 齊魯藝苑, 2017(2): 4-8.
LI Piyu. The bi-directional perspective for historical and cultural research on the heritage of the silk road under the background of the Belt and Road Initiative[J]. QiLu Realm of Arts, 2017(2): 4-8.
[4]秦子瑜. 淺析“一帶一路”跨界文化傳播對經濟發展的促進[J]. 新聞傳播, 2016(13): 119-120.
QIN Ziyu. A brief analysis on the promotion of the Belt and Road Initiative cross-border cultural communication to economic development[J]. News Dissemination, 2016(13): 119-120.
[5]趙海英, 賈耕云, 潘志庚. 文化計算方法與應用綜述[J]. 計算機系統應用, 2016(6): 1-8.
ZHAO Haiying, JIA Gengyun, PAN Zhigeng. Review on the methods and applications in cultural computing[J]. Computer System Application, 2016(6): 1-8.
[6]MICHEL J B, SHEN Y K, AIDEN A P, et al. Quantitative analysis of culture using millions of digitized books[J]. Science, 2011, 331(6014): 176-182.
[7]邵培仁, 林群. 中華文化基因抽取與特征建模探索[J]. 江蘇師范大學學報(哲學社會科學版), 2012, 38(2): 107-111.
SHAO Peiren, LIN Qun. Exploration of extracting chinese cultural genes and modeling its characteristics[J]. Journal of Jiangsu Normal University(Philosophy and Social Science Edition), 2012, 38(2): 107-111.
[8]龔為綱, 羅教講. 大數據視野下的19世紀海上絲綢之路[J]. 學術論壇, 2015, 38(12): 82-91.
GONG Weigang, LUO Jiaojiang. The 19th century "maritime silk road" under the vision of big data[J]. Academic Forum, 2015, 38(12): 82-91.
[9]CORREIA R A, JEPSON P, MALHADO A C M, et al. Internet scientific name frequency as an indicator of cultural salience of biodiversity[J]. Ecological Indicators, 2017, 78: 549-555.
[10]KOZLOWSKI A C, TADDY M, EVANS J A. The geometry of culture: analyzing the meanings of class through word embeddings[J]. American Sociological Review, 2019, 84(5): 905-949.
[11]GOLD M K, KLEIN L F. Debates in the Digital Humanities 2016[M]. Minnesota: University of Minnesota Press, 2016.
[12]于娟, 劉強. 主題網絡爬蟲研究綜述[J]. 計算機工程與科學, 2015, 37(2): 231-237.
YU Juan, LIU Qiang. An overview of thematic web crawler[J]. Computer Engineering and Science, 2015, 37(2): 231-237.
[13]苗奪謙, 衛志華, 張志飛. 中文信息處理原理及應用[M]. 北京: 清華大學出版社, 2015.
MIAO Duoqian, WEI Zhihua, ZHANG Zhifei. The Theory and Applications of Chinese Information Processing[M]. Beijing: Tsinghua University Press, 2015.
[14]黃昌寧, 趙海. 中文分詞十年回顧[J]. 中文信息學報, 2007, 21(3): 8-19.
HUANG Changning, ZHAO Hai. Chinese word segmentation: a decade review[J]. Journal of Chinese Information Processing, 2007, 21(3): 8-19.
[15]化柏林. 知識抽取中的停用詞處理技術[J]. 現代圖書情報技術, 2007, 2(8): 48-51.
HUA Bolin. Stop-word processing technique in knowledge extraction[J]. New Technology of Library & Information Service, 2007, 2(8): 48-51.
[16]錢穆. 文化學大義[M]. 北京: 九州出版社, 2011.
QIAN Mu. The Basics of Culture[M]. Beijing: Jiuzhou Press, 2011.
[17]梁艷紅, 坎啟軒, 蘇翌. 基于主題分布優化的模糊文本分類研究[J]. 計算機工程, 2019, 45(10): 221-226.
LIANG Yanhong, KAN Qixuan, SU Yi. Research on fuzzy text classification based on topic distrifution optimization[J]. Computer Engineering, 2019, 45(10): 221-226.
收稿日期: 20200508; 修回日期: 20201105
基金項目: 浙江省軟科學研究計劃項目(2020C35024)
作者簡介: 陶晨(1981),男,副教授,博士,主要從事絲綢文化與設計的研究。通信作者:周赳,教授,zhoujiu34@126.com。