999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“大數據”時代的中國現當代文學研究

2017-11-07 01:15:51
關鍵詞:大數據數據庫時代

張 全 之 韓 莉

(重慶師范大學 文學院,重慶 401331;齊魯工業大學 圖書館,山東 濟南 250353 )

2017-6-25

張全之(1966--),男,山東沂南人,文學博士,重慶師范大學文學院教授。

韓莉(1970--),女,山東滕州人,齊魯工業大學圖書館館員。

“大數據”時代的中國現當代文學研究

張 全 之 韓 莉

(重慶師范大學 文學院,重慶 401331;齊魯工業大學 圖書館,山東 濟南 250353 )

我們已經進入“大數據”時代。“大數據”改變著我們的生活,也改變著我們的思維方式,文學研究也必然會受其影響,進入一個新的時代。就目前來看,中國古代文學研究在數據庫的開發利用方面已經取得很高成就,在對“大數據”使用方面也有較為充分的準備。相對而言,中國現當代文學研究對“大數據”時代的反應較為遲鈍,尚無理論上的思考和準備。但無論怎樣,“大數據”給中國現當代文學帶來的新思維和新方法是無法抗拒的,必將給這一學科的研究帶來巨大變化。

大數據;數據庫;數字化;數據化

一、“大數據”與文學研究的現狀

當下我們已經進入大數據時代。所謂“大數據”(Big data),麥肯錫全球研究所給出的定義是:“一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。”(見百度百科)舍恩伯格和庫克耶在《大數據時代》中指出:“大數據標志著‘信息社會’終于名副其實。我們收集的所有數字信息都可以用新的方式加以利用。我們可以嘗試新的事物并開啟新的價值形式。但是,這需要一種新的思維方式,并將挑戰我們的社會機構,甚至挑戰我們的認同感。……但是,現在大多數人都認為數據是一個技術問題,應側重于硬件或軟件,而我們認為應當更多地考慮當數據說話時會發生什么。”[1]239-240海量的數據,通過“云計算”按照操作者的需要進行處理,已經得到廣泛的運用,并產生了驚人的效果。在我國,有關“大數據”的研究和討論也漸成熱點。從中國知網看,標題含有“大數據”的論文,近一兩年呈井噴之勢,具體數據如下:

年份20102011201220132014201520162017論文數量194335819634448706097802570

很明顯,前三年的數據起伏不大,但從2013年開始到2016年,數據迅速擴大,成為眾多研究領域中的熱點。與之相適應,我們國家對“大數據”也十分重視。2015年,經李克強總理簽批,國務院發布《促進大數據發展行動綱要》,對“大數據”在未來經濟社會發展中的作用給予了高度重視,認為:“堅持創新驅動發展,加快大數據部署,深化大數據應用,已成為穩增長、促改革、調結構、惠民生和推動政府治理能力現代化的內在需要和必然選擇。”“大數據”不僅帶來經濟和科技發展的新跨越,對人文社會科學研究也會產生重要影響。事實上,在國外,利用“大數據”開展文學研究早已起步。美國斯坦福大學教授弗朗哥·莫萊蒂(Franco Moretti)在他提出的“遠距離閱讀”(distant reading)的基礎上,與馬修·喬克思建立了“文學實驗室”[2]。他通常的做法是雇傭幾個研究生,“專門借助計算機檢索、收集相關數據,以供他來分析。他的主要職責是利用統計的數據繪制文學的圖表,通過對圖表的分析來揭示文學的秘密”[3]。如他在《文體:對7000個小說標題的反思》一文中,通過對數據的整合分析,尋找到小說標題字數的變化與時代之關系,還指出了小說標題的四種類型,他的這類研究如果不靠“大數據”是無法完成的。所以說,以“大數據”為依托,采用數據分析法對文學進行研究,已經成為一種不可阻擋的新趨勢,也是“大數據”時代文學研究的題中應有之義。在中國,也有很多學者在思考“大數據”時代文學研究的新方法和新問題,相關研究主要集中在二個方面:一是綜合論述“大數據”時代文學研究方法或綜合介紹西方相關研究的,這樣的論文主要有上面曾經引述過的2篇:《大數據時代的文學研究方法:基于弗蘭克·莫萊蒂文學定量分析發的考察》和《“大數據”分析與文學研究》。前者詳細介紹了莫萊蒂用定量分析法研究文學取得的成就,認為:“莫萊蒂和他的團隊用定量分析的具體研究成果向世人證明,借助大數據的文學研究不是烏托邦的空想,而是具有切實的實踐性,它能夠為文學研究提供新的研究思路。”后者也是以介紹莫萊蒂“文學實驗室”的相關研究為主,但也提出了“大數據”與“小閱讀”的問題。作者認為,研究者個人的“小閱讀”是不可替代的,但通過“大數據”分析對文學進行研究,也有積極意義:“人腦和電腦在閱讀文本的時候所用的方法和關注的重點不一樣,讀出來的東西也可能截然不同。不過人腦和電腦在閱讀闡釋文學的時候也往往可以互為體用,互補短長,文學‘大數據’分析和學者個人的‘小閱讀’之間存在著許多交融與合作的可能。”[2]二是各學科紛紛著手研討“大數據”與相關學科研究之間的關系。比較而言,中國文學下面的二級學科中中國古代文學研究領域顯得較為活躍,早在2005年《文學遺產》就推出了李鐸和王毅的《關于古代文獻信息化工程與古典文學研究之間互動關系的對話》,他們特別提醒:“人與計算機將來的關系不是誰代替誰的問題,而是互相交流和啟發,對話和融通,當然這之中并不是絕對平等的,人的主體性是第一位的,但我們也要向計算機學習,包括進入它的思維方式:要融合各種知識,也要補課,古典文學研究領域以后培養某些研究生時,應該開電子信息、統計學等課程,應該借鑒社會學數據統計方法等等,在知識結構、特別是在研究方法和研究路徑的設計上,彌補我們學科以往明顯的欠缺。”[4]這是很有前瞻性的建議,可惜到今天也沒有得到充分重視。之后《文學遺產》于2014年推出《加快“數字化”向“數據化”轉變——“大數據”“云計算”理論與古典文學研究》,2015年又推出《大數據時代的古典文學研究——以數據分析、數據挖掘與圖像檢索為中心》,詳細討論“大數據”“云計算”對古代文學研究的助推意義。之后又有人發表《大數據背景下古代文學研究的新策略——以“小李杜”詩詞研究為例》,認為“大數據會給古代文學的研究提供新的方法和視角”。

事實上,早在計算機普及之前,已經有多人通過數據分析的方式研究《紅樓夢》前八十回和后四十回是否為一人所撰的問題,也提出了多種有價值的說法,這充分說明在古代文學研究領域,數據分析法早就得到應用。[5]在文藝學、網絡文學和語言學研究領域,采用大數據推進學術研究,也漸漸成為熱門話題,相關論文有《統計文藝學:大數據時代文學研究的新范式》(周才庶)、《大數據時代網絡文學多維度評價方法及應用》(介晶)、《大數據時代的漢語語言學研究》(詹衛東)等,立足于當今的大數據時代,提出學科研究的新思維和新方法。但令人奇怪的是,檢索中國知網,討論大數據與中國現當代文學研究的論文,至今沒有一篇。經過深度檢索,《文學研究的大數據與小時代》(傅修海)一文涉及到大數據與當代文學研究的關系,但就文章的整體而言,依然談的是大數據與文學研究的一般性問題,并不是專門針對當代文學研究而言的。熟悉學術史的人都很清楚,中國現當代文學研究自新時期以來,就一直處于新思維和新方法的潮頭上,總能率先將西方的各種新潮理論應用到具體的文學史研究和文本分析之中,雖然因此也遭受一些詬病,但總體而言,現當代文學研究的先鋒性是有目共睹的。但當我們進入大數據時代以后,就大數據給本學科研究可能帶來的機遇與挑戰,似乎始終處于不自覺狀態,與相鄰學科相比,明顯落后了。所以今天我們來討論這一問題就顯得十分必要。

二、中國現當代文學研究的“數字化”與“數據化”

“大數據”時代,數據庫建設是基礎,沒有數據庫,就無從談起“大數據”。與中國古代文學相比,現當代文學研究中的數據庫建設明顯滯后。就目前狀況而言,中國現當代文學研究者常用的數據庫主要是綜合庫:google books、中國知網、晚清民國期刊全文數據庫(上海圖書館)、瀚文民國書庫、愛如生民國大報庫、大成老舊報刊數據庫、臺灣學術文獻數據庫等等,這些綜合性數據庫覆蓋很多學科和專業,屬于現當代文學學科的專業數據庫則很少,北京大學出版社開發過可以檢索的《新青年》數據庫,但只能在光盤上使用,沒有上線;重慶師范大學正在建設“大后方文學史料數據庫”,目前尚不能使用。與之相比,古代文學的專題性數據庫則有很多,如《四庫全書》《四部叢刊》《歷代石刻史料匯編》《十通》《國學寶典》《中國基本古籍庫》《古今圖書集成》《龍語瀚堂典籍數據庫》《全唐詩》《全宋詩》等。而在現代文學研究領域,魯迅研究雖為顯學,但至今沒有建成一個像樣的數據庫。所以現當代文學研究者及相關部門,開發建設專題性數據庫,已迫在眉睫。但就目前已有的數據庫而言,特別是現代文學研究者經常使用的“晚清民國期刊全文數據庫”和“瀚文民國書庫”,只是完成了將紙質圖書變成圖像的過程,只能根據作者、題名、來源等要素進行檢索,基本上無法對全文進行統計和檢索,這只是一個數字化的過程,還不能稱為數據化。在這一點上,谷歌圖書的做法很有代表性。“剛開始,谷歌所做的就是數字化文本,每一頁都被掃描然后存入谷歌服務器的一個高分辨率數字圖像文件中。書本上的內容變成了網絡上的數字文本,所以任何地方的任何人都可以方便地進行查閱了。然而,這還是需要用戶要么知道自己要找的內容在哪本書上,要么必須在浩瀚的內容中尋覓自己需要的片段。因為這些數字文本沒有被數據化,所以他們不能通過搜索詞被查找到,也不能被分析。谷歌所擁有的只是一些圖像,這些圖像只有依靠人的閱讀才能轉化為有用的信息。”[1]109-110隨后谷歌使用了能識別數字圖像的光學字符識別軟件來識別文本的字、詞、句和段落,如此一來,書頁的數字化圖像就完全數據化了,其功能和意義得到成倍增長。比如說通過檢索魯迅、郁達夫、郭沫若三個詞在數據庫中出現的頻率在時間上的分布,就可以得到這樣一個對比曲線圖:

這就是“大數據”檢索的結果,如果沒有谷歌的“大數據”,我們很難清晰地看到這三個詞在文獻中出現的頻率變化情況。根據這個圖表,我們可以分析出很多有價值的問題。如魯迅出現的兩個高峰,一個顯然是在1936年前后,因為他的逝世,他的名字頻繁出現在各類文獻中;一次是1980年代思想解放時期。同時通過對比,可以清楚地看出三個人中魯迅出現的頻率是最高的,而三個人出現的高峰似乎有著一致性,其中原因值得深思。

與谷歌將數字化圖書數據化相比,中國大量的數據庫都停留在數字化階段,還沒有完成數據化,這無疑影響了研究的深入和拓展。

三、“大數據”給現當代文學研究帶來的新路徑

依靠專業數據庫或者大數據,現當代文學研究可以拓展出新的路徑,會極大地改觀研究的現狀。“大數據”的特點就是“大而全”,不像過去那樣只能靠抽樣,正如有人指出的那樣:“在大數據和云計算出現之前,自然科學抑或人文社會科學,都主要依賴抽樣數據和局部數據,甚至在無法獲取實證數據時只能依賴假設、經驗理論等去推測。這些基于經驗、理論或抽樣數據的學術研究和理論探討在未來相當長的時間內還將繼續發揮其應有的作用。但是,這種方法所得到的結論,有可能是扭曲的認識或假象,具有一定的局限性。而基于大數據思維和方法分析所得到的結論,在把握問題的實質和分析其發展趨勢方面顯然具有極大的優越性。”[6]“大數據”帶來的最為有效的研究就是通過對詞頻或字頻的統計數據,進行關鍵詞研究。金觀濤和劉青峰撰寫的《觀念史研究:中國現代重要政治術語的形成》一書就是一次成功的嘗試。兩位作者通過“中國近現代思想史專業數據庫(1830—1930)”“《新青年》數據庫”等,統計出了“公理”“國民”“個人”“權利”等關鍵詞的使用頻率,借此理出了一條觀念史的演變軌跡,令人耳目一新。在現當代文學研究領域,我們也可以采用數據統計的方法,查找“啟蒙”“個人”“反帝”“反封建”等重要概念的使用頻率,也可以從中看到中國文學觀念的演變歷程。除了對這些思想性關鍵詞進行統計外,還可以對文學意象,尤其是詩歌意象進行統計,也能看出詩歌審美的變化。莫萊蒂還通過關鍵詞統計的方法,研究過更為復雜的文學史問題。2013年,他出版《資產階級:文學和歷史之間》一書,通過對“有用”“有效”“舒適”“嚴重”“影響”等特定關鍵詞出現頻率的統計分析,來說明資產階級文學的興衰變遷,這已經不是簡單的關鍵詞分析了,而是指向了更為復雜的文學史現象。

莫萊蒂在斯坦福大學的“文學實驗室”還通過對詞語的統計,分析研究黑格爾的悲劇理論,也產生很大影響,其研究方法也值得借鑒。[7]另外,利用“大數據”可以解決的文學問題還有很多。像作家的地域分布、家庭背景、受教育經歷等數據,對我們了解作家的成長與分布很有幫助。就以“文學與生活”的研究而言,如果能拿到書店的銷售記錄、圖書館的借閱記錄以及手機閱讀的相關數據,我們一定能從中分析出當前中國人閱讀的整體狀況,以及文學介入人們日常生活的深度。

就單個作家而言,可以通過詞匯的分類統計分析,了解一個作家在不同時期或不同階段對詞匯的偏愛以及用語習慣等。有時可以借助語言統計,對一些可疑文本進行數據分析,以找到真正的作者。這方面國外有一個成功的案例。《哈利·波特》的作者J.K.羅琳匿名發表了一本小說《布谷鳥的呼喚》。隨后牛津大學的Peter Millican和Duquesne大學的Patrick Juola通過一系列法律語言學的分析方法對比分析了這部小說和羅琳以往的寫作風格,最后推測這部小說非常可能是羅琳的新作。最后羅琳承認此書是她親筆創作。所以每個作家的作品,都帶有自己的印記,就像人的DNA一樣,可以通過細致的檢測,找到這些個人特征,這為一些佚文或有爭議文本的鑒定提供了條件。

“大數據”與“云計算”當前正處于高速發展和迅速普及的狀態,它給人們帶來的震撼及其潛在的價值和作用,目前還沒有被我們充分意識到,所以率先采用“大數據”開展文學研究是適應時代發展的重要步驟。自然,“大數據”也是數據,文學研究需要感情的介入和富有個性的理解、闡釋,通過冷冷的數據對文學進行“科學”的分析,自有其局限。但毫無疑問,“大數據”帶來的新思維與新方法,必將給文學研究帶來一場變革,也可能是一場革命。

[1] [英]維克托·邁爾—舍恩伯格,肯尼斯·庫克耶.大數據時代——生活、工作與思維的大變革[M].盛楊燕、周濤譯.杭州:浙江人民出版社,2013.

[2] 金雯,李繩.“大數據”分析與文學研究[J].中國圖書評論,2014,(4).

[3] 陳曉輝.大數據時代的文學研究方法——基于弗蘭克·莫萊蒂定量分析法的考察[J].文藝理論研究,2016,(2).

[4] 李鐸,王毅.關于古代文獻信息化工程與古典文學研究之間互動關系的對話[J].文學遺產,2005,(1).

[5] 陳大康.文學、數學與電子計算機[J].自然雜志. 1988,(12).

[6] 鄭永曉.加快“數字化”向“數據化”轉變——“大數據”“云計算”理論與古典文學研究[J].文學遺產,2014,(6).

[7] 周才庶.統計文藝學:大數據時代文學研究的新范式[J].文藝理論研究,2016,(5).

StudyforModernandContemporaryChineseLiteraturein“TheBigData”Era

Zhang Quanzhi Han Li

(School of Literature, Chongqing Normal University, Chongqing 401331;Qilu University of Technology, Library, Jinan Shandong 250353, China)

We’re in the era of “Big Data”. “Big Data” is changing our life, and our way of thinking, and the study of literature is entering a new era. According to the present situation, study for classic Chinese literature has achieved great accomplishment in the development and utilization of database, and that is convenient to own these adequate preparations. Comparatively speaking, study for modern and contemporary Chinese literature, to some degree, slow to respond the era of “Big Data”. And there’s no theoretic thinking or preparation on it. However, the change of new thinking way and the new method that were brought about by “Big Data” is irresistible for modern and contemporary Chinese literature, and it will certainly give rise to great change to study this subject.

big data;database;digitization;datamation

I2

A

1673—0429(2017)05—0005—05

[責任編輯:左福生]

猜你喜歡
大數據數據庫時代
數據庫
財經(2017年2期)2017-03-10 14:35:35
e時代
足球周刊(2016年14期)2016-11-02 10:56:23
e時代
足球周刊(2016年15期)2016-11-02 10:55:36
e時代
足球周刊(2016年10期)2016-10-08 10:54:55
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 精品伊人久久大香线蕉网站| 久久国产亚洲欧美日韩精品| 亚洲视屏在线观看| 国产视频a| 99热这里只有精品在线观看| 国产真实乱人视频| 亚洲国产成人麻豆精品| 久久性妇女精品免费| 国产成人亚洲无吗淙合青草| 欧美中文字幕无线码视频| 在线精品视频成人网| 亚洲国产亚综合在线区| 日韩乱码免费一区二区三区| 欧美三级视频在线播放| 亚洲欧洲日韩国产综合在线二区| 国产99免费视频| 国产AV无码专区亚洲精品网站| 99re热精品视频中文字幕不卡| 成人久久精品一区二区三区| 久久永久视频| 色偷偷av男人的天堂不卡| 国产乱子精品一区二区在线观看| 干中文字幕| 亚洲国产天堂在线观看| 91久久大香线蕉| 亚洲综合色区在线播放2019| 在线看片免费人成视久网下载| 99青青青精品视频在线| 亚洲第一精品福利| 毛片基地美国正在播放亚洲| 亚洲国产欧美国产综合久久| 成人欧美日韩| 国产一级毛片网站| 丁香婷婷综合激情| 国产精品浪潮Av| 四虎影视8848永久精品| 亚洲色图欧美在线| 日本黄色不卡视频| 天天激情综合| 日韩午夜片| 中文毛片无遮挡播放免费| 日韩欧美中文| 尤物成AV人片在线观看| 中文无码精品A∨在线观看不卡| 91福利免费视频| 亚洲色图狠狠干| 成人综合在线观看| 国产精品吹潮在线观看中文| 国产一区二区福利| 国产一区二区色淫影院| 天天综合网色| 欧美午夜精品| 伊人网址在线| 日本欧美成人免费| 国产成人免费视频精品一区二区 | 国产在线麻豆波多野结衣| 天天躁日日躁狠狠躁中文字幕| 国产人人射| 69视频国产| 国产精品永久不卡免费视频| 久久a级片| 狠狠五月天中文字幕| 中文字幕无线码一区| 亚洲综合精品香蕉久久网| 呦女精品网站| 亚洲欧美精品一中文字幕| 国产美女免费| 亚洲午夜久久久精品电影院| 亚欧乱色视频网站大全| av在线无码浏览| 亚洲欧美综合在线观看| 久久香蕉国产线看精品| 精品综合久久久久久97| 欧美成人免费午夜全| 国产精品一线天| 精品中文字幕一区在线| 国产永久免费视频m3u8| 日本三级欧美三级| 美女被操黄色视频网站| 色国产视频| 中文字幕av一区二区三区欲色| 免费午夜无码18禁无码影院|