999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

計算民俗學

2017-01-28 05:23:36郭翠瀟
民間文化論壇 2017年6期
關鍵詞:數據庫研究

郭翠瀟

計算民俗學

郭翠瀟

隨著數字時代和網絡時代的到來,全球范圍內民俗數字資源急劇增加,數據量空前龐大,數據類型多樣。社交媒體、自媒體在信息傳播中起到越來越重要的作用。當代民俗學者能接觸到的資料數量之大、獲取方式之便捷是前人無法想象的。

然而,在這樣一個時代,早期的民俗學方法開始遭遇困境:手工制作的索引卡片跟不上數字資源的增長,原有的基于小樣本的民俗學分類和索引不能滿足多樣化和個性化的建檔與檢索需求,傳統的“文本細讀”(close reading)方法無法應對海量資料。民俗學者必須要適應這樣的新環境,掌握新的研究方法,來應對這一巨大變化。

2012年,加州大學洛杉磯分校亞洲語言文化系的蒂莫西?坦蓋利尼(Timothy R. Tangherlini)等學者聯袂發表文章,明確提出“計算民俗學”(computational folkloristics)這一新概念。他們認為計算民俗學是民俗學的子學科,并將其初步定義為“以計算機算法為研究方法的民俗研究屬于計算民俗學”。①James Abello, Peter M Broadwell, and Timothy R. Tangherlini, “Computational Folkloristics,”Communications of the Association for Computing Machinery, 55(7): 60-70, 2012.計算民俗學本質上是方法論的革新,是將信息技術與傳統民俗學研究相結合實現學術創新。其方法論層面涉及民俗研究全過程和民俗檔案的全生命周期:從采集、立檔、存儲、分類、索引、檢索,到呈現、利用、分析解釋乃至分析工具的開發,每一步都可以運用計算機和信息傳播技術來實現。

其實,在“計算民俗學”這一概念提出之前,就已有學者探索利用計算機技術做相關研究。如中國學界熟悉的約翰?邁爾斯?弗里(John Miles Foley)從20世紀70年代初就開始嘗試用計算機技術輔助史詩研究,并成功利用計算機分析《貝奧武甫》的步格和韻律②John Miles Foley, “Formula and Theme in Old English Poetry,” Benjamin A. Stolz and Richard S.Shannon eds., Oral Literature and the Formula. Ann Arbor: Center for Coordination of Ancient and Modern Studies, pp. 207–38, 1976. John Miles Foley, “A Computer Analysis of Metrical Patterns in Beowulf,” Computers and the Humanities, 12: 71-80, 1978. 弗里本人也是口頭傳統研究領域一向堅持以信息傳播技術探討人類表達文化的領軍人物,參見朝戈金:《約翰?弗里與晚近國際口頭傳統研究的走勢》,《西北民族研究》,2013年第2期;巴莫曲布嫫:《約翰?邁爾斯?弗里》,《民間文化論壇》,2016年第1期。。自20世紀80年代以來,芬蘭、美國等發達國家相繼開展了一系列實踐,各地的民俗學研究機構和民俗學者積極進行民俗資料數字化和數字檔案庫建設工作,取得了豐碩的成果,國際間學術交流日趨頻繁①詳情見畢傳龍:《大數據時代民俗文化資源的數字化》,《民族藝術研究》,2016年第3期。。

然而,就術語構詞和方法論而言,“計算民俗學”(computational folkloristics)不同于“數字民俗學”(digital folkloristics)。坦蓋利尼及其合作者的相關文章表明,“計算民俗學”主要側重于運用計算機算法來開展研究性分析,或基于現有數據庫進行研究,或利用更先進的計算機技術改進現有數據庫,而非基礎性數字化和數據庫建設工作。在前期數字化、數據化工作積累的基礎上,民俗學研究正步入“算法時代”。

計算機算法給民俗學研究帶來了新機遇和創新空間,也帶來了新挑戰。面對數字形式的研究對象,坦蓋利尼認為民俗學者應當特別注意四個方面②Timothy R. Tangherlini, “Big Folklore: A Special Issue on Computational Folkloristics”, Journal of American Folklore, 129(511):5-13, 2016. Timothy R. Tangherlini, “The Folklore macroscope:Challenges for a computational folkloristics,” Western Folklore, 72(1): 7–27, 2013.:

搜集和立檔:民俗學者可以不必與人面對面地調查搜集資料,而是可以利用網絡爬蟲技術搜集信息,在更大范圍內做調查研究,但網絡爬蟲抓取到的數據可能會引發隱私侵犯等相關倫理問題。雖然民俗學者更容易獲得大量數據,但過量數據又帶來數據處理的負擔。從資料立檔方面看,前數字化時代的民俗資料,不論從數量上還是從形式上看都較少,易歸檔,而現在數字化的資料數量龐大、格式多樣,但技術更新換代易導致舊有格式數據不易被讀出、異構數據不易整合的問題。此外,提供數字化資料有時會引發復雜的知識產權問題。

分類、索引和檢索:以往的民俗學分類,是基于分類者個人的語言、學識水平和掌握的有限資料而得出的。計算機算法能夠基于民俗語料庫建立相關的統計模型,突破這些局限,助力學者做超越類型、母題之上的研究。民俗檔案庫資料的多模式呈現,可以讓分類方式和檢索方式適應研究者個性化的需求,而不是讓研究者的需求受分類和檢索方法的制約。

可視化和導航:可以運用諸如地理信息系統(GIS)、時間線、統計圖表、社交網絡圖等可視化方式呈現民俗資源。比起傳統的民俗地圖方法,低成本GIS軟件的出現和易用的網絡地圖服務為制作民俗學提供了便利。

計算分析:基于優質數據和數據庫,用計算機技術發現問題、分析問題、解決問題。在傳統民俗學的文本細讀之外,運用文本挖掘分析、可視化等技術實現的“遠讀(distant reading)”為研究者提供了一個宏觀視角。

從實踐層面上看,計算民俗學的學者積極探索,在多個領域均有創新成果。下面選擇具有代表性的項目擇其要略予以分述。

在分類、檢索方面,格雷戈爾?斯特勒(Gregor Strle)和馬蒂亞?馬洛爾特(Matija Marolt) 運用自然語言處理(NLP)方法對斯洛文尼亞民歌中潛在的語義結構進行研究;分析結果表明,適當的算法可以在民歌的主題分布和相似性度量的基礎上生成多維語義空間,從而實現對民歌更細致的類型分析③Gregor Strle and Matija Marolt, “Computational folkloristics: A semantic analysis and visualization of topic distribution of song types,” Glasnik Sed, 54(3) :36-43, 2014.。福爾格特?卡爾斯多普(Folgert Karsdorp)等人開發了湯普森民間文學母題索引(Motif-Index of Folk Literature)的在線搜索引擎——MOMFER,通過使用自然語言處理和信息檢索技術,實現了語義搜索①Folgert Karsdorp, Marten van der Meulen, Theo Meder and Antal van den Bosch, “MOMFER: A Search Engine of Thompson's Motif-Index of Folk Literature,” Folklore, 126(1):37-52, 2015.。特奧?梅德爾(Theo Meder)等人在論文中介紹,荷蘭民間故事數據庫建設過程中,他們使用命名實體(named entity)探測技術,為未標記數據創建人名和地名索引,將元數據信息自動分配給民間故事。這些自動生成的元數據既可以用于地理可視化和社會網絡呈現等各種分析工作,又有助于更好地理解民間故事的類型和母題序列②Theo Meder, Folgert Karsdorp, Dong Nguyen, Mari?t Theune, Dolf Trieschnigg, and Iwe Everhardus Christiaan Muiser, “Automatic Enrichment and Classification of Folktales in the Dutch Folktale Database,” Journal of American Folklore, 129(511):78-96, 2016.。

在可視化呈現方面,丹麥民俗數據庫③http://etkspace.scandinavian.ucla.edu/danishfolklore/, 2017-09-25.是一個優秀案例。該數據庫由加州大學洛杉磯分校基于丹麥民俗學家唐?克里斯滕森(Tang Kristensen)記錄翔實的田野調查資料建成。其特色是將時間、地點(包括故事搜集地點和故事涉及地點)、人物(故事講述者和學者)、故事文本相互連接起來,用可視化互動地圖方式呈現。

在計算分析方面,成果豐富且多樣化。例如坦蓋利尼開發了一種統計方法,基于故事講述者的性別、階級或教育識別某一傳統的主題“趨勢”,并可以在微觀層面進一步探索④Timothy R. Tangherlini, Interpreting Legend: Danish Storytellers and their Repertoires. New York:Routledge, 2005[1994].。馬克?阿蘭?芬雷森(Mark Alan Finlayson)依據普羅普故事形態學理論,從普羅普語料庫中選取15個民間故事,采用人工智能技術學習并導出規則,很好地再現了普羅普的功能項。這表明計算技術對于民俗學研究來講,不只可以處理表層的詞匯和關鍵詞分析,在檢測民間敘事的深層結構方面也能提供很大幫助⑤Mark Alan Finlayson, “Inferring Propp’s Functions from Semantically Annotated Text”, Journal of American Folklore, 129(511):55-77, 2016.。斯科特?魏因加特(Scott Weingart)和珍娜?喬根森(Jeana Jorgensen)探討了是否有可能運用計算分析技術來理解歐洲童話中性別和身體的表征與建構⑥Scott Weingart and Jeana Jorgensen, “Computational Analysis of the Body in European Fairy Tales,”Literary and Linguistic Computing, 2013, pp. 404-416.。凱瑟琳?拉根(Kathleen Ragan)用定量分析的方法研究民間故事講述者性別與民間故事“性別”的關系⑦Kathleen Ragan, “What Happened to the Heroines in Folktales? An Analysis by Gender of a Multicultural Sample of Published Folktales Collected from Storytellers,” Marvels & Tales, 23(2): 227-247, 2009.。拉爾夫?肯納(Ralph Kenna)和帕德里克?麥卡隆(Pádraig MacCarron)用網絡科學方法研究神話史詩,以社會網絡分析的方法呈現了四個著名的歐洲神話史詩的復雜網絡,通過比較人物之間的關系,確定了他們之間的相似性元素⑧Ralph Kenna and Pádraig MacCarron, “A Networks Approach to Mythological Epics”, R. Kenna et al. eds., Maths Meets Myths: Quantitative Approaches to Ancient Narratives, Springer International Publishing Switzerland, 2017.。尤里?別列茲金(Yuri E. Berezkin)通過對美洲民間故事和神話的母題地理分布規律的可視化分析,呈現了美洲移民的分布和遷徙路線。該研究結果與考古數據形成關聯,印證了15000至17000年前早期移民從波尼吉亞遷徙到美洲大陸的假說⑨Yuri E. Berezkin, “Peopling of the New World from Dataon Distributions of Folklore Motifs”, R.Kenna et al. eds., Maths Meets Myths: Quantitative Approaches to Ancient Narratives,Springer,2016.。賈姆希德?德赫拉尼(Jamshid J. Tehrani)和朱利安?于伊(Julien d’Huy)用生物信息學方法研究國際民間故事,通過兩個實例——小紅帽和波呂斐摩斯,展示了如何使用這些方法來識別不同社會和時代的故事之間的同源關系,重建故事演變過程①Jamshid J. Tehrani and Juliend’Huy, “Phylogenetics Meets Folklore: Bioinformatics Approaches to the Study of International Folktales,” R. Kenna et al. eds., Maths Meets Myths: Quantitative Approaches to Ancient Narratives, Springer,2016.。達沃爾?尼古利奇(Davor Nikoli?)和 尼古拉?巴卡里奇(Nikola Bakari?)結合語音學、計算分析和統計方法檢測和區分聲音模式及其對克羅地亞繞口令中音效的影響,并與其它類似的民俗文類進行了比較②Davor Nikoli? and Nikola Bakari?, “What Makes Our Tongues Twist?: Computational Analysis of Croatian Tongue-Twisters,” Journal of American Folklore, 129(511):43-54, 2016.。約翰?勞頓(John Laudun)和喬納森?古德溫(Jonathan Goodwin)用計算機方法描述了美國三種民俗學研究期刊125年間所發表的學術論文的50種主題③John Laudun and Jonathan Goodwin, “Computing Folklore Studies: Mapping over a Century of Scholarly Production through Topics,” Journal of American Folklore, 126 (502):455-475, 2013.。

在分析工具開發方面,坦蓋利尼及其團隊針對丹麥民俗數據庫開發了兩套工具: WitchHunter④Peter M. Broadwell and Timothy R. Tangherlini, “WitchHunter: Tools for the Geo-Semantic Exploration of a Danish Folklore Corpus,” Journal of American Folklore, 129(511):14-42, 2016. http://etkspace.scandinavian.ucla.edu/maps/witchhunter.html, 2017-09-26.可以將故事主題與地理位置之間的關系可視化展示出來,使研究人員能夠在大型民俗語料庫(大于3.5萬個故事)的中發現和探索文本間潛在的地理—語義關系,提煉研究問題;GhostScope⑤Peter M. Broadwell, Timothy R. Tangherlini, “GhostScope: Conceptual Mapping of Supernatural Phenomena in a Large Folklore Corpus,” R. Kenna et al. eds., Maths Meets Myths: Quantitative Approachesto Ancient Narratives, Springer, 2016.則可以將故事講述者置于一個概念性的“中心”,以此為起點測量某一地點相對于他們的方向和距離,從而描述故事講述者對當地環境的概念映射。

就計算民俗學的特點和未來發展方向而言,由以上計算民俗學的代表性研究和案例,可以發現計算民俗學具有如下特點:(1)絕大多數項目由民俗學領域和計算機科學、統計學等領域的學者跨學科合作完成。(2)計算民俗學領域的民俗學者主要來自歐美國家,代表性學者有蒂莫西?坦蓋利尼、約翰?勞頓、特奧?梅德爾、尤里?別列茲金等人。(3)尚無專門刊物,較為集中地討論見《美國民俗學刊》2016年冬季號刊出的“計算民俗學”專輯⑥The Journal of American Folklore. Vol. 129, No. 511, Winter 2016.,以及《當數學見到神話:古代敘事量化研究方法》論文集⑦R. Kenna et al. eds., Maths Meets Myths: Quantitative Approaches to Ancient Narratives, Springer,2016.。(4)優質數據庫是計算民俗學的基礎,民俗學研究過程和民俗資源的生命周期各個階段彼此密切相關。(5)越來越多的民俗資源是音聲、圖像數據,但目前計算民俗學的研究對象仍主要是文本數據。(6)在傳統的“文本細讀”的細致分析之外,補充和拓展了“遠讀”的宏觀視角,將民俗學研究對象放在更大的語境中去研究,同時提倡二者相結合;重視數據與數據之間的多維度、多模態的連接關系。在未來的理想情形下,研究者既可以“遠讀”,宏觀觀察整個研究語料庫,觀察到人、地點、作品之間的復雜互連,又可以用很多民俗學者擅長的“文本細讀”方法來審視,并且能夠在“遠”“近”之間自由移動。(7)計算機算法帶來的突破和自由,反過來迫使民俗學者思考民俗學的一些基本概念,比如當我們說“A故事與B故事相似”時,“相似”到底意味著什么?⑧Timothy R. Tangherlini, “Big Folklore: A Special Issue on Computational Folkloristics,” Journal of American Folklore, 129(511):5-13, 2016.

回觀計算民俗學在中國的譯介和實踐,與民俗學界較為熟知的“數字民俗學”相比,“計算民俗學”還是一個較新的概念。目前有三篇關聯性譯文:(1)德國學者利洛?貝格(Lilo Berg)的《小紅帽2.0版——數字人文學的新發展》①[德]利洛?貝格:《小紅帽2.0版——數字人文學的新發展》,彭牧譯,《民間文化論壇》,2014年第3期。,約翰?勞頓的《故事計數:論計算方法在民間敘事研究中的應用》②[美]約翰?勞頓:《故事計數:論計算方法在民間敘事研究中的應用》,宋穎譯,《民間文化論壇》,2014年第5期。和《計算機民俗學研究:百年學術論文主題地圖繪制》③[美]約翰?洛頓、喬納森?古德溫:《計算機民俗學研究:百年學術論文主題地圖繪制》,喬英斐、李揚譯,《文化遺產》,2016年第5期。。此外,董曉萍的《數字民俗搜集理論》一文對數字時代的民俗資料搜集工作進行了理論思考④董曉萍:《數字民俗搜集理論》,《民間文化論壇》,2014年第5期。。就實證性操演和計算研究而論,吉國秀及其團隊在IT笑話研究中使用了R語言文本挖掘技術⑤吉國秀、胡安亮:《IT笑話:網絡社會中的新民間敘事》,《民俗研究》,2015年第6期;吉國秀、王明月:《信息技術、職業群體與社會變遷:一項基于IT笑話的跨學科研究》,《中國科技論壇》,2016年第2期;吉國秀、王明月、楊宏戟:《信息技術如何進入日常生活:一個知識擴散的視角》,《民俗研究》,2016年第4期。,堪稱計算民俗學在中國的先行實踐案例,值得關注。

綜上所述,計算民俗學在國際上也是一個新興學科,雖起步未久,卻已顯現出廣闊的發展空間。在中國,民間文學、民俗學及少數民族文學的數字化建檔和數據庫建設取得了相應的階段性成果,但計算民俗學的基礎非常薄弱,面臨著諸如民俗資源相關數據庫開放程度不夠、數據質量不高、復合型人才缺乏、跨學科合作不足等現實問題和困境。在大數據時代,這些瓶頸問題尤其是科際整合當引起學界和政府相關部門的重視,相關的理論和方法論討論也亟待展開。

K890

A

1008-7214(2017)06-0124-05

郭翠瀟,中國社會科學院民族文學研究所中國少數民族文學研究資料中心助理研究員。

本文為國家社會科學基金重大項目“中國少數民族口頭傳統專題數據庫建設:口頭傳統元數據標準建設”(編號:16ZDA160)的階段性成果。

丁紅美]

猜你喜歡
數據庫研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 麻豆国产精品一二三在线观看| 一本久道久久综合多人| 国内精品久久人妻无码大片高| 国产亚洲欧美在线中文bt天堂| 国产成人精品一区二区秒拍1o| 精品国产香蕉在线播出| 日本尹人综合香蕉在线观看| 免费观看成人久久网免费观看| 国产综合色在线视频播放线视| 国产国产人免费视频成18| 香港一级毛片免费看| 久久天天躁狠狠躁夜夜2020一| 久久福利片| 欧美在线伊人| 国产成人啪视频一区二区三区| 8090午夜无码专区| 91精品免费久久久| 国内a级毛片| 免费a在线观看播放| 尤物国产在线| 国产精品成人第一区| 成人日韩精品| 91黄视频在线观看| 91在线精品麻豆欧美在线| 国产91高清视频| 国产乱人乱偷精品视频a人人澡| 奇米精品一区二区三区在线观看| 噜噜噜久久| 波多野结衣亚洲一区| 国产微拍一区二区三区四区| 亚洲无码精品在线播放| 国产探花在线视频| 激情爆乳一区二区| 国产精品区视频中文字幕| 国产欧美日韩精品综合在线| 欧美一级99在线观看国产| 成人看片欧美一区二区| 国产精品制服| 伊人精品视频免费在线| 亚洲精品天堂在线观看| 99在线视频网站| 99视频在线观看免费| 国产剧情伊人| 国产乱子伦视频三区| 91视频99| 亚洲国产欧美国产综合久久 | 欧美性久久久久| 97狠狠操| 色婷婷狠狠干| 欧美视频在线不卡| 久久综合久久鬼| 天天色天天综合网| 免费a在线观看播放| 日韩高清成人| 国产美女丝袜高潮| 亚洲欧美成人综合| 久久婷婷六月| 亚洲精品无码不卡在线播放| 重口调教一区二区视频| 呦女亚洲一区精品| 日韩小视频网站hq| 专干老肥熟女视频网站| 国产尤物视频在线| 国产精品福利在线观看无码卡| 国产人人干| 国产精品天干天干在线观看| 九九热视频在线免费观看| 色综合中文综合网| 4虎影视国产在线观看精品| 91人妻在线视频| 日本三级黄在线观看| 亚洲性日韩精品一区二区| 婷婷色中文网| 久久国产热| 国产精品.com| 四虎永久免费在线| 国产成人免费高清AⅤ| 国产成人成人一区二区| 国产精品男人的天堂| 青草视频在线观看国产| 婷婷六月激情综合一区| 久久99精品国产麻豆宅宅|