999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于水族文獻的計量分析與知識圖譜研究

2019-03-04 08:30:52楊秀璋
現代計算機 2019年1期
關鍵詞:分析文化研究

楊秀璋

(貴州財經大學信息學院,貴陽550025)

0 引言

隨著科學技術迅速發展,學術成果呈爆炸式增長,基于文獻的計量分析可以挖掘出一個研究領域的高影響力期刊和機構,識別出高被引論文的主題、出版社和核心作者;基于知識圖譜的分析可以構建文獻作者的合作關系,挖掘出核心科研群體,并揭示文獻的主題演化趨勢。

水族是一個具有悠久歷史和古樸文化的民族,繁衍生息于貴州、云南、廣西等省份,擁有獨特的民族文化、風土人情和語言文字[1],具有重要社會歷史文化價值。近年來,學術界和社會媒體掀起了研究水族文化和水書的熱潮,1953 年至今,中國知網共收錄水族相關文獻990 余篇,涉及水族文化、水族體育、水族醫學、水族音樂、水書文字等主題。水族文獻作為水族文化和知識交流的重要載體,是水族相關的學術研究團隊或科研工作者貢獻的重大成果。這些學術成果將有效地推動水族學科和領域的發展,為進一步追蹤水族源流、研究水族文化變遷、保護和傳承水族文化提供相關啟示。

傳統的學術成果研究方法是基于文獻計量學和科學計量學的方法,分析內容包括文獻的主題、地域分布、機構分布、核心作者、引文特點等。姜春林通過文獻計量歷時法對《科學學研究》做出全面的計量分析[2]。梁永霞等基于CSSCI 的中國引文分析進行了可視化研究,展現引文分析領域的知識結構關系[3]。黃曉斌等統計分析我國情報學高被引論文,展示情報學的發展歷程和學科主題[4]。蔡文伯等通過計量分析方法研究我國民族教育文獻態勢[5]。王宗水等基于1998-2014 年中國社會科學引文數據分析社會網絡范式的演化、發展與應用[6]。徐庶睿等利用引文內容進行主題級學科交叉類型分析[7]。近年來,國內外學者致力于通過數據分析與機器學習技術來研究學術文獻,基于社交網絡和知識圖譜的引文分析技術也被用來輔助科研工作者和管理者把握學科發展脈絡,挖掘主題關鍵詞和核心作者。羅雙玲等提出了基于半積累引文網絡社區發現的學科領域主題演化分析方法,并應用于“合作演化”領域[8]。馬文博等通過文獻計量方法和知識圖譜分析《經濟研究》近十年載文[9]。任曉松等歸納研究中國碳排放熱點演化與知識圖譜分析[10]。

當前水族領域的研究更多的是采用傳統的查閱資料、現場考察及問卷調查等方法分析水族文化、歷史、習俗、水書內容,沒有采用計量分析方法和知識圖譜來研究水族文獻,缺乏對水族文化深層次的主題演化和科研群體發現的研究。針對這些不足,本文提出了一種基于計量分析和知識圖譜的水族文獻分析方法,一方面統計分析水族文獻的高影響力期刊、報紙及機構的基本情況,挖掘水族領域高被引論文、發文熱點時間及核心作者;另一方面通過知識圖譜構建水族領域核心科研群體及作者間的合作關系,并揭示出水族文獻的主題演化趨勢。本文的研究成果具有重要的理論意義和實用價值,對傳承與弘揚水族傳統文化具有重要意義,為水族文化的研究和進一步發展提供相關啟示,為后續的水族引文分析、水族遷徙研究和水族文化傳承提供有效支撐。

1 研究方法和數據采集

1.1 算法總體流程

當前科研成果的分析研究已經引起了社會和學術界的廣泛關注和重視,所涉及的領域包括引文分析、論文自動分類、主題挖掘、學術成果測度、論文知識圖譜構建等。本文主要是關于水族文獻的計量分析和知識圖譜研究,算法的總體流程如圖1 所示。

圖1 水族文獻計量分析和知識圖譜研究流程圖

(1)調用Python、Selenium 和XPath 技術自動抓取中國知網水族領域的文獻共990 篇。

(2)對所抓取的論文信息進行數據預處理,包括數據清洗、數值提取、中文分詞、停用詞過濾等處理,這是數據分析的重要處理環節。

(3)將預處理之后的文本數據轉換為特征詞矩陣,涉及特征提取和權重計算。

(4)通過計量分析和知識圖譜方法研究水族文獻,包括水族高影響力論文、知識圖譜挖掘核心作者及科研群體、水族文獻主題挖掘及演化趨勢等。

1.2 數據說明及預處理

本文數據集采用Python 自定義爬蟲抓取中國知網CNKI 水族領域相關的學術成果信息,包括1953-2018年共收錄的990 篇水族領域的學術文獻,其中學術期刊論文662 篇,會議論文106 篇,博士論文7 篇,碩士論文91 篇,中國專利5 篇,科技成果3 個,報紙116篇,詳細信息如表1 所示。所抓取的水族文獻共包括九個字段,如圖2 所示,包括文章標題、出版社、文獻類型、出版年份、下載次數、引用次數、作者、摘要和關鍵詞。

表1 中國知網水族領域的學術成果匯總表

圖2 水族文獻數據集部分數據

在進行數據分析之前,通常需要對所爬取的信息進行預處理操作,包括缺失值填充、異常值處理、數據清洗、中文分詞、停用詞過濾等步驟,其目標是為了得到高標準、高質量的數據,從而提升分析的結果。接著從六個方面分析水族文獻,包括水族文獻的高影響力期刊報紙及機構計量分析、高被引水族論文計量分析、水族文獻的時間跨度分析、高引論文的核心作者分析、核心作者知識圖譜分析及科研群體發現、水族文獻主題挖掘及演化趨勢。

2 水族文獻分析及研究

2.1 高影響力期刊、報紙及機構計量分析

本文將分析水族文獻的高影響力期刊、報紙及機構,所采用的指標是刊載成果數量、總引用數量、總下載數量、篇均引用數量和篇均下載數量。

(1)引文期刊分析

對水族學術期刊論文的計量分析,可以從宏觀層面揭示出刊載期刊及研究群體的力量分布情況,也在一定程度上挖掘出高影響力的期刊,它們對水族文化研究做出了重要的貢獻。表2 列出了刊載水族論文六篇及以上的所有期刊,其中《黔南民族師范學院學報》刊載論文數量最多,共刊載45 次;《貴州民族研究》總引用次數最多,42 篇論文共被引用203 次;《人類學學報》篇均引用數量最高,刊載10 篇論文,平均每篇論文被引用16.40 次。

表2 刊載六篇及以上水族論文的期刊

(2)引文機構分析

引文機構分析主要研究來自全國各大高校、各類研究所和圖書館等機構的水族文獻。本文根據畢業論文的第一單位進行統計分析,得出了如表3 所示的計量分析結果。發表水族領域相關論文兩篇及以上的機構共16 個,其中刊載水族論文數量排名前三位的分別是:貴州民族大學(共刊載16 篇)、貴州師范大學(共刊載8 篇)、貴州大學(共刊載8 篇);論文被引用最多的四個機構是:貴州民族大學(共被引用32 次)、貴州師范大學(共被引用24 次)、云南大學(共被引用19 次)、昆明理工大學(共被引用19 次);論文被下載最多的三個機構是:云南大學(共被下載4193 次)、貴州民族大學(共被下載3715 次)、中央民族大學(共被下載2793次)。

該結果表明大學是水族領域研究機構的中堅力量,這些大學主要分布于貴州、云南、廣西等省份,這些省份也是水族的聚居區;同時民族類和師范類大學也對水族文化有重要的貢獻,如貴州民族大學、中央民族大學、華東師范大學、廣西民族大學等。

表3 刊載水族論文兩篇及以上的機構

(3)引文報紙分析

報紙作為學術成果的組成部分,同樣對水族文化和水族傳承具有一定的貢獻,它能讓社會大眾接觸到水族文化內涵、水書藝術和遷徙漂泊的歷史。

圖3 是報道水族領域相關的報紙計量分析結果圖,橫坐標為報紙的名稱,縱坐標從上至下依次為成果總數、下載總數和被引用總數。其中《貴州民族報》報道的水族領域文章數量、下載次數和被引用次數都是最多,分別為發表45 篇、被下載633 次和被引用2 次;接下來是《黔南日報》報道了20 篇,《貴州日報》報道了19 篇,《中國民族報》報道了9 篇。

圖3 各類報紙關于水族領域文獻的計量分析圖

2.2 高被引水族論文計量分析

論文被引用頻次越高,說明論文的學術價值越高。本文研究的990 篇水族學術成果共被引用2124次,平均每篇學術成果被引用2.15 次。被引用次數最多的文獻類型是學術期刊和碩士/博士論文,其中學術期刊662 篇共被引用了1869 次,碩士/博士論文98 篇共被引用了242 次,二者共占總被引用次數的99.4%。

表4 是被引頻次前10 位的學術論文,全部10 篇高引論文的被引頻次都是20 次以上,是所有水族文獻篇均被引用次數(2.15 次)的10 倍。其中被引頻次最高的論文是李培春等在1994 年發表在《人類學學報》上的“水族的體質特征研究”一文,被引頻次為82 次;排名第二的是蘇和平所作,2004 年發表在《貴州民族研究》上的“水族審美意識探源”,被引頻次為48 次;隨后是孫志國等于2011 年發表在《貴州民族學院學報(哲學社會科學版)》上的“水族非物質文化遺產保護的探討”,顧曉艷等于2006 年發表在《中國體育科技》上的“傳統體育文化在水族山寨中的生存狀態——水族‘端節’賽馬活動的變遷”,兩者被引頻次均為38 次。

表5 是被引頻次前10 位的碩士/博士畢業論文,這10 篇高引論文總計被引120 次,平均每篇論文的被引頻次為12 次。其中被引頻次前三位的分別是:陜西師范大學陳永娥的“黔南本土文化語文校本課程資源開發的研究”,被引用23 次;云南大學尤偉瓊的“云南民族識別研究”,被引用18 次;上海師范大學韋學純的“水語描寫研究”,被引用14 次。這10 篇論文主要分布于民族類、師范類、人文社科專業較強以及西南水族聚居區所在的高校,一定程度上反映了這類大學對我國民族文化研究的影響程度。

表4 水族領域被引用頻次最高的10 篇期刊論文

表5 水族領域被引用頻次最高的10 篇期碩士/博士論文

2.3 水族文獻的時間跨度分析

時間跨度分析展示了學術成果的擴散過程,有效地反映出水族領域的研究進程及主題演化趨勢。圖4是所有水族相關學術成果的年度分布圖,最早一篇論文發表在1953 年,是凌慰民老師發表在《中國金融》的“少數民族地區的農貸工作不能違反民族政策”,作者深入彝、水、苗、侗等族聚居的農村,研究貸放工作與民族政策的關聯;第二篇論文是12 年之后,發表在《中國民族》的“水族人民破舊立新過‘端節’”,接著是1979年王連和老師的文章“西南地區少數民族天象歷法調查報告”。1991 年是水族論文量產的一年,共發表了32 篇;2004 年至2017 年水族領域的學術成果越來越多,其中2016 年發表的81 篇學術成果為歷史最高。

表6 是水族文獻2001 年至2017 年被引用次數的分布情況。從表中可以看出,2001 年至2017 年被引用過的水族文獻共397 篇,占總水族文獻數量的40.1%,被引用文獻的總頻次為1748 次。其中被引用10 次及以上的文獻共45 篇,被引用5 至9 次的文獻共64 篇,被引用2 至4 次的文獻共151 篇,僅被引用1 次的文獻共137 篇。同時,2012 年被引用過的水族文獻最高,共45 篇;2006 年被引用的總頻次最高,為277 次,其中10篇文章被引用頻次10 次以上,為高被引論文;2004 年單篇均被引用頻次最高,平均每篇論文被引用10.69 次。

圖4 水族文獻1953-2018年的學術成果數量分布圖

表6 水族文獻2001-2017 年被引用次數分布表

2.4 高引論文的核心作者分析

水族領域的核心作者是對水族研究發展具有較大貢獻的科研工作者,同時也是期刊學術影響力、競爭力的重要貢獻者,他們影響著水族文化的繁衍與發展。本文主要采用發文量、被引頻次、篇均被引頻次三個指標評估核心作者。該方法從論文的量和質兩方面來確定核心作者,表7 水族文獻核心作者統計表,共包括了40 位核心作者。其中余躍生發表了水族相關的文章23 篇,被引頻次為174 次,篇均被引頻次為7.57 次;顧曉艷發表了水族文獻16 篇,被引頻次為176 次,篇均被引頻次11 次;趙凌發表了水族領域的論文14 篇,被引頻次為25 次,篇均被引頻次1.79 次。

表7 水族文獻高被引用頻次的核心作者

2.5 核心作者知識圖譜分析及科研群體發現

知識圖譜分析主要是對1953-2018 年刊發在中國知網的所有水族文獻作者之間的關系進行分析,挖掘出水族科研核心作者以及對水族文化作出重要貢獻的科研群體。其步驟如下:

(1)首先計算水族學術成果作者的共現矩陣,當兩名作者合作完成一篇學術成果時,則認為共現并構建一條相關聯的邊,否則沒有。

(2)接著采用Gephi 構建核心作者的知識圖譜如圖5 所示,圖中圓圈代表發文作者,圓圈越大發文量越多,反之越少;連線代表作者間的共現關系。

圖5 所對應的關系圖譜共構建了497 個核心作者和1095 條關系,它將經常合作的科研群體聚集在一起,形成了以余躍生、顧曉艷、趙凌、潘朝霖、何燕、吳昌學、劉世彬、單可人等學者為核心的學術研究團體。同時,圖5 過濾了關系較為簡單的群體,例如碩士論文或博士論文中學生與導師的關系,這些兩兩關系對水族文獻群體發現貢獻較少。

圖5 水族文獻發文作者共現知識圖譜

圖6 是通過知識圖譜分析發現的水族文獻核心科研群體,這些科研群體對應核心成員、科研主體機構及單位、主要研究方向和代表學術成果如表8 所示。其中以余躍生為首的團隊以水族基因、水族醫學、遺傳學方向為主;以顧曉艷和王亞瓊為首的團隊主要研究水族體育、水族文化傳承;以何燕為首的團隊研究方向是水族醫學、水族基因、心血管疾病;以趙凌為首的團隊主要研究水族音樂和水族樂器;以潘朝霖老師為首的團隊主要研究水書、水族圖騰、水族祝詞;以張振江為首的團隊以水族村落、水族祖靈和民族語言為主。這些團隊主要來自于黔南民族醫學高等專科學校、黔南民族師范學院、貴陽醫學院、黔南民族師范學院、貴州民族大學、中山大學等機構。

2.6 水族文獻主題挖掘及演化趨勢

本文采用LDA 模型對水族文獻主題進行深層次挖掘,得到了水族文獻五大主題對應的關鍵詞,如表9所示。其中,水族文化主題是關于水族民俗、文化變遷、農耕文化、水族圖騰、水書文字、特色旅游的文獻。水族體育主要以傳統民族活動為主,典型的包括水族舞蹈、賽馬、吞口舞、水族武術、棋類活動等。水族音樂是用于祭祀、節慶、喪葬儀式的少數民族音樂,在水族傳統的卯節、端節、敬霞節通過樂器銅鼓、大皮鼓演奏古歌、酒歌等。水族醫學是針對水族聚居群體的研究,具有代表性的包括水族本土人群的遺傳性狀、基因頻率、血型、民族族源、地中海貧血等研究。水書主要用來記載水族民俗、天文、地理、文化、婚喪嫁娶等信息,于2006 年被列為國家級非物質文化遺產。但是很多水族文獻顯示了這些特有的傳統水族文化有逐步消退的趨勢,保護水族文化刻不容緩。

圖6 水族文獻核心科研群體

表8 水族文獻核心科研群體表

圖7 展示了1953 年以來水族文獻的主題演化趨勢,包括1953-1995 年、1996-2000 年、2001-2005 年、2006-2010 年、2011-2015 年、2016-2018 年中不同年份的水族文獻所研究的熱點主題關鍵詞。從圖7 可以發現,1953-1995 年主要研究水族基因、遺傳醫學、水書等主題;1996-2000 年主要研究水族文化、服飾、傳統節日等主題;2001-2005 年主要研究水族文化、水族醫藥、民族旅游等主題;2006-2010 年主要研究水族文化、水書、水族體育等主題;2011-2015 年主要研究水族文化、水族傳承、貴州發展等主題;2016-2018 年主要研究水族文化、民俗保護、水族體育、水書和醫學等主題。

表9 LDA 模型識別水族文獻主題關鍵詞

圖7 水族文獻不同年份的主題關鍵詞演化趨勢

3 研究結論

本文采用計量分析方法和知識圖譜方法研究中國知網的水族文獻,涉及1953-2018 年共990 篇水族領域的學術成果。研究成果如下:

(1)通過對水族文獻的高影響力期刊、報紙及機構計量分析發現:①民族類和人文社科類的期刊對水族文化研究做出了重要的貢獻,如《黔南民族師范學院學報》《貴州民族研究》《人類學學報》等。②大學是水族領域研究機構的中堅力量,這些大學主要分布于貴州、云南、廣西等省份,這些省份也是水族的聚居區;同時民族類和師范類大學也對水族文化有重要的貢獻,如貴州民族大學、中央民族大學、華東師范大學等。③報紙是學術成果的重要組成部分,對水族文化和水族傳承具有一定的貢獻,它能讓社會大眾接觸到水族文化內涵、水書藝術和遷徙漂泊的歷史,具有代表性的包括《貴州民族報》《黔南日報》《中國民族報》。

(2)高被引論文期刊和機構主要分布于民族類、師范類、人文社科專業較強以及西南水族聚居區所在的高校。被引頻次前10 位的學術論文的被引頻次都是20次以上,是所有水族文獻篇均被引用次數(2.15 次)的10倍,這些作者是水族文化研究的核心力量,這一定程度上反映出高校對我國民族文化研究的影響程度。

(3)通過水族文獻時間跨度分析展示了水族文獻研究的進程和不同年份的文獻分布情況。最早一篇論文發表在1953 年,是凌慰民老師發表在《中國金融》的“少數民族地區的農貸工作不能違反民族政策”。被引用10次及以上的文獻共45 篇,被引用5 至9 次的文獻共64篇,被引用2 至4 次的文獻共151 篇,僅被引用1 次的文獻共137 篇。2012 年被引用過的水族文獻最高,共45 篇;2006 年被引用的總頻次最高,為277 次,其中10篇文章被引用頻次10 次以上,為高被引論文;2004 年單篇均被引用頻次最高,平均每篇論文被引用10.69 次。

(4)高引論文的核心作者分析采用發文量、被引頻次、篇均被引頻次三個指標評估核心作者,并挖掘出40位核心作者,其中余躍生發表了水族相關的文章23篇,被引頻次為174 次,篇均被引頻次為7.57 次;顧曉艷發表了水族文獻16 篇,被引頻次為176 次,篇均被引頻次11 次;趙凌發表了水族領域的論文14 篇,被引頻次為25 次,篇均被引頻次1.79 次。

(5)通過知識圖譜構建了水族文獻作者之間的合作關系,挖掘出水族文獻的核心科研群體,形成了以余躍生、顧曉艷、趙凌、潘朝霖、何燕、吳昌學、劉世彬、單可人等學者為核心的學術研究團體。其中以余躍生為首的團隊以水族基因、水族醫學、遺傳學方向為主;以顧曉艷和王亞瓊為首的團隊主要研究水族體育、水族文化傳承;以何燕為首的團隊研究方向是水族醫學、水族基因、心血管疾病;以趙凌為首的團隊主要研究水族音樂和水族樂器;以潘朝霖老師為首的團隊主要研究水書、水族圖騰、水族祝詞;以張振江為首的團隊以水族村落、水族祖靈和民族語言為主。這些團隊主要來自于黔南民族醫學高等專科學校、黔南民族師范學院、貴陽醫學院、黔南民族師范學院、貴州民族大學、中山大學等機構。

(6)通過LDA 模型識別出水族文獻的五大主題(水族文化、水族體育、水族音樂、水族醫學和水書文字)及關鍵詞,并采用詞云展示了1953 年以來水族文獻的主題演化趨勢,包括1953-1995 年、1996-2000 年、2001-2005 年、2006-2010 年、2011-2015 年、2016-2018 年中不同年份的水族文獻所研究的熱點主題關鍵詞。

總之,本文的研究成果具有重要的理論意義和實用價值。該結果展示了我國水族文獻的發展歷程、高引論文、核心科研群體的研究熱點,指出了水族領域高被引論文的主要特征及影響,識別出水族文化、體育、音樂、醫學和水書五大主題的關鍵詞及歷年的主題演化趨勢,對傳承與弘揚水族傳統文化具有重要意義,為水族文化的研究和進一步發展提供相關啟示,為后續的水族引文分析、水族遷徙研究和水族文化傳承提供有效支撐。

猜你喜歡
分析文化研究
FMS與YBT相關性的實證研究
以文化人 自然生成
年味里的“虎文化”
金橋(2022年2期)2022-03-02 05:42:50
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
誰遠誰近?
電力系統及其自動化發展趨勢分析
主站蜘蛛池模板: 欧美成人免费一区在线播放| 婷婷激情亚洲| 欧美在线免费| 国产91特黄特色A级毛片| 72种姿势欧美久久久大黄蕉| 中文字幕久久亚洲一区| 麻豆国产精品视频| 国产福利影院在线观看| 国产成人精品日本亚洲| 亚洲综合日韩精品| 欧美啪啪网| 午夜啪啪福利| 中文字幕久久亚洲一区| 四虎永久在线精品国产免费 | 久久国产成人精品国产成人亚洲| 久久综合五月婷婷| 国产一二三区视频| 男人的天堂久久精品激情| 国产亚洲欧美日韩在线观看一区二区| 极品性荡少妇一区二区色欲| 九九热精品视频在线| 亚洲AⅤ综合在线欧美一区 | 亚洲第一综合天堂另类专| 99草精品视频| 99热免费在线| 就去色综合| 欧美不卡视频在线| 成人国产一区二区三区| 免费在线色| 91在线一9|永久视频在线| 免费无遮挡AV| 国产性爱网站| 99精品高清在线播放| 婷婷色婷婷| 99一级毛片| 国产欧美日韩一区二区视频在线| 伊人久久大香线蕉aⅴ色| 亚洲成年人片| 精品三级网站| 久久久精品无码一区二区三区| 91精品国产一区自在线拍| 97在线公开视频| 五月丁香伊人啪啪手机免费观看| 一本久道久久综合多人| 欧美综合区自拍亚洲综合绿色| 91精品日韩人妻无码久久| 欧美午夜网站| 久久黄色一级片| 丁香亚洲综合五月天婷婷| 精品五夜婷香蕉国产线看观看| 亚洲福利网址| 亚洲色无码专线精品观看| 日本免费精品| 日韩一级二级三级| 久久国产精品无码hdav| 白浆视频在线观看| 国产综合亚洲欧洲区精品无码| 欧美国产成人在线| 99久久性生片| 久久综合五月| 欧美亚洲中文精品三区| 在线国产91| 国产精品免费久久久久影院无码| 日韩在线播放中文字幕| 国产成人AV大片大片在线播放 | 亚洲制服中文字幕一区二区| 99在线视频网站| 无码'专区第一页| 中文字幕伦视频| 亚洲美女一级毛片| 婷婷色丁香综合激情| 久久久亚洲色| 福利在线不卡一区| 日韩毛片免费视频| 免费播放毛片| 57pao国产成视频免费播放| 日韩专区欧美| 青草精品视频| 亚洲激情99| 2022国产无码在线| 又粗又硬又大又爽免费视频播放| 欧美成在线视频|