999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于共詞知識圖譜的人文學科研究熱點可視化的實證研究

2010-04-18 02:12:10秦長江
圖書館理論與實踐 2010年12期
關鍵詞:學科農業研究

●秦長江

(1.南京農業大學 信息科技學院,南京 210000;2.河南科技大學 管理學院,河南 洛陽 471003)

學術論文是學術研究的有形載體,是映射某一學科領域興起、發展、演進、融合及分化態勢過程和規律的一個重要標志。論文的關鍵詞又是論文內容的提示符,是作者學術思想及學術觀點的凝煉,也是文獻計量、科學計量研究的重要指標。[1]

兩個關鍵詞在同一篇文獻中同時出現稱為關鍵詞共現。該方法中聚類和分析的指標是詞(敘詞或關鍵詞),而詞與詞之間的關系代表著概念間的關系,因而聚類處理之后所形成的類能夠比較清晰、簡單、明了地揭示學科或主題的結構與變化。[2]與單純的主題詞統計、排序,進而分析研究熱點的文獻計量方法相比,共詞分析不僅分析高頻詞,更注重這些詞之間的聯系,從而更好地反映了概念之間的關系。更為重要的是,共詞分析法是對當前發表文獻的直接統計,反映的是當前論文所集中關注的主題和趨勢形成之后的焦點,適合尋找知識領域的研究熱點和前沿。因為前沿領域的研究往往人數眾多而不集中,作品較分散,被引用情況不穩定,而關鍵詞卻很好地體現了學科的研究熱點、焦點領域和該領域前沿發展方向。[3]

總之,共詞分析法與共引分析法的功能、結果是一致的,但對國內研究者而言,共詞分析法更有價值的是不需要龐大的引文索引作基礎,免去了國內引文數據庫數據質量不高的障礙,而且應用的范圍更為廣泛,不僅僅包括學術期刊,還可以包括會議錄等其他灰色文獻。[4]隨著計算機技術的發展,共詞分析法在分析學科發展歷史、揭示某一領域研究的發展動態和趨勢、發現新的學科增長點和突破口等方面的作用越來越顯著。

而共詞知識圖譜則是指將可視化技術與共詞分析原理結合,生成具有各種屬性的圖形、圖表或科學地圖,來確定這些代表性詞語之間的概念圖譜或知識網絡結構,通過一系列圖譜詳細地描述某一學科領域的主題和熱點,以揭示知識領域結構、映射知識領域發展趨勢。[5]

1 實驗設計思想

大量的文獻調研表明,國內共詞知識圖譜的研究與國外相比有極大差距,主要表現在3個方面:[6]①研究手段和方法嚴重滯后;②研究層次低;③研究對象范圍過窄。目前國內共詞知識圖譜研究都局限在自然科學、管理科學領域,且大部分都是這些學科某一研究方向的國際化研究,數據都選自國外權威數據庫,還沒有在我國人文學科,特別是文史學科中研究成果的報道。由于人文社會科學研究及其文獻具有自然科學所沒有的特點,因此,構建文史學科的共詞知識圖譜,研究方法更具復雜性和特殊性。比如對于相關朝代和地名的取舍問題,如果也采取共詞知識圖譜通常使用的方法,一開始就將朝代和地名舍去,那么,一是由于文史學科過多的高頻詞都是類似性質的詞,略去過多會影響到研究的準確性;二是會影響區域史和不同時期分區史的研究。然而,如何對待這些高頻關鍵詞,國內外還沒有任何研究報道。因此,本文把研究對象選定為文史特征很強的學科——農業史學科,把知識圖譜方法應用到我國人文學科領域的研究中,從實證角度證明知識圖譜這一科學計量學方法在人文學科中的有效性和存在的問題。這也是國內文獻和科學計量學研究方法的一次有意義的創新嘗試。

本文采用共詞分析法,按照1980—1995、1996—2008兩個階段,對1980—2008年我國農業史學科文獻的關鍵詞進行統計,通過考察這兩個階段關鍵詞之間關聯的強弱來挖掘知識結構之間的親疏,用知識圖譜方法中的類團關系圖來定量地分析兩個時期農史學科集中關注的熱點主題和主題變遷,使結論具有定性、定量的特點,提供了一個觀察學科發展演進過程全景的新視角。

2 數據處理

2.1 篩選和清理數據源

本次實驗共詞數據采用套錄“中國農史論文全文數據庫”(該數據庫是由南京農業大學中華農業文明研究院開發的,主要對現、當代農史研究論文進行數字化加工和整合。共收錄1980—2005年間的農史論文10098篇)的數據,補充錄入2005—2008年數據的方法(補充數據主要采用“中國期刊全文數據庫”中《中國農史》《農業考古》《古今農業》這三大農史期刊2005年至今的所有論文數據),同時再搜索、篩選、補充其他相關期刊中農史論文的數據,將三種方法獲得的數據進行查重、剔除后整合到一起,建立中國農史學科論文關鍵詞共詞數據庫,作為分析的樣本和基礎。所建立的中國農史學科論文關鍵詞共詞數據庫共有文獻數據12247條,1980—1995年有4325條,年平均270條;1996—2008年有7922條,年平均609條。詞表的集合足夠大,進行共詞分析是適合和恰當的。

首先對共詞數據庫的數據進行篩選清理,將非純學術論文和沒有關鍵詞的論文全部剔除后,利用自編的計算機程序,將這些關鍵詞按照它們出現的頻次由高到低排序,得到兩個階段降序排列的關鍵詞總數分別是8472、11631個。按照科學計量學的原理,共詞分析法對高頻詞數量的選擇沒有統一規定,如果選擇的高頻詞過少,則不能如實反映學科結構的構成;如果范圍過大,則將給共詞分析帶來不必要的干擾。目前高頻詞的選擇一般為截取的高頻詞的累積頻次要達到總頻次的40%左右,[7]因此,本文分別截取第一階段詞頻量大于12、第二階段詞頻量大于14的高頻關鍵詞,這樣第一階段詞頻量大于12的關鍵詞共有120個,累積頻次為3054,達到總頻次的36.1%(3054/8472=0.3605);第二階段詞頻量大于14的關鍵詞共有156個,累積頻次為5291,達到總頻次的46.6%(5291/11361=0.4657),將這些關鍵詞作為表現當前中國農史學科研究熱點的標志是合適的。

2.2 合并關鍵詞

鑒于文史學科的特殊性,筆者在數據處理過程中,發現有許多同義和意義相近的關鍵詞匯,如明清時期和明清、江南地區和江南、民國時期和民國、茶葉和茶、先秦時期和先秦、農具和農業工具、栽培史和栽培歷史等等。為統一處理,筆者將所有這樣的兩個詞統一為一個更常用的詞。將所有類似表達同樣內容的詞匯統一規范處理后,再將一些無法表達實際意義的詞如:發展、起源、開發、對策、影響、傳播、現狀、分布等統一刪除,這樣,第一階段詞頻量大于12的120個關鍵詞簡化為86個、第二階段詞頻量大于14的156個關鍵詞簡化為113個,從而分別確定了兩個階段的86個和113個高頻關鍵詞表(限于篇幅,兩個詞表略),作為共詞分析我國農史學科研究熱點的基礎。

2.3 形成原始共詞矩陣和構造相異矩陣

利用自編的計算機程序,統計這些關鍵詞在該共詞數據庫中共同出現的次數,這樣形成了一個86×86和113×113的共詞矩陣(由于篇幅限制,兩個表略)。這樣的共詞矩陣是一個對稱矩陣。因為兩個關鍵詞共現頻次的多少直接受兩個關鍵詞各自詞頻大小的影響。因此,要想真正揭示關鍵詞之間的共現關系,還需引入表示關鍵詞共現相對強度的指標。在文獻計量學中,目前應用較多的就是Ochiia系數和Jaccard指數。[8]本文用Ochiia系數將共詞矩陣轉換成相關矩陣,然后再用“1”與全部相關矩陣上的數據相減,得到表示兩詞間相異程度的相異矩陣(86個高頻關鍵詞的相異矩陣片段見表1,113個高頻關鍵詞的相異矩陣略)。相異矩陣中的數據數值越大,表明關鍵詞之間的距離越遠,相似度越差。[9]

表1 86個高頻關鍵詞共詞相異矩陣(部分)

2.4 構建類團關系圖

利用相關的多元統計方法,進行聚類分析,得到聚類結果樹狀譜系圖。用該圖把這些關鍵詞重新組合起來,關鍵詞之間的親疏關系就表示出來。從而反映出這些關鍵詞所代表的研究熱點和研究主題。[10]類團形成后,通過計算各類目之間的外部鏈接和內部鏈接,得到類團之間和類團內的聯系強度。兩個類團的所有關鍵詞共同出現在同一篇論文中的次數總和就是兩者的“外部鏈接”,內部鏈接指某類團所包含的全部關鍵詞共同出現在同一篇論文中的次數總和。按照鏈接強度繪制成類團關系圖,以反映各類團之間的關系。[11]本文首次在國內利用社會網絡分析軟件pajek繪制出類團關系圖。

3 實驗結果和分析

3.1 實驗整體情況

通過對1980—1995年、1996—2008年兩個階段86、113個高頻詞共詞矩陣的聚類,分別在分類閾值為2.2、2.25水平上得到12個、15個類團,分別包含55個、61個關鍵詞。兩個階段中刪去的詞分別是:表示朝代和地區的關鍵詞、未聚入任何類目的詞、聚成了兩個小類團的詞(如第一階段的農業資料和甲骨文、第二階段的少數民族和畜牧業等,由于每個類團只有2個關鍵詞而被忽略掉)。由此,筆者列出了每階段的聚類結果(由于篇幅限制,兩個階段的樹狀聚類圖略),繪制了類團關系圖等知識圖譜,進行詳細的對比研究。

3.2 主要研究領域及其演變

兩個階段由聚類圖的聚類結果形成的類團關系表見表2。

第一階段有12個類團,根據學科范疇總結為以下6個方面:①農業科技史,有農業生產與工具史、畜牧獸醫史、稻作農業研究、作物栽培史、農田水利史5個類團,居各類團主題內容之首;②農業考古與農業起源研究(有兩個強度大的類團);③農業經濟史研究(有土地制度史和以農業經濟結構為主的研究兩個類團);④農書研究類團;⑤農業文化史研究(即茶文化類團);⑥傳統農業與農業現代化研究類團。

表2 類團關系表

第二階段有15個類團,根據學科范疇總結為以下6個方面:①農業科技史,稻作農業研究、農田水利史依然存在;畜牧獸醫史、作物栽培史消失;農業考古、農業起源與原始農業、農業生產與工具史合并成一個關鍵詞最多、強度最大的一個類團:農業起源與原始農業研究。②農書研究、傳統農業與農業現代化研究、茶文化類團依然保留,變化不大,該階段又有了茶葉生產與貿易史研究類團,說明有關茶的研究內容在擴展。最值得關注的是第二階段中出現的新類團。在這一階段,與農業經濟史(特別是當代農業)研究有關的新類團和農業環境史研究、農業災害史研究類團的出現是最顯著的特征。雖然這些類團關鍵詞不多,類團強度不夠大,但很值得研究。③農業經濟史研究。該階段有4個類團(筆者把當代農業經濟研究也劃入到該領域),即農業經濟史、農業賦役史、三農問題研究、人口與土地利用研究。④農業環境史。本階段有兩個與環境史有關的類團:農業環境史、生態環境保護與新農村建設研究(嚴格來說,人口與土地利用研究類團也與環境史研究相關)。⑤農業災害史。這一階段有一個災害史類團,根據關鍵詞的內容來看,研究范圍包括了幾乎所有的農業自然災害。⑥農業與農村社會發展史。該階段首次有一個類團:農業鄉村社會史研究進入熱點研究領域。

3.3 類團關系圖分析

筆者根據各類團之間的內部聯系強度和其外部鏈接數量,首次在國內用社會網絡分析軟件pajek繪制了兩個階段的類團關系圖(圖1、圖2),形象直觀的研究哪些類團是核心類團、邊緣類團以各類團彼此聯系的強度。

pajek軟件繪制的網絡圖,節點大小代表該類團的內部聯系強度,節點越大,該類團的內部聯系強度越大;連接節點線條的粗細和顏色的深淺代表兩個節點外部鏈接數量和強度,線條越粗,顏色越深表示兩個節點外部鏈接數量和強度越強。

從圖1可以看出,第一階段,“農業生產與工具史”“農業起源與原始農業研究”和“農業考古研究”三個大類團是整個領域的研究重點,它們幾乎與所有的類團都有著或強或弱的聯系。“稻作農業研究”“畜牧獸醫史”“傳統農業與農業現代化研究”“農田水利史研究”“作物栽培史研究”等是次核心類團,其他類團是邊緣類團,相互影響很小。

從圖2可知,第二階段情況發生了很大變化。上階段的兩個大類團合并為一個最大的“農業起源與農業考古研究”核心類團。“三農問題研究”成為第二大核心類團;同時上階段的次核心類團“稻作農業研究”“傳統農業與農業現代化研究”“農田水利史研究”仍然是次核心類團,而“農業經濟史研究”“農業環境史研究”類團成為新的次核心類團,它們與其他類團聯系也較多。其余類團是邊緣類團,相互影響很小。唯一例外的是,“茶文化研究”“茶葉生產與貿易史”類團聯系很強,但與別的類團聯系很少。

圖2 15個類團關系圖

總之,從兩個階段的“稻作農業研究”等次核心類團保持不變;新興的“農業環境史研究”等類團成為新的次核心類團;出現了不少強度更小、范圍更廣的新類團——這三個現象充分說明農業史學科的重要研究領域比較穩定、主要研究熱點比較突出、學術特色依然保持,同時新興研究熱點不斷涌現,研究范圍和內容更加拓展,研究熱點增多和更加分散。

4 小結

特別需要說明的是本文對于相關朝代和地名的取舍。類似性質的高頻詞所占比例非常大,因此如何處理,會極大地影響到研究的準確性和科學性,而國內外還沒有如何處理這些高頻關鍵詞的任何研究報道。因此,筆者采取了4種方法進行試驗:

(1)在降序排列的關鍵詞詞頻分布表排出之后,將這些詞排除,然后再進行相關的后續步驟;

(2)在合并、規范處理關鍵詞后再舍去;

(3)全部詞參與聚類并形成聚類圖后,在形成類團關系表時將它們排除(就是本文的方法);

(4)這些詞全部參與聚類和分析。

經過對比分析,第三種方法效果最好。原因如下:由于學科的特殊性,第一種方法誤差太大,不能如實反映學科研究熱點;第二種方法得到的共詞數量很少,無法進行共詞分析;第四種方法會影響、干擾到類團的命名和分析。因此,雖然第三種方法也有不足,即會影響區域史和分區史的研究,但目前是最理想的方法。

總之,雖然共詞分析法避開了引文數據這一重要影響研究質量的因素,尤其對我國的人文學科更為適用,但仍然存在一定局限性。比如:①由于人文學科的特殊性,關鍵詞的著錄不完全規范,在歸并意義相同的關鍵詞時存在一定的主觀性;②期刊不同發文量造成部分主題關鍵詞過多或過少,干擾部分類團的命名以及使某些類團的密度和向心有些失真等,這些命題仍需要進一步研究。

[1]張勤,馬費成.國內知識管理研究結構探討——以共詞分析為方法 [J].情報學報,2008,27(1):93-101.

[2]鐘偉金,李佳.共詞分析法研究(三)——共詞聚類分析法的原理特點[J].情報雜志,2008(7):118-120.

[3]馮璐,冷伏海.共詞分析方法理論進展[J].中國圖書館學報,2006,32(162):88-92.

[4]周靜怡,孫坦.共詞可視化:以人類基因組領域為例 [J]. 情報學報,2007,26(4):532-537.

[5] Chaomei Chen,Jasna Kuljis.Therisinglandscape:a visual exploration of superstring revolutions in physics[J].Journal of the American society for information scienceand technology, 2003, 54 (5): 435-446.

[6]秦長江.知識圖譜——信息管理與知識管理的新領域[J].大學圖書館學報,2009,27(1):30-37.

[7]張勤,馬費成.國外知識管理研究范式——以共詞分析為方法 [J].管理科學學報,2006,12(6):526-531.

[8]梁立明,謝彩霞.詞頻分析法用于我國納米科技研究動向分析[J].科學學研究,2003,21(3):138-142.

[9] Bauin,Setal.Using bibliometrics in strategic analysis:“understanding chemical reactions” at the CNRS[J].Scientometrics, 1991, 22 (1): 113-137.

[10]劉則淵,尹麗春.國際科學學主題共詞網絡的可視化研究 [J]. 情報學報,2006,25 (5):20-25.

[11]鐘偉金,李佳.共詞分析法研究(二)——類團分析 [J].情報雜志,2008 (6):141-143.

猜你喜歡
學科農業研究
國內農業
今日農業(2022年1期)2022-11-16 21:20:05
國內農業
今日農業(2022年3期)2022-11-16 13:13:50
國內農業
今日農業(2022年2期)2022-11-16 12:29:47
【學科新書導覽】
FMS與YBT相關性的實證研究
擦亮“國”字招牌 發揮農業領跑作用
今日農業(2021年14期)2021-11-25 23:57:29
遼代千人邑研究述論
土木工程學科簡介
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
主站蜘蛛池模板: 欧美日韩动态图| 亚洲中文字幕在线精品一区| 手机精品视频在线观看免费| 91精品最新国内在线播放| 国产视频久久久久| 亚洲一级无毛片无码在线免费视频| A级全黄试看30分钟小视频| 亚洲成AV人手机在线观看网站| 亚洲视频三级| 国产一级小视频| 国产精品亚洲综合久久小说| 日韩欧美国产三级| 91小视频在线观看| 国产精品一区在线观看你懂的| 色哟哟国产精品一区二区| 久久伊人操| 综合人妻久久一区二区精品| 日韩毛片在线播放| 国产综合另类小说色区色噜噜 | 精品国产Ⅴ无码大片在线观看81 | 亚洲天堂免费观看| 伦伦影院精品一区| 久草视频精品| 综合网久久| 国产主播在线一区| 亚洲三级电影在线播放 | 亚洲人成色77777在线观看| 欧美国产综合视频| 人妻精品全国免费视频| 国产精品流白浆在线观看| 国产乱人免费视频| 野花国产精品入口| 亚洲人妖在线| 伊人天堂网| 无码aⅴ精品一区二区三区| 亚洲成人在线免费| 另类综合视频| 美女国产在线| 日韩第九页| 亚洲一区第一页| 92午夜福利影院一区二区三区| 午夜国产精品视频| 国产日本欧美在线观看| 视频一区亚洲| 一本大道无码日韩精品影视| 久青草免费视频| 中国丰满人妻无码束缚啪啪| 久久特级毛片| 激情六月丁香婷婷| 久久久久人妻一区精品| 国产av剧情无码精品色午夜| 久久久久久久久18禁秘| 欧美成人综合视频| 国产在线八区| 国产亚洲精久久久久久久91| 美女啪啪无遮挡| 国产视频入口| 国产三级精品三级在线观看| 亚洲国产AV无码综合原创| 国产精品嫩草影院视频| 日本成人精品视频| 国产精品人成在线播放| 亚洲综合中文字幕国产精品欧美| 国产精品尤物在线| 久久久精品久久久久三级| 中文天堂在线视频| 婷婷色中文| 国产波多野结衣中文在线播放| 日韩国产 在线| 国产系列在线| 一区二区日韩国产精久久| 孕妇高潮太爽了在线观看免费| 制服无码网站| 欧美一区二区啪啪| 亚洲精品午夜无码电影网| 久久久久久久97| 99视频在线看| 久久国产热| 先锋资源久久| 中文字幕2区| 67194成是人免费无码| 天天色天天综合|