999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人文社科領域科學數據使用特征分析
——基于《中國社會科學》樣本論文的實證研究

2015-12-03 05:23:46沈婷婷
大學圖書館學報 2015年3期
關鍵詞:學科科學研究

□沈婷婷

?

人文社科領域科學數據使用特征分析
——基于《中國社會科學》樣本論文的實證研究

□沈婷婷

對《中國社會科學》期刊的論文進行內容分析,探討我國部分人文社會科學學科在科學數據使用上的特征。重點分析研究者獲取實證數據的主要來源,所要分析的數據類型,處理數據的常用方法和工具,以及數據分析完成后的表現形式,并分析一些空泛概念的名詞在人文社科論文中的使用情況。根據數據分析的結果,為圖書館提供科學數據服務給出建議。

人文社會科學 科學數據 使用特征

1 引言

在大數據時代,以科學數據為主要學術資源的數據密集型科學正改變著當前的科學研究模式[1]。人文社會科學領域的研究者已經開始關注科學數據的作用和價值,定量研究也越來越得到重視[2][3]。在一些數據科學的國際會議上,人文社科的數據管理也成為研究者討論的重點之一[4][5]。

各種翔實、可靠的數據為以各種社會對象為研究主體的人文社會科學研究提供支撐,推動了社會調查方法、計量學方法、可視化方法等研究方法的應用和發展。中國管理科學與工程學會理事長李京文院士在2013年管理科學與工程學會年會暨第十一屆中國管理科學與工程論壇上指出,必須不斷研究大數據的形態變化規律,利用大數據來研究、認識和預測客觀世界及人類自身的發展變化趨勢[6]。同時,科學數據也影響著傳統人文社會科學研究方法的轉型與創新。復雜的經濟統計模型、大規模的社會調查、豐富的科研數據處理和分析工具等,都為人文社會科學研究的創新提供了條件。科學數據的使用使得人文社會科學的“科學性”顯著增強[7]。

雖然科學數據推動了人文社會科學的新發展,但是也有學者認為科學數據并未與人文科學結合起來,比如一些學者在從事人文研究時,常使用“絕大多數”等空泛概念的名詞[8]。在數據密集型研究模式的背景下,人文社科領域的研究者對科學數據的使用習慣是怎樣的呢?哪些人文社科學科的研究者更擅長利用數據?他們獲取數據的來源、處理數據的類型和方法以及數據表現形式如何?研究者是不是由于缺乏對科學數據的使用而增加了“絕大多數”等空泛概念名詞的使用呢?

本文圍繞以上問題,對《中國社會科學》期刊的全文論文進行內容分析,探討我國部分人文社會科學學科在科學數據使用上的特征。重點分析研究者獲取實證數據的主要來源,所要分析的數據類型,處理數據的常用方法,以及數據分析完成后的表現形式。另外,針對學者提出“絕大多數”等空泛概念的名詞在人文社科學科中使用的問題,本文將分析研究者在這些名詞使用等方面的習慣。最后,根據人文社科研究者在科學數據使用上的特點,為圖書館提供科學數據服務給出建議。

2 研究方法

本文采用文獻調查法采集論文資料,用內容分析方法統計論文中所用到的數據、中文數詞,分析其中的問題。人文社科數據主要指調查數據、網絡公開數據、政府統計數據和指標等[9],本文研究的數據對象除以上這些外,還包括實驗數據、文獻數據和圖片數據。文中討論的實證研究數據是指狹義實證研究所需要分析的數據。狹義實證研究是指僅依靠統計分析法的研究[10]。另外,本文把“絕大多數”、“差不多”、“若干”、“大量”、“無數”、“少量”等詞語定義為模糊數詞。

本文的數據來源是《中國社會科學》的全文論文。《中國社會科學》是綜合性社會科學期刊,所刊登的論文代表我國人文社會科學領域最新的學術研究成果,也是我國人文社會科學研究的風向標。選用該期刊的全文進行分析,不僅可以了解我國最高水平人文社科學術成果在科學數據使用上的特點,而且也可以了解人文社科不同學科的學者在科學數據處理上所采用的最新方法。筆者于2014年12月通過CNKI數據庫收集該期刊2010年1月至2014年6月的全部期刊論文522篇,剔除其中“編者按”之類的7篇文章后,最終得到全文數據515篇。

3 數據分析

3.1 總體概況

筆者對2010年1月到2014年6月的《中國社會科學》進行分析,共有全文數據515篇,把它們按研究內容分成馬克思主義、哲學、社會學、管理學、人口學、政治學、法學、經濟學、傳播學、語言學、文學、歷史學這12個學科。但由于人口學和傳播學的樣本數都小于5,統計的數據會在一定程度上有所失真,因而本文不統計這兩個學科的數據。

首先對論文的引用數據和實證數據進行分析。除去人口學和傳播學的論文,在剩余的論文中,僅引用數據而未進一步統計分析的論文168篇,占總數的33%,進行實證研究統計分析的論文113篇,占總數的22%。統計發現(見圖1):除了哲學學科的論文沒有引用數據外,其余學科的論文都或多或少地引用了數據。而實證數據主要集中在經濟學、社會學、管理學等幾個學科上,其中社會學和經濟學實證研究的比例分別達到67%和73%。這里政治學的數據值得注意,雖然該學科的論文沒有實證研究的數據,但引用數據的比例卻較高,達到53%,顯示了該學科數據使用的特點。

圖1 各學科使用數據的論文比例

3.2 實證數據情況分析

本節主要對社會學、管理學、法學、經濟學、語言學和歷史學這六個有實證數據的學科進行分析,分別調查其使用數據的類型、來源、處理方法及其表現形式。這里,語言學和歷史學的實證數據由于是小樣本(樣本數小于5),因而需辯證看待這兩個學科的數據。

(1) 數據類型

從使用數據的類型上看,這六個學科使用的數據基本上是數值型數據,經濟學還使用了部分圖片數據(表1)。

表1 各學科使用數據的類型情況

(2) 數據來源

本文根據數據來源把實證數據分為一手數據和二手數據,其中一手數據是指研究者通過訪談、直接觀察、間接觀察等方式首次親自收集并經過加工處理的數據,二手數據是指來源于他人調查和科學實驗的數據[11]。本文中,把一手數據分為調查數據、實驗數據和文獻資料數據;二手數據分為政府公開數據(如全國普查數據、各類統計年鑒)和數據管理機構(如中國社會科學調查中心ISSS等)的數據。

從數據的來源分析,社會學中44%的論文采用的是一手數據,而在經濟學中這一比例只有15%,經濟學更多的是使用政府公開數據等二手數據(圖2)。

在對一、二手數據的進一步分析后,可以看出社會學和法學的一手數據主要來自調查數據,經濟學的一手數據主要來自實驗數據;對于二手數據的來源,管理學、法學和經濟學主要以政府公開數據為主,而社會學稍微偏向于管理機構的數據(表2)。

圖2 六學科一、二手數據使用比例

圖3 六學科數據處理方法比例

學科一手數據二手數據調查數據實驗數據文獻數據政府公開數據管理機構數據社會學87%0%13%42%58%管理學33%33%33%100%0%法學50%17%33%75%25%經濟學33%67%0%81%19%語言學0%50%50%--歷史學0%0%100%--

(3) 處理方法

本文把數據處理方法分為初級方法、中級方法和高級方法。初級方法是指平均數、頻數、方差、標準差等描述性統計方法;中級方法是指回歸分析、參數估計、假設檢驗、相關分析等統計方法;高級方法則是指模型計算等高等數學方法。

從數據處理方法上看,這六個學科的大部分論文都使用了描述性統計方法之類的初級方法,社會學比較注重對回歸分析、相關分析、假設檢驗等中級方法的運用,而經濟學則更擅長運用高等數學方法(圖3)。

圖4 六學科數據表現形式比例

圖5 模糊數詞在部分人文社科論文中的使用比例

(4) 表現形式

本文把數據的表現形式分為統計表、統計圖和特定軟件繪制的圖形這三類。

從數據的表現形式來看,比較常用的是統計表形式,折線圖、柱狀圖和散點圖之類的統計圖在管理學、社會學和法學中的應用也比較廣泛。除此之外,經濟學和語言學還有一些利用特定軟件繪制的圖形(圖4)。

3.3 模糊數詞使用情況分析

本節分析部分人文社科的論文使用“絕大多數”、“差不多”、“若干”、“大量”、“無數”、“少量”、“很多”和“很少”這八個模糊數詞的習慣,以及這些模糊數詞在部分人文社科學科論文中的使用情況。

首先統計以上這八個模糊數詞在一些人文社科學科論文中使用的比例(圖5)。筆者發現社會學、經濟學和文學這三個學科使用到以上八個模糊數詞的論文比例最高。相對來說,哲學的論文中出現這八個模糊數詞的比例稍微小些。

在統計2010年到2014年模糊數詞的篇均使用次數后發現,人文社科的學者在模糊數詞的使用上趨于穩定,各年篇均使用次數基本在2.0到2.5的區間內,除2012年和2013年的數值波動相對較大外,其余各年篇均使用次數的數值趨于2.3(圖6)。

圖6 模糊數詞各年篇均使用次數

隨后統計這八個模糊數詞的總使用次數及其篇均使用次數(圖7)。筆者發現,“大量”這個詞在論文中的總使用次數最多,而且篇均使用次數也最高(達3.14),這說明人文社科的研究者普遍喜歡使用這個詞,使用范圍也比較廣。其次是“很多”這個詞,研究者也比較喜歡使用。而“若干”這個詞,雖然總使用次數不算很大,但其篇均使用次數卻很高,這說明該詞的使用范圍比較集中。同樣的現象也發生在“絕大多數”這個詞上。最后討論一下“差不多”這個詞。雖然,胡適先生提出中國人是“差不多先生”,凡事馬馬虎虎,不求精確,但是這個詞在人文社科領域的學術論文中卻很少使用,其總使用次數和篇均使用次數都是這八個詞中最低的。

圖7 模糊數詞的總使用次數及其篇均使用次數

這八個模糊數詞在部分人社科論文中使用分布情況見表3。表3中“-”表示該詞未在該學科中使用,“√”表示該詞在該學科中有使用,“★”表示該詞不但在該學科中使用,而且其使用的頻率更高,即每一列的三個“★”分別代表使用該詞的論文比例最高的前三個學科。從表3可以看出,管理學的論文對模糊數詞的使用頻率較高,有“差不多”、“若干”、“大量”等六個數詞在其學科論文中高頻率使用,其次是社會學。相比之下,哲學和語言學的論文對模糊數詞的使用頻率相對低一點。

表3 模糊數據在部分人文社科論文中使用分布

4 結果討論

本節依據以上數據分析我國部分人文社會科學學科的學者在科學數據使用上的特點,為圖書館今后開展科學數據服務給出針對性的建議。

4.1 人文社科學科對數據的使用主要由研究對象決定

我們知道,社會學和經濟學是以社會現象或經濟現象為研究對象的學科,是偏向量化的科學。從上一節圖1的數據也可以看出,大多數論文(67%的社會學論文和73%的經濟學論文)都使用了基于數據的實證研究方法。在這些學科里,研究者尊重數據,把數據當作研究的主要素材,通過調查統計和模型計算使數據和學科發展有效結合在一起,推動了新知識和新規律的發現。而且,這些學科研究者的數據意識也比較強,對數據需求也更為迫切,獲取數據和處理數據的能力更強。比如經濟學,這個學科的論文有較高的實證數據使用比例,也非常注重政府公開數據等二手數據的獲取,二手數據的使用率比其他學科的使用率更高(圖2)。這就是由于研究者數據意識強烈,數據需求迫切,從而使他們獲取數據的渠道要比其他學科的研究者更廣。

相比之下,馬克思主義、哲學和文學這些學科是依靠思維邏輯的研究學科,主要是對傳統文獻資料的探討,很少討論實證或經驗現象,因而對實證數據的使用就不是很多,偶爾會引用一些數據,數據來源也只是依靠文獻。這些學科的研究方法仍較為傳統,主要以文獻為主,對數據使用的需求不是很迫切。

科學數據服務作為圖書館的一項創新服務,首先應該明確服務的對象。諸如以上這些人文社科學科,如果圖書館對其全面鋪開科學數據服務,那可能效果就并不是很理想,但如果圖書館首先對社會學和經濟學的研究者提供科學數據服務,為他們提供數據獲取、處理、共享方面的服務,則可能會取得事半功倍的效果。因而,筆者建議,針對人文社科的科學數據管理服務,首先可以把社會學和經濟學的研究者作為主要服務對象,把政治學的研究者作為潛在服務對象,在服務得到一定認可后,逐步向其他學科展開。對于主要服務對象,圖書館可以提供常規的檢索、收集、存儲、分析等數據情報服務和數據技術服務;而對于潛在服務對象,則可先向研究者提供科學數據在該學科中創新應用的情報信息,待研究者對科學數據服務需求提高后,再提供常規數據服務。

4.2 人文社科學科對實證數據的處理以初級方法為主

在人文社科類論文的實證研究中,為了讓讀者了解數據和研究對象的特征,進而更好地了解統計分析結果,研究者根據不同的研究目的和研究對象會選取不同的數據處理方法。人文社科的研究者對數據處理采用的方法以描述性統計等初級方法為主,初級方法在法學、社會學、管理學等學科的實證數據研究中占了較大比例(圖3)。

相對而言,一些實證研究比較多的學科在數據處理方法上則更為多樣。比如社會學和經濟學,這兩個學科的研究者除了掌握描述性統計等初級方法外,對回歸分析、參數估計、假設檢驗、相關分析等一些中級方法也運用自如,而經濟學的研究者使用高等數學方法進行模型計算的能力更為突出,數據的表現形式也多種多樣,除了常用的統計圖表外,還有由各種特定軟件繪制的圖形,這些都顯示出他們優異的數據素養。

人文社科研究者在數據處理方法上的使用,一方面由論文的研究目的和對象決定,另一方面也由研究者的數據素養決定。對于前者,可能超出了圖書館的服務范圍,但要改善研究者的數據素養,圖書館還是可以有所作為的。筆者建議圖書館為研究者提供有針對性的數據處理方面的開放課程等信息,幫助研究者掌握更多關于數據處理的知識。除此之外,也可為研究者提供本學科在數據應用上創新研究的情報信息,讓他們了解本學科最新的數據處理技術,并提供相應的數據分析工具,促進定量研究的深入。同時,圖書館也可以與數學、統計學等院系合作,為研究者提供數據處理方面的專業講座,一方面增強對研究者數據素養的教育,另一方面也可為研究者跨學科合作提供平臺。

4.3 模糊數詞的使用與研究對象和傳統文化有關

模糊數詞的使用在人文社科領域比較常見,并且各學科在使用上并沒有體現出明顯的差異。諸如在社會學和經濟學這些數據使用比較廣泛的學科里,研究者并沒有因為使用了數據而減少對模糊數詞的使用,反而模糊數詞在這兩個學科中的使用要比其他學科更多(圖5),而且各年模糊數詞的篇均使用次數也較穩定,沒有很大波動(圖6)。因而,模糊數詞的使用并不能說明科學數據沒有與人文科學的發展結合起來,這主要還是與研究者的研究對象和受傳統文化影響下的用語習慣有關。

比如“大量”這個詞,該詞使用總量和篇均使用量在這八個模糊數詞中都是最高的,說明人文社科的研究者普遍習慣使用該詞。然而進一步分析顯示,該詞在經濟學中的使用頻率最高。一方面,經濟學論文中存在的各種數量關系需要用“大量”這個詞來表述,另一方面,由于這個詞所代表的數量本身較難考證,再加上力求精確的數據精神缺乏和大概而言的用詞習慣,使得研究者摒棄了數據化表達而使用了這些模糊概念的詞語。

模糊數詞在人文社科領域的使用還是比較廣泛的,這與其研究對象有一定聯系,有些數量關系難以考證,無法精確量化。除此之外,研究者在傳統文化影響下的用詞習慣也是模糊數詞使用廣泛的重要因素之一。筆者建議圖書館在為人文社科學者提供科學數據服務時,要考慮到不同學科研究對象的影響,既要提倡數據文化,又要遵循人文精神。平時要注重收集有學術價值的科學數據,并為研究者提供方便查詢的數據平臺。與此同時,也可以根據研究者的需求,幫助他們收集和統計相關研究所需要的特定數據,以盡量減少模糊數詞的使用。但作為科學數據服務的提供方,圖書館也應尊重原有的人文社科研究方法,使科學數據作為一種補充材料,與現有的人文社科研究結合,相得益彰。

5 結語

隨著大數據時代的到來,大數據分析方法為人文社會科學研究提供了新的研究空間和研究可能[7]。人文社會科學領域也會有越來越多的研究者使用科學數據,同時也引起更多圖書館員關注并研究人文社會科學領域的科學數據管理問題[12][13]。高校圖書館應抓住這一契機,根據研究者不同的數據需求和使用特征,為他們提供更多、更有效的科學數據服務。

當然,本文的研究也有一定的局限性。由于《中國社會科學》是一份綜合性期刊,一些跨學科論文給學科分類帶來了一些困難,不可避免地存在一定偏失。另外,雖然綜合性期刊為研究的廣度提供了有利條件,但同時也給研究的深度帶來困難,無法更詳細、深入地探討。因而,筆者后續將會對某一學科進行深入研究,以更好揭示其數據使用特征。

1 海伊, 坦斯利, 托爾. 第四范式:數據密集型科學發現[M]. 潘教峰, 張曉林等譯.北京: 科學出版社, 2012: 181-187

2 King G. Ensuring the Data-Rich Future of the Social Sciences[J]. Science, 2011, 331: 719-721

3 陳云松, 吳曉剛.“復制性研究”: 社會科學定量分析新趨勢[J].評價與管理, 2012(4): 47

4 A Review of the U. S. Global Change Research program’s Draft Strategic Plan[EB/OL]. [2014-9-22]. http://www.nap.edu/catalog.php?record_id=13330

5 UK e-science All Hands Meeting 2011[EB/OL].[2014-9-22]. http://www.allhands.org.uk/

6 楊怡. 大數據在人文社科領域有廣泛應用前景[N]. 中國社會科學報, 2013-11-6(2)

7 孫建軍. 大數據時代人文社會科學如何發展[N]. 光明日報, 2014-7-7(11)

8 韓晗. 論“大數據”與人文研究的轉向[J]. 晉陽學刊, 2014(3): 22-25

9 The University of Michigan. Data-PASS[EB/OL].[2014-9-14]. http://www.data-pass.org/

10 喬坤, 馬曉蕾. 論案例研究法與實證研究法的結合[J]. 管理案例研究與評論, 2008, 1(1): 62-67

11 Hox J J, Boeije H R. Data Collection, Primary vs. Secondary[J]. Encyclopedia of Social Measurement, 2005(1): 593-599

12 Mooney H. Citing data sources in the social sciences: do authors do it[J]. Learned Publishing, 2011, 24(2): 99-108

13 彭建波. 北美人文社會科學數據管理的實踐及其啟示[J]. 大學圖書館學報, 2013(6): 33-37, 87

The Characteristic of Research Data Application in Humanities and Social Science: An Empirical Study of Publications in Social Science in China

Shen Tingting

This paper analyses the full texts in Social Sciences in China, and discusses research data application characteristic of Humanities and Social Sciences in our country. The focus has been put on the main sources of the empirical data, data types, common methods and tools for processing data, and display forms of the data analyzed. Some vague concepts in the use of Humanities and Social Science’s papers have also been discussed. According to data, the paper then gives library some advices on providing research data services for researchers.

Humanities and Social Sciences; Research Data; Application Characteristic

*本文為教育部人文社會科學研究青年基金項目“數據素養對科學數據管理的影響及對策研究”(項目編號:14YJC870017)的研究成果之一。

上海大學圖書館,上海,200444

2014年11月26日

*通訊作者:沈婷婷,ORCID:0000-0001-8328-3437,shen_tt@shu.edu.cn。

猜你喜歡
學科科學研究
【學科新書導覽】
FMS與YBT相關性的實證研究
遼代千人邑研究述論
土木工程學科簡介
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
科學大爆炸
小小藝術家(2019年6期)2019-06-24 17:39:44
EMA伺服控制系統研究
“超學科”來啦
科學
論新形勢下統一戰線學學科在統戰工作實踐中的創新
主站蜘蛛池模板: 成人国产小视频| 97色婷婷成人综合在线观看| 日本精品影院| 色爽网免费视频| 国产日产欧美精品| 天天做天天爱夜夜爽毛片毛片| 亚洲精品无码久久毛片波多野吉| 欧美区一区| 国产成年无码AⅤ片在线| 丝袜亚洲综合| 国产亚洲一区二区三区在线| 99久久国产综合精品2020| 综合色在线| 精品无码一区二区在线观看| 丁香婷婷久久| 国产人成网线在线播放va| jizz在线观看| 性欧美在线| 她的性爱视频| 国产精品手机在线播放| 日韩精品专区免费无码aⅴ| 色天天综合| 国产91精选在线观看| 人妻无码中文字幕一区二区三区| 亚洲国产精品日韩欧美一区| 蜜芽一区二区国产精品| 国产乱肥老妇精品视频| 国产福利免费在线观看| 五月婷婷精品| 久久亚洲国产最新网站| 在线国产91| 夜夜操国产| 国产成年女人特黄特色毛片免| 天堂网亚洲系列亚洲系列| 亚洲国产精品一区二区高清无码久久| lhav亚洲精品| 热99re99首页精品亚洲五月天| 午夜爽爽视频| 亚洲综合专区| 免费中文字幕一级毛片| 国产导航在线| 免费jjzz在在线播放国产| 亚洲无码视频喷水| 91成人在线免费观看| 国产素人在线| 国产视频入口| 亚洲精品亚洲人成在线| 亚洲欧洲一区二区三区| 18黑白丝水手服自慰喷水网站| 亚洲精品成人片在线播放| 亚洲无限乱码一二三四区| 无码电影在线观看| 欧美激情视频一区| 老司机aⅴ在线精品导航| 亚洲二三区| 999精品视频在线| 91精品情国产情侣高潮对白蜜| 久久国产精品麻豆系列| 久久黄色毛片| 四虎影视库国产精品一区| 一区二区三区国产精品视频| 欧美日韩精品一区二区在线线| 无码久看视频| 亚洲欧美日韩天堂| 99热这里只有精品国产99| 中文成人在线| 亚洲色图另类| 熟妇丰满人妻| 国产精品3p视频| 成人国产精品2021| 国产一线在线| 97久久精品人人做人人爽| 精品国产Ⅴ无码大片在线观看81| 国产成人精品一区二区不卡| 欧美国产日韩另类| 亚洲国产精品一区二区高清无码久久| 在线人成精品免费视频| 国产菊爆视频在线观看| 国产粉嫩粉嫩的18在线播放91| 久久国产免费观看| 亚洲成人在线网| 久久精品国产精品青草app|