李博聞,章成志
(南京理工大學經(jīng)濟管理學院信息管理系,南京 210094)
20世紀80年代,我國進入改革開放和社會主義現(xiàn)代化建設(shè)新時期,在“科技工作要圍繞經(jīng)濟建設(shè)這個中心”的宏觀氛圍與信息技術(shù)蓬勃發(fā)展的雙重作用下,我國情報實踐在廣度和深度上都得到了極大的發(fā)展,逐步走出科技情報的狹小天地,向社會各種情報滲透。豐富的情報實踐與貧困的情報理論間矛盾日益凸顯,落后的理論愈來愈難以概括日益豐富多彩而又錯綜復雜的情報實踐[1]。情報學界運用系統(tǒng)科學的觀點和方法,對情報理論與實踐中出現(xiàn)的社會化、系統(tǒng)化、網(wǎng)絡(luò)化、綜合化和國際化等發(fā)展趨勢和普遍聯(lián)系進行高度概括和總結(jié)[2],并于1987年首次提出“大情報觀”。在隨后十余年的批判與辯護中,“大情報觀”不斷被重新發(fā)現(xiàn)與闡釋,歷史功績得以肯定,時代價值得以彰顯。隨著“信息、情報之爭”愈演愈烈,2000年后“大情報觀”逐漸淡出學界視野。
近年來,世界正經(jīng)歷百年未有之大變局,我國進入中華民族偉大復興的關(guān)鍵時期。與此同時,大數(shù)據(jù)、人工智能正推動數(shù)據(jù)密集型科研范式的變革。在這個快速變革和發(fā)展、機遇與挑戰(zhàn)共存的新時代,隨著國家安全觀的提出以及《中華人民共和國國家情報法》(以下簡稱《情報法》)的頒布,情報學研究的內(nèi)涵與外延進一步得到深化和拓展,“大情報觀”也隨之重新進入研究者們的視野。學者們承繼前人爭鳴的思想資源,從情報學研究失衡、情報工作偏差入手[3],再思“大情報觀”[4],重釋“大情報”內(nèi)涵,并建構(gòu)新形勢下情報學崛起路徑[5]與情報工作突破對策[6],進而重塑契合時代特征的“大情報觀”。就“大情報觀重述”現(xiàn)象,存在如下兩個問題。
問題1:如果說,20世紀“大情報觀”的形成與確立是情報學理論“修補”前夜必要的思想準備和行動指南;那么時隔30載,在趨同大背景環(huán)境下,應當如何厘清“大情報觀”回歸與重塑表象下內(nèi)蘊的生成邏輯?
研究方法是學術(shù)研究的基礎(chǔ)與支撐,然而在科學哲學語境中,研究方法并非單純“主體認識客體的手段或工具”[7],誠如先賢們“任何一門科學的真正完善在于數(shù)學工具的廣泛應用”“有無專門的科學方法是衡量一門學科是否成熟的基本標志之一”“混合方法研究是當今社會學方法的新趨勢和方法論研究的新取向”等論述,研究方法及其使用被賦予了復雜的學理內(nèi)涵與實踐指向。學術(shù)文獻中的研究方法使用情況和使用水平,直接反映了學科領(lǐng)域內(nèi)學者們的實踐經(jīng)驗,又客觀地展現(xiàn)了集體智慧。
問題2:能否通過方法這一處學理高地來俯視學術(shù)研究歷史,置身于時間洪流與方法沉浮中,透過對一個較長時期情報學領(lǐng)域?qū)W術(shù)文獻的爬梳和細讀,細粒度地還原研究方法的使用風貌、回溯方法發(fā)展歷程,立足于情報學研究方法演進探析情報學群體方法素養(yǎng)與其成因,進而解答問題1?
20世紀80年代以來,對學術(shù)文獻所使用的研究方法展開量化調(diào)查研究,不僅是情報學者們的自覺行為,也是一種優(yōu)良的學術(shù)傳統(tǒng)。截至2020年9月,情報學領(lǐng)域(含“圖書情報”視角,下同)研究方法調(diào)查研究主要成果如圖1所示。
圖1中的塊體“長”表示某項調(diào)查研究中樣本文獻的時間跨度;在期刊論文欄目中,塊體“寬”表示調(diào)查刊物的數(shù)量;顏色深淺表征相關(guān)研究中研究方法編碼框架粒度,即該研究中編碼框架所囊括研究方法總數(shù),最淺色數(shù)量小于等于20類,最深色為大于40類。

圖1 情報學領(lǐng)域研究方法使用調(diào)查主要成果匯總
這類研究始于1987年周曉英[8]對《情報學報》等3種刊物所刊載文獻的抽樣調(diào)查。20世紀末,研究方法使用調(diào)查研究日趨成熟,白崇遠[9]的課題中,樣本文獻跨度長達11載,已具備揭示研究方法使用規(guī)律的能力。2010年后,調(diào)查研究呈現(xiàn)出一種新的態(tài)勢,研究者為增加揭示能力,不斷提高研究方法標注粒度。其中,孫鴻飛等[10]率先引入計算機輔助方法,極大地拓寬了此類研究的調(diào)查范,提升了標注粒度。
如表1所示,相關(guān)研究在樣本文獻時間跨度、編碼框架方面各不相同,學者們遴選研究對象卻均具有代表性,能夠大致反映特定歷史時期內(nèi)情報學領(lǐng)域中研究方法的使用樣貌。

表1 相關(guān)研究概況
立足于不同樣本、不同編碼框架的眾多計量結(jié)果間存在“異質(zhì)性”,無法歸一化處理,但仍可借鑒“元分析”思想,對宏觀結(jié)論進行再統(tǒng)計。本節(jié)運用內(nèi)容分析法對上述相關(guān)研究中結(jié)論部分展開內(nèi)容分析、標注和匯總主要論點。如圖2所示,其中右側(cè)數(shù)值表征“研究支持度”。例如,有2篇調(diào)查范圍覆蓋1985年的相關(guān)研究,均指出調(diào)查階段存在“研究方法使用多元化趨勢”,則圖2中1985年相應坐標的支持度數(shù)值為2。
如圖2所示,在情報學領(lǐng)域40年歷程中,研究方法使用方面呈現(xiàn)出4個主要特征:研究方法多元化趨勢;定量方法比例攀升/定性方法比例減少趨勢;跨世紀后,混合研究方法使用比例逐漸增加趨勢;研究方法使用失范、方法名詞術(shù)語混亂現(xiàn)象則長期存在。同時,可觀察到早期文獻計量學方法突顯,2000年后,計算機相關(guān)方法、實驗法等增勢顯著。

圖2 情報學領(lǐng)域方法使用情況的"元分析"結(jié)論
研究方法相關(guān)實證研究的揭示能力很大程度上取決于研究方法標注粒度。人工標注“是一件十分復雜的事情”[12],細粒度標注代價高昂。學者通常結(jié)合研究目標,靈活設(shè)置研究方法編碼框架。由于相關(guān)研究目標旨在宏觀視角揭示學科領(lǐng)域內(nèi)研究方法的使用情況、發(fā)現(xiàn)研究方法使用方面的問題與不足、評價學科發(fā)展狀況、探索研究方法演化規(guī)律和演進趨勢等,因此,學者采用多種途徑平衡標注粒度與揭示能力。如孫鴻飛等[10]將學術(shù)文獻中題目、關(guān)鍵詞與摘要中沒有體現(xiàn)任何研究方法的文獻剔除掉,15935篇留存5866篇;司莉等[19]將個別使用量較少的研究方法(如扎根理論等)歸為“其他類”,并且“其他類”占比約3%;王芳等[12]將占比約50%的“計算機信息技術(shù)相關(guān)方法”設(shè)置為一級類目。盡管上述“取舍”“破立”降低了研究揭示能力,但確保了研究可操作性或者凸顯了研究目標。
方法標注主要有人工標注和機器標注兩種途徑。人工標注方法基于內(nèi)容分析法,具備領(lǐng)域知識的標注者接受培訓后,隨后根據(jù)編碼框架展開標注,最后進行一致性檢驗。人工標注方法優(yōu)勢在于具備較高的準確性、標注過程中允許靈活優(yōu)化預定義的編碼框架,同時,標注過程往往可以啟發(fā)研究者,但成本高昂。機器標注則是將標注任務(wù)視作自然語言處理領(lǐng)域中的分類任務(wù)或序列標注任務(wù)。肖連杰等[24]以安全領(lǐng)域文獻為數(shù)據(jù)來源,利用BiL‐STM-CRF模型進行情報分析方法命名實體識別,準確率、召回率、F1值分別達到84.71%、79.25%、81.83%。章成志等[25]以《情報學報》近10年論文全文為依據(jù),比較8種研究方法命名實體自動抽取模型,其中Char-CRF-BiLSTM(single)模型的實體識別任務(wù)綜合性能最優(yōu),準確率、召回率、F1值分別達到66.93%、63.98%、65.42%。王昊等[26]以我國近20年來情報學領(lǐng)域相關(guān)文獻20000篇左右,運用Bi-LSTM-CRFs進行大規(guī)模語料訓練與測試,通過實驗探究各變量對模型效果的影響。章成志等[27]以情報學領(lǐng)域820篇學術(shù)論文全文為研究對象,在專家標注的基礎(chǔ)上,訓練6種不同分類模型,實驗結(jié)果表明,CC-NB(Classifier Chain-Na?ve Beyesian)模型在基于全文內(nèi)容的研究方法分類任務(wù)中性能最優(yōu),準確率、召回率、F1值分別達到64.9%、77.4%、70.6%。
現(xiàn)階段,基于機器標注方法的使用調(diào)查研究,其科學性還存在進一步改善的空間。
一方面,半自動標注方法、機器標注方法(基于序列標注)科學性基于兩個“樸素”的基本假設(shè)。基本假設(shè)1:研究方法在學術(shù)論文中的出現(xiàn),是“樸素的”。即其出現(xiàn)作為“研究方法”而非“研究對象”或其他;被正確、真實的使用而非誤用或提及、引用;術(shù)語使用符合學術(shù)規(guī)范。基本假設(shè)2:研究方法世界中,研究方法間在形式概念、研究貢獻上關(guān)系是“樸素的”。
現(xiàn)實場景中,上述假設(shè)難以成立。第一,“一組具有科學功能的行為手段”在不同研究中的身份是多樣的。例如,對于某一聚類方法而言,其在研究熱點發(fā)現(xiàn)相關(guān)研究中或以“研究方法”出現(xiàn),在算法改進的實驗研究中或作為“研究對象”出現(xiàn),而在信息系統(tǒng)設(shè)計與實現(xiàn)研究中可能僅為一個次要“技術(shù)要素”出現(xiàn)。第二,研究方法世界里,研究方法間相互獨立又彼此緊密聯(lián)系,在形式概念上存在一系列復雜關(guān)系。以方法間的層次性為例,由“一組手段”構(gòu)成的扎根理論方法包括了必要的數(shù)據(jù)收集方法等,兩者地位并不平等。第三,研究方法的貢獻程度難以度量,甚至有些研究方法的“方法身份”并不牢靠,例如,描述統(tǒng)計分析方法在1980年文獻中具有方法意義,2020年文獻里通常不會被認定為研究方法。
另一方面,機器標注方法(分類)依賴大規(guī)模標注數(shù)據(jù)集。由于學術(shù)文獻中混合方法比例日益提升(多分類問題),學術(shù)研究中研究方法使用并不均衡(樣本不均衡問題)。同時,缺乏公開可用的大規(guī)模標注數(shù)據(jù)集,該方法還有較大的提升空間。
本研究的目標是通過準確、細粒度揭示“大情報觀”淡出學界關(guān)注視野后(2000—2019)我國情報學領(lǐng)域研究方法使用風貌,回溯方法的發(fā)展歷程,探析情報學群體方法素養(yǎng)及其成因、方法相關(guān)共同記憶,進而探究“大情報觀重述”的真實成因。
首先,確定調(diào)查范圍、調(diào)查對象與時間跨度,并收集數(shù)據(jù)。情報學和圖書館學兩者歷史上交叉、關(guān)聯(lián)乃至趨同的關(guān)系是毋庸置疑的,本研究調(diào)查范圍為“情報、圖書情報”視角下相關(guān)學術(shù)文獻。在前文相關(guān)研究中,《情報學報》《中國圖書館學報》分別被選為研究對象的次數(shù)為10次、5次,兩者良好的代表性已獲得學者們的認可。結(jié)合最后一篇聚焦第一次“大情報觀”研究發(fā)表于2000年的情況,本研究以《情報學報》《中國圖書館學報》2000—2019年刊登的所有學術(shù)論文為基礎(chǔ)數(shù)據(jù),利用中國知網(wǎng)、萬方數(shù)據(jù)獲取所有全文數(shù)據(jù)。其次,開展預標注。選用《情報學報》2009—2018年1349篇學術(shù)文獻通過閱讀全文開展預標注,兩名作者與另外一名圖書情報領(lǐng)域教授共同使用扎根理論、專家法構(gòu)建“研究方法編碼表”、《標注方法》《標注細則》。再次,正式標注。運用內(nèi)容分析法對《情報學報》《中國圖書館學報》2000—2019年所有學術(shù)文獻進行編碼。隨后,展開兩輪檢驗。第一輪,比照標注結(jié)果與以往研究結(jié)論,初步檢驗可靠性;第二輪,邀請5名情報學碩士志愿者檢驗編碼的一致性。最后,探究問題1。
由于學術(shù)文獻中的研究方法使用失范、名詞術(shù)語混亂現(xiàn)象長期存在[28],人工標注工作本身就是一項極其復雜的工作。制訂“標注方法”旨在規(guī)范標注行為、平衡人工標注工作量與揭示能力、保障本研究科學性和可重復性。“標注方法”摘要如表2所示。

表2 本研究“標注方法”摘要
以標注方法中“原則6:作者可錯”為例,學術(shù)文獻中關(guān)于方法使用的文字闡述,不能簡單作為標注依據(jù),因具有“可錯性”,可錯事件類型如表3所示。

表3 本研究標注方法示例:“原則6:作者可錯”
例如,在“1.借鑒”類型中,作者在文中陳述使用A研究方法,但實質(zhì)上僅是借鑒研究方法A的思想,并非真實使用。正如本研究前文中所借鑒的“元分析”思想,這種情況需要通過通讀原文獲取真實方法。
編碼是保證內(nèi)容分析法得出的研究結(jié)果的關(guān)鍵。本文研究的問題對編碼提出了新的要求。如圖3所示,編碼表包括數(shù)據(jù)收集方法、數(shù)據(jù)分析方法、收集分析一體方法、綜述類文章4個一級類目。

圖3 研究方法編碼表
本研究采取了細粒度標注、解構(gòu)、消解“其他”三重策略,編碼表在細枝末節(jié)處得到充分伸展。相較傳統(tǒng)標注方式,細粒度標注可以捕捉隱含的方法使用轉(zhuǎn)型現(xiàn)象;解構(gòu)“思維方法”等,則填補以往研究中被忽視盲區(qū)的同時,把握到學術(shù)文獻背后關(guān)涉研究方法的學者觀點與主張;消解“其他”,則關(guān)注到那些樣本稀少,往往被列為“其他”的小眾研究方法。
(1)細粒度標注策略。以方法為最小編碼單位幾乎成為研究方法使用調(diào)查研究中一種主流傾向。這一習以為常的思維定勢阻礙了調(diào)查揭示力度。粗糙、表層的標注方式遮蔽與忽視學術(shù)文獻蘊涵方法使用方面的特點。圍繞研究問題,本研究以細粒度標注辦法捕捉隱含的研究方法現(xiàn)代化轉(zhuǎn)型現(xiàn)象,以揭示情報學領(lǐng)域研究方法使用水平的演進脈絡(luò)。以“在科學研究活動中具有特殊地位”的實驗法為例。本研究依據(jù)實驗法應用過程是否包含“對照/比較”環(huán)節(jié),分別標注A5.1實驗法(1)、A5.2實驗法(2),不同方法類型可以大體反映研究主題,例如,只有聚焦算法、模型研究才能嚴格開展對照實驗。
(2)解構(gòu)策略。以“思維方法”為例,情報學者廣泛運用分解與組合、分析與綜合、抽象與具體、歸納與演繹、類比和假說等思維方法進行問題發(fā)掘、理解現(xiàn)象與事件、闡述觀點與成果[29]。學者通過基于思維方法的學術(shù)文獻傳播話語的背后,通常暗含著學術(shù)觀點與學術(shù)主張。把握情報學歷史上的傳播話語,特別是厘定各種話語背后或隱或顯的目的,能夠充分把握情報學歷史上學術(shù)方法流變的總體特征。然而,基于思維方法的學術(shù)文獻難以細粒度標注,一方面,由于任何科學研究都不是單一思維活動形式的產(chǎn)物[7];另一方面,通過學術(shù)文獻本身,把握研究者思維活動全貌極為困難。本研究顛覆思維從功能維度出發(fā)的分類方法,圍繞研究問題重建基于話語目的的分類方法,并將思維方法解構(gòu)如下。A8.1闡述法(1):闡述政策與對策、學術(shù)理論、學科建設(shè)、事業(yè)經(jīng)驗、新現(xiàn)象等;A8.2闡述法(2):闡述具體信息系統(tǒng)、數(shù)字資源等建設(shè)成果;A8.3闡述法(3):以引進為目的,闡述學科外部的成熟新方法、新技術(shù),不含實證環(huán)節(jié);A8.4闡述法(4):以創(chuàng)新為目的,闡述尚處在構(gòu)想階段的一種創(chuàng)新,但不含實證環(huán)節(jié)。
(3)消解“其他”策略。部分研究方法由于樣本稀少,缺乏統(tǒng)計學意義,通常在研究中被歸并為“其他”。其中,不乏如“今日社會科學中最有影響的研究范式”——扎根理論[30]、“一種更科學和客觀的綜述方法”——系統(tǒng)綜述[31]等使用難度大、高水平的研究方法。“其他”是眾多研究者易于忽視的部分,合理地處理“其他”對于更好地把握情報學在學科交叉加劇、跨界融合興盛的時代,吸收其他學科養(yǎng)分“為我所用”的水平。本研究消解“其他”這一研究盲點,在保留高水平研究方法獨立標簽的同時,對一些在情報學研究方法舞臺上有淡出趨勢的研究方法,如RFM(recency,frequency,monetary)分析、灰色關(guān)聯(lián)分析、DEA(data envelopment analysis)分析等,溯其來源,并以來源學科視角出發(fā)進行歸并。
具有可操作性的實施細則,是本研究具備科學可重復性的重要前提。在預標注階段、踏勘過程中,考察得出一系列的執(zhí)行困境:研究方法名詞術(shù)語使用不統(tǒng)一、衍生子技術(shù)名詞術(shù)語眾多、文獻包含未明確指出但又真實存在“具有科學功能的行為手段”、方法使用上的復雜層次性關(guān)系。本研究為使標注更加嚴密、便于操作,在預標注經(jīng)驗教訓總結(jié)基礎(chǔ)上,參考相關(guān)研究做法,進而制訂標注細則。以C3訪談法為例,其標注細則如表4所示。
如表4所示。若一篇文獻使用了“焦點小組”時,則需要歸并,標注C3訪談法。若一篇文章使用了與專家的“采訪記錄”作為研究數(shù)據(jù),則標注C3訪談法。若使用B3扎根理論方法,則該研究中的訪談法不標注。歸并衍生子項、認定必要行為手段、簡化方法間層次關(guān)系,從而使本研究標注行為在科學化、精細化和規(guī)范化的軌道上更進一步。
在研究方法編碼表和標注方法指引下,通過閱讀全文并依據(jù)標注細則,對利用CNKI(China Na‐tional Knowledge Infrastructure)、萬方數(shù)據(jù)庫獲取的《情報學報》《中國圖書館學報》于2000—2019年所有刊登文獻全文閱讀并開展標注。在標注過程中,排除所有非學術(shù)類文獻,包括但不限于通知、書評、新聞、公告、講話通稿、卷首語、會議紀要與學會報告、人物志等。為保證標注的一致性,同時,排除偶見的英文輯刊、“選摘文”(學術(shù)文獻被期刊方壓縮為1頁進行發(fā)表)、創(chuàng)刊紀念賀詞賀文(以學術(shù)文獻形式呈現(xiàn))等,最終實際標注學術(shù)文獻4612篇。
標注完成后,進行歸一化操作:視每一篇文獻中方法數(shù)為“1”單位,若一篇學術(shù)文獻包含n種研究方法,則每個研究方法計為1/n。隨后,以年份為橫軸,研究方法`使用比例為縱軸,利用Micro‐soft Excel構(gòu)成百分比面積堆積圖,如圖4所示。
在上文中,本研究借鑒“元分析”思想,匯總以往研究成果,得出3項趨勢特征。通過比較以往研究結(jié)論,初步驗證本研究標注結(jié)果的可靠性,利用標注結(jié)果得到圖5。
圖5a中,2000年17種標簽被使用,2018年編碼表中全部54種標簽被使用,該趨勢與“研究方法多元化”結(jié)論一致。需要指出的是,編碼細則中含“歸并操作”。例如,需求曲線分析、成本曲線分析、價值鏈分析、RFM分析等十余種分析方法被歸并為O10經(jīng)濟學方法。因此,實際的多元化趨勢遠超圖5a所示。
圖5b中,由A8.1闡述法(1)~A8.4闡述法(4)構(gòu)成的“思維方法”,從2000年近七成走低至2020年約兩成。由A5實驗法(其他)與A5實驗法(對照)構(gòu)成的“實驗法”呈現(xiàn)出相反的態(tài)勢。圖5中呈現(xiàn)趨勢與“定量方法比例攀升”結(jié)論一致。
圖5c中,每篇文獻平均標簽使用數(shù)量所呈現(xiàn)走勢,與“多方法使用比例逐漸增加”結(jié)論一致。實際的多方法趨勢遠超圖5c所示,除含歸并操作外,一方面,大量“未獲得學術(shù)界認可的準研究方法”被排除。例如,文獻計量研究中利用“檢索式”收集數(shù)據(jù)。另一方面,由于借鑒“去停用詞”思想,標注方法限制“高頻基本方法”標注。例如,A9.1描述統(tǒng)計分析僅在作為“文獻中思維方法外的唯一方法”時被使用。
本研究邀請5名情報學碩士研究生開展一致性檢驗工作。首先,標注者接受編碼表、編碼方法、編碼細則培訓。其次,隨機抽選文獻100篇,標注者利用一周時間,在線上協(xié)商基礎(chǔ)上開展標注。遇分歧時,標注者組內(nèi)討論,無法統(tǒng)一,則投票決定。最后,將集體標注結(jié)果與作者標注結(jié)果進行比較,分類為:完全一致、部分一致和完全不一致。利用加權(quán)Kappa檢驗,得Kappa值為0.901,雙方標注結(jié)果具有較強的一致性。
學術(shù)論文是反映科學研究成果的重要載體,學術(shù)論文的質(zhì)量和數(shù)量能夠反映學科的發(fā)展水平[32]。學術(shù)論文中,研究方法使用情況既直接展現(xiàn)學科領(lǐng)域內(nèi)學者們的實踐經(jīng)驗,又客觀地體現(xiàn)集體智慧。本節(jié)從研究方法演進視角出發(fā),在調(diào)查結(jié)果的基礎(chǔ)上,呈現(xiàn)情報學群體研究方法實踐經(jīng)驗、探析情報學群體智慧。
定性方法,是指憑借研究者經(jīng)驗、敏感性等從事物內(nèi)在規(guī)定性來研究事物,通常以普遍承認的公理、一套演繹邏輯和大量的歷史事實為基礎(chǔ),依據(jù)事物的本質(zhì)屬性描述,闡述所研究的事物[33]。學者利用分解與組合、分析與綜合、抽象與具體、歸納與演繹、類比和假說等思維方法進行問題發(fā)掘、理解現(xiàn)象,如圖6所示,A8.1~A8.4思維方法在圖6中占據(jù)主要比例。

圖6 “思維方法”分布情況示意圖
20世紀80年代,在“科技工作要圍繞經(jīng)濟建設(shè)這個中心”的宏觀氛圍,以及信息技術(shù)、互聯(lián)網(wǎng)技術(shù)等蓬勃發(fā)展的雙重作用下,我國情報實踐在廣度和深度上均得到了極大發(fā)展,日益豐富的情報實踐與貧困的情報理論之間的矛盾日益凸顯。落后的理論愈來愈難以概括日益豐富多彩而又錯綜復雜的情報實踐。研究范疇擴大的同時,本身并無堅實理論基礎(chǔ)的情報學進入理論研究“混沌期”[34]。“大情報觀”的提出、“情報改信息”政策的發(fā)布,引發(fā)學界大討論的同時,激發(fā)了人們從哲學高度探索情報概念和功能的理論思考[35]。大量學者運用思維方法參與到學科方法論、核心概念、學科教育與發(fā)展等基礎(chǔ)性問題的探討之中,2000年A8.1比約為50%。在這場學理訓練中,學者們的理論素養(yǎng)得到了提升,學理研究氛圍得以營構(gòu)。在定量研究持續(xù)煥發(fā)活力的大背景下,學理研究氛圍得以延續(xù)至今,并保持穩(wěn)定在10%~15%。
學理研究氛圍對創(chuàng)造新學理成果有著重要意義,過剩則會導致“學理生產(chǎn)力”溢出。曾有學者回顧,“情報”定義的相關(guān)闡述就有191種[36]。在標注過程中,發(fā)現(xiàn)2001—2007年思維方法活躍期間,關(guān)于分支科學的理論開新就有18種之多,如信息倫理學、信息經(jīng)濟學等。
A5.1實驗法(1)是指對照實驗或比較實驗,即在實驗環(huán)節(jié)中設(shè)置對照組,或使用不同研究范式,通過比較進一步驗證構(gòu)想可行性。例如,不同算法、模型間性能的對照實驗;自動化推薦結(jié)論與問卷調(diào)查結(jié)論間的比較實驗。
由于情報活動是一種社會活動,影響情報活動的因素繽紛復雜,畢竟有別于實驗室環(huán)境[37],情報實驗更多地采用“準實驗”形式。例如,學者基于“不同專利間,若相似度越高,則專利權(quán)人之間合作可能性越高”的假設(shè),運用相似度自動發(fā)現(xiàn)500強企業(yè)潛在的商業(yè)合作伙伴,該構(gòu)想既不能嚴格控制無關(guān)變量,又難以比較其他研究范式結(jié)論。A5實驗法(2)即代表這類以驗證可行性為目的實證研究。
21世紀初,計算機科學與信息科學大發(fā)展,由于其包含數(shù)據(jù)庫、搜索引擎、數(shù)據(jù)挖掘等一系列與情報學研究關(guān)系密切的技術(shù)和方法,模型、算法的對照實驗研究率先進入情報學,研究成果在情報學刊物中所占比例越來越大,以至于“讓人懷疑拿到的是一本計算機專業(yè)刊物”[38]。如圖7所示,這種形勢的逐漸轉(zhuǎn)變發(fā)生在2008—2010年,一方面,得益于良好的學理研究氛圍,學科內(nèi)部對這種“泛化、虛化、異化”問題展開了充分討論;另一方面,學者們積累足夠?qū)嶒灧椒ㄟ\用經(jīng)驗,度過了實驗法“橫向上沒有展開、縱向上沒有深入”[39]的低水平移植期。2008年以后,立足于情報問題的準實驗、比較實驗迅速增加。最近十年,實驗法已經(jīng)成為情報學的核心方法之一,約占方法使用總量的40%,兩種實驗類型大致相等。

圖7 實驗法分布情況
在自然科學領(lǐng)域語境中,實驗方法被視為知識再生產(chǎn)的重要來源,很多情況下,實驗法甚至可以和“科學研究”畫上等號,作為科學研究的一種普遍方法,科學工作者對實驗法的推崇是毋庸置疑的,情報學領(lǐng)域也不例外。在經(jīng)過實驗法洗禮后,事實上,培養(yǎng)了情報學領(lǐng)域?qū)W者們的科學精神,逐漸摒棄僅靠經(jīng)驗直覺和純粹思辨認識世界的精神傳統(tǒng),認知方法邁向以精密的數(shù)學分析和實驗方法相結(jié)合的路徑[40],這種新觀念也促使了其他傳統(tǒng)研究范式向規(guī)范化和實證化轉(zhuǎn)向。
移植法是指將某個領(lǐng)域內(nèi)的原理、技術(shù)、方法、結(jié)構(gòu)、材料等,引用到另一個領(lǐng)域內(nèi)進行研究的方法[41]。移植法并非具體某種主體認識客體的具體手段或工具,而是一種“為我所用”的吸納精神。葉繼元[42]曾定義研究方法創(chuàng)新的三種類型:移植創(chuàng)新、原始創(chuàng)新和集成創(chuàng)新。移植實踐是創(chuàng)新精神存在的肯定和確證。
在本研究中,A8.3闡述法(3)可以視作專門的移植實踐:學者引進為目,運用思維方法專門闡述學科外部的成熟新方法和新技術(shù),不含實證。
20世紀80年代,研究者就發(fā)現(xiàn)其他學科很多成熟研究方法稍加移植就可以從新角度撩開撲朔迷離的情報學帷幕,移植運動隨之拉開序幕。如圖8所示,21世紀初,專門移植實踐的占比約為5%,在學理大討論期間,占比一度達到10%。隨著以實驗法為代表的實證研究,嚴密性和實踐性得到學者們的青睞與認可。實證研究在2008—2010年逐步獲得正統(tǒng)地位。包含A8.3闡述法(3)在內(nèi),基于思維方法的傳統(tǒng)研究范式,由于被指不能滿足現(xiàn)代科學標準的要求,其空間被實證研究擠占。盡管專門的移植實踐退出了歷史舞臺,但是情報學領(lǐng)域內(nèi)的“創(chuàng)新精神”事實上是加強的,止步于定性闡述階段的移植實踐已被淘汰,移植必須接受實證的檢驗,盲目移植現(xiàn)象得到抑制。

圖8 情報學移植實踐的轉(zhuǎn)型
長期的移植實踐傳統(tǒng)、移植實踐范式轉(zhuǎn)型,加之情報學固有的“耳目”定位,情報學者眼觀六路、耳聽八方、為我所用的素養(yǎng)不斷提升。例如,美國谷歌公司2018年年底發(fā)布了BERT模型,不足一年,利用BERT模型解決情報問題的多項研究見刊。漫長移植實踐史,也促使情報學呈現(xiàn)出方法觀念上的開放性與包容性,情報學本身的學科橫斷性特質(zhì)[43]得以舒展。
新方法新技術(shù)層出不窮的大背景下,研究方法世界呈現(xiàn)出百家爭鳴的態(tài)勢,優(yōu)勝劣汰的生物性法則越來越成為方法世界的終極法則。調(diào)查則呈現(xiàn)出情報學在方法使用觀念上的固守與圖新。
固守,主要體現(xiàn)在學科專門研究方法上,如圖9所示,由A10文獻計量、A11專利計量、A12網(wǎng)絡(luò)計量、A13其他文本計量、A14引文分析所構(gòu)成的情報學專門研究方法在20年內(nèi)占比穩(wěn)定保持在3%~5%。
圖新,以使用數(shù)學語言表述事物的狀態(tài)、關(guān)系和過程的O1數(shù)學方法為例,20世紀成長期的情報學虔誠地接受馬克思關(guān)于“一種科學只有在成功地運用數(shù)學時,才算達到了真正完善的地步”的論述,情報學者們曾經(jīng)頑強地嘗試以數(shù)學語言通過推導、演算和分析晦澀的揭示情報現(xiàn)象。直到最近二十年,由于外部環(huán)境變化和學科自身的成熟,情報學逐步擺脫了舊觀念的束縛,正如叢敬軍[44]提出,采用“六適合”原則,科學地選用研究方法是保證情報學研究成功的前提;包昌火等[45]指出,情報學方法論選擇的依據(jù)只有一個——情報研究任務(wù)。如圖9中O1數(shù)學方法間斷而非連線的分布可知,方法使用觀點正在轉(zhuǎn)變。

圖9 若干研究方法分布情況示意圖
研究方法推陳出新,促進方法使用觀念轉(zhuǎn)變。方法使用觀念的轉(zhuǎn)變又促進了研究方法的創(chuàng)新和自身學術(shù)水平的提高,兩者之間相互影響、共同進化的關(guān)系恰如語言與人腦。例如,學者們利用C8爬蟲取代C4德爾菲法獲取更具代表性的數(shù)據(jù);為了更好地以000綜述闡述某技術(shù),學者在綜述文章中融合入對照實驗或文獻計量方法等。自身學術(shù)水平提高又對學者們的方法使用提出更高要求,例如,在本研究中,SWOT分析由于逐漸淡出,被歸并入O8管理學方法。
O13法學方法是指關(guān)涉法律問題的法律價值分析、法律規(guī)范分析和法律解釋。本研究觀察到該研究方法主要圍繞《中華人民共和國公共圖書館法》(以下簡稱《公共圖書館法》)。由于圖書館學和情報學兩者歷史上的親緣關(guān)系,情報學者擁有《公共圖書館法》相關(guān)記憶,國家層面專門立法對一個學科發(fā)展的重大意義無須贅言。A9.2多元統(tǒng)計在本研究中內(nèi)涵豐富,歸并包括傳統(tǒng)多元統(tǒng)計、結(jié)構(gòu)方程分析、因子分析、QAP回歸等約20多種具體方法,由圖10可見,情報學領(lǐng)域具備較強的數(shù)理基礎(chǔ)是不爭的事實。“情報心理學”誕生于20世紀,但真正開展心理學實驗則是在21世紀。現(xiàn)階段情報學群體切實引進其他科學研究成熟范式,而非止步在理論開新。

圖10 情報學若干共同學術(shù)記憶
唯物辯證法認為,事物的發(fā)展是內(nèi)因和外因共同起作用的結(jié)果。群體中一種觀點的提出,也不例外。“大情報觀重述”既有自身內(nèi)在因素,也有外部因素。傳統(tǒng)內(nèi)外因分析,需要我們思辨式展開。本研究旨在跳出傳統(tǒng)規(guī)范下單一維度的定性模式敘述。內(nèi)因部分,由前文中情報學領(lǐng)域群體呈現(xiàn)出的實踐經(jīng)驗、方法素養(yǎng)、學術(shù)記憶等構(gòu)成;外因部分,本研究有意消解人們對過往時空的既有認知,淡化可能存在的偏見,轉(zhuǎn)而主要利用情報定量手段重返歷史現(xiàn)場。具體來說,利用內(nèi)容分析法對“大情報觀重述”發(fā)生前5年(2012—2016年)“大數(shù)據(jù)”相關(guān)學術(shù)文獻進行調(diào)查,通過文獻計量和適當闡述復原當時劇烈變化的外部環(huán)境。
5.1.1 學理研究氛圍
情報學領(lǐng)域擅長使用思維方法定性闡述學理話題,學者們在經(jīng)歷一系列關(guān)乎學科命運的大討論中,學理能力得到了充分訓練,這種學理研究氛圍得以營造和維持。2007—2019年,情報學領(lǐng)域保持著穩(wěn)定的“學理生產(chǎn)力”。
5.1.2 移植能力
情報學整體有極強方法移植能力,這與歷史經(jīng)驗不無關(guān)系。21世紀初,由于情報學過分吸收其他學科,特別是計算機科學與信息技術(shù)領(lǐng)域,實驗法在移植初期“橫向上沒有展開、縱向上沒有深入”,情報學一度成為“別的學科的領(lǐng)地”[46]。2008年以后,這種現(xiàn)象得到了有效扭轉(zhuǎn),立足于情報問題的準實驗、比較實驗迅速增加。情報學移植能力在隨后的十余年得到了檢驗。移植能力體現(xiàn)在:對其他學科成熟方法技術(shù)應用于情報問題的強大吸納能力;對最新技術(shù)成果具備捕捉能力,情報學能夠快速把握最新方法技術(shù),并轉(zhuǎn)化為科學產(chǎn)出;在研究方法使用上呈現(xiàn)多元化。
5.1.3 “科學化”改造
目前,實證研究是情報學領(lǐng)域研究的核心范式。社科界認為,社會科學的“科學化”進程分為3個階段。其中,第一個階段是運用實證研究方法,實現(xiàn)基礎(chǔ)研究領(lǐng)域的“科學化”[47]。情報學自身的實踐性決定了情報學研究主流范式必須是實證研究。在2008年之前,我國情報學研究的主流范式仍然是“前科學”特征的經(jīng)驗性研究和規(guī)范性研究。隨著以實驗法為代表的實證研究逐步獲得了正統(tǒng)地位,情報學完成了“科學化”第一階段改造,已經(jīng)具備成熟科學的基本面貌。
5.1.4 方法自信
萌芽期情報學,曾經(jīng)迫切的需要通過確立專門研究方法,以證明自身學科的獨立性。同時,存在一種方法觀念:專門方法不僅是推進該學科發(fā)展的工具[48],也可以發(fā)現(xiàn)本學科的特殊規(guī)律性[49]。專門方法的存在是一門學科獨立的前提,也是衡量一門學科是否成熟的標志[50]。情報學方法方面的自信體現(xiàn)在破除陳舊觀念上。第一,方法關(guān)注焦點轉(zhuǎn)移到“情報研究任務(wù)為導向、合適為原則”。第二,情報學領(lǐng)域內(nèi)研究方法呈現(xiàn)的爭鳴態(tài)勢促進了方法創(chuàng)新。第三,專門研究方法維持一個穩(wěn)定水平,既無過度依賴,也沒有舍棄,甚至優(yōu)秀成果傳播到其他學科。
首先,本節(jié)對陳述情報學領(lǐng)域內(nèi)“大數(shù)據(jù)”相關(guān)學術(shù)文獻的收集方法;其次,陳述編碼方法;最后,結(jié)合計量結(jié)果呈現(xiàn)“大情報觀重述”前五年外部環(huán)境變化情況。
(1)文獻收集方法。檢索方法如表5所示。通過瀏覽題名、摘要以及部分論文的全文,排除非學術(shù)文獻以及不相關(guān)文獻后,獲得177篇相關(guān)文獻。

表5 數(shù)據(jù)來源、檢索方法
(2)編碼方式。為反映外部環(huán)境變化程度,將“大數(shù)據(jù)”相關(guān)學術(shù)文獻根據(jù)利用水平分為三大類。①“引入研究”:學者對“大數(shù)據(jù)”開展淺層次接觸,話題類型包括“大數(shù)據(jù)”概念分析、機遇和挑戰(zhàn)、熱點討論、移植構(gòu)想、問題和展望等定性闡述,不包含實證;②“融合研究”:學者基于“大數(shù)據(jù)”解決具體情報問題,構(gòu)想闡述或相關(guān)實證研究;③“變革研究”:大數(shù)據(jù)背景下,學科理論情報事業(yè)變革的相關(guān)研究、人才培養(yǎng)話題、分支學科開新。
(3)統(tǒng)計結(jié)果。2012—2016年,情報學領(lǐng)域“大數(shù)據(jù)”相關(guān)學術(shù)文獻內(nèi)容分析統(tǒng)計結(jié)果如表6所示。

表6 情報學領(lǐng)域“大數(shù)據(jù)”相關(guān)學術(shù)文獻內(nèi)容分析
5.2.1 社會現(xiàn)象階段
2012年,“大數(shù)據(jù)”作為一種新興社會現(xiàn)象,敏銳的情報學學者從文獻計量學視角,對“大數(shù)據(jù)”展開詞頻分析研究。競爭情報領(lǐng)域反響強烈,有學者指出,“大數(shù)據(jù)”未來將被視作一種重要的生產(chǎn)要素,這種“未來的新石油”將會促進新的競爭形式和新價值產(chǎn)生[51]。情報學領(lǐng)域整體則表現(xiàn)出謹慎的態(tài)度,有學者作出“機遇巨大,挑戰(zhàn)更大,需要我們對此有清醒的認識”的判斷[52]。
5.2.2 研究對象階段
2013年,競爭情報領(lǐng)域?qū)Α按髷?shù)據(jù)”重視愈加明顯,多篇文章就“大數(shù)據(jù)”對企業(yè)競爭情報的機遇、挑戰(zhàn)、對策、發(fā)展、動向等展開論述。同時,構(gòu)想“大數(shù)據(jù)”在眾包、競爭情報系統(tǒng)中的應用。競爭情報領(lǐng)域率先在研究中融合大數(shù)據(jù)概念,如建立基于大數(shù)據(jù)模型以進行電信客戶流失成因的挖掘。情報學長于“研究熱點挖掘”,關(guān)涉“大數(shù)據(jù)”的熱點挖掘興起。與其同時,數(shù)據(jù)密集型研究范式被學界探討。
5.2.3 進入與融合階段
2014年,情報學者與公安情報學者關(guān)涉“大數(shù)據(jù)”首個合作成果在情報學領(lǐng)域核心刊物中刊出。同時,已成為焦點話題的“大數(shù)據(jù)”全面進入情報學領(lǐng)域的視野。情報學領(lǐng)域的學者敏銳地察覺到“大數(shù)據(jù)”潛在價值,一方面,積極地從國外吸收“大數(shù)據(jù)”經(jīng)驗,如國外大數(shù)據(jù)教育、國外大數(shù)據(jù)研究特征、國外大數(shù)據(jù)應用、國外大數(shù)據(jù)研究特征等調(diào)查研究;另一方面,大數(shù)據(jù)分析方法被鋪開實踐,在信息行為、信息檢索等諸多情報問題領(lǐng)域上多點開花。
5.2.4 自我改造階段
2015—2016 年,情報學與軍事情報、公安情報學者合作日益緊密。人民公安大學教授彭知輝在情報學核心刊物刊出“讓情報主導警務(wù)成為現(xiàn)實”[53]令人矚目。情報學“大數(shù)據(jù)”實證研究增多的同時,學界展開學理層面全面改革,具體包括“大數(shù)據(jù)”背景下的課程改革、“大數(shù)據(jù)”背景下的情報素養(yǎng)新要求、情報5.0的情報體系闡述、情報服務(wù)3.0時代闡述、情報學研究范式轉(zhuǎn)換、構(gòu)建大數(shù)據(jù)環(huán)境下的情報學研究方法體系、面向情報流程的情報方法體系構(gòu)建,大數(shù)據(jù)范式下情報學變革的體系框架等。
本研究在前文分析結(jié)論的基礎(chǔ)上,對“大情報觀重述”事件進行還原式考察,在重建的歷史情境中對事件成因進行闡述。
5.3.1 時代背景
曾有學者將第一次“大情報觀”發(fā)生的時代背景歸納為“信息技術(shù)大發(fā)展,社會經(jīng)濟信息化成為全球性熱潮,乃至成為我們時代的總特征”。2017年,由學術(shù)界的學術(shù)成果反饋可知,大數(shù)據(jù)呈現(xiàn)出現(xiàn)了同樣的總特征,包括:①大數(shù)據(jù)受到各領(lǐng)域的高度重視,體現(xiàn)在軍事情報、警務(wù)情報領(lǐng)域?qū)W者、政府官員與情報學領(lǐng)域互動緊密,這是前所未有;②大數(shù)據(jù)幫助情報學極大地拓寬了研究邊界,甚至改變了學科面貌,尤其是競爭情報問題、輿情研究等;③大數(shù)據(jù)范式上升到科學哲學層面,即科學研究的第四次范式革命;④大數(shù)據(jù)的開發(fā)與應用技術(shù)迅速發(fā)展。
5.3.2 實踐基礎(chǔ)
第一,情報學群體擁有上一次信息化浪潮的歷史經(jīng)驗,有閱歷的學者能夠敏銳地捕捉到與20世紀80年代趨同的社會發(fā)展大趨勢,特別是競爭情報領(lǐng)域。第二,情報學具備豐富的移植經(jīng)驗,有能力第二年即開展立足于情報問題的實證研究。第三,情報學固有“熱點挖掘”“科學評價”等情報方法,能夠服務(wù)學科自身決策,幫助學者充分把握歷史機遇。第四,情報學領(lǐng)域內(nèi)完成方法層面“科學化”改造,學者們具備快速適應大數(shù)據(jù)研究范式能力,為“大數(shù)據(jù)”成果的涌現(xiàn)奠定了基礎(chǔ)。第五,情報學群體具備方法自信,不用擔心再次成為其他學科的“后花園”。第六,情報學擁有學理討論氛圍,具備學理層面迅速吸納融合的“理論生產(chǎn)力”,而健康的學理氛圍也促進群體共識的產(chǎn)生。第七,情報學親歷《公共圖書館法》為圖書館領(lǐng)域事業(yè)發(fā)展提供保障,并拓寬圖書館領(lǐng)域研究范疇,具備把握《情報法》國家立法歷史機遇的能力。
5.3.3 歷史方位
情報學核心定位依然不清晰。情報學自身最主要矛盾依然是情報、信息之爭,以及由此衍生的學科發(fā)展目標、情報工作性質(zhì)與作用、人才培養(yǎng)等一系列學科基礎(chǔ)性問題。
5.3.4 “大情報觀重述”成因分析
近年來,“大情報觀重述”有其自身的社會歷史條件:世界大發(fā)展、大變革、大調(diào)整,尤其是大數(shù)據(jù)時代、大數(shù)據(jù)驅(qū)動的科學研究第四范式的到來作為時代背景,情報學群體的實踐經(jīng)驗與集體智慧結(jié)晶是實踐基礎(chǔ)。情報學依據(jù)自身實際情況,先鋒學者們把握國家創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略、總體國家安全觀、情報法立法等一系列歷史機遇,旨在與交流日漸緊密的公安情報、軍事情報領(lǐng)域?qū)W者一起團結(jié)更多力量,共同建設(shè)“大情報科學”,通過各情報領(lǐng)域的互相融合、互相支持,更好地解決情報學自身長期定位不清晰的學科內(nèi)部矛盾,通過集群效應拉升情報學在學科中的地位。
如果說第一次“大情報觀”本質(zhì)上作為人們對逐漸暴露出理論脫離實踐問題的補救,以暫時緩解當時日漸尖銳的學理內(nèi)部矛盾——實踐愈加豐富、理論進展緩慢;那么“大情報觀”的重提,既非周期性的歷史輪回,也非先鋒學者們一時審時度勢的言說,而是情報界學人不斷流動與建構(gòu)的群體意識在新時代背景下的自然覺醒,是情報學人尋找學科發(fā)展進路的積極探索。
第一次“大情報觀”作為一個情報學史上的注腳,記錄著重要的時代之音,甚至可以說是那個歷史階段最醒目的標簽之一。它無時無刻告誡著我們:對學理研究要高度重視。第二次“大情報觀”則更似“傳達誠意”的對話方案,一方面,反映出情報學人對學科的學術(shù)路向有自覺的規(guī)劃;另一方面,體現(xiàn)了情報學人的學術(shù)自信。
本研究可視為一場關(guān)于研究方法的創(chuàng)新實驗,利用傳統(tǒng)情報學研究方法和對象,探索性的求解一個關(guān)涉情報學的真實情報問題。透過這場實踐,我們可以體察到“研究方法分析法”[28]大有可為,然而受制于方法標注的高昂成本,學者們欲有為而難有為。我們要充分抓住當下學術(shù)資源開放、先進技術(shù)手段日趨成熟的有利時機,積極探索學術(shù)文獻中研究方法的自動化標注方法。作者未來將繼續(xù)對“研究方法分析法”展開進一步的探討。