齊 靜 王 強
(遼寧中醫藥大學圖書館,遼寧 沈陽 110000)
中醫藥是中華文明的瑰寶,傳承精華、守正創新是中醫藥事業發展的動力源泉。《中華人民共和國國民經濟和社會發展第十四個五年規劃和二〇三五年遠景目標綱要》中明確指出要傳承弘揚中華優秀傳統文化。在國家層面政策支持下,中醫藥科學領域專家學者更是致力于中醫經典古籍文獻的研究。在大科學時代,科研團隊往往引領學科發展態勢。中醫古籍文獻的研究需要關注領軍科研團隊,國家層面政策的制定與調整更需要緊跟科研團隊及其科研項目。
筆者利用作者合著關系構建合著網絡,從中心性分析、派系分析角度發現中醫古籍的科研團隊以及核心人物;網絡調研作者之間社會關系并構建社會關系網,從社會學觀點比較分析合著網絡和實際社會關系網絡;分析中醫古籍科研領域的合作模式。
科研團隊是以科學技術研究與開發為內容,由為數不多的技能互補、愿意為共同的科研目的、科研目標和工作方法而相互承擔責任的科研人員組成的群體[1]。科研團隊成員之間擁有相近的科研興趣,能夠在同一研究領域共享信息和研究成果,為共同的科研目標協同配合。科研團隊的成員人數一般在5-20人之間[2]。從人員組成看,科研團隊內常由具備豐富科研經驗的學科帶頭人,以及具有跨學科背景的人員組成。科研目標不同,科研團隊的規模和類型也有所差別[3]。科研團隊是知識密集型群體,具有科研目標明確、團隊合作規則隱性、團隊知識共享等特點。
傳統科研團隊的識別主要通過問卷調查、專家訪談等方式[4]。隨著科研環境的變化,專家認為發現隱性的科研團隊并對其進行計量分析非常有價值[5]。社會網絡分析法的快速發展,為識別科研團隊提供了新思路。從數據獲取來看,通過數據庫獲得的作者合著信息[6]、關鍵詞與作者耦合信息[7-8]、引用與被引信息,以及網絡中獲取的鏈接信息都可以建立科研專家之間的網絡關系,從而識別出科研團隊。從研究內容來看,主要有兩方面的內容,一是識別不同學科領域科研團隊的研究,如人工智能[9]、管理科學[10]、情報學[6]、腫瘤學[8]、護理學[11]等領域;二是改進科研團隊發現算法的研究,如構建論文與作者的向量空間[12];引入論文權重因子,建立計算量化論文質量的權重因子和鏈路權值的數學模型[13];利用合著次數、合著人數、作者排名、被引頻次等要素構建一種綜合性的合著網絡加權模型[14]等。
科研領域中,作者之間的合著關系網絡數據應該屬于多值無向網絡。每位作者都是網絡的節點,連接各個節點的邊就是作者之間的合著關系值。Newman[15]構建的合著關系矩陣僅考慮了合著次數;朱麗娟[16]將作者在文獻中的排名、是否為通訊作者等因素考慮在內,利用作者對文檔的貢獻度矩陣計算出了作者之間的相似度矩陣;李綱[8]則綜合了合著強度、作者貢獻度和合著影響力構建出了作者合作關系矩陣。任妮[17]針對以上提出的基于加權要素的算法進行了比較研究,結果發現不同加權要素的選擇對點度中心性和核心-邊緣結構影響明顯,對網絡圖形的結構沒有影響。盡管學者對于作者合著關系網絡的構建進行了各種嘗試,卻始終缺少將作者之間產生合著的社會因素考慮在內。
筆者采集了中國知網的文獻數據,利用Python程序進行數據清洗,計算作者之間的合著關系矩陣,選取社會網絡研究工具Ucinet6作為合著關系網絡研究指標計算的主要工具,同時利用該軟件集成的NetDraw實現分析數據可視化展示,流程如圖1所示。

圖1 中醫古籍科研團隊發現流程
筆者采用中國知網、維普、萬方數據庫的數據分析,這3個數據庫對國內各學科最新的科研成果報道及時,是研究中醫古籍科研領域較理想的數據采集庫。采用SU=(′中醫古籍′+′醫史學′+′古籍圖像′+′傳統醫藥′+′黃帝內經′+′神農本草經′+′本草綱目′+′內經圖′+′東醫寶鑒′+′中醫藥傳統知識′+′古籍善本′+′醫學經典′+′古醫籍′)檢索式進行專業檢索,時間范圍為數據庫收錄起始年至2021年12月31日,去除重復數據后共檢得17745條文獻(見圖2)。

圖2 相關論文歷年發文量
識別科研團隊首先需要對機構數據和作者信息進行消歧,從采集到的數據集中提取出準確的作者信息,因此需要剔除缺少作者和機構信息及其他非相關文獻。對機構信息的清洗,采用迭代的方法統一相同機構名稱。統一不同時期機構的名稱,合并機構下屬不同部門,并進行人工復查。作者姓名不存在全稱與縮寫的“異形同義”但存在重名的情況,需借助機構信息來消歧,從原始數據中抽取作者姓名和機構信息,利用機構信息識別重名作者。
3.1.1 科研機構分析
中醫古籍研究領域內研究機構共有468家,分別為中醫藥類科研機構、高校、醫院、中醫藥類協會等,表1為部分機構列表。中國中醫研究院中醫藥信息研究所和中國中醫科學院中國醫史文獻研究所在中醫古籍研究領域優勢明顯;緊隨其后的是中醫藥類高校,其中包含6所一流學科建設高校;此外中醫類醫院也涌現出大量中醫古籍領域的科研人員。

表1 擁有作者數量排名前15家機構列表
3.1.2 合著關系網絡分析
經統計,在中醫古籍文獻中共抽取作者2473位,其中有743位作者與其他作者無合著關系,此類作者不屬于任何科研團隊;1516位作者僅發表了一篇文獻,他們往往不是第一作者或通訊作者,對科研成果貢獻較小;即使是第一作者或通訊作者,也是該研究領域的新進作者。Glanzel[18]認為分數計數法更能發現網絡中的簇群,故采用分數計數法計算相關性。如果一篇文章有n位作者,則任意兩位作者之間的相關系數就為利用自行開發的Python程序計算得到作者的合著關系矩陣,構建作者屬性信息,將其導入NetDraw繪制作者合著關系網絡圖。根據作者節點的屬性信息設置不同符號和顏色加以區分,節點連線設置4種粗細效果展示強弱關系。圖3展示了部分專家的合著關系網絡。科研機構內部合著關系網復雜且規模龐大,高校、中醫醫院的研究團隊相對分散,同一機構往往擁有多個“小團體”科研團隊,關系網呈現為完備網絡。合著關系多建立在機構內部,跨機構合著相對較少。

圖3 部分合著關系網絡
中心性分析能夠發現居于網絡中心、對資源具有控制力且不易被其他作者影響的科研團隊領導人[19]。中心性分析可分為點度中心性分析、中間中心性分析、接近中心性分析。將作者從A1-A214進行編號,所屬機構從O1-O56進行編號,具體分析如下。
3.2.1 點度中心性
點度中心性能體現網絡節點與其他點發展直接交往關系的能力,可分為絕對中心度和相對中心度[20]。表2為部分作者點度中心性列表,同一局部網絡中會出現多個中心性值高的點,即同一科研團隊中存在多個作者與其他作者直接關系較多,這些作者在團隊中的地位和影響力接近。同一機構節點之間點度中心性的值差距不大,但不同機構間的差距明顯。前40位作者分屬13個機構,分別位于北京、山東、江蘇等10個省份,地域分布較均勻。

表2 部分作者點度中心性列表
3.2.2 中間中心性
弗里曼(Freeman)認為處于多人中間位置,為群體內部建立“橋梁”而起到中介作用的人,可以通過控制或者曲解信息的傳遞而影響群體。中間中心性測量的是行動者對資源控制的程度。經計算合著網絡的標準化中間中心勢的值比較高為1.08%,說明整個合著網絡具有較明顯的集中趨勢。表3列舉了部分作者的中間中心度的值,機構O53在中醫古籍科研領域占有絕對的優勢,機構內部作者對團隊內部資源的控制能力差別較大,團隊內部呈現層次明顯的等級差別。其余中間中心度值逐漸下降,影響力相對較小。

表3 部分作者中間中心性列表
3.2.3 接近中心性
接近中心性關注點在傳遞信息方面的能力,居于網絡中心的點具有較高接近中心度。表4為部分作者接近中心性列表,結合前述合著網絡關系可知,中醫古籍領域科研團隊大多為分散的小團體,故大部分作者接近中心性相對較低,機構O53的科研團隊規模較大,其核心學科帶頭人接近中心性較高。

表4 部分作者接近中心性列表
凝聚子群分析能夠找到網絡中與學科領導人具有高度凝聚性的團隊成員。凝聚子群是一個行動者之間具有相對較強、直接、緊密、經常的或者積極的關系的集合。其內部關系相對穩定、人數不多、具有共同的科研目標、信息共享等特點。根據合著網絡特點,筆者利用n-派系進行凝聚子群分析。
Ucinet可以間接地計算出多值關系的網絡派系。首先需設定作者之間關系閾值C,然后進行二值化處理,得到二值數據矩陣進行派系分析,即可得到不同C值下的n-派系結果。為尋找最佳C值,分別以合著關系值的中位數、平均值、標準差、上四分位、下四分位值為C值進行派系分析。結合前面中心性分析的結果,找到最佳的C層次派系分析結果。
臨界值C的取值越高,劃分出的派系就越少,子群的凝聚力就越強。由劃分的派系來看,臨界值分別取標準差、0.3、中位數、平均值時的派系劃分結果大體相同,當臨界值C取值0.45、0.67619時派系內凝聚力增強,但是派系數量急劇減少。綜合中心性分析的結果,可以得到中醫古籍科研領域的科研團隊。

圖4 部分n-派系分析結果列表
目前我國該領域科研團隊整體分布較分散,中國中醫科學院中醫藥信息研究所和中國中醫科學院中國醫史文獻研究所實力雄厚,其合著關系網絡龐大且復雜;高校、中醫醫院等機構合著關系網絡大多成零星散狀,多為小規模團隊。所有古籍科研團隊中規模最大為27人,規模在5~10人的科研團隊數量約占總數的2/3,其余為2~4人的小團體。表5展示了部分機構的部分科研團隊(不代表該機構的全部科研團隊)。

表5 部分科研團隊列表
科研領域網絡是由科研工作者及其間關系構成的網絡集合。有學者利用社會網絡分析法識別科研團隊,將每個科研工作者視為“行動者”而非“能動者”。僅關注作者節點的一般屬性,忽視其“主觀能動性”是不科學的。每位科研人員有自身的“主觀能動性質”,包括具體和抽象兩種類型的性質,具體性質包括性別、年齡、學歷、職業、經濟收入等;抽象性質則指個人的社會價值取向、性格特點、內在科研動力及潛力等。表面上的合著關系不能反映其背后蘊含的多種“文化”要素。學術關系產生的深層次原因,可能與科研人員的社會地位、職務、專業技能等因素有關。故筆者采用實在論(realist)來探討科研領域網絡中實際存在于科研人員之間的關系。
筆者選取中國中醫科學院中醫藥信息研究所的科研團隊為例進行網絡調研,尋找團隊成員之間的實際社會關系,以比較分析社會實際關系網絡和合著關系網絡。重點調研的社會關系有師生關系、同師門關系、同事關系、上下級關系、發文署名喜好等。根據專家意見賦予不同的關系系數值,若存在兩種以上的關系,關系值為每種關系系
數之和,據此構建出社會關系網絡矩陣。將社會關系矩陣轉化為Ucinet文件,導入NetDraw繪制出作者社會關系網絡圖,節點標示大小表示作者點度中心性大小。

圖5 社會關系網絡與合著關系網絡比較
從中心性來看,兩種網絡的顯示結果基本一致,利用社會網絡分析法研究作者合著網絡能夠較準確地找到科研團隊核心人物。崔蒙、李敬華等人點度中心性較高,居于關系網絡中心,具有一定影響力。從網絡關系來看,兩種網絡的關系連接大體相同,但略有差別。采集樣本的特殊性,導致合著關系網絡不能完全反映作者之間的實際社會關系。在各種社會因素的影響下,社會關系密切的作者也可能科研合作相對較少。
中醫古籍科研合作網絡是一種復雜的異構疊加網絡,是科研人員的社交網絡、知識網絡交織疊加的多維關系網[21],具有明顯的小世界網絡特征[22](見圖6)。科研人員之間的知識網絡可以通過構建合著關系網絡,尋找網絡節點與邊等要素的規律而揭示;從社會網絡研究中的實在論出發[23],要揭示社交網絡則需要構建科研人員之間的實際社會關系網絡。知識網絡主要由信息、學科背景、技術水平、學術能力、知識儲備等要素組成;社交網絡則主要由工作社交、師門社交、私人關系、科研社交等要素組成。知識網絡與社交網絡不是完全分裂的兩部分,而是相輔相成的關系。在知識網絡中能夠獲得最新信息、知識儲備強大、掌握最新科研技術的人,在社交網絡中也具有絕對的話語權;相反,在社交網絡中活躍的人,也能夠及時獲取最新信息,通過社交運作將有利于自身科研發展的最新技術等要素向著利己的方向運動。

圖6 中醫古籍科研合作網絡
中醫古籍科研領域科研合作模式主要有層級型、多點共中心型、共用點交叉合作型3種。
(1)層級型。層級型主要體現在同師門之間或上下級關系中,成員之間的話語權呈現自上而下的垂直流動模式。領軍人物在知識網絡中占有更多的信息,具有強大的學科背景及知識儲備,學術科研能力強,掌握先進的科研技術及設備,位于最頂層;中間層人員為科研團隊的核心成員,是科研團隊的主要力量,同時也扮演“中間人”的角色,控制著底層人員和領軍人物之間的交流;底層人員在科研團隊中影響力最低,負責團隊基礎工作。
(2)多點共中心型。中醫古籍科研領域大多合作模式為多點共中心型,成員之間在科研團隊中地位相當,每位成員都有自己的優勢,但相比學科領軍人物,他們在科研能力、知識儲備、占有的技術設備等方面存在不足,因此需要尋找實力相當、優勢互補的人合作,以增加科研產出。多點共中心型具有“去中心化”的特征,成員規模較小。
(3)共用點交叉合作型。兩個科研單位之間,通過一個共用交點形成的跨機構交叉合作模式。在科研單位內部的合作模式一般為多點共中心型,兩個科研機構中間有一個“中間人”,此人在兩個機構科研合作中至關重要,掌握兩個機構間的所有交流信息及話語權,在跨機構合作交流中積極活躍。