嚴 珊
(中南財經政法大學圖書館,湖北 武漢 430073)
中國人民大學復印報刊資料庫(以下簡稱“資料庫”)搜集、整理、編輯人文社會科學資料,具有較高的學術價值,通過摘編、濃縮、匯集某一學科領域的高質量研究成果,以優質的資源和便捷的方式,為學者提供知識管理與知識服務。筆者以資料庫中的《圖書館學情報學》為數據來源,對其所載文章的內容特征進行研究分析,旨在快速了解該學科領域的研究熱點、研究成果及研究趨勢。
筆者統計后發現,《圖書館學情報學》2021年選文的來源期刊共有23種,共收錄文章206篇。原發期刊及相關指標數據詳見表1(被轉載量占比是指期刊被資料庫轉載的相對值,轉載率是指期刊當年被轉載量占期刊當年發文總數的比例)。表1顯示,排名前18的均為核心期刊,說明資料庫選文要求文章具有較高的學術價值。排名第20的《科技情報研究》是2019年新創立的期刊,雖不是核心期刊但轉載率達到8.33%,說明該刊在論文質量和研究熱點方面把關較嚴。

表1 被轉文章前20的原發期刊統計

(續表)
收錄論文的時效性是指入選論文的收錄年與發文年之間的時間差,時效性反映了資料庫對學科領域研究熱點的反應速度。如下頁表2所示,論文被資料庫轉載的時間差為0的文章比例為89.91%,時間差為1的文章比例為10.19%,時間差為2及以上的文章比例為0,說明當年新發表論文是資料庫選文的主要來源。進一步分析發文年和收錄年的期數后可知,時間差為1的文章的原期刊發表時間大多是當年的最后1期,導致未能在《圖書館學情報學》出刊前被錄入,由此也說明資料庫收錄論文非常重視時效性。

表2 收錄年與發文年差值情況
從基金項目看,《圖書館學情報學》收錄的論文中國家級項目占59.92%,其中國家社會科學基金占比為41.62%,國家自然科學基金占比為11.35%,教育部人文社會科學研究項目占比為5.95%。
資料庫2021年轉載文獻的第一作者共有181人,其中被轉3篇的作者有5人,被轉2篇的作者有15人,詳見表3。表3顯示,被轉論文排名前20的作者的H指數均大于12,平均數為23.4,說明資料庫收錄的高被轉作者通常也是高被引作者。

表3 被轉排名前20的作者(第一作者)統計

(續表)
筆者分析資料庫收錄的作者所屬的一級機構可知,206篇文章的來源機構共107家,均為國內機構,大部分為高校和研究所。因篇幅有限,筆者僅列出總被轉載量排名前20的機構,詳見表4。表4中的機構大部分在我國圖情領域具有較強的學術影響力,其中被轉載論文排名前9的機構均為高校,且均在全國第4次學科評估中排名靠前,說明資料庫選文時較注重作者所屬機構的學術地位。

表4 轉載量排名前20的機構統計
為進一步了解圖情領域的選文熱點,筆者利用高頻關鍵詞可視化圖譜選取出現頻次≥7的高頻詞進行分析,發現數字人文、新文科、社交媒體、人工智能等是高頻關鍵詞網絡圖譜中聯系最緊密、出現最多的關鍵詞。
圖書館是數字人文天然的孵化器,圖書館學情報學與人文學科的深度融合更容易實現數字與人文之間的實用性和效益性,有利于人文學科在實際應用層面上的推廣利用。圖情界可通過為史料數字化建設提供標準參考、為學科融合提供高層互操作框架、為數字資源提供可長期保存的基礎設施、提供共建共享的數據平臺服務等方式參與人文學科的融合建設。例如,黃如花等從圖書情報的角度探索了數據信息領域的新問題,內容包括面向政府決策的數據素養培訓、基于Altmetrics(學術產出的社會傳播指標)的網絡科學論文擴散追蹤、信息流行病與健康信息學、面向知識的用戶畫像、社交媒體信息歸類存檔等;劉瀏等從多個角度對《春秋》三傳中的女性人物進行知識標注和新的解讀;李惠等以《四庫全書總目》為研究對象,采用提要網絡分析模型構建了古籍目錄分析工具,并整合提要的元數據和語義信息到推薦算法中,完善提要推薦系統;曾蕾等通過舉證圖檔博對珍貴文化遺產進行數據和信息源處理的三個階段,即數字化、數據化和語境化,論證了語義增強技術應用于圖檔博對數字人文發展的支持。
在大數據時代,社交媒體作為網絡信息的重要載體,成為記錄人類活動信息與保存人類記憶的重要形式和不可忽視的數據來源,對其歸檔有利于拓展人類記憶空間。例如,安璐等構建了社交媒體高影響力用戶完整畫像,幫助突發事件管理部門快速識別并掌握社交媒體中關鍵用戶的態度傾向和關注熱點,為輿情管理和應急預案提供數據支持;李綱等以圖像語義理解框架為研究基礎,通過機器學習與深度學習構建圖文相關性的多標簽分類方法,以此分析、理解災害情境下的微博圖文內容;王晰巍等通過構建區塊鏈網絡謠言甄別模型,凈化網絡信息,保證輿情信息傳播的安全性、完整性和可追溯性;李旭光等將信息生態理論應用于信息搜尋行為當中,探索用戶搜尋行為的影響因素以及引導用戶搜索健康信息。
學科融合、復合型高素質人才稀缺、社會問題復雜化是新文科提出的背景。在新文科背景下,新技術諸如大數據、人工智能、5G、物聯網、云計算、區塊鏈的快速崛起與發展對圖情領域產生了深刻影響。在教育定位上,程煥文等認為中國圖書館學教育需在“培養什么人、怎樣培養人、為誰培養人”方面交好答卷;柯平認為在新文科建設背景下新圖情檔建設需通過技術賦能構建人文技術一體式教育,滿足社會需求,突出中國特色;馬費成等認為要以新文科建設為契機,通過面向社會需求、重視理論創新、加強交叉融合、恪守人文傳統等措施推動圖書情報學科未來的發展;初景利等認為新文科背景下圖情檔建設應從軟學科走向硬學科,在理論與實踐中加強圖情檔一級學科內的深度發展,探究跨學科的交叉融合,并努力促進和擴大圖情檔學科的滲透與輸出。
在圖情領域人工智能技術研究方面,孫二林等完善了情報轉化理論,在理論與實踐中解決人工和機器、信息和情報的轉換與融合問題;張智雄等構建了“科技文獻庫”向“科技知識引擎”轉變的路徑,探討了如何把深度學習技術應用到情報分析中的知識挖掘當中。人工智能技術作為新一輪科技革命和產業變革的重要推動力,在疫情防控信息管理中具有巨大的潛能,同時也存在數據、算法和信息安全等問題和挑戰。基于此,趙楊等分析了人工智能技術在疫情防控、社會治理、疾病診療、復工復產等場景中的應用作用,并從數據、場景、技術三個維度構建與人工智能技術相匹配的疫情防控大數據平臺,形成以人工智能為核心技術的疫情防控“硬核”支撐。