999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

圖書館科研熱點發掘服務模型研究與設計
——以應用經濟學為例

2015-12-26 05:04:14羅琰欽
圖書館論壇 2015年12期
關鍵詞:學科圖書館服務

羅琰欽

圖書館科研熱點發掘服務模型研究與設計
——以應用經濟學為例

羅琰欽

科研熱點發掘是圖書館工作內容之一。在經濟學研究過程中發現,學術文獻發表周期長、外部資源零散等問題長期阻礙著科研工作的開展。為此,文章以應用經濟學為研究范例,提出基于圖書館內外網信息融合的科研熱點發掘服務模型,給出該模型的問題解決方案、體系結構以及運作流程。該模型結合館藏信息資源與學術網站信息進行熱點發掘。測試證明,在應用經濟學領域,該模型能較為準確、及時和全面地提供熱點發掘服務。

圖書館服務 熱點發掘 網絡信息 應用經濟學

0 引言

科研熱點通常由某一學科中最能代表學科發展趨勢,并能影響當前學科發展的關鍵性科學難點、重點及相應的學說構成[1-2]。圖書館信息服務模式正在從面向館藏資源的普惠信息服務向面向讀者的個性化信息服務轉變[3]。從應用經濟學研究看,鑒于其研究范圍廣、資料多、信息需求大等特點,針對應用經濟學的圖書館科研熱點發掘工作主要從三方面為讀者提供服務:(1)查新求證,避免重復研究,即判斷科研主題(通常是讀者正在研究或感興趣的內容)是否屬于本學科前沿,是否具有研究價值和研究可行性;(2)查漏補缺,擴展讀者的研究思路,即為讀者提供其關注科研主題關聯度高的熱點資源,如關鍵詞、學者、文獻;(3)啟迪引路,指導領航,即為科研新手提供學科梳理和指導,使其對要進行的研究工作有全面清晰的認識,能盡快切入研究熱點[4-5]。盡管相關服務流程與工具(如Cite Space)已得到了較廣泛的應用,但在應用經濟學研究和教學過程中,上述方法與工具暴露出一系列問題:(1)Cite Space等工具操作較復雜,知識圖譜的應用也需要較多的前期經驗與較深厚的學科背景,并不適合科研新手和非計算機專業人員。(2)上述服務流程需要較多人工干預,自動化程度不高,生成結果受主觀因素影響大。以四川大學應用經濟學《學科前沿》課程為例,該學科涵蓋內容廣,6組博士研究生獨立發掘出的科研熱點的評分(百分制)標準差高達28.3。(3)上述服務對各學科的相關資源應用率低,時效性差。針對這些問題,本文分析其成因,提出解決方案,以應用經濟學為例,構建基于內外網信息融合的圖書館科研熱點發掘服務模型(Scientific Research Focus Mining,SRFM)。

1 體系結構與運作流程

1.1 模型結構

SRFM模型的體系結構與模塊見圖1。

(1)外部科研熱點跟蹤模塊。該模塊的設計依據是“八二原理”,即網絡中80%的信息源自20%的網站?;谠撛恚撃K能采用網頁發掘方法(網絡機器人)對應用經濟學所屬的認可度較高的教科研網站進行數據采集,從中發現與科研熱點相關的學者、專業詞匯、鏈接等信息。在實際應用中,結合應用經濟學實際情況,SRFM模型對47個學術網站進行全文抓取,處理后僅占用352M存儲空間,體現了較好的模型可用性。對部分難以直接通過網絡機器人抓取的網站,采用反向檢索技術,通過向全文搜索引擎提交指定站點搜索項的請求,獲取搜索引擎中的緩存數據(如Baidu Cache和Google網頁快照),從中采集這些科研網站中的突發詞、膨脹詞等信息。此外,一方面通過頻繁更新,提高科研熱點發現的及時性,另一方面通過相關鏈接的擴展搜索,提高熱點發現的全面性。由于系統的存儲容量有限,同時為避免重復搜索,該模塊設定的發掘深度為3層:從初始網站開始,至多進行2層相關鏈接的發掘。

圖1 模型體系結構與處理流程

(2)內部科研主題采集模塊。該模塊分為兩個子模塊,第一個子模塊基于圖書館購買的文獻數據庫構建,它結合外部發掘模塊提供的基礎信息,依據數據庫提供的樹型學科分類結構開展內部科研主題的全面提取,主要發掘算法參見下文;第二個子模塊基于校內對應的學術群體構建,以提高服務的針對性和實用性,它能夠在網絡空閑時間自動調用網絡機器人程序對校內學術群體進行深度發掘,對學術群體發布的相關文檔和網頁進行數據采集與分析,并通過Poi文檔解析工具(支持doc/pdf/ppt等常用科研文獻格式)和共詞分析技術,發現其中的科研主題需求等信息,為內外挖掘提供更為精準的依據。

(3)科研熱點發掘模塊。基于內外科研信息采集模塊收集到的相關信息,構建對應的科研主題數據庫,并基于該數據庫開展三類發掘:①以時間為驅動,定期(周/月)發掘主題數據庫,并更新應用經濟學的“熱點池”。針對應用經濟學的實際情況,SRFM模型為每個二級學科設定一定容量的熱點池。②以讀者特定的精確需求為依據,對某下屬學科進行及時發掘。由于新算法和熱點池的構建,SRFM模型針對應用經濟學下屬二級學科的發掘時間能夠在15分鐘內完成。③以交叉學科熱點為目標,以熱點池為初始發掘點,以外部學術搜索引擎(百度學術和Google Scholar)為搜索工具,以近似關鍵詞和鏈接為搜索對象開展搜索。

(4)交互服務模塊。針對應用經濟學研究人員的計算機操作水平參差不齊,平均水平低于圖書館員的現狀,該模塊分為兩個子模塊:第一個為專業管理服務子模塊,由圖書館員操控,通過對讀者進行熱點發掘操作輔導,明細化發掘目標,再提交給發掘模型進行處理;第二個為普通查詢服務子模塊,該子模塊根據科研主題數據庫中高排名的熱點信息,繪制樹狀(森林)圖譜,每一個節點代表一個科研主題,節點間連線代表從屬或學科交叉關系。有關交互服務模塊的設計將在2.3節中闡述。

1.2 發掘與處理流程

基于上述結構與處理模塊,SRFM模型的熱點發掘與處理流程見圖1。

(1)圖書館內外的科研熱點數據采集,主要包括科研信息的內部主題和外部熱點兩部分。其中,外部科研熱點跟蹤主要采取定時遍歷的方式,以網絡機器人程序為采集工具,將指定網站的最新網頁下載到本地服務器,并從中抽取突發詞(最新出現詞)和膨脹詞(最近高頻詞);內部科研主題采集模塊的兩個子模塊則分別對CNKI等學術數據庫和館內讀者需求進行主題抽取與分析,一方面從館內信息源中發掘近期的讀者關注熱點,從而提高熱點發掘的針對性,另一方面對館外發掘出的科研熱點予以驗證,從而判斷其是否新穎,關注度是否較高,從實踐來看,這一判斷過程減少了外部模塊的信息處理量。

(2)對采集的科研主題/熱點進行清洗處理。在此過程中,科研熱點發掘模塊將結合內外部科研主題/熱點數據,對內部發掘到的科研主題實施清洗,初步抽取近期的相關學科突發詞和膨脹詞,將這些含有關鍵詞、學者、從屬關系等內容的信息保存在科研主題數據庫中,以節省后續處理所需的系統資源。

(3)科研熱點發掘。內外部發掘得到的科研主題數據存儲在科研主題數據庫中,由于各網站及文獻數據中的熱點數據極多(以技術經濟學為例,近3年科研熱點數量超過55個,涉及關鍵詞1457個),如果要進行完整的突發詞關聯檢測,將會非常困難。因此SRFM模型構建高速發掘算法,通過樹狀結構的熱點發掘窗口進行數據掃描,將發掘到的熱點存儲在熱點池中。

(4)科研熱點綜合服務。圖書館員根據讀者的不同需求與實際信息技術水平提供兩類服務:當讀者初涉相關領域,對學科發展缺乏足夠了解時,圖書館員細化其需求,從分析中得到讀者需求的所屬學科、近似關鍵詞與所需熱點的內容、時限、關聯主題等信息,并以上述分析內容為依據,在科研主題數據庫的熱點池中檢索匹配程度最高的熱點;當讀者對某領域較為熟悉時,可通過科研主題數據庫支持的樹狀圖譜,直接進入所需發掘的子學科進行內容瀏覽,如果其中缺少相關內容,讀者可提供缺失內容對應的關鍵詞,通過科研熱點發掘模塊,驅動內外熱點采集模塊進行更深入的發掘[6]。

2 關鍵算法與模塊

2.1 熱點存儲結構

為節約系統開銷,SRFM模型采用較為精煉的樹狀存儲結構來進行科研熱點相關信息的存儲,即根據二級學科劃分將采集到的科研信息分類成主題樹。以學科作為分類標準的科研主題樹具有以下特征:第一,其根節點是某個科研主題的核心,可以是學者名或者專業關鍵詞;第二,下屬的每個葉子節點將存儲與核心詞相關的內容,包括主題ID、專業關鍵詞、權重、相關學者名、詞性、內容摘要、檢索詞頻、上下關系指針,其定義構造過程如下:首先進行參量配置,主題的核心詞權重為常量1;其次非根節點的權重由它在整個數據庫中出現的總次數計算得到(具體計算方法見下文);再次通過構建停止條件集合,構建終端的葉子節點,由于實驗采用的是CNKI等以中文為主的數據庫,因此條件集中包括以下詞匯:“完成”“結束”“綜述”“截止”“為止”等,當葉子節點關聯的文獻中出現停止詞時,相關主題詞的權重將減少(陳舊或終結的主題詞)。上述所構建的科研主題樹存儲了從數據庫和外網挖掘到的所有科研主題,且遍歷發掘所有的主題樹(即從主題根節點開始,計算相關分支上的權重和,并進行分支權重排序)。這個過程可以用下列迭代算法進行表述,最終通過較為完整的樹形結構展示相關的科研主題。

2.2 科研熱點發掘算法

SRFM模型的遍歷發掘核心算法步驟如下:假設科研話題集合是一個包含n個主題樹的森林圖譜X,算法總體目標是將n棵樹型主題xi(i=1,2,…,n)劃分為c個類,進行科研熱度排序,構建每個類的聚類中心(熱點池)。SRFM模型依據模糊數學理論,對每一個已發掘的科研主題,通過設定/計算其在[0,1]區間的隸屬度來判斷它在各個類的歸屬程度。此外,為保證交叉學科研究熱點的公平性和可計算性,硬性設定一個歸一化要求,即任意一個主題的所有隸屬度之和必須等于1,由此有下式:

其中,本模型使用的權重函數如式2:

上式中的uij在[0,1]區間中取值,而ci為模糊分類i的熱點池;其中dij=||ci-xi||是第i個熱點池與第j個主題之間的歐幾里得空間距離,而m∈1,∞)則是加權參量。

基于上述數據結構,本模型依托FCM(Fuzzy Clustering Means)方法確定實際的計算步驟,其中使用的內存變量為熱點池ci和隸屬度矩陣U:

第一步,確定熱點池的數量c(2≤c<N),本模型的實驗針對應用經濟學展開,因此熱點池設定為74個(即二級學科數量)。

第二步,設定初始化的模糊分類矩陣。模糊分類矩陣以U(s)表示,設定s=0,即U(0),開始計算。

第三步,處理U(S)時的基礎數據Vi(s),其中有:

第四步,通過2個子步驟將U(S)處理成U(S+1)(j=1~N).

首先,處理Ij和:

其次,處理主題xj的新隸屬度uij,表示如下:

uij=0,,同時設定

第五步,通過閾值控制U(S)和U(S+1)之間的距離,當||U(S)-U(S+1)||<ε分類停止;反之,則有s=s+1,算法將返回第三步繼續循環[7-10]。

2.3 交互服務模塊設計

交互服務模塊是SRFM模型中的重點,包括專業管理服務和普通查詢服務兩個子模塊,實現難點是專業管理服務子模塊的設計。為滿足科研查新求證、查漏補缺以及啟迪引路三類需求,同時為學科專家(專業讀者)和科研新手(普通讀者)提供個性化服務,該模塊采用圖2所示結構和服務流程。

第一步,當讀者需要進行科學熱點發掘時,圖書館員為其提供指導,協助讀者確定發掘需求與依據(可以是若干科研主題詞、學者姓名,甚至可以是一段摘要或一個文檔)。例如,讀者需要對互聯網金融進行發掘時,圖書館員可將其發掘依據擴展為<互聯網金融,大數據,移動支付,謝平>。

圖2 交互服務結構與流程

第二步,圖書館員將指導讀者從發掘依據中提取科研主題(主要是關鍵詞),并為其發掘進行學科粗劃分,再交由模塊中的科研主題提取器(基于自動分詞工具)進行自動提取。

第三步,圖書館員依據讀者的不同類型(學科專家或科研新手)選擇不同的發掘器,對科研主題樹進行匹配發掘。其中學科專家提供的發掘依據通常描述較為精準,分類較為清晰,因此采用深度發掘器,最終發掘到的結果也較為深入,主題匹配度很高;而科研新手提供的發掘依據通常較寬泛,分類較模糊,因此采用廣度發掘器,最終發掘到的結果較全面完整。

第四步,圖書館員在發掘器完成工作后,將結果以不同形式展示給讀者:對學科專家,主要以科研熱點列表形式提供文字信息和鏈接;而對科研新手,主要以科研熱點主題樹的形式,提供可視化信息[11]。

3 實驗結果與分析

3.1 實驗對象

為全面測試SRFM模型的性能,基礎數據設定為應用經濟學相關的174925篇CSSCI核心期刊論文,分別對表1所示6類應用經濟學下屬二級學科進行測試。為保證測試的公平和可信,測試中調用兩臺相同配置的聯想萬全服務器進行并行測試。詳細測試項見表1。與之對應,外網信息源包括經濟學院學術委員會指定的47個網站和150個其他相關網站,如中國世界經濟學會、中國技術經濟學會。由于科研熱點發掘結果的最終認定存在較多主觀因素,測試中對讀者群體進行主觀問卷調查,被調查的群體包括教師103名,其中副高職以上為75名;經濟學相關專業研究生353名,其中博士研究生95名。

表1 應用經濟學發掘對象

3.2 科研熱點發掘實驗結果

最終調查結果見表2。圖3為兩類模型對應用經濟學熱點的動態發掘覆蓋度。該覆蓋度的定義為:在一定時間段內,模型發掘出的并被讀者群體認可的科研熱點,在所有讀者群體實際關注熱點中的數量比例變化情況。由圖3可知,由于充分利用內外網的信息資源,SRFM模型在靜態和動態情境中均表現出較高的熱點發掘準確率和查全率。

表2 模型發掘性能的主觀滿意度對比

圖3 動態發掘精確度對比

3.3 服務效能實驗

為測試本模型的服務效能,以《應用經濟學專題》課程為背景,以其中的4個專題(從16個專題中隨機抽取)為實驗對象,將46名碩士研究生分為兩組,對兩種模型進行平行實驗,2名任課教師與2名圖書館員同時對實驗進行跟蹤指導和結果評判。最終的實驗結果見表3。由表3可知,SRFM模型的服務效能較高,能在檢索詞較少、平均檢索次數較少、教師/館員指導次數較少的情況下,取得質量較高、較全面的科研熱點發掘結果。從讀者角度看,該模型方便易用,無需讀者掌握特殊的工具和技巧;從圖書館員角度看,該模型能將圖書館服務與科研工作無縫銜接,提供高質量的科研熱點服務,降低館員的工作強度。

表3 模型服務效能對比

4 結語

本文以應用經濟學為研究對象,提出圖書館科研熱點發掘服務的SRFM模型和實現框架。較之操作專業化的基于Cite Space工具的模型,SRFM模型地自動化程度較高、更新速度快,能較全面的發掘應用經濟學中的科研熱點,為應用經濟學研究提供信息支持。未來工作中,將進一步推廣SRFM模型的應用至其他領域,并引入更為高效快捷的算法來實現海量數據發掘。此外,該模型在實際應用中對目前界定較為含混的交叉學科(如應用經濟學的部分二級學科)的發掘性能還有待提高,將在后續工作中進一步研究。

[1]程燕鋒.廣東高??萍疾樾鹿ぷ鞯默F狀分析與對策研究[J].圖書館論壇,2013(3):90-96.

[2]洪凌子,黃國彬,于洋.基于CiteSpace的國內外數字圖書館研究論文的比較分析[J].圖書館論壇,2011(6):91-100.

[3]盛宇.基于微博的學科熱點發現、追蹤與分析——以數據挖掘領域為例[J].圖書情報工作,2012,56(8):32-37.

[4]徐燦,陳晨.基于CiteSpace的學科領域研究熱點與前沿可視化分析——以無線傳感器網絡領域為例[J].信息資源管理學報,2012(4):69-75,87.

[5]汪東偉,李梅,殷沈琴,等.基于動態數據的經濟學領域研究熱點分析[J].圖書館雜志,2014(12):24-31.

[6]劉麗.基于信息可視化的國際圖書館服務領域前沿演進分析[J].圖書館論壇,2012(3):6-12.

[7]張偉聰.教育部科技查新工作站調查與分析[J].圖書館論壇,2014(5):36-40.

[8]覃麗金,吉家凡,唐朝勝,等.主題式學科化服務模式研究——結合海南大學圖書館的案例分析[J].圖書館論壇,2014(4):23-29.

[9]衛軍朝,蔚海燕.基于CiteSpaceII的數字圖書館研究熱點分析[J].圖書館雜志,2011(4):70-78.

[10]張云,曾莉,李文林,等.基于聚類分析的圖書館聯盟熱點分析[J].圖書館學研究,2013(6):2-7,20.

[11]張藝蔓,李秀霞,韓牧哲.基于共詞分析的圖書館學科服務研究熱點分析[J].情報探索,2015(4):126-130.

Research and Design of Scientific Research Focus Mining Service Model in Libraries——A Case of Applied Economics

LUO Yan-qin

Scientific research focus mining is an important point of library researches.The long publication cycle of sci-tech periodicals and the disparity of exterior network scientific information make the related works difficult. With a case of applied economics,a scientific research focus mining model was presented based on library interior/exterior information fusion.Then the solutions,architectures and working flows of the model are proposed as following.And the model fused the scientific sites and the library information resources to deal the problems above.Test results prove that the model can provide correspondingly exact,real-time and comprehensive scientific research focus mining services in applied economics fields.

library service;focus mining;information fusion;applied economics

格式 羅琰欽.圖書館科研熱點發掘服務模型研究與設計——以應用經濟學為例[J].圖書館論壇,2015(12):56-61.

羅琰欽(1983-),四川大學經濟學院博士研究生。

2015-06-02

猜你喜歡
學科圖書館服務
【學科新書導覽】
土木工程學科簡介
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
“超學科”來啦
飛躍圖書館
論新形勢下統一戰線學學科在統戰工作實踐中的創新
主站蜘蛛池模板: 国内精自线i品一区202| 四虎影视无码永久免费观看| 免费Aⅴ片在线观看蜜芽Tⅴ| 亚洲最新在线| 国产免费人成视频网| 怡春院欧美一区二区三区免费| 91人人妻人人做人人爽男同| 亚洲色图欧美一区| 欧美成人精品高清在线下载| 国产嫖妓91东北老熟女久久一| 黄色网站在线观看无码| 国产综合精品一区二区| 欧美日韩午夜视频在线观看| 深爱婷婷激情网| 国产女同自拍视频| 女人18毛片一级毛片在线| 午夜欧美理论2019理论| 国产成人精品2021欧美日韩| 成人欧美在线观看| 制服丝袜一区| 免费国产高清精品一区在线| 广东一级毛片| 久久综合色88| 99re这里只有国产中文精品国产精品 | 亚洲无码A视频在线| 无码一区二区三区视频在线播放| 91在线日韩在线播放| 久久亚洲欧美综合| 午夜精品久久久久久久无码软件| 国产女人18水真多毛片18精品 | 午夜视频免费一区二区在线看| 久久国产亚洲偷自| 欧美精品v日韩精品v国产精品| 香蕉精品在线| 中文字幕在线播放不卡| 自拍中文字幕| 青青极品在线| 操美女免费网站| 亚洲天堂精品视频| 超清人妻系列无码专区| 国内99精品激情视频精品| 无码AV动漫| 日韩a级毛片| 动漫精品啪啪一区二区三区| 综合天天色| 爆乳熟妇一区二区三区| 又黄又湿又爽的视频| 在线观看欧美国产| 日本91视频| 日韩乱码免费一区二区三区| 97久久免费视频| 国产91丝袜在线观看| 久久一色本道亚洲| 国产爽爽视频| 日韩精品无码不卡无码| 亚洲成综合人影院在院播放| 国产亚洲成AⅤ人片在线观看| 国产精品女熟高潮视频| 美女被狂躁www在线观看| 国产微拍精品| 国产精品手机在线观看你懂的| 无码日韩视频| 日本高清视频在线www色| 久久6免费视频| 色综合中文字幕| 在线国产综合一区二区三区| 97se亚洲综合不卡| 在线毛片免费| 久草中文网| 亚洲不卡av中文在线| 亚洲国产综合自在线另类| 波多野结衣久久精品| 97视频精品全国在线观看| 欧美α片免费观看| 亚洲激情99| 欧美曰批视频免费播放免费| 国内熟女少妇一线天| 视频二区亚洲精品| 国产精品xxx| 国产福利微拍精品一区二区| 欧美成人精品欧美一级乱黄| 日本亚洲欧美在线|