趙雪芹 蔡銓 王青青
關鍵詞:學術社交網絡;知識組織:知識服務;研究現狀
學術社交網絡能夠打破科研工作者的傳統知識交流壁壘,致力于滿足其科研信息需求,維護其個人學術社交關系,促進科研工作者的知識交流與知識創新。學術社交網絡最初起源于在線學術社區,學術社區設立的初衷在于為學者提供前沿知識、存儲優質學術資源,依托于該理念而設立的典型社區有Scilinks、Linkedin等。此后隨著社交網絡的發展與普及,以Twitter、Facebook為代表的社交媒體針對用戶科研需求開始拓展服務范圍,在社交網絡中架構學術平臺.幫助研究者建立維護和管理自己的學術社會網絡。但由于大眾社交網絡中用戶群體差異較大且其中信息專業性不強.無法充分滿足學者科研信息需求,因而催生了針對不同科研用戶特征的垂直科研領域的學術社交網絡。自學術社交網絡發展至今,國內外學者和機構為優化其知識組織模式,提升知識服務質量開展了各式各樣的實踐探索.如我國唐杰教授率領團隊應用語義技術將科研人員、科技文獻和學術活動三者相互關聯,從多個資源中集成學者數據構建學術社交網絡AMiner;中科院計算機研究所在為學者提供資源支撐基礎上添加學者個人微博、科研群組以及實時更新關注的論文與話題功能模塊,搭建了一個既保留了社交平臺屬性又結合了文獻資源管理的學術社交網絡Sos.cholar:美國麻省理工的Wickramasekara率領團隊通過開發云端設計個人知識管理工具Benchling,在生命科學領域有效地幫助學者收集、儲存、加工、利用和傳播各類信息資源;西班牙哈恩大學通過不同語言標簽集管理文獻信息,集成信任、協作和內容3種知識組織方法的混合推薦系統,設計并實現了學術社交網絡SharingNotes。盡管國內外學術社交網絡種類繁多.但根據運營理念和核心功能不同,主要分為4種不同類型的學術社交網絡:以ResearchGate為代表的用戶互動平臺、以Men.deley為代表的文獻信息管理平臺、以小木蟲為代表的UGC(用戶生成內容)社區和以經管之家為代表的學科前沿資訊平臺。然而,無論是哪種類型的學術社交網絡.知識組織都是提升用戶體驗的基礎,但隨著網絡中數字化的科研信息不斷擴充,學術社交網絡中海量的科研信息和用戶交互內容逐漸呈現無序化、異構化,極大地增強了用戶搜尋信息的難度,使得學術社交網絡發展出現瓶頸。基于這一現狀,如何將現存良莠不齊、離散異構的學術信息篩選組織成一個結構化的知識體系,滿足用戶科研信息獲取與知識交流需求,是優化在線學術社交網絡的當務之急。立足于這一現實,國內外學者從理論和方法兩方面,對學術社交網絡知識組織展開了深入研究。
1在線學術社交網絡知識組織理論研究
在線學術社交網絡知識組織理論研究主要分為兩個研究領域,即不同知識單元之間的廣度關聯研究和知識組織體系的深度聚合研究。不同知識單元之間的廣度關聯研究不僅包括文本和詞匯之間的關聯研究,還包括厘清用戶知識需求與知識單元之間映射模式研究。知識組織體系的深度聚合研究則包括構建不同類型的知識組織結構體系,進而探析在線學術社交網絡知識組織的未來發展趨勢。
1.1知識組織單元由單一粗粒度向多元細粒度發展
文本和詞匯是在線學術社交網絡最基本的知識單元,在早期學術社交網絡中,大多以文本知識單元為基礎,基于科研本體和主題本體構建知識組織。如宋文等基于概念理論提出采用語義技術鏈接不同主題的知識體系,并通過計算文本相似度拓展學術社交網絡的知識發現服務。這種僅基于文本粒度的簡單知識組織理論粗略地幫助人們鏈接學術社交網絡中的知識.但隨著知識資源形態的豐富,單一文本層次的語義技術遠遠無法滿足學術社交網絡知識組織。在分眾分類法興起的背景下,學術社交網絡知識組織衍生出了詞匯為量級的知識單元.通過挖掘詞匯之間的語義關系抽取新的文本特征,在一定程度上彌補了語義缺失的不足。因此,學術社交網絡知識組織轉向以文本一詞匯的跨粒度知識單元聚合研究,如傅城州等以分眾分類為基礎依托于語句關系收集標簽詞匯增強語義關系,并通過計算文本相似度和聚類構建架構學術社交網絡。而學術社交網絡的社交屬性要求知識組織需要圍繞用戶開展,為用戶交互服務,僅基于文本、詞匯的知識組織無法滿足用戶知識交流需求。因而,曾建勛提出了應用本體語義技術,從用戶生成內容和用戶關系構建科研關系網絡,以用戶一文本新視角探索學術社交網絡知識關聯服務新模式。如今,學者們正嘗試利用深度學習從大量簡單數據中尋找規律處理新知識構建多粒度知識組織,如Pradhan T等結合深度學習和隨機游走模型從文本、詞匯和用戶多層次細粒度地為學者推薦潛在科研伙伴,并通過采集數據集驗證模型在精度、召回率和F1得分等指標上相較于其他方法具有更強的有效性。
1.2知識組織體系從鏈式知識層向多維知識網絡演變
在最初的學術社交網絡知識組織體系中,將不同學科的文獻信息分成不同的知識層,通過元數據鏈接不同知識層,以便于用戶獲取知識。如Verd.ugo N等搭建了Ogmios系統利用元數據集成科研成果信息,并基于上下文的匹配方法將學術社交網絡中的研究者個人資料與知識需求結合,根據學者知識需求情景實時協同知識組織。然而隨著學術社交網絡中知識交流頻率的增加,產生了大量的新知識.最初的單鏈式關聯不足以整合源源不斷產生的新的交互內容,只有通過增添新的知識和語義關系,才能不斷強化不同知識層之間的關聯,保持學術社交網絡中資源組織可持續發展。陳果等在構建的領域知識庫中利用知識元將學術社區中用戶生成的碎片化知識與原有知識體系鏈接,為學術社交網絡中知識組織引入新的知識單元,形成多鏈式知識組織結構。而如今,在用戶知識需求轉變迅速背景下,盡管現有知識組織結構能勉強整合科研信息,但無法動態地隨用戶知識需求變化而變化,為厘清知識空間至知識需求的映射規律,只有通過更加密切的網狀關聯,融合用戶需求聚合知識層,才能精準滿足多層次的用戶知識需求。如張連峰等應用關聯數據分析用戶個體間、個體與群體間、交互群體間的關系歸納用戶知識需求,提出了一種深度融合主題和SECI模型的知識組織框架,以加速學術社交網絡中的知識的流轉和創新。
學術社交網絡知識組織單元由單一粗粒度的文本、詞匯轉向多元細粒度的知識超網絡,知識組織體系亦從鏈式知識層演化至多維知識網絡,這些變化既是知識組織理論變革的具象表征,也是學術社交網絡知識組織理論順應時代潮流的發展趨勢。從學術社交網絡知識組織理論研究歷程來看,無論是從概念理論、分眾分類到社會網絡理論,還是從元數據、領域本體到關聯數據學術社交網絡知識組織理論研究都無一例外地朝著用戶聚攏。同時,用戶在學術社交網絡中除了是知識利用者,更是知識的生產者和管理者,這使得學術社交網絡知識組織愈發注重用戶交互的作用.通過揭示用戶交互關系進行知識組織將成為革新學術社交網絡知識組織理論的要點。
2在線學術社交網絡知識組織方法研究
學術社交網絡的知識組織理論研究逐步深入的同時,知識組織方法也不斷迭代更新,已有的研究實踐中,已經從學者關系、標簽聚類、主題聚合和推薦機制等方面進行了方法探討,以揭示學術社交網絡知識結構,明晰知識交流演化規律和趨勢.促進學者有效利用學術社交網絡開展科研交互與合作。
2.1利用學者關系拓展社交網絡
學者關系中的引證、合作、信任關系既是現實學術社交的基礎,也是網絡學術社交的脈絡,面向學者關系開展知識組織利于學者交流合作實現知識的共享和創新。2014年,邱均平等在國家社科基金重大課題成果中利用共現和耦合的方法挖掘潛在科研關系.為學術社交網絡專家發現和知識服務提供了新思路;2018年,Hoang D T等利用學者之間已有研究合作網絡,建立了一個加權向量圖來幫助學者發現學術社交網絡中新的合作者;胥偉嵐引入社會網絡分析方法進一步解析學術社交網絡中用戶科研關系,提出了一種基于人際網絡優化學術社交網絡知識交流模式的方法。
2.2結合用戶標簽聚類信息資源
VanderWal于2005年創造了社會標簽(Folk.sonomy)一詞,它是由用戶生產的,用于描述實體的詞表或分類事物的機制。在學術社交網絡中社會標簽的應用多融合于知識組織體系中,2013年,Uddin M N等認為應建立社會標簽和知識之間的聯系.并基于Folksonomy提出了一種根據學者評分檢索和排序學術社區資源的方法。2015年,畢強等以豆瓣網為研究對象,挖掘圖書情報學科的圖書標簽之間的潛在關聯關系,融合社會分析法拓展了用戶標簽聚類方法。2018年,郭順利在博士學位論文中通過提取知乎中用戶原創內容關鍵詞,利用DPAC算法聚合社會化問答社區用戶生成答案發現知識主題,為用戶生成知識融人社區知識體系提供了廣闊的前景。
2.3融入關聯數據聚合主題內容
2006年.萬維網之父Tim.Bemera-Lee提出以關聯數據簡化實現語義Web,其中關聯數據主要通過發布和鏈接結構化數據使得分散異構的數據孤島實現語義關聯,從而促進傳統文件網絡向數據網絡的演進。在學術社交網絡中面向主題關聯的知識組織則是指依據本地資源主題內容補充新數據.以完善學術社交網絡知識脈絡的一種關聯數據應用方法。2014年,Kava M等構建了一種新的基于數據立方體的模型.鏈接學術社交網絡中某一主題的所有異構資源,豐富了學術社交網絡的知識結構。2018年,王日芬等使用LDA主題模型在科研文獻共現關系重構了社區學科知識網絡,同時提出主題影響力概念并規范了其測度方法。2018年,關鵬等在該研究基礎上,通過復雜網絡與多agent系統仿真.實現了整合主題的學科知識網絡演化,為主題關聯的知識組織提供了新的方法與工具。
2.4應用推薦系統重構知識組織
推薦系統是目前信息過濾系統中最有效解決用戶信息過載問題,提升信息服務質量的工具之一。在學術社交網絡中.主流推薦系統機制分為以下3種:協同過濾、基于內容和混合推薦。協同過濾是推薦系統中應用最廣泛的算法,它無需注解領域術語,對各個研究領域具有普適性。2016年,吳燎原等提出了聯合概率矩陣分解科研信息的新算法,協同群組信息和用戶標注更精準地為學者過濾了冗余信息,提升了科研社交網站知識推薦服務的精度。協同過濾具有普適性,但其存在稀疏矩陣和冷啟動的問題。為解決這一問題,2018年,ZhaoP等通過提取高層次學者的研究內容,計算提取研究主題與潛在讀者的閱讀興趣之間的相似度后進行匹配,跨越了用戶相似度稀疏產生的服務障礙,解決了冷啟動問題。但基于內容的推薦算法仍存在缺陷,其推薦結果易重復,無法滿足用戶多樣化的信息需求。混合推薦算法彌補了前兩種傳統推薦方法的缺點,能大幅度地提升推薦效果。2019年,Sarwar S等利用機器學習技術(案例推理和神經網絡的混合)提出了一種個性化、可調整的用戶分類模型,并結合情境感知優化知識服務系統,實時地向學者推薦所需科研信息。
綜上所述,學術社交網絡知識組織方法主要有:利用學者關系拓展社交網絡、結合用戶標簽聚類信息資源、融人關聯數據進行主題聚合和應用推薦系統重構知識組織這4類,其中學者關系依托于用戶交互關系、用戶標簽由用戶與內容交互產生、關聯數據依賴知識交互關聯、推薦系統立足于用戶交互行為需求,并且用戶交互貫穿于用戶使用學術社交網絡的全過程,亦是學術社交網絡建設的主題。因此,依托于用戶交互行為滿足用戶知識需求的學術社交網絡知識組織方法研究將成為學界未來的重要方向。
3研究評述及未來研究建議
綜上所述,國內外相關研究圍繞學術社交網絡知識組織問題,展開了知識組織理論探索,提出了許多改進社交網絡知識組織的方法并應用于技術實踐中,取得了較多研究成果,為本研究的開展提供了理論支持與技術模型借鑒,但仍存在一些問題:①現有的對學術社交網絡知識組織的理論研究.多從用戶知識需求分析與資源關聯角度展開,盡管其中摻雜了一些用戶交互行為的分析,卻未將用戶交互行為與學術社交網絡的知識資源組織結合起來進行深入研究。②現有的學術社交網絡知識組織的方法與實踐研究集中在學者與論文推薦服務方面,未能充分挖掘學術社交網絡的社交屬性和碎片化的交互內容開展更深層次的知識服務。針對這些問題,未來研究可從以下幾個方面展開。
3.1學術社交網絡用戶交互特征與需求分析
用戶對于知識的需求呈現出多樣化與個性化特征.用戶交互行為特征是用戶需求偏好的有效反映,用戶知識發現與獲取需求從分散、孤立的顯性需求,轉變為基于知識關聯關系的聚合需求,用戶需求的滿足仍存在精準性不高、延展性不強等缺陷。因此,針對學術社交網絡中用戶交互特征與需求進行分析是未來學術社交網絡知識組織拓展的第一步.為了更好地滿足用戶的知識需求,理應對學術社交網絡用戶進行群體差異分析與精準刻畫,在此基礎上進行用戶交互需求建模.為知識組織的開展提供依據。
3.2學術社交網絡用戶交互內容與關系關聯揭示
用戶的知識交流與利用形態處在新的變革之中.用戶通過知識交流和利用行為形成用戶交互關系、用戶一知識資源間的關聯關系和知識資源間的關聯關系。這些關聯關系與用戶的知識需求內容緊密相連。通過對交互內容進行深度語義挖掘,將其與用戶的需求偏好和用戶的社會化交互關系進行語義關聯,能夠更好地揭示用戶關系與知識需求之間的關聯關系。學術社交網絡用戶間所開展的廣泛科研交互及所形成的交互關系.是實現學術社交網絡中合作關系轉化和科研合作開展的重要支撐,以用戶交互關系為視角動態關聯用戶知識需求,有助于構建跨系統的知識關聯組織.與時俱進地滿足科研用戶不斷變化的信息訴求。在其關聯揭示中,應對用戶交互內容進行實體識別與抽取.并界定語義特征,挖掘實體之間的概念語義關系;根據實體特征與語義關系進行交互內容與關系標注。同時,為便于知識關聯組織階段對交互內容的利用.亦需要針對資源標注結果優化語義描述,以實現機器可理解。
3.3基于用戶交互關系的多維知識關聯組織
由于學術社交網絡中學術資源來源廣泛、類型多樣,致使知識分布呈現無序化、碎片化,無法建立緊密有效的知識關聯,但優質的知識關聯是實現知識資源的細粒度組織的關鍵,如果知識資源關聯組織無法完整鏈接在一起.將無法為用戶提供精準、個性化的知識服務。因而,將異構的學術資源和UGC內容通過何種方法鏈接成一個新的動態整體,將成為未來學術社交網絡知識組織研究的新方向。目前,已有學者提出通過語義分析細粒化知識單元,結合科研關系關聯異構學術資源,但其仍未能充分挖掘學術社交網絡的社交屬性和碎片化的交互內容,其中許多問題仍亟待解決,如:如何抽取學術社交網絡中多元知識單元之間的關系、多維關系與知識網絡之間的映射模式以及知識交互關聯構建等問題。因此,在未來研究中為了更深層次揭示學術社交網絡中知識資源關聯關系,構建多維關聯關系網絡,需要融合用戶之間的交互關系、用戶與知識交互關系、知識之間的關系進行多維度、多層次的立體化關聯。
3.4面向用戶交互需求的知識服務拓展
知識組織的目的是為了提供更好的知識服務,因而提升學術社交網絡知識的利用效率,發揮社交屬性和碎片化交互知識的價值,需要圍繞用戶的交互需求進行知識服務拓展,構建面向用戶交互關系的知識來源關聯、結構關聯和知識進化關聯服務體系。未來研究推進中,應在前述知識關聯多維組織的基礎上.探索基于用戶交互關系的潛在科研關系匹配與推薦服務、碎片化知識的聚合服務、隱l生知識的獲取與推送服務等。除此之外,學術資源組織應在知識元鏈接系統、學科分面導航系統和知識關聯檢索系統中選擇何種形式呈現給用戶也將成為學術社交網絡研究重點。學術社交網絡知識組織研究不應當局限于理論與方法研究,應攜手信息服務機構將研究理論與方法運用在實踐中,增強理論與方法的普適性。實證研究需要在不同類型、專業的學術社交網站中,揭示不同知識單元之間的知識關聯.面向用戶開展多維知識組織.集成碎片化的顯性知識,發現理論機制中存在的問題,完善平臺建設,推動知識的組織、傳遞和應用。
4結語
本研究系統回顧了國內外學術社交網絡知識組織的理論和方法研究,結果表明:學術社交網絡知識組織正在逐漸由傳統學科類屬體系轉向依托于用戶交互關系的新模式,促進知識的關聯發現與鏈接,形成內容相互關聯、多維度、多層次的知識網絡。本研究結合國內外研究現狀,提出未來的研究可以圍繞用戶交互行為與內容特征、揭示用戶交互關系、多維知識關聯組織等內容展開。