宋艷輝 邱均平
摘要:[目的/意義]在當今數(shù)字網(wǎng)絡(luò)、知識經(jīng)濟和大數(shù)據(jù)背景下,“五計學(xué)”學(xué)科群表現(xiàn)出一些新的發(fā)展特征和發(fā)展趨勢,“五計學(xué)”領(lǐng)域出現(xiàn)了新現(xiàn)象和新問題,需要采用新思維和新方法來研究和解決“五計學(xué)”研究成果,整合“五計學(xué)”研究方法,為“五計學(xué)”的融合發(fā)展指明方向。[方法/過程]本文運用內(nèi)容分析法與歸納演繹法對相關(guān)研究進行分析。[結(jié)果/結(jié)論]嘗試性地提出了6種“五計學(xué)”知識融合實現(xiàn)模式:基于語義規(guī)則的知識融合,基于貝葉斯網(wǎng)絡(luò)的知識融合,基于D-S理論的知識融合,基于知識挖掘的知識融合,面向網(wǎng)格環(huán)境的知識融合以及面向近似知識的知識融合;提出了2種“五計學(xué)”知識融合過程控制手段分別是知識融合評價和知識融合系統(tǒng)。
關(guān)鍵詞:五計學(xué);知識融合;語義網(wǎng)絡(luò)
DOI:10.3969/j.issn.1008-0821.2019.02.001
〔中圖分類號〕G250252〔文獻標識碼〕A〔文章編號〕1008-0821(2019)02-0004-04
“五計學(xué)”是以“文獻計量學(xué)”為起點的。1969年,學(xué)術(shù)文獻中相繼出現(xiàn)了兩個類似的英文術(shù)語:Bibliometrics(譯為文獻計量學(xué))和Scientometrics(由俄文轉(zhuǎn)譯成英文),譯為科學(xué)計量學(xué)。隨著社會的進步和科學(xué)技術(shù)的發(fā)展,人類社會先后出現(xiàn)了信息化、網(wǎng)絡(luò)化、知識化的新趨勢。這些新的社會環(huán)境和技術(shù)條件的變化,深深地影響著計量學(xué)科的發(fā)展,于是“信息計量學(xué)”、“網(wǎng)絡(luò)計量學(xué)”和“知識計量學(xué)”便相繼應(yīng)運而生。“五計學(xué)”的誕生和發(fā)展不僅具有科學(xué)意義,更是量化分析方法的主要來源。目前,我國人文社會科學(xué)創(chuàng)新主要有方法創(chuàng)新、理論創(chuàng)新(學(xué)術(shù)觀點)和學(xué)科創(chuàng)新(分支學(xué)科)。而“五計學(xué)”的融合,特別是方法融合更有利于科學(xué)研究的方法創(chuàng)新,大大提高“五計學(xué)”的應(yīng)用價值和方法論意義,從而有力地促進整個人文社會科學(xué)的快速和健康發(fā)展。知識融合,是從知識整體的角度,依據(jù)一定的目的需要、理念設(shè)計,把不同實踐要素按照合理的活動程序、配置比例,將各種知識片斷或分散的對象元素或單元再建構(gòu),使之具有可以發(fā)揮功能的總體性能。知識融合對于更新組織的知識非常關(guān)鍵,其體系結(jié)構(gòu)是一個開放式結(jié)構(gòu),與外界存在廣泛的交流和接觸。知識融合有著多種類型、多種層次、多種方式,并有著與創(chuàng)新規(guī)律一致的融合機制,可以分為形式融合、分類融合、立體融合和用途融合等。知識融合是知識管理的一個重要環(huán)節(jié),融合把各部分的功能組合成一種新的功能,把各部分的效用結(jié)合成一種新的效用,通過融合產(chǎn)生了系統(tǒng)創(chuàng)新的功效。
1相關(guān)研究
2010年,劉則淵等提出了“SIBW”計量學(xué)科群[1]。2015年6月,在第九屆全國科學(xué)計量學(xué)與科教評價研討會上作了題為“我國“五計學(xué)”的進展與趨勢”的大會報告,再一次詳細論述了“五計學(xué)”問題,得到與會學(xué)者的普遍認同。2015年,侯劍華等提出了“泛知識計量學(xué)科群”[2]。2017年10月,第十六屆國際科學(xué)計量學(xué)和信息計量學(xué)研討會(16thISSI)和第十屆全國科學(xué)計量學(xué)與科教評價研討會都將“五計學(xué)”研究作為大會的重要議題。武漢大學(xué)研究團隊先后出版了“五計學(xué)”研究系列叢書[3-7]。
楊小華等認為,隨著信息化、網(wǎng)絡(luò)化和知識化的推進,“五計學(xué)”相互融通,呈現(xiàn)出“計量學(xué)”學(xué)科群相互促進、共同發(fā)展的態(tài)勢[8]。“五計學(xué)”之間在研究對象、研究內(nèi)容、研究方法、數(shù)據(jù)來源、計量指標等方面呈現(xiàn)出交叉關(guān)聯(lián)、互為引用、相互融合的發(fā)展特征和趨勢[9]。計量學(xué)科在“五計學(xué)”的基礎(chǔ)上,形成了泛知識計量學(xué)科群,具有明顯的交叉性和協(xié)同性,表現(xiàn)為以基礎(chǔ)理論、研究對象和研究方法與工具等為核心要素的協(xié)同演進。
2“五計學(xué)”知識融合實現(xiàn)模式
2.1基于語義規(guī)則的知識融合
基于語義規(guī)則的“五計學(xué)”知識融合能實現(xiàn)深入的信息集成,提供更加集成的答案,對知識源數(shù)量較多的情況以及對時間較為敏感的任務(wù)來說,尤其彰顯價值。知識與信息的主要區(qū)別之一,在于知識具備推理屬性,構(gòu)建本體是實現(xiàn)知識推理的重要手段,因此,基于語義規(guī)則實現(xiàn)知識融合可以成為“五計學(xué)”融合的主要實現(xiàn)模式。
第一種做法是建立語義規(guī)則,實現(xiàn)知識融合。可以開發(fā)一種基于語義規(guī)則的融合算法,將知識映射到本體庫,并轉(zhuǎn)換成元知識集,本體和元知識集共同構(gòu)成知識對象。為了融合知識對象,接著正式地描述了一組比較規(guī)則,來明確融合條件,同時通過結(jié)構(gòu)格式和語義規(guī)則過濾知識對象,能夠?qū)崿F(xiàn):①將知識對象分成不同粒度層級;②指導(dǎo)融合過程,以規(guī)避不合邏輯的結(jié)果。例如,Xie等人[10]就曾針對網(wǎng)絡(luò)信息中的農(nóng)業(yè)知識,研究了基于語義規(guī)則的農(nóng)業(yè)知識融合,不僅涉及通過鏈接向用戶傳遞結(jié)果信息,還涉及通過解決結(jié)果一致性、去除重復(fù)項等方法融合來自農(nóng)業(yè)信息資源的知識,并實際設(shè)計了基于知識融合的信息獲取界面。
第二種做法是結(jié)合圖論與本體,實現(xiàn)知識融合。既有關(guān)系圖,也有主題圖,進而實現(xiàn)語義可視化。
第三種做法是基于知識空間理論的新型知識融合方法,將知識空間中的對象結(jié)點,在不同粒度的結(jié)構(gòu)中表示,每個知識對象有相應(yīng)的本體對象和元知識集,知識對象之間的距離由結(jié)構(gòu)和語義關(guān)系來定量化。這種知識聚類方法調(diào)整了空間結(jié)構(gòu),能夠提高知識搜索的策略,優(yōu)化知識融合過程。
2.2基于貝葉斯網(wǎng)絡(luò)的知識融合
綜合貝葉斯網(wǎng)絡(luò)(Bayesian Networks,BNs)是實現(xiàn)“五計學(xué)”知識融合中非常有潛力的技術(shù)。筆者認為,一個有效的貝葉斯網(wǎng)絡(luò)綜合方法不應(yīng)在底層貝葉斯網(wǎng)絡(luò)上添加任何特別的約束條件,以便該方法可以應(yīng)用于這5種知識工程情境。總的來說,可靠的貝葉斯網(wǎng)絡(luò)綜合知識融合方法,應(yīng)當滿足3個基本標準,即避免循環(huán)、保持貝葉斯結(jié)構(gòu)條件的獨立性和保留個體貝葉斯參數(shù)的特征。為了實現(xiàn)多個貝葉斯知識源的融合,解決在不確定環(huán)境下的“五計學(xué)”知識融合問題,可以將概率模型表示成貝葉斯知識基礎(chǔ),并提出貝葉斯知識融合的算法,該算法允許將多個貝葉斯知識基礎(chǔ)融合成單個貝葉斯知識基礎(chǔ),同時保留所有輸入源中的知識。這就實現(xiàn)了通過提供一個框架,對多個知識源進行簡易聚合和逆向聚合,同時框架中的所有意見都得到保留和推理。可以進一步設(shè)計和開發(fā)的新型貝葉斯組合方法,主要關(guān)注兩個方面:①用于組織貝葉斯網(wǎng)絡(luò)的基因算法,不對底層貝葉斯網(wǎng)絡(luò)施加任何特別的約束條件;②一種有效方法保持貝葉斯結(jié)構(gòu)條件獨立性和保留個體貝葉斯參數(shù)特征。
2.3基于D-S理論的知識融合
D-S(Dempster-Shafer)證據(jù)組合理論作為融合方法,首先構(gòu)建不同觀測結(jié)果的信任函數(shù),利用Dempster證據(jù)組合規(guī)則將之組合,再根據(jù)一定的規(guī)則對組合后的信任函數(shù)進行判斷,最終實現(xiàn)融合和決策選擇。在許多應(yīng)用情境中,有大量的知識需要融合,例如,涉及計量數(shù)據(jù)樣本的理論與方法等,基于D-S理論的知識融合就有了用武之地,其包含了研究了3個組合規(guī)則,即原始的D-S規(guī)則、墨菲規(guī)則和基于非精確狄利克雷模型的規(guī)則,D-S規(guī)則和墨菲規(guī)則有匯聚行為,這種匯聚行為并不與新需求相一致。當許多計量理論與方法被融合的時候,只有基于非精確狄利克雷模型的規(guī)則呈現(xiàn)出了所需求的行為,所以基于非精確狄利克雷模型的規(guī)則,具備用于合作知識發(fā)現(xiàn)與數(shù)據(jù)挖掘或者生物計算領(lǐng)域的潛力。
2.4基于知識挖掘的知識融合
近十年來,知識挖掘技術(shù)得到長足發(fā)展,能夠從數(shù)據(jù)中抽取分類模型,但是結(jié)果通常不是非常直觀,或者缺少對于領(lǐng)域?qū)<襾碚f符合邏輯的模式。具體實現(xiàn)如下:通過擴展蟻群挖掘分類技術(shù)來包含領(lǐng)域知識,通過改變環(huán)境和影響啟發(fā)值,分別將蟻群搜索限制和引導(dǎo)向?qū)<艺J為符合邏輯的、直觀的解空間區(qū)域,從而實現(xiàn)“五計學(xué)”的知識融合。因此,基于知識挖掘的“五計學(xué)”知識融合,較為適用于非專家知識與專家知識的融合。
2.5面向網(wǎng)格環(huán)境的知識融合
以往網(wǎng)絡(luò)關(guān)注信息的交流,現(xiàn)在網(wǎng)絡(luò)開始強調(diào)知識重用,以形成大型分布式知識基礎(chǔ)。語義網(wǎng)格將信息和服務(wù)進行了良好定義,擴展了現(xiàn)有網(wǎng)格來支持軟件代理、用戶和項目合作。在上述過程中,要將各種計量知識源有效地組合,來輔助研究者進行高效推理或者促進研究者合作,“五計學(xué)”知識融合在網(wǎng)格環(huán)境中的應(yīng)用因而受到重視。
2.6面向近似知識的知識融合
針對各種計量知識資源中的近似知識,集中精力定義知識融合的整體機制,繼而開發(fā)了有利于保障融合知識的技術(shù),融合的知識可被表達成命題動態(tài)邏輯的Horn子集。另一方面,命題邏輯可視為第一順序邏輯的子集,第一順序邏輯是在描述性邏輯精神(Spirit of Description Logics)中定義概念的天然工具,其定義的概念可以進一步用于定義各種本體,例如那些在語義網(wǎng)中可用的本體。使用模糊集和關(guān)系的一般式,研究分布異構(gòu)信息源中知識的融合,該一般式依賴任意相似關(guān)系的存在。在多代理系統(tǒng)中引入了知識融合框架,代理的個體感知能力由相似關(guān)系表示,再進一步聚合形成團隊的聯(lián)合能力,該聚合已經(jīng)通過動態(tài)邏輯被正規(guī)化,允許從個體層次向社會層次轉(zhuǎn)移。建立了基于規(guī)則的分層結(jié)構(gòu),在提出的框架中,將動態(tài)邏輯的Horn子集與推理數(shù)據(jù)庫技術(shù)結(jié)合,獲得的知識融合規(guī)則在現(xiàn)實數(shù)據(jù)中成功地得到應(yīng)用。
3“五計學(xué)”知識融合的過程控制
3.1知識融合評價
“五計學(xué)”知識融合的評價機制有利于更好的發(fā)現(xiàn)潛在知識,融合知識的語義相關(guān)性和準確性也能得到提高,所以應(yīng)更加重視知識融合的評價問題。為了控制融合知識的規(guī)模,以及避免非邏輯的知識,可以構(gòu)建具備屬性值的融合知識測度,為知識融合算法提供指導(dǎo):首先,分析知識元素與基于本體的語義相關(guān)性之間的關(guān)系強度;然后,利用最大熵值模型定義和分析了融合知識(Fusion-knowledge)的語義熵。在此基礎(chǔ)上,通過融合知識測度構(gòu)建了加速適應(yīng)度方程,通過提高人群選擇和基因操作將基因仿真退火算法應(yīng)用到知識融合。根據(jù)知識熵平衡方程的分析,基于信息擴散理論的評價機制被用來提高融合知識的準確度。筆者認為,“五計學(xué)”知識融合的過程需要評價、反饋和控制,以提高融合的效率。針對融合進行的評價研究,有助于用戶選取最合適的融合算法和融合步驟。
3.2知識融合系統(tǒng)研究
在知識融合實現(xiàn)模式和知識融合評價的研究基礎(chǔ)上,需要設(shè)計和開發(fā)實際的知識融合系統(tǒng),一方面檢驗提出的融合算法和評價方法;另一方面為投入實際應(yīng)用奠定基礎(chǔ)。總的來說,知識融合系統(tǒng)的開發(fā),在技術(shù)架構(gòu)和設(shè)計細節(jié)上,知識融合研究者需要逐漸認識到,需要根據(jù)應(yīng)用需求,在通用知識融合系統(tǒng)基礎(chǔ)上,進行個性化定制,來實現(xiàn)多層次、個性化、創(chuàng)新性的知識服務(wù)。知識融合系統(tǒng)應(yīng)用問題解決方法技術(shù)(Problem-solving Methods Technology),允許綜合面向融合過程子任務(wù)的方法,也允許選擇最佳的方法,這取決于領(lǐng)域以及任務(wù)的具體內(nèi)容。系統(tǒng)應(yīng)為一種自適應(yīng)知識融合系統(tǒng),展示具有反饋和自適應(yīng)機制的知識融合方法,所提出的反饋機制基于知識空間和應(yīng)用服務(wù)之間的消息交流,還能評價融合結(jié)果和優(yōu)化融合過程以適應(yīng)需求。
4結(jié)語
本文從兩個方面探討我國“五計學(xué)”的知識融合發(fā)展問題,一是“五計學(xué)”知識融合實現(xiàn)模式;二是“五計學(xué)”知識融合的過程控制。最后,筆者認為,隨著大數(shù)據(jù)時代的到來,大數(shù)據(jù)環(huán)境下“五計學(xué)”的知識融合,還需要重點解決大數(shù)據(jù)分析問題。“五計學(xué)”側(cè)重于對不同的計量對象,不同的文獻、信息、知識、數(shù)據(jù)類型的整合與分析。唯有做到這一點,注重量化分析的“五計學(xué)”才能達到本質(zhì)上的融合。因此,需要我們針對大數(shù)據(jù)時代面向5種知識源的知識融合過程模型進行詳細分析與設(shè)計,針對典型的大數(shù)據(jù)知識源,進行知識融合實現(xiàn)模式的設(shè)計,為大數(shù)據(jù)時代“五計學(xué)”知識融合的實現(xiàn)提供解決方案。擬解決的主要問題包括:①大數(shù)據(jù)知識融合過程模型的構(gòu)建。結(jié)合大數(shù)據(jù)的特點和知識源類型,設(shè)計大數(shù)據(jù)知識融合的流程步驟,分析各功能模塊之間的關(guān)系及所需的關(guān)鍵技術(shù),探討融合知識服務(wù)的應(yīng)用模式及實現(xiàn)方案,定義大數(shù)據(jù)知識融合過程模型。②基于分布式知識庫的大數(shù)據(jù)知識融合實現(xiàn)模式設(shè)計。分析大數(shù)據(jù)時代分布式知識庫的構(gòu)成特征和知識抽取方法,研究大數(shù)據(jù)時代元知識抽取和元知識庫構(gòu)建方法,設(shè)計知識融合算法和融合規(guī)則庫構(gòu)建過程,通過知識抽取、知識轉(zhuǎn)化、知識清理、知識集成,形成知識倉庫,實現(xiàn)知識融合。③基于網(wǎng)絡(luò)知識源的大數(shù)據(jù)知識融合實現(xiàn)模式設(shè)計。分析大數(shù)據(jù)時代網(wǎng)絡(luò)數(shù)據(jù)遷徙的途徑和方法,研究通過Web服務(wù)實現(xiàn)對異構(gòu)網(wǎng)絡(luò)知識源進行知識發(fā)布、知識表示的過程和方法,研究大數(shù)據(jù)時代知識檢索和知識網(wǎng)絡(luò)構(gòu)建流程與方法。
參考文獻
[1]劉則淵,朱曉宇.國際科學(xué)計量學(xué)及其姊妹學(xué)科的計量與圖譜[C]//第七屆中國科技政策與管理學(xué)術(shù)年會論文集,南京:第七屆中國科技政策與管理學(xué)術(shù)年會,2011.
[2]侯劍華,都佳妮.泛知識計量學(xué)科協(xié)同演進初探[J].情報科學(xué),2015,33(7):7-10.
[3]邱均平,等.知識計量學(xué)[M].北京:科學(xué)出版社,2014.
[4]邱均平,等.網(wǎng)絡(luò)計量學(xué)[M].北京:科學(xué)出版社,2010.
[5]邱均平,等.科學(xué)計量學(xué)[M].北京:科學(xué)出版社,2016.
[6]邱均平,等.信息計量學(xué)[M].武漢:武漢大學(xué)出版社,2007.
[7]邱均平.文獻計量學(xué)(第2版)[M].北京:科學(xué)出版社,2018.
[8]鐘積奎,楊小華.學(xué)習過程的知識轉(zhuǎn)化模式新探——以“文獻觀”學(xué)習過程為例[J].現(xiàn)代情報,2010,30(5):28-33.
[9]趙蓉英,魏明坤.“五計學(xué)”在我國的發(fā)展演進分析[J].現(xiàn)代情報,2017,37(6):155-167.
[10]Xie Nengfu,Wang Wensheng,Yang Xiaorong,et al.Rule-based Agricultural Knowledge Fusion in Web Information Integration[J].Sensor Letters,2012,10(1):635-638.
(責任編輯:馬卓)