大數(shù)據(jù)時(shí)代的到來(lái),標(biāo)志著信息技術(shù)已經(jīng)跨越了數(shù)字化與網(wǎng)絡(luò)化階段,進(jìn)入智能化處理階段.由此引發(fā)的一個(gè)新的挑戰(zhàn)就是知識(shí)的碎片化問(wèn)題,表現(xiàn)為與特定主題相關(guān)的知識(shí)以文本、圖像、視頻、音頻、圖、網(wǎng)頁(yè)等多模態(tài)跨模態(tài)的形式分散在多個(gè)數(shù)據(jù)源中,呈現(xiàn)出位置分散、模態(tài)多樣、結(jié)構(gòu)無(wú)序、內(nèi)容片面、動(dòng)態(tài)依賴(lài)的特點(diǎn),由此造成日趨嚴(yán)重的“學(xué)習(xí)迷航、認(rèn)知過(guò)載”和“只見(jiàn)樹(shù)木、不見(jiàn)森林”等問(wèn)題,成為構(gòu)建智慧化知識(shí)密集型應(yīng)用的一個(gè)瓶頸問(wèn)題.因此,如何從多源、異質(zhì)、時(shí)變的大數(shù)據(jù)中分析挖掘碎片化知識(shí)并融合成為知識(shí)圖譜,是提升知識(shí)可用性和系統(tǒng)性的基礎(chǔ)性關(guān)鍵問(wèn)題,也是大數(shù)據(jù)、人工智能、知識(shí)自動(dòng)化等領(lǐng)域面臨的共性難題.
為此,《計(jì)算機(jī)研究與發(fā)展》推出“碎片化知識(shí)融合與應(yīng)用”專(zhuān)題,介紹在此新領(lǐng)域中的實(shí)際案例,交流學(xué)術(shù)思想和研究成果,促進(jìn)碎片化知識(shí)融合與應(yīng)用的研究與發(fā)展.本期專(zhuān)題得到同行的廣泛關(guān)注,通過(guò)公開(kāi)征文收到15篇高質(zhì)量投稿稿件,這些論文圍繞不同應(yīng)用領(lǐng)域闡述了碎片化知識(shí)融合與應(yīng)用的研究成果,展現(xiàn)出大數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、知識(shí)圖譜等方法在破解碎片化知識(shí)融合與應(yīng)用難題方面取得的最新進(jìn)展和前沿趨勢(shì).
本專(zhuān)題的審稿嚴(yán)格按照期刊審稿的要求進(jìn)行,特邀編委先后邀請(qǐng)了二十余位相關(guān)領(lǐng)域的專(zhuān)家參與評(píng)審,歷經(jīng)初審、復(fù)審、終審等階段,最終遴選出3篇高質(zhì)量的論文入選本專(zhuān)題.內(nèi)容涵蓋了醫(yī)療知識(shí)圖譜、視覺(jué)問(wèn)答系統(tǒng)等應(yīng)用,在一定程度上反映了當(dāng)前國(guó)內(nèi)學(xué)者在碎片化知識(shí)融合的代表性應(yīng)用.
隨著醫(yī)療大數(shù)據(jù)時(shí)代的到來(lái),知識(shí)互聯(lián)受到了廣泛的關(guān)注.如何從海量的數(shù)據(jù)中提取有用的醫(yī)學(xué)知識(shí),是醫(yī)療大數(shù)據(jù)分析的關(guān)鍵.知識(shí)圖譜技術(shù)提供了一種從海量文本和圖像中抽取結(jié)構(gòu)化知識(shí)的手段,知識(shí)圖譜技術(shù)在醫(yī)療領(lǐng)域擁有廣闊的應(yīng)用前景.侯夢(mèng)薇等作者的“知識(shí)圖譜研究綜述及其在醫(yī)療領(lǐng)域的應(yīng)用”一文針對(duì)醫(yī)療領(lǐng)域大數(shù)據(jù)專(zhuān)業(yè)性強(qiáng)、結(jié)構(gòu)復(fù)雜等特點(diǎn),對(duì)醫(yī)學(xué)知識(shí)圖譜架構(gòu)和構(gòu)建技術(shù)進(jìn)行了剖析;并分別針對(duì)醫(yī)學(xué)知識(shí)圖譜中知識(shí)表示、知識(shí)抽取、知識(shí)融合和知識(shí)推理這4個(gè)模塊的關(guān)鍵技術(shù)和研究進(jìn)展進(jìn)行綜述.此外,介紹了醫(yī)學(xué)知識(shí)圖譜在臨床決策支持、醫(yī)療智能語(yǔ)義檢索、醫(yī)療問(wèn)答等醫(yī)療服務(wù)中的應(yīng)用現(xiàn)狀以及發(fā)展前景的展望.
結(jié)構(gòu)無(wú)序、內(nèi)容片面的碎片化信息以文本、圖像、視頻、網(wǎng)頁(yè)等不同模態(tài)的形式,高度分散存儲(chǔ)在不同數(shù)據(jù)源中,通過(guò)構(gòu)建視覺(jué)問(wèn)答系統(tǒng)實(shí)現(xiàn)對(duì)多模態(tài)碎片化信息的提取、表達(dá)和理解.王一蕾等作者的“基于深度神經(jīng)網(wǎng)絡(luò)的圖像碎片化信息問(wèn)答算法”一文研究包括圖像特征提取、問(wèn)題文本特征提取、多模態(tài)特征融合和答案推理各個(gè)流程的模型與算法.構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型提取用于表示圖像與問(wèn)題信息的特征,結(jié)合注意力機(jī)制與變分推斷方法關(guān)聯(lián)圖像與問(wèn)題兩種模態(tài)特征并推理答案.
利用群體智慧原理,將多個(gè)相互獨(dú)立的聚類(lèi)方法的結(jié)果進(jìn)行聚合,可提高聚類(lèi)結(jié)果的準(zhǔn)確性.張恒山等作者的“基于群體智慧的簇連接聚類(lèi)集成方法”一文提出基于群體智慧的簇連接聚類(lèi)集成方法,首先使用群體智慧理論的獨(dú)立性、分散性、多樣性原則引導(dǎo)個(gè)體聚類(lèi)結(jié)果的生成,然后提出基于連接三元組的聚類(lèi)集成方法對(duì)個(gè)體聚類(lèi)結(jié)果進(jìn)行分組聚合,將分組聚合的結(jié)果再次進(jìn)行聚合得到最終的聚類(lèi)結(jié)果.實(shí)驗(yàn)結(jié)果表明,該方法可以提高集成聚類(lèi)結(jié)果的準(zhǔn)確性.
碎片化知識(shí)融合應(yīng)用的領(lǐng)域非常多,本專(zhuān)題僅僅選擇3個(gè)有代表性的應(yīng)用進(jìn)行嘗試性的報(bào)道,以饗讀者.最后,衷心感謝各位作者、審稿專(zhuān)家和編輯部的全力支持和辛勤工作,使得本專(zhuān)題得以順利出版!