999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于詞嵌入的國家自然科學基金學科交叉知識發現方法
——以“人工智能”與“信息管理”為例

2021-09-09 03:18:16王衛軍姚暢喬子越崔文娟杜一周園春
情報學報 2021年8期
關鍵詞:語義人工智能學科

王衛軍,姚暢,喬子越,崔文娟,杜一,周園春

(1.中國科學院計算機網絡信息中心,北京 100190;2.中國科學院大學,北京 100049;3.國家自然科學基金委員會信息中心,北京 100085)

1 引言

學科交叉是伴隨社會和學科自身發展需求而出現的一種綜合性科學活動[1],面對科研問題的復雜性,科學研究超越單一學科的范疇,眾多學科交叉、融合和滲透是現代社會科學問題的解決方法與途徑。關于交叉科學的研究中,Woodorth于1926年提出了“interdisciplinary”(跨學科)的概念以來[2],Morillo等[3]、Rosenfield[4]在相關研究中對與學科交叉相近的概念“多學科”“邊緣學科”“超學科”“跨學科”等概念之間的差異進行了詳細闡述。我國科學家錢學森[5]、路甬祥[6]也在相關文獻中對學科交叉以及交叉學科的相關問題進行了論述。學科交叉在人類發展過程中,促進了許多重要成就的產生,如人類基因組測序、納米技術等。鑒于學科交叉研究在科學發展中的重要地位,世界各國相關科研管理機構都投入更多的資金以及制定相應的政策以支持學科交叉領域的研究工作,國家自然科學基金委員會(National Natural Science Foundation of China,NSFC)于2020年11月成立交叉科學部,以探索支持交叉研究的新機制,培育新興交叉領域的重大原創突破,有效促進學科交叉研究。

近年來,人工智能技術的興起促使許多行業發生了變革,許多科研管理機構也希望人工智能技術能在科研項目的資助和管理方面提供幫助。國家自然科學基金委員會主任李靜海院士表示,國家自然科學基金委員會正在建立一個更加復雜的系統,利用AI(artificial intelligence)技術輔助項目的評審工作[7]。在學科交叉研究中,融入人工智能技術以輔助潛在交叉學科知識點的發現,提供新的學科交叉研究切入點,同時以理論與實踐問題為導向,培育其成長為新的學術增長點,進而形成交叉學科,服務國家需要是一項有意義的研究工作。國家自然科學基金委員會每年資助的國家自然科學基金項目在一定程度上代表著當年相關科學領域的重要或前沿研究內容,國家自然科學基金所資助項目中的關鍵詞在某種程度上是相關科研項目的主題提煉,是快速獲取項目所研究內容的重要途徑。本文擬嘗試利用國家自然科學基金資助項目的關鍵詞信息,通過文獻計量學及詞嵌入(word embedding)相關技術方法,分析發現學科交叉研究中的潛在知識融合地帶,探索利用人工智能技術輔助科研人員獲取潛在的學科交叉研究知識點,進而從微觀學科交叉知識粒度討論并研判學科交叉知識成長為交叉學科的新途徑。

2 相關工作

2.1 學科交叉知識點發現

本文以國家自然科學基金資助項目關鍵詞數據為主要分析對象,嘗試解析并發現學科之間的潛在知識交叉點,因此,可將研究工作歸納為學科劃分體系、“跨學科性”測度、跨學科知識轉移與知識點發現等。學科劃分體系是進行跨學科內容識別與判斷的基礎,國家自然科學基金委員會下設9個科學部,每個科學部包括若干學科門類,其項目申請代碼在一定程度上體現了學科的分類體系,其分類體系基本采用4級結構。以申請代碼“F020101”為例(2019年公布的代碼數據),第1位“F”代表信息科學部,第2~3位“02”代表計算機科學,第4~5位“01”代表計算機科學的基礎理論,第6~7位“01”代表理論計算機科學?!翱鐚W科性”測度是指對學科交叉程度的一種計量方法。在學科交叉測度的研究中,Stirling[8]提出了三個指標(豐富性、多樣性和差異性),并構建了多樣性測度的一般框架;Rafols等[9]在Stirling[8]的基礎上提出了使用多樣性指標和凝聚性指標測度學科交叉性;文獻[10]從學科多樣性、學科聚合性和綜合性測度3個方面對目前的學科交叉性測度方法進行總結。跨學科間的知識轉移與知識發現方面的研究已經取得了較大的進展,研究對象主要為引文、作者、主題詞(或關鍵詞),其研究方法包括共詞分析、引文分析、作者分析等[11],例如,文獻[12]提出通過學科之間的引用關系和作者,在學科領域間的遷移進行知識轉移的研究;文獻[13]根據學科間引文的變化,發現新興的學科交叉;文獻[14]通過文檔聚類技術,發現不同學科間的交叉知識點;文獻[15]通過對論文內容聚類后,利用論文間的引用關系發現學科交叉研究主題。

關于基金資助項目的學科交叉研究,在國外研究中,文獻[16]通過計算IDD分數的方法定量分析項目的學科交叉程度;文獻[17]探索了量化美國國家科學基金會(National Science Foundation,NSF)項目中跨學科性的新方法;文獻[18]分析了美國國家科學基金人類與社會動力學(human and social dynamics,HSD)計劃資助研究項目的跨學科特征。在國內研究中,文獻[19]對國家自然科學基金資助項目中的跨學科知識流進行了共現網絡分析;文獻[20]對國家自然科學基金委員會資助學科交叉研究模式進行了分析;文獻[21]介紹了國外開展的學科交叉項目評價的實踐,并結合我國學科交叉項目的實際提出了相關建議;文獻[22]對國家自然科學基金委交叉學科申請項目評審方法進行了相關研究;文獻[23]構建了研究團隊(“投入”)及其研究成果(“產出”)的跨學科測度方法,并探討跨學科研究團隊是否有助于產出跨學科研究成果。關于學科交叉的研究在國內外已形成了豐富的研究體系,對基金資助項目的學科交叉問題進行研究,國內外學者也均有相關研究涉及。

2012年,谷歌公司在其知識工程的長期實踐基礎上提出了知識圖譜的概念,主要應用目標為提升搜索引擎的智能化水平,其本質是一種語義網絡,提供從實體間關系的角度進行問題分析的能力[24]。知識圖譜中知識的表示包括符號邏輯和向量兩種[25]。以邏輯符號為基礎進行知識的表示,其在表示顯式、離散知識時具有可解釋性,但是推理很難得到理想的效果?;谶B續向量的方法可以通過數值計算發現事物間新的關系、潛在及隱式知識,同時,基于向量的表示方法,易于對接深度學習、圖神經網絡等模型,在鏈接預測、實體對齊、知識問答、信息推薦等領域得到不斷的發展。國家自然科學基金項目中的關鍵詞由系統提供給申報者選取,或者由申報者自行填寫,具有一定的規范性,能在很大程度上代表項目的主要研究內容。國家自然科學基金同一資助項目中的關鍵詞K1、K2之間的關系為共現關系,可將[K1,K2]稱為關鍵詞共現。詞嵌入方法,可以將關鍵詞及其共現語義信息映射到向量空間,通過關鍵詞向量計算不同關鍵詞之間的共現大小,可發現尚未建立鏈接的關鍵詞之間的共現關系,進而提取潛在學科交叉知識點,討論學科間形成交叉學科的潛力問題?;陬A測的不同學科間關鍵詞發生的共現鏈接進行分析,是本文進行潛在學科交叉知識發現的主要思路。

2.2 詞嵌入

詞嵌入是將詞和實數向量關聯起來的方法,早期的one-hot模型構建的詞向量之間缺少潛在的關聯性,向量之間相互獨立,且當語料庫中的詞匯過多時,易造成維度災難。為解決其不足,研究人員從降低詞的表示維度,在詞向量之間融入詞之間的特定關系出發,開發了許多新的詞嵌入模型。2003年,Bengio等[26]提出了利用神經網絡建立統計語言模型的框架NNLM模型(neural network language mod‐el),提出了詞嵌入(word embedding)的概念,該模型使用多層神經網絡預測給定的下一個單詞,在低維向量空間中表示單詞和文檔。2013年,Miko‐lov等[27-28]提出word2vec方法,該方法包含CBOW(continuous bag-of-words)模 型 和skip-gram模 型,由于模型不涉及密集的矩陣乘法,該架構具有較高的計算效率,訓練速度也得到了很大的提升。word2vec是一種詞嵌入的方法,可將自然語言表示的詞語映射到低維向量空間,同時保留詞語的語義、句法信息等[29]。該方法中的skip-gram模型是通過當前詞去預測圍繞在當前詞周圍的上下文詞。CBOW模型是通過圍繞在當前詞左右窗口大小內的上下文詞語預測當前詞。同時,word2vec為CBOW模型和skip-gram模型提供兩種加快訓練速度的方式,分別是層次softmax方法(hierarchical softmax)及負采樣方法(negative sampling)。以skip-gram模型為例,其分為3層,輸入層為當前詞的one-hot表示,維度為詞的數量;輸入層到隱藏層之間有一個權重矩陣,輸入當前詞的one-hot表示與權重矩陣相乘,獲取隱藏層的向量;隱藏層與輸出層也有一個權重矩陣,隱藏層的向量與權重矩陣相乘得到輸出層的向量,最終輸出經過softmax函數,將向量的每一個元素歸一化到0~1之間。訓練通過反向傳播和梯度下降的方法不斷優化模型,同時,在輸出層采用層次softmax方法或負采樣方法加快訓練速度。

文中選取word2vec方法,將關鍵詞及其之間的共現關系映射到向量空間,其主要原如下。首先,word2vec方法可以利用關鍵詞之間的共現關系將關鍵詞映射到向量空間,從而獲取與某關鍵詞最常同時出現的其他關鍵詞。其次,在國家自然科學基金資助項目中,每個項目的關鍵詞可以看作無序的關鍵詞列表,而在word2vec方法的兩個模型中,當前特定詞的窗口內上下文關鍵詞的序列信息是被忽略的。最后,word2vec根據已出現的關鍵詞去預測可能與其共現的關鍵詞,該方法可以獲取未在項目中出現過的關鍵詞共現。在項目中未出現過的新的關鍵詞共現,在文獻[30]中不認為其是錯誤的關鍵詞共現關系,而是將其看作未來可能出現的共現關系從而進行相關研究,并取得了一定的預測效果。通過Word2vec方法的模型去發現哪些關鍵詞與當前關鍵詞更容易一起出現,從而獲取新的未來可能出現的關鍵詞共現具有理論上的可行性。

3 模型及實驗方法

本節首先從整體上構建學科交叉知識點的發現模型,對學科交叉知識點發現模型中的詞嵌入模型選擇及參數優化訓練方法進行介紹,接著對模型進行學科交叉知識點發現時,涉及的理論基礎、相關算法以及方法等進行論述,最后嘗試構建衡量學科間知識點交叉趨勢大小的指標。

3.1 學科交叉知識點發現模型

本文模型利用word2vec相關模型,將項目中的關鍵詞及共現關系映射到向量空間,進而進行學科之間交叉知識的發現。文中不同學科的關鍵詞由于存在特定的語義關系,而在向量空間中相互接近形成相應的聚類簇。簇中具有不同學科性質的關鍵詞由于存在可能的關鍵詞共現關系,而形成具有學科交叉價值的知識點。學科交叉知識點發現模型如圖1所示,其步驟如下:

圖1 基于word2vec方法的學科交叉知識點發現模型

Step1.數據抽取與處理。從國家自然科學基金資助項目中抽取項目數據,并處理成skip-gram模型可理解的數據格式。以項目為單位,抽取同時出現在每個項目中的關鍵詞共現關系。

Step2.關鍵詞向量化。將基金資助項目及其關鍵詞輸入skip-gram模型中,以設定的優化目標調節skip-gram模型參數,最終將每個關鍵詞映射到低維連續向量空間,獲取關鍵詞的向量表示。

Step3.新的關鍵詞共現關系生成。通過計算關鍵詞向量之間的余弦相似度,劃定大于特定閾值的關鍵詞共現構成新的關鍵詞共現網絡,計算關鍵詞在共現網絡中的PageRank值衡量關鍵詞重要性。同時,選取關鍵詞K1、K2分屬于不同學科的關鍵詞共現,以進行潛在學科交叉知識發現。PageRank算法[31]是一種廣泛應用于網頁重要性評價的算法,其本質上是一種將網頁之間鏈接數量和質量作為分析網頁重要程度的算法。

Step4.跨學科知識點提取。對第3步提取出來的具有跨學科性質的關鍵詞共現中的關鍵詞及向量,通過DB‐SCAN(density-based spatial clustering of applications with noise)算法[32]進行聚類,提取包含不同學科關鍵詞的跨學科聚類。DBSACN算法是一種基于密度的聚類算法,算法通過將具有足夠密度的區域劃分為一個簇,并可在噪聲的數據空間中發現任意形狀的聚類。具有強共現關系的關鍵詞,在向量空間中分布足夠緊密,該算法能夠較好地滿足應用場景。

Step5.跨學科知識點可視化。通過提取的跨學科聚類、聚類中關鍵詞的向量及PageRank值,計算并獲取如表1~表3(第4節)所示數據。利用t-SNE方法將聚類中的關鍵詞向量維度降到二維空間,并進行如圖4和圖5(第4節)所示的可視化呈現。t-SNE是一種非線性的降維算法,其降維后可視化效果非常優秀。

3.2 word2vec模型選擇及參數優化

word2vec方 法 包 括CBOW和skip-gram兩 種 模型,實驗在對數據進行初步驗證的基礎上,選用skip-gram模型和負采樣優化方法進行國家自然科學基金資助項目關鍵詞到低維向量的映射。實驗首先選取一定時間段內的項目關鍵詞作為訓練數據,通過將該時間段內的每個項目和包含的關鍵詞,作為已經進行過分詞處理的一個句子,在該步驟中忽略關鍵詞的先后順序。將每個項目看作一個句子,構成符合詞嵌入模型所需要的數據格式,作為詞嵌入模型的輸入數據。同時,抽取在同一個項目中的關鍵詞共現關系,并存儲為關鍵詞共現文件,作為模型優化對比的目標。

在詞嵌入模型的訓練中,實驗通過計算每次訓練后的關鍵詞向量之間的余弦相似度,形成更多的關鍵詞共現關系。將新計算出的關鍵詞共現關系分為“實際共詞關系”和“預測共詞關系”兩部分。其中,“實際共詞關系”為新計算出的一定時間段內的關鍵詞共現關系與項目已有的關鍵詞共現關系的交集,而“預測共詞關系”為新計算出的關鍵詞共現關系減去“實際共詞關系”后剩余的部分。實驗設定以下優化目標,進行模型參數的不斷優化。第一,模型訓練后,獲取的關系大于α閾值(實驗設置為0.9)的關鍵詞共現中,包含盡可能多的“實際共詞關系”,期望能夠讓更多的“實際共詞關系”的關鍵詞在向量空間中更加接近。第二,調節模型參數過程中,利用準確率、召回率和F1值3個指標作為參數調節的參考。其中,準確率是模型學習到的關系大于α閾值的“實際共詞關系”數量與模型學習到的關系大于α閾值的“實際共詞關系+預測共詞關系”數量的比值;召回率是模型學習到的關系大于α閾值的“實際共詞關系”數量與項目中全部的已有關鍵詞共現數量的比值;F1值為準確率和召回率的調和平均值。

在word2vec模型的訓練中,實驗根據國家自然科學基金資助項目的關鍵詞特點對一些模型參數進行了特定的設置。其中,對模型中用于設置丟棄詞頻小于一定次數的詞的參數,由于國家自然科學基金資助項目的關鍵詞大部分重復出現頻次較少,實驗中將其設置為1;用于設置當前詞與預測詞之間的距離的參數,實驗設置為所有項目中具有最多關鍵詞的項目的關鍵詞數減去1作為參數;將關鍵詞映射到向量的維度大小參數設置為100。

3.3 交叉知識點獲取

共詞分析是建立在理想化的理論假設基礎上的內容分析方法,該方法通過統計一對關鍵詞同時出現在同一文獻中的次數,并以此為基礎對詞進行聚類分析,從而分析詞所代表的學科和主題的結構變化[33]。文獻[34]認為文獻的術語是作者認真選取的;同一文獻中不同的術語之間的關系是被作者認可和要求的;如果有足夠的作者對同一種關系認可,那么這種關系所關聯的科學領域具有一定的意義;專業的標引關鍵詞所描述的文獻內容,是相關學科概念可以信賴的一個指標。根據分布式假設理論,詞的含義來源于其所使用的上下文環境,在相同的上下文環境中,詞具有相同的含義?;谏鲜隼碚?,本文利用word2vec相關方法以及國家自然科學基金資助項目關鍵詞間的共現關系,將關鍵詞映射到低維連續向量空間,資助項目所屬的學科體系作為劃分關鍵詞所屬學科的依據,獲取新的在項目中還未出現過的具有跨學科性質的關鍵詞共現,作為分析學科間潛在交叉知識點的基礎,通過DBSCAN算法獲取不同學科之間的跨學科知識交叉點。

國家自然科學基金資助項目關鍵詞映射到低維向量空間后,關鍵詞之間的共現關系大小各異,關鍵詞向量間的余弦相似度的值越大,兩個關鍵詞發生共現的可能性也就越大。因此,實驗在詞嵌入模型訓練出關鍵詞向量后,計算關鍵詞之間的共現關系,從大于特定閾值的“實際共詞關系”和“預測共詞關系”中計算關鍵詞的PageRank值大小,提取具有分屬兩個不同學科屬性的關鍵詞組成的關鍵詞共現。為了更全面地呈現跨學科知識點,本文的實驗中設定如果關鍵詞共現中的一個關鍵詞同時屬于兩個不同學科,那么此關鍵詞共現也視為具有跨學科性質的關鍵詞共現,通過在具有跨學科性質的關鍵詞共現中,提取出相應關鍵詞,對這些關鍵詞的向量利用DBSCAN算法進行聚類,將學科交叉知識點提取出來,并進行深入地分析。

3.4 學科間交叉知識測度

學科交叉知識發現的本質,是對學科間知識流動、融合情況的研究與分析。文獻[35]認為,學術文獻之間的引用存在馬太效應,即文獻的被引用概率與其已有的引用數據成正比;文獻[36]認為,知識之間的流動與知識之間的知識勢差呈正相關關系,即知識之間的知識勢差越大,其間的知識流動效應越大;文獻[37]從國家間知識流動的角度,認為知識勢差能夠在一定程度上促進兩國知識交流的增加,但如果進一步擴大,那么將對兩國間的知識流量產生負影響,同時,證明了知識相似性、科學家流動量、科研合作強度和國家間關系的網絡位置四個變量與兩國間的知識流量的正向影響;文獻[38-39]認為,知識位勢的差異為知識的轉移和擴散共享提供了動力;文獻[40]認為,當創新的參與者具有更高的知識互補性時,能夠增加知識共享的深度?;谏鲜鑫墨I,從學科間知識流動的角度看,學科知識的受關注程度存在分化的現象,主要體現在知識吸引其他知識發生交流能力方面的差距,這種差距可以看作是知識之間的勢差。從熵的角度看,知識研究的人越多,則其與其他知識的交流越頻繁,熵值也越大;反之,則知識熵值也較小。與知識勢差的認知相結合,可以認為熵值差距大的知識之間,如果具有知識的語義相關性(關鍵詞共現),那么知識流動效應、動力也會越大。從科學研究選題的角度分析,科研人員為使研究選題具有創新性,會去避開積累了大量的研究技術或方法的熱門選題,也會避免前期研究資料較少、科研價值有限的冷門選題。然而,如果冷門的知識與熱門的知識之間在語義上發生強烈的相關關系,那么可以認為在兩者之間中找到了具有研究價值的學術問題,兩者之間的知識更具有互補性、驅動力和創新價值,更易被接受為新穎的科研選題。

綜上所述,不同學科知識之間發生關聯關系,是促進學科間知識發生流動的基礎;不同學科之間的知識勢差越大,學科間知識流動效應、動力越大;不同學科關鍵詞之間發生關聯關系的大小可認為是知識之間語義上的相關性大小,知識語義的相關性越大,則知識之間的交流動力越大。為了對知識之間的流動趨勢進行定量分析,本文實驗將關鍵詞的PageRank值的差值作為關鍵詞的知識勢差度量指標(實驗中依據實際需要對PageRank值大小進行放大),將關鍵詞間的共現關系大小作為知識之間的語義相關性度量指標。將每個聚類中的關鍵詞劃分到A、B學科,聚類中A、B學科各自關鍵詞PageRank值最大的關鍵詞代表相應學科的研究,其他關鍵詞為Pag‐eRank值大的關鍵詞提供語義環境信息,通過計算聚類中不同學科PageRank值最大的關鍵詞之間的差值的絕對值,衡量相關學科交叉知識點的勢差;通過表3所示的A、B學科關鍵詞共現關系大小的均值,衡量對A、B學科知識的語義相關性。將學科間知識勢差與知識語義相關性大小相乘,作為衡量學科間知識融合趨勢的指標(論文定義為IT,interdisci‐plinary trend),IT值越大,知識融合動力及效應越大,并產生更具有價值的學術研究。計算方法為

其中,Mean()函數用于求取每個聚類中A、B學科關鍵詞共現關系(表3)大小的均值,RAB為學科關鍵詞共現關系大小;Max()函數為求取特定學科中最大關鍵詞PageRank值,PRA、PRB分別為A、B學科相關關鍵詞PageRank值。PR(K)為關鍵詞K的PageRank值;PR(Ki)為鏈接到關鍵詞K的關鍵詞Ki的PageRank值;C(Ki)為與關鍵詞Ki關聯的數量;d為阻尼系數(介于0~1,通常設置為0.85);N為關鍵詞總數。

4 實驗與結果分析

4.1 實驗過程

4.1.1 項目數據統計

關鍵詞在不同的語境或學科環境下含義往往存在差別。為了更好地驗證文中模型的有效性,本文實驗選取“F06人工智能”“G0114信息系統與管理”“G0414信息資源管理”相應的學科項目關鍵詞作為實驗對象(2019年公布的申請代碼數據)。“F06人工智能”隸屬于信息科學部,屬于計算機學科范疇;“G0114信息系統與管理”“G0414信息資源管理”隸屬于管理科學部,屬于管理學科范疇。有些高校的信息管理學院在設置相關專業時往往包含信息管理與信息系統、信息資源管理的方向,為了便于描述,本文將G0114、G0414對應項目以及關鍵詞學科屬性統稱為“信息管理”學科,將F06對應項目以及關鍵詞學科屬性統稱為“人工智能”學科。近年來,人工智能與信息管理呈現逐漸融合的趨勢,兩個學科資助項目的關鍵詞在語義上也有一定的相似性,從減少關鍵詞多義、同義現象對分析結果的影響出發,本文選擇上述學科項目作為實驗對象,來驗證本文模型的合理性。在實驗中,本文使用基金資助項目中申報者選取的關鍵詞數據進行分析,對于關鍵詞的學科屬性劃分,實驗將申報者申報“F06人工智能”項目時選取的關鍵詞劃分到人工智能學科,將申報者申報“G0114信息系統與管理”“G0414信息資源管理”項目時選取的關鍵詞劃分到信息管理學科,同時,如果某個關鍵詞同時出現于不同學科的資助項目中,那么視該關鍵詞具有跨學科性質,此類關鍵詞是將不同學科相關知識關聯的重要節點或橋梁。

在實驗過程中,選取2012—2019年(年份為項目開始執行年份)信息學部F06學科和管理學部G0114、G0414學科資助項目關鍵詞數據,絕大部分項目關鍵詞數量在3~5個,相應項目及關鍵詞數量分布情況如圖2所示。通過模型將項目關鍵詞映射到向量空間,在此基礎上選取2017—2019年資助項目的關鍵詞向量,進行學科交叉知識發現,在模型訓練時,主要任務為將關鍵詞及共現關系映射到向量空間,由于不涉及數據分類等問題,故不存在數據樣本均衡問題。

圖2 2012—2019年資助項目關鍵詞數分布情況

4.1.2 關鍵詞向量化及分析

通過skip-gram模型加負采樣優化方法,以關鍵詞共現關系大小盡可能分布于大于0.9的閾值范圍為優化目標,結合F1指標對2012—2019年的項目關鍵詞進行向量映射。對模型中的迭代次數參數iter和負采樣時噪聲詞數量參數negative進行最優選取,實驗設置iter參數范圍為[220,1180],每次增加40。negative參數范圍為[10,120],每次增加10。實驗最終參數選擇iter為900,negative為40生成最終的關鍵詞向量,2012—2019年相應關鍵詞向量降維后,在二維空間的分布情況如圖3所示。

圖3 2012—2019關鍵詞二維空間分布情況

4.1.3 跨學科知識點提取

通過對數據進行實際分析,本研究選取關鍵詞間余弦相似度關系大于0.75閾值的關鍵詞共現作為學科交叉知識獲取分析的基礎,計算關鍵詞的Pag‐eRank值,獲取具有跨學科性質的關鍵詞共現。實驗使用DBSCAN算法對具有跨學科屬性的關鍵詞共現中的關鍵詞進行聚類,將算法中的最小包含點數參數設置為3,掃描半徑參數設置為0.084。最后,對聚類結果進行篩選,只保留聚類中具有兩個學科關鍵詞,且每個學科關鍵詞數量均大于等于2的關鍵詞聚類,最終獲取14個聚類結果,如表1所示(聚類結果依據第3.4節公式(1)進行排序)。

表1 學科交叉知識點

4.2 實驗結果分析

4.2.1 結果分析

實驗中學科交叉知識點的形成是基于同時分布于不同學科的同一個關鍵詞建立,論文對同時分布于人工智能和信息管理學科中的關鍵詞數量進行了統計,共獲得96個關鍵詞。相關數據通過圖1模型共獲取14個學科交叉知識點。

以聚類1為例進行了詳細分析。表2為該聚類中關鍵詞的學科和PageRank值信息,在計算該聚類中不同學科知識之間的知識勢差時,可以通過序號0和序號3的關鍵詞PageRank值絕對值之差獲取。表3為該聚類中預測的跨學科關鍵詞詞對的共現關系強度,在計算不同學科之間的知識相關度時,可通過對表中詞對關系大小求取均值獲取。最終,知識勢差與知識相關度相乘作為該聚類的IT值。圖4a為預測共現關系大于0.75的跨學科關鍵詞共現中,關鍵詞向量降維后在二維空間的分布情況,圓圈內的點為當前聚類簇的位置;圖4b為聚類簇中關鍵詞在二維空間的可視化結果,圓形節點關鍵詞表示該關鍵詞同時屬于兩個學科。圖5a的可視化圖中,關鍵詞節點大小依據PageRank值確定,關鍵詞節點之間關系來自表3;圖5b的詞云圖是表2的關鍵詞以及PageRank值大小可視化。在上述圖表所呈現的學科交叉知識中,關鍵詞“社會學習”在兩個學科中具有相同的語義信息,人工智能學科的關鍵詞為“合作演化”“移動Agent”。在人工智能領域,我國研究人員更多的是將“Agent”翻譯為智能體,其特性包括自治性、反應性、主動性等,其在改善Internet應用、開發分布式交互仿真環境等均有應用。信息管理學科的相關關鍵詞為“用戶知識行為”“持續知識共享”“在線實踐社區”,可認為是以“用戶知識行為”為研究主題,同時關鍵詞“在線社區”“知識共享”等賦予“用戶知識行為”更多的語義環境信息。在該聚類中,不同學科之間的知識融合,包括Agent技術應用于,在線社區的用戶知識共享行為是合理的研究主題。例如,文獻[41]用多智能體模擬實驗研究不同因素對用戶分享效果的影響;文獻[42]采用多Agent系統建模方法,構建科研合作網絡知識擴散仿真演化模型,分析網絡結構、知識溢出效應和個體知識創新能力對知識擴散的影響。從交叉學科成長的層面分析,人工智能領域學科Agent相關技術構建仿真模型與信息管理學科用戶知識行為、知識共享研究相結合,為基于經驗進行數據分析的信息管理學科帶來了更為有效的分析手段,是人工智能學科技術融入信息管理學科社區用戶行為研究的學科交叉地帶。

圖4 聚類中的關鍵詞可視化(t-SNE)

圖5 聚類中的關鍵詞關系圖及詞云

表2 聚類中的關鍵詞PageRank值及學科屬性

表3 關鍵詞之間的共現關系

在聚類2中,相關知識通過“動力學”進行關聯,動力學在人工智能中涉及機器人等相關概念,信息管理中涉及知識擴散的動力,該關鍵詞關聯的兩個學科知識在語義環境上相差較遠,其結果具有不合理性。需在后續研究中,從語義消歧的角度剔除此類學科交叉知識點,以提升模型的準確性。

在聚類3中,“互聯網金融”在兩個學科中具有相同的語義信息,人工智能學科的關鍵詞為“深度挖掘”“個人信用評價”,信息管理學科的關鍵詞為“風險預測”“信用評分”“欺詐”“P2P”“網絡借貸”。人工智能學科中,關鍵詞“深度挖掘”“個人信用評價”可視為對用戶各種金融行為信息進行深度挖掘,進而進行個人信用評價的研究。在信息管理學科中,關鍵詞傾向于互聯網金融中的風險預測、信用評價、金融欺詐、借貸等方面的研究。近年來,人工智能得益于金融領域大量高質量數據的累積,其方法和技術在金融信息服務領域中得到迅速應用。兩個學科之間可以認為是用戶金融行為挖掘與金融領域風險預測、金融欺詐等主題進行融合的研究。從交叉學科成長的層面分析,人工智能學科側重于用戶數據分析技術,而信息管理學科側重于金融用戶信用風險識別、預測、建模等機制、理論、體系問題的研究,目前可認為融入智能的金融信息服務系統研究是兩個學科間重要的學科交叉地帶。

在聚類4中,人工智能學科與信息管理學科相關研究通過“多模型”關鍵詞進行知識的關聯,但兩個學科的關鍵詞“多模型”在語義上具有完全不同的含義,指代的模型互不相同,此處的交叉知識點具有不合理性。與聚類2中的問題相似,需在后續研究中,從語義消歧的角度剔除此類學科交叉知識點,以提升模型的準確性。

在聚類5中,“社會影響力”在兩個學科中具有相同的語義信息,人工智能學科的關鍵詞為“社會網絡挖掘”“信任關系”“異構網絡融合”,信息管理學科的關鍵詞為“社群經濟”“消費畫像”“屬性圖挖掘”。信息管理學科研究主題中,社群經濟是指社交媒體消費社群,是建立在產品和粉絲相互信任基礎之上的經濟系統,是目前值得關注的前沿研究問題。人工智能學科研究主題為異構網絡中社會網絡及信任關系的挖掘。社群建立和延續的基礎是信任關系的建立,在研究社群經濟發展和形成過程中,關注于多種異構網絡數據的融合,挖掘賣家與買家等主體之間信任關系的形成、演化機制與原理,對于促進社群經濟的發展具有重要的研究價值。從交叉學科成長的層面分析,兩個學科的融合可以認為是通過人工智能相關用戶行為分析技術,來提升社群經濟的運行及管理效率,輔助增進用戶之間的信任關系,進而產生價值反哺,形成良性的自循環經濟體系。在社群經濟的研究中,融入人工智能技術作為促進其發展的主導力量,其交叉屬于智能化社群經濟平臺或系統的范疇。

在聚類6中,“認知負荷”在兩個學科中具有相同的語義信息,人工智能學科的關鍵詞為“學習情緒”“自適應交互”“被動式腦-機接口”“腦機互適應”,信息管理學科的關鍵詞為“從眾信息行為”“社會連接”“影響因素”。在人工智能學科的相關研究中,側重于從用戶情感、自適應交互、腦機接口等角度進行用戶認知相關技術的研究。信息管理學科領域則側重于社會環境下人員從眾信息行為等研究。通過將人類情感(學習情緒)、腦機接口自適應技術與社會環境下用戶行為研究相結合,可為相應學科提供新的科學依據和方法,或為腦機接口研究提供理論依據,或為社會網絡中的從眾信息行為研究提供技術支撐。目前,腦機接口技術、自適應交互、人類情感(學習情緒)、人類從眾行為研究等相融合的研究領域,在現在及未來均具有重要的價值,如健康醫療、自動駕駛、虛擬現實等領域。從交叉學科成長的層面分析,兩個學科的交叉是一個融入用戶行為和認知功能的人機交互交叉研究領域,是未來重要的交叉研究發展方向。

在聚類7中,“協同進化算法”是兩個學科中相關知識關聯的基礎,人工智能學科的關鍵詞為“協同進化學習模型”“信息核”“個性化推薦系統”,信息管理學科的關鍵詞為“服務等級協議”“雙層規劃模型”。信息管理學科中,“服務等級協議”是指針對不同的用戶制定不同的服務等級策略,“雙層規劃模型”[43]是雙層決策問題的數學模型,是一種具有雙層遞階結構的系統優化問題,上下層都具有各自的目標函數和約束條件,具有層次性、獨立性、沖突性、優先性、自主性、制約性和依賴性等特點,在交通領域、資源分配、價格制定等方面都有應用場景,如在交通領域向用戶推薦合適的出行路徑等。兩個學科的學科知識交叉,可以認為是在信息推薦領域的特定場景下,引入雙層規劃模型、用戶服務等級策略等理論與方法進行相關研究。雙層規劃模型是尋求一種將各層的目標協調至最優的具體方案,如交通領域路網規劃兼顧建設費用與用戶出行費用、鐵路票價制定兼顧成本與市場需要因素等,其本質是為各層提供雙方都能接受的決策方案。在信息推薦系統的設計中,不僅要考慮用戶的喜好,而且還要考慮推薦物品或內容的質量等因素進行多個目標的優化推薦,從合理性上看,上述其融合是值得嘗試的研究主題。從交叉學科成長的層面分析,其是與智能信息服務相關的學科交叉研究。

在聚類8中,“群體推薦”在兩個學科中具有相同的語義信息,人工智能學科的關鍵詞為“興趣聚集”“群體決策”,信息管理學科的關鍵詞為“語義偏好”“信任引導”“多輪信息交互”。群體決策指的是對于復雜的決策問題,需要發揮集體智慧的作用,即群體成員制定決策的過程。通過對群體成員語義偏好挖掘、群體成員信任關系建模、多輪信息交互等理論體系和方法的研究,準確描述群體決策研究中群體成員的群體交互行為及活動,并在此基礎上進行群體興趣、群體決策等人工智能領域相關問題的研究具有重要的研究價值和意義。隨著人工智能相關技術的不斷發展,群體決策也體現出了在未來將進一步發展的巨大價值,如卡耐基梅隆大學將自愿癥狀調查、醫生報告、實驗室統計數據和谷歌搜索趨勢等結合一體,實時預測新冠肺炎流行趨勢等。從交叉學科成長的層面分析,結合信息管理學科關于群體成員用戶行為研究的理論與技術,進行群體決策相關研究是人工智能領域重要的研究方向,兩個學科的交叉是智能信息服務決策系統的研究。

在聚類9中,“模型檢測”是將兩個學科中相關知識關聯的基礎。模型檢測是一種用于檢測系統狀態時序邏輯關系正確性及可靠性的自動驗證方法,可以揭示系統狀態轉移的時序邏輯規律[44]。人工智能學科的關鍵詞為“策略推理”“全局博弈策略”,信息管理學科的關鍵詞為“時序邏輯”“負面情感”“應急響應”。其中,“全局博弈策略”是一種博弈系統,策略表示與推理是其構建的關鍵。信息管理學科研究主題為對突發事件分析相關人員負面情感變化的規律,進行應急響應策略制定的研究。從兩個學科的研究主題看,兩者均有揭示系統狀態轉移的時序邏輯規律問題的研究,具有語義環境的相似性。目前,有相關文獻就“情感”與“博弈”結合進行相關研究,如文獻[45]就情感計算與博弈理論相結合,進行情感演化的預測方法的研究。從交叉學科成長的層面分析,將博弈理論、用戶情感分析和推理與突發事件中用戶情感演化機制及原理的研究相結合,是突發事件應急響應理論方法與人工智能策略推理相融合的研究方向,兩個學科的交叉是智能應急響應信息服務系統的研究。

在聚類10中,“數據包絡分析”在兩個學科中具有相同的語義信息,人工智能學科的關鍵詞為“能效分析”“預測建?!薄皬碗s化工過程”,信息管理學科的關鍵詞為“移動信息技術”“用戶適應性”“組織績效”。兩個學科的知識通過“數據包絡分析”方法進行關聯,數據包絡分析方法[46]是根據多項投入指標和產出指標,利用線性規劃的方法,對具有可比性的同類型單位進行相對有效性評價的一種數量分析方法。人工智能相關內容是在復雜化工過程中,進行能效分析以及對能效預測的研究。信息管理相關研究為針對移動信息技術構建用戶適應性策略,提升組織績效。兩者之間的研究領域相差較遠,但其合理性值得探討,從某些角度分析,其交叉具有一定意義,如企業人員對移動信息技術的適應性的預測與建模、從用戶適應性角度對企業的績效進行分析及預測等。從交叉學科成長的層面分析,該交叉主題屬于用戶技術適應性及組織績效預測相關的研究。

在聚類11中,“云計算安全”在兩個學科中具有相同的語義信息。人工智能學科的關鍵詞為“信息安全技術”“生物密鑰”,信息管理學科的關鍵詞為“技術采納”“云存儲服務”“采納行為”。兩者之間的知識交叉點是基于生物密鑰的信息安全技術(包括不斷優化的新型高強度生物密鑰技術)應用于云存儲相關服務,在用戶采納、技術風險等方面相關問題的研究。基于生物密鑰的信息安全技術與用戶采納技術行為方面的原理及理論研究相結合,具有重要的現實研究價值及意義,可以完善豐富基于生物密鑰的信息安全技術的理論基礎。從交叉學科成長的層面分析,該學科交叉知識點是關于云存儲技術安全領域用戶技術采納行為的研究。

在聚類12中,“微博輿情”在兩個學科中具有相同的語義信息,人工智能學的科關鍵詞為“傳播控制”“可信評估”,信息管理學科的關鍵詞為“信息窄化”“信息溝”。人工智能學科的研究主題主要集中于信息傳播的控制技術、信息的可信性評價技術方面的研究。信息管理學科中,“信息溝”理論認為,新傳播技術的采用帶來的利益對所有社會成員并非均等,既有信息富裕階層具有信息獲得的優勢,新技術不斷出現,新的信息溝不斷形成[47]。“信息窄化”是指由于信息過濾機制的影響,個人獲取的知識會沉溺于固有的范圍,使人的知識陷入狹窄的認知中[48]。在“信息溝”“信息窄化”等問題中,通過信息傳播控制、信息可信性評價等方法、技術或算法進行相關問題的治理、干預、策略制定等,具有一定契合性及研究意義。從交叉學科成長的層面進行分析,可以認為是人工智能領域信息傳播控制相關算法、技術與信息傳播中相關問題優化的交叉研究,兩個學科的交叉是人工智能技術優化信息服務,進而消減用戶信息認知副作用的研究。

在聚類13中,“網絡分析”在兩個學科中具有相近的語義信息,即網絡科學中的網絡分析相關概念。人工智能學科的關鍵詞為“模式學習”“軌跡預測”,信息管理學科的關鍵詞為“中心度”“小世界網絡”。上述研究主題可以理解為網絡科學中的理論知識與模式學習、軌跡預測相融合的學科交叉研究。在目前的相關學術研究中,軌跡預測作為人工智能領域重要的研究方向,將軌跡數據以網絡的方式進行組織,從復雜網絡理論的角度,結合機器學習相關技術,開展軌跡預測方面的研究是值得關注及深入探究的學科交叉研究方向。從交叉學科成長的層面分析,該學科交叉知識點屬于網絡科學理論與機器學習軌跡預測相融合的智能信息服務學科交叉研究,歷來具有重要的研究價值與意義。

在聚類14中,“平臺演化”在兩個學科中具有相近的語義信息,即電子商務領域消費平臺的演化。人工智能學科的關鍵詞為“社交服務平臺”“復雜消費行為”“社交影響力”“用戶興趣建?!?,信息管理學科的關鍵詞為“平臺績效”“電商平臺”“平臺商業生態系統”“復雜適應”。人工智能學科研究主題是社交電子商務中關于社交用戶消費等行為方面的研究。信息管理學科中研究主題是與復雜適應理論相結合,進行電商平臺生態系統平臺績效的相關研究。“復雜適應”來源于復雜適應系統理論[49],其思想是系統中的成員能夠與環境及其他主體進行交互作用,在這種持續不斷的交互作用中,不斷的學習或積累經驗,并根據學到的經驗改變自身的結構和行為方式。社交與電子商務的融合,為電子商務的發展帶來了新的活力,如拼多多、小紅書等平臺,是電子商務平臺的一種表現形式,其核心在于對社交用戶價值的挖掘以及其平臺商業生態系統的不斷完善。在社交電商平臺用戶復雜消費行為挖掘建模的基礎上,研究社交電商平臺生態系統、績效等之間的影響機理,對于促進社交電商平臺的健康發展具有重要研究價值。從交叉學科成長的層面分析,該研究屬于智能電子商務服務系統相關的研究。

經過對上述結果的解析,兩個學科領域的交叉研究主要側重人工智能技術與用戶行為、認知、模型、情感以及信息獲取等方面的交叉,其知識交叉大部分具有重要的研究價值和意義。雖然關鍵詞的語義差異和語義環境會導致聚類結果出現偏差,如關鍵詞“動力學”“多模型”等,但大多數聚類結果具有較好的可解釋性,因此,認為上述模型具有一定的合理性和有效性。

4.2.2 結果評價

從模型的合理性角度分析。當關鍵詞共現于同一項目中時,其必定具有語義上的相關性,通過上文中模型將關鍵詞映射到向量空間后,關鍵詞在向量空間中因語義相關而距離相近,形成特定的研究主題,其理論上具有合理性。聚類結果的出現主要依賴分布于兩個不同學科的同一個關鍵詞,將不同學科之間的知識關聯起來。通過對同時出現于兩個學科的關鍵詞進行統計共獲取96個,通過圖1所示模型共計獲取表1所示14個學科交叉知識點,共有82個關鍵詞關聯的知識點經過圖1模型后被過濾掉。經過對數據和模型進行分析后認為,一是模型在設計時,將聚類結果中某學科關鍵詞只有1個的聚類進行剔除,主要原因為相關領域專家認為某學科只有1個關鍵詞的聚類提供的該學科語義信息過少,不能支撐該聚類為學科交叉知識點;二是受語料庫提供的關鍵詞間關系影響,關鍵詞映射到向量空間后,具有2個學科屬性的關鍵詞,與其他學科關鍵詞共現關系強度低于模型中設置的閾值,無法圍繞此類關鍵詞形成有效聚類。從模型的合理性角度分析,可認為圖1模型是有效的。

從聚類結果的合理性角度分析。從表1聚類結果可知,上述結果的合理性是建立在連接不同項目的相同關鍵詞具有語義信息或語境信息相似的基礎上,如果相同的關鍵詞連接兩個不同學科的知識點在語義信息或語境信息差別較大時,即關鍵詞的多義性,那么會造成關聯的學科交叉知識差異性較大。本研究初期隨機選擇兩個學科資助項目數據進行分析,嘗試將本文圖1所示模型應用于學科之間學科交叉知識的發現,但將兩個學科之間的知識進行關聯的許多關鍵詞在語義或語境上相差巨大,造成具有可解釋性的交叉知識點相對較少,而無法體現出模型的合理性。因此,現有實驗選擇人工智能學科相關項目和信息管理學科相關項目進行研究,雖然同樣受到關鍵詞歧義的影響,但是當兩個學科語義環境較為接近時,絕大部分結果獲得了較好的可解釋性。針對上述問題,本文認為需要在后續研究中,對關聯不同學科的關鍵詞進行消歧處理,從而在模型中過濾掉在不同學科語義相差較大的關鍵詞,形成的學科交叉知識點,進而提升聚類結果的合理性和準確性,目前已有文獻對跨學科術語歧義問題[50]、科學領域的語義詞移問題[51]進行研究。結合第4.2.1節對表1聚類結果的分析,本文認為模型最終提取的聚類結果合理、有效,在一定程度上揭示了兩個學科之間的學科交叉熱點,并研判未來學科間潛在的交叉學科形成。

從交叉學科發展的角度分析。從表1的聚類結果可知,文中模型提取的重要學科交叉知識包括:智能體(agent)理論與社區用戶知識共享行為;人工智能用戶行為挖掘與金融風險預測、欺詐識別;異構社會網絡中用戶挖掘與社群經濟的研究;自適應交互、腦機接口技術與用戶信息行為相關的認知研究;群體行為的挖掘與語義信息結合的研究;全局博弈策略與群體情感演化的應急響應研究;云存儲生物密鑰技術和用戶技術接受以及采納行為的研究;信息的傳播控制技術與信息社會問題的研究;復雜網絡理論與軌跡預測相關的研究;社交電商平臺用戶行為挖掘與電商生態系統績效相關的研究等。人工智能與信息管理兩個學科的交叉研究中,人工智能領域側重于技術方法的研究,信息管理領域則側重于理論、機制、機理等方面的研究,兩者之間的融合地帶,如金融風險識別、社群經濟、腦機交互、群體決策、情感演化、用戶技術采納、信息傳播控制、軌跡預測等,均可看作未來的前沿學科交叉及發展方向。兩個學科的交叉主要集中于將人工智能技術與用戶行為(如信息共享、信息獲取、采納、情感、認知等)相融合,在更廣泛的領域提供高效的智能信息服務,這種融合也與人工智能和信息管理兩個學科的學科特點有著密切的關系。從交叉學科成長的角度,應側重于資助人工智能技術、用戶行為、用戶認知等結合的智能信息服務研究,促進其在更廣泛的智能信息服務領域得到應用,如金融、電子商務、智能交通、決策支持、人機交互等,進而圍繞智能信息服務形成相關的交叉學科研究領域。本文模型雖然受到關鍵詞歧義的影響,但絕大部分的分析結果具有一定的合理性和研究前瞻價值,為啟迪相關研究人員拓展研究思路,開展學科交叉相關研究具有參考價值。

從學科交叉結果的評價角度分析。本文制定的聚類結果排序公式,雖然受語料庫關鍵詞收集范圍等因素的影響,很難從研究價值上進行衡量或評價,但是本文認為知識勢差相差越懸殊,知識語義相關度越大,其融合趨勢更具有驅動性和創新性,上文公式的定義具有一定的合理性和價值。上述模型的結果是建立在已有數據的共現關系基礎之上,隨著新的資助項目的不斷融入,相對較弱的共現關系可能會逐漸增強,被過濾掉的跨學科知識點會得到呈現,因此,在后續研究中,需要不斷擴充語料庫,賦予關鍵詞更多語義關聯信息。由于本文選定了特定的具有一定語義相通性的不同學科進行分析,聚類結果能夠通過已有數據較好地呈現出新的研究知識點,然而在更加復雜的語義環境下,需要針對特定的問題進一步做深入研究和探索。同時,后續研究還需融入知識出現的時間等因素,完善學科知識交叉評價方法。

5 總結與展望

通過對實驗結果進行分析以及對學科專家進行訪談,本文認為通過詞嵌入的方法進行關鍵詞的詞向量映射,進而發現學科交叉知識點,不僅可以完成關鍵詞在共現網絡中的重要性評價,還可以對學科關鍵詞之間的共現關系大小進行量化,便于開展相關學科交叉分析及評價。模型獲取的最終結果也證明了本文思路的可行性,為學科交叉知識發現與評價提供了一種新的思路。但該模型也需要在后續通過更多的工作進行優化提升,主要包括以下幾個方面:①從知識工程的角度,對學科知識進行管理和利用。知識圖譜是識別、發現和推斷數據中事物之間關系的可計算模型,在輔助語言理解、數據分析等方面發揮越來越重要的作用。通過知識圖譜技術,從知識工程的角度對科研數據進行知識抽取、消歧、組織、管理和利用,可以在最大程度上提升數據的質量和分析效果。②學科知識分類體系的研究。學科交叉識別的一個重要挑戰是識別和界定相關研究對象的學科屬性,為基金項目相關知識實體等賦予合適的學科信息,是學科交叉研究的先決條件。關于知識實體學科屬性的劃分方法,一種是將論文和出版物按照學科分類體系歸屬到不同的學科門類下,另外一種方式是通過文獻的引文分析、文本分析形成聚類,從而探究學科的結構[9]。將基金資助項目以及相應知識劃分到合適的學科體系開展相關研究,是提升學科交叉識別質量的重要方向。③學科關鍵詞歧義問題的研究。在學科交叉知識發現中,學科中代表成果主題的一些關鍵詞在不同的學科背景或上下文語義環境中存在多義(polyse‐my)現象,或者不同的關鍵詞代表同一個研究主題或語義的同義(synonym)現象。多義現象或同義現象在進行學科交叉研究時,都會在一定程度上會阻礙學科交叉知識識別的準確性。消除詞語歧義的研究,除了要通過相關技術的提升改進準確率外,還要構建更多的與關鍵詞關聯的實體和關系信息,豐富特定詞語在特定環境下的含義,從而提升了知識消歧的效果。④鏈接預測與交叉評價的研究。預測是通過已有的知識去預測未知的知識的過程,是人類認知世界的重要途徑。學科交叉發生的因素各種各樣,目前的方法通常是通過對學科交叉知識演變的過程進行分析,從而發現學科交叉演變等,但也有相關研究[52]從預測的角度對學科未來的交叉方向進行分析。近年來,圖神經網絡通過處理圖結構的數據以及捕捉圖中節點之間的鄰近關系,從而實現了節點之間關系的推理與預測,并取得了較好的效果。學科間知識的交叉研究,除了通過鏈接預測的方法進行研究外,還需對學科交叉發生的內層原因進行分析,如文獻[53-54]從動力學角度進行理論解析等。⑤從交叉知識發現,到交叉學科成長的研究。從本文模型發現的學科交叉結果合理性來看,其在一定程度上可以體現目前人工智能與信息管理學科之間的學科交叉研究情況;從交叉知識點的研究內容也可以看出,兩者之間的潛在交叉學科可以看作智能信息服務相關的研究。但是,目前的模型對交叉知識的提取是一種相對靜態的模型,還需引入學科知識動態演變的角度對交叉學科形成進行分析,如時間因素融入學科交叉知識的發現。

猜你喜歡
語義人工智能學科
【學科新書導覽】
土木工程學科簡介
語言與語義
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
“超學科”來啦
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
論新形勢下統一戰線學學科在統戰工作實踐中的創新
主站蜘蛛池模板: 找国产毛片看| 欧美日本中文| 在线免费a视频| 久久99国产综合精品女同| 日本在线免费网站| 国产福利拍拍拍| 亚洲欧美另类中文字幕| 久久精品人人做人人爽97| 中国丰满人妻无码束缚啪啪| 啊嗯不日本网站| 国产在线欧美| 亚洲人成网站在线观看播放不卡| 日韩麻豆小视频| 亚洲无码四虎黄色网站| 91成人精品视频| 精品伊人久久久久7777人| 人人看人人鲁狠狠高清| 亚洲一级毛片免费看| 久久香蕉国产线看精品| 欧美亚洲香蕉| 五月激情婷婷综合| 国产一区三区二区中文在线| 午夜日b视频| 日韩在线欧美在线| 亚洲日韩第九十九页| 无码精品福利一区二区三区| 欧美日韩免费观看| 国产精品中文免费福利| 国产高清在线丝袜精品一区| 国产成人亚洲无吗淙合青草| 真人高潮娇喘嗯啊在线观看 | 日韩AV无码一区| h视频在线播放| 国产无人区一区二区三区| 国产精品久久自在自线观看| 91欧美在线| 国产成人综合亚洲欧美在| 国产美女免费| 中文字幕免费在线视频| 亚洲精品中文字幕午夜| 性欧美久久| 少妇露出福利视频| 中文无码日韩精品| 国产成人区在线观看视频| 亚洲五月激情网| 國產尤物AV尤物在線觀看| A级毛片高清免费视频就| 88av在线播放| 91在线高清视频| 92精品国产自产在线观看| 亚洲中文在线看视频一区| 特级欧美视频aaaaaa| 日韩a在线观看免费观看| 91色综合综合热五月激情| 国产区福利小视频在线观看尤物| 精品自拍视频在线观看| 无码一区中文字幕| 91色在线视频| 国产精品无码制服丝袜| 国产一级视频在线观看网站| 一级不卡毛片| 熟妇丰满人妻| 国产va欧美va在线观看| 亚洲天堂成人在线观看| 五月天久久综合国产一区二区| 波多野结衣视频网站| 天天做天天爱夜夜爽毛片毛片| 国产精品女人呻吟在线观看| 国产精品视频白浆免费视频| 日韩麻豆小视频| 波多野结衣无码视频在线观看| 亚洲色图在线观看| 久久伊人久久亚洲综合| 91日本在线观看亚洲精品| 国产精品久久国产精麻豆99网站| 成人福利在线视频| 色综合婷婷| 精品伊人久久久大香线蕉欧美| 久久鸭综合久久国产| 国产成年女人特黄特色大片免费| 少妇精品在线| 精品无码一区二区三区在线视频|