渠國(guó)慶,熊 峰,牛 倩,吳祖?zhèn)ィ瑓伪避?/p>
(上海大學(xué) 機(jī)電工程與自動(dòng)化學(xué)院 上海市智能制造及機(jī)器人重點(diǎn)實(shí)驗(yàn)室,上海 200072)
基于知識(shí)地圖的知識(shí)推送方法研究
渠國(guó)慶,熊 峰,牛 倩,吳祖?zhèn)ィ瑓伪避?/p>
(上海大學(xué) 機(jī)電工程與自動(dòng)化學(xué)院 上海市智能制造及機(jī)器人重點(diǎn)實(shí)驗(yàn)室,上海 200072)
對(duì)于知識(shí)密集型的高新企業(yè)來(lái)說(shuō),有效利用豐富且復(fù)雜知識(shí)的方法與途徑,一直是企業(yè)發(fā)展的一個(gè)重要環(huán)節(jié)。隨著推薦系統(tǒng)的出現(xiàn)與發(fā)展,催生了諸多經(jīng)典推薦算法,并在電子商務(wù)和社交網(wǎng)絡(luò)中得到了成功應(yīng)用,但現(xiàn)有經(jīng)典推薦算法并不適用于更加專業(yè)化的企業(yè)知識(shí)推送。為了提高企業(yè)知識(shí)與企業(yè)員工的匹配程度,使企業(yè)員工能更高效地利用企業(yè)知識(shí),提出了一種改進(jìn)的協(xié)同過(guò)濾推薦算法。該算法基于知識(shí)地圖的知識(shí)推送方法,由知識(shí)地圖的關(guān)聯(lián)度得到更具體的關(guān)聯(lián)關(guān)系,并綜合考慮路徑關(guān)聯(lián)權(quán)值對(duì)推薦算法的影響,改進(jìn)了相似度構(gòu)成與計(jì)算方法,以相似度衡量用戶之間的相似性,加強(qiáng)了用戶之間的相似度的評(píng)估。理論分析表明,所提出的算法提高了知識(shí)推送的匹配程度和可行性,為企業(yè)知識(shí)推送提供了新的思路和途徑。
企業(yè)知識(shí)管理;知識(shí)地圖;知識(shí)推送;協(xié)同過(guò)濾
近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展和數(shù)據(jù)信息的廣泛傳播,進(jìn)入了“信息爆炸”時(shí)代,雖然人們可以方便地獲取更多的數(shù)據(jù)信息,但是也被大量無(wú)關(guān)信息所淹沒(méi)。信息呈現(xiàn)的多元化發(fā)展以及企業(yè)信息化的不斷發(fā)展,使得企業(yè)需要及擁有的知識(shí)不斷增加,而網(wǎng)絡(luò)的快速發(fā)展導(dǎo)致信息與知識(shí)加速流通。企業(yè)所面臨的競(jìng)爭(zhēng),已從原始資本的競(jìng)爭(zhēng)、速度的競(jìng)爭(zhēng),轉(zhuǎn)變?yōu)橹R(shí)的競(jìng)爭(zhēng)。知識(shí)已成為在取得持久性競(jìng)爭(zhēng)優(yōu)勢(shì)的過(guò)程中必不可少的重要元素。另一方面,在知識(shí)推送方面,大多知識(shí)管理系統(tǒng)還是采取基于類似于RSS的被動(dòng)推送方式。但是RSS的訂閱粒度太大,不能有效地進(jìn)行跨領(lǐng)域訂閱。更重要的是,被動(dòng)推送方式需要用戶對(duì)自己的喜好和所需信息與知識(shí)及其所屬領(lǐng)域有一個(gè)清晰的了解。這些在很大程度上給用戶帶來(lái)了諸多不便。近年來(lái),由于推薦系統(tǒng)中信息過(guò)濾的特殊屬性,推薦系統(tǒng)已應(yīng)用于任何規(guī)模的電子商務(wù)網(wǎng)站中,為這些網(wǎng)站提供了海量的推薦結(jié)果。推薦系統(tǒng)可以幫助企業(yè)決定向哪個(gè)客戶出價(jià),實(shí)現(xiàn)一對(duì)一的營(yíng)銷戰(zhàn)略目的。推薦系統(tǒng)可以說(shuō)是當(dāng)前大型商業(yè)網(wǎng)站的必備模塊,如亞馬遜、淘寶網(wǎng)和京東商城等,都建設(shè)了性能優(yōu)良的推薦系統(tǒng),通過(guò)成功地應(yīng)用推薦系統(tǒng),亞馬遜成功將其銷售額提高了三成[1]。但是,由于企業(yè)知識(shí)推薦的特殊性,原有的推薦方法不能完全適用于企業(yè)內(nèi)部,造成了企業(yè)知識(shí)孤島問(wèn)題嚴(yán)重。而且,現(xiàn)有知識(shí)推薦系統(tǒng)中,主要采用兩種方式。一種是被動(dòng)的知識(shí)推送方法,通過(guò)用戶對(duì)一類知識(shí)的訂閱來(lái)獲取知識(shí),但是這種方法的主要問(wèn)題是需要用戶對(duì)自己需要的知識(shí)是什么非常清楚。同時(shí)這種方法很難達(dá)到細(xì)粒度的知識(shí)獲取,往往使用戶得到許多不必要的知識(shí)。所以這種方法的使用越來(lái)越少。另外一種是推薦系統(tǒng),當(dāng)今推薦系統(tǒng)的主流算法是協(xié)同過(guò)濾推薦算法,通過(guò)分析知識(shí)與用戶、知識(shí)與知識(shí)、用戶與用戶的相互關(guān)聯(lián)而得到一個(gè)合理的推薦結(jié)果。然而在實(shí)際情況中,往往由于知識(shí)與知識(shí)、用戶與用戶之間的關(guān)系不便獲得與鑒定,使得現(xiàn)在的主要算法多是基于知識(shí)與用戶間的關(guān)聯(lián)來(lái)得到,從而大大降低了算法的有效性。
為此,借鑒電子商務(wù)中推薦系統(tǒng)的發(fā)展思路,提出了基于知識(shí)地圖的知識(shí)推送方法,加強(qiáng)了用戶與用戶間的相似性度量,并改進(jìn)了現(xiàn)有的協(xié)同過(guò)濾算法,利用知識(shí)地圖展現(xiàn)的知識(shí)節(jié)點(diǎn)間的權(quán)重關(guān)系,通過(guò)知識(shí)源和知識(shí)點(diǎn)以及知識(shí)源和知識(shí)源間的圖論路徑權(quán)重優(yōu)化傳統(tǒng)的協(xié)同過(guò)濾算法。
1.1知識(shí)地圖發(fā)展
知識(shí)地圖作為一種導(dǎo)航系統(tǒng),可以顯示不同知識(shí)存儲(chǔ)之間的靜態(tài)結(jié)構(gòu)和動(dòng)態(tài)聯(lián)系。它是知識(shí)管理過(guò)程中的輸出層,將整合后的知識(shí)內(nèi)容輸出,實(shí)現(xiàn)知識(shí)關(guān)聯(lián)和知識(shí)的匯聚。構(gòu)建知識(shí)地圖的過(guò)程需要依賴一定的信息和準(zhǔn)則,很多研究者根據(jù)不同的信息構(gòu)建了知識(shí)地圖。Chung W等[1]利用信息間的鏈接構(gòu)建了知識(shí)地圖;Yoon B等[2]利用信息間的引用關(guān)系構(gòu)建了知識(shí)地圖;Gordon J L等[3]利用信息間的依賴關(guān)系(學(xué)習(xí)依賴)構(gòu)建了知識(shí)地圖。
然而以上方法并不能完全適用于企業(yè)知識(shí)地圖構(gòu)建,一方面企業(yè)知識(shí)間存在鏈接關(guān)系、引用關(guān)系和依賴關(guān)系,不同的部門、員工間所需要的知識(shí)分類層次區(qū)別很大。另一方面,這些方法并沒(méi)有考慮在企業(yè)知識(shí)過(guò)程中的知識(shí)分層問(wèn)題,在不同層次和不同節(jié)點(diǎn)的知識(shí)推送權(quán)重會(huì)有所不同。綜上所述,現(xiàn)有知識(shí)地圖雖然取得了很大的應(yīng)用發(fā)展,但針對(duì)企業(yè)的知識(shí)地圖并不能有效表達(dá)知識(shí)節(jié)點(diǎn)間的權(quán)重關(guān)系。
1.2推薦算法發(fā)展
推薦算法是個(gè)性化推薦算法的核心。現(xiàn)有的推薦算法包括基于內(nèi)容的推薦算法[4]、基于項(xiàng)目的協(xié)同過(guò)濾[5]、基于用戶的協(xié)同推薦[6]、基于模型的協(xié)同過(guò)濾[7]以及最近興起的基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦算法。王有遠(yuǎn)等[8]提出了基于集對(duì)分析的知識(shí)多維度篩選模型;蔣翠清等[9]根據(jù)設(shè)計(jì)過(guò)程中的知識(shí)需求模型,建立了一種面向產(chǎn)品設(shè)計(jì)知識(shí)的協(xié)同推送模型。但是上述研究大都限于產(chǎn)品設(shè)計(jì)本身,很少涉及企業(yè)內(nèi)部知識(shí)協(xié)同的需求,同時(shí),在對(duì)設(shè)計(jì)人員進(jìn)行知識(shí)推送時(shí),并沒(méi)有考慮用戶對(duì)某一知識(shí)的匹配程度權(quán)重。綜上,現(xiàn)有協(xié)同過(guò)濾算法在互聯(lián)網(wǎng)電子商務(wù)和社交等大數(shù)據(jù)量應(yīng)用中效果比較明顯,但在專業(yè)性更強(qiáng)的企業(yè)知識(shí)推送過(guò)程當(dāng)中準(zhǔn)確度不高。
2.1分層立體知識(shí)地圖
依托金字塔式知識(shí)管理體制,將龐大業(yè)務(wù)和技術(shù)狀態(tài)知識(shí)分別縱向梳理到專業(yè)層、項(xiàng)目層、子項(xiàng)目層、知識(shí)節(jié)點(diǎn)層,另外在分層系統(tǒng)中關(guān)聯(lián)用戶和知識(shí),并為用戶貼標(biāo)簽。在分層立體知識(shí)地圖的框架[10]基礎(chǔ)上,根據(jù)各層知識(shí)的構(gòu)成特點(diǎn),構(gòu)建橫向的單層知識(shí)地圖,并在每一層的知識(shí)節(jié)點(diǎn)上定位用戶,以進(jìn)一步優(yōu)化知識(shí)互聯(lián)的關(guān)聯(lián)關(guān)系,特指用戶即為知識(shí)源。
知識(shí)節(jié)點(diǎn)和知識(shí)源節(jié)點(diǎn)以及它們間的關(guān)聯(lián)關(guān)系構(gòu)成了知識(shí)地圖架構(gòu)(見(jiàn)圖1)。知識(shí)節(jié)點(diǎn)是知識(shí)的具體存儲(chǔ),知識(shí)源指企業(yè)不同的用戶。在知識(shí)地圖中,權(quán)重體現(xiàn)了節(jié)點(diǎn)間的關(guān)聯(lián)關(guān)系,權(quán)重越大關(guān)聯(lián)越緊密,反之說(shuō)明兩者的相關(guān)性不大,這種關(guān)聯(lián)具體為知識(shí)節(jié)點(diǎn)間的關(guān)聯(lián)和用戶節(jié)點(diǎn)間的關(guān)聯(lián)。從企業(yè)內(nèi)部特征來(lái)說(shuō),知識(shí)節(jié)點(diǎn)與知識(shí)節(jié)點(diǎn)間的關(guān)聯(lián)組成了企業(yè)知識(shí)網(wǎng)絡(luò),而用戶間的關(guān)聯(lián)則組成了企業(yè)內(nèi)部的人際社會(huì)網(wǎng)絡(luò),體現(xiàn)的是用戶間合作的緊密程度,知識(shí)網(wǎng)絡(luò)和人際社會(huì)網(wǎng)絡(luò)以及兩者之間的關(guān)聯(lián)構(gòu)成了知識(shí)地圖。

圖1 企業(yè)知識(shí)地圖模型
2.2路徑關(guān)聯(lián)權(quán)重
根據(jù)知識(shí)地圖模型很容易量化知識(shí)點(diǎn)和知識(shí)源之間的路徑關(guān)聯(lián)權(quán)重[11],節(jié)點(diǎn)語(yǔ)義相似度由聚類(Cluster)相似度和差異性(Specificity)決定,聚類相似度基于知識(shí)地圖建模中的知識(shí)點(diǎn)和知識(shí)源以及知識(shí)源之間的關(guān)聯(lián)路徑。由于推薦知識(shí)的匹配度和知識(shí)源所在的領(lǐng)域和范圍相關(guān),知識(shí)地圖把不同的部門,不同的項(xiàng)目和不同的崗位按節(jié)點(diǎn)劃分,由此來(lái)區(qū)分知識(shí)源及用戶。根據(jù)知識(shí)地圖中的網(wǎng)絡(luò)模型以及節(jié)點(diǎn)間的權(quán)重,可以計(jì)算任意兩個(gè)節(jié)點(diǎn)間的關(guān)聯(lián)權(quán)重,這種關(guān)聯(lián)權(quán)重能夠體現(xiàn)知識(shí)節(jié)點(diǎn)和用戶間的關(guān)聯(lián)程度,可以得出知識(shí)點(diǎn)P和知識(shí)源I關(guān)聯(lián)權(quán)重計(jì)算公式:

(1)
節(jié)點(diǎn)間并不都是兩兩相連的。絕大多數(shù)不相連的節(jié)點(diǎn)間都由一條或多條路徑連接。在這種情況下,對(duì)不相連的兩個(gè)節(jié)點(diǎn)間的關(guān)聯(lián)權(quán)重就由它們間的最短路徑?jīng)Q定,即關(guān)聯(lián)路徑。式(1)知識(shí)地圖定義兩相鄰節(jié)點(diǎn)的關(guān)聯(lián)路徑為1,則W(P,I)是最短路徑的相鄰點(diǎn)權(quán)值的和,得出知識(shí)源和知識(shí)點(diǎn)之間的關(guān)聯(lián)權(quán)重:

(2)
同理可得知識(shí)源和知識(shí)源間的關(guān)聯(lián)權(quán)重,其作用是進(jìn)一步增加用戶間的相似度,計(jì)算方法是根據(jù)分層知識(shí)地圖模型中用戶個(gè)體所在的節(jié)點(diǎn)直接計(jì)算該路徑的長(zhǎng)度,同式(2):

(3)
3.1協(xié)同過(guò)濾算法
協(xié)同過(guò)濾算法是目前較常用的推薦算法之一,是通過(guò)采集其他用戶對(duì)某個(gè)內(nèi)容或知識(shí)的評(píng)價(jià)來(lái)獲得相似用戶對(duì)同知識(shí)的評(píng)價(jià)[12]。假設(shè)Ii是某用戶i評(píng)價(jià)過(guò)的所有內(nèi)容或者知識(shí)的集合,可以得出該用戶對(duì)內(nèi)容或者知識(shí)的平均評(píng)價(jià)計(jì)算方法:
(4)
根據(jù)知識(shí)地圖中節(jié)點(diǎn)間的關(guān)聯(lián)權(quán)重,改進(jìn)協(xié)同過(guò)濾算法,重新計(jì)算該用戶的評(píng)價(jià)。計(jì)算兩個(gè)用戶間的相似度的方法有很多,最常用的是根據(jù)兩個(gè)用戶評(píng)價(jià)過(guò)的內(nèi)容或者知識(shí)之間的相似度來(lái)計(jì)算,可以利用Pearson算法來(lái)衡量這種相似度,公式如下:

(5)

3.2基于知識(shí)地圖權(quán)重關(guān)系的算法改進(jìn)
(1)基于知識(shí)地圖模型中的網(wǎng)絡(luò)關(guān)系,根據(jù)節(jié)點(diǎn)間的權(quán)重,加強(qiáng)不同用戶間的相似程度,改進(jìn)協(xié)同過(guò)濾算法。利用知識(shí)地圖中知識(shí)源間的關(guān)系加強(qiáng)用戶間的相似度。根據(jù)式(5)可得到兩個(gè)用戶之間的相似度,是通過(guò)兩個(gè)用戶對(duì)其公共評(píng)價(jià)過(guò)的知識(shí)的評(píng)價(jià)相似度計(jì)算得到。但是通過(guò)知識(shí)地圖的關(guān)聯(lián)權(quán)重,可以計(jì)算不同節(jié)點(diǎn)之間的關(guān)聯(lián)程度。它是基于這樣一個(gè)假設(shè),關(guān)聯(lián)權(quán)重高的用戶之間對(duì)同一個(gè)知識(shí)的評(píng)價(jià)總是相似的,處在同一個(gè)部門的用戶關(guān)聯(lián)權(quán)重越高,他們需要的知識(shí)內(nèi)容重合度也就越高。通過(guò)這樣的假設(shè)[13-14],對(duì)相似度計(jì)算公式進(jìn)行改進(jìn):將知識(shí)源相關(guān)信息從知識(shí)地圖中獨(dú)立出來(lái);按照知識(shí)地圖的權(quán)值計(jì)算方法計(jì)算這個(gè)知識(shí)地圖的連接權(quán)重;根據(jù)式(5)得到新的相似度計(jì)算公式:
Sim(i,j)=

(6)

(2)通過(guò)知識(shí)地圖中的人際關(guān)系網(wǎng)絡(luò)縮小預(yù)測(cè)的用戶基數(shù),根據(jù)式(5),與待預(yù)測(cè)用戶相關(guān)程度不大的所有用戶都被作為評(píng)價(jià),這些相關(guān)程度不大甚至不相關(guān)的用戶很明顯會(huì)降低預(yù)測(cè)的準(zhǔn)確度。結(jié)合K近鄰算法的思路,基于建立企業(yè)知識(shí)地圖網(wǎng)絡(luò)及節(jié)點(diǎn)之間的權(quán)重關(guān)系,采用如下方案:
步驟1:根據(jù)式(5)計(jì)算相似度并對(duì)相似度進(jìn)行排序,選取相似度最高的N*K個(gè)用戶作為預(yù)測(cè)的集合。
步驟2:根據(jù)式(6)計(jì)算相似度并排序,并根據(jù)步驟1計(jì)算的N*K個(gè)用戶預(yù)測(cè)集合,選取相似度最高的K個(gè)用戶作為預(yù)測(cè)集合。
步驟3:求出相似度最高的K鄰居,基于此向目標(biāo)用戶推薦知識(shí)。
針對(duì)現(xiàn)有的推薦算法不能有效解決企業(yè)知識(shí)精確推送的問(wèn)題,在協(xié)同過(guò)濾推薦算法基礎(chǔ)上,提出了一種結(jié)合路徑權(quán)重,基于知識(shí)地圖技術(shù)的企業(yè)知識(shí)推薦算法。即根據(jù)知識(shí)地圖模型利用知識(shí)地圖節(jié)點(diǎn)間的權(quán)重關(guān)系,得到相似度更高的用戶預(yù)測(cè)集合,并以此來(lái)向目標(biāo)用戶推薦知識(shí)。理論分析表明,改進(jìn)算法有效解決了企業(yè)知識(shí)推薦匹配程度低的問(wèn)題,可以準(zhǔn)確獲取用戶之間的關(guān)聯(lián)度,提高推薦算法的質(zhì)量和個(gè)性化程度。但該算法尚未考慮項(xiàng)目間的語(yǔ)義關(guān)系和用戶間的語(yǔ)義關(guān)系,一定程度上影響了相似度計(jì)算和推薦效果,需要今后進(jìn)一步研究解決。
[1] 朱文奇.推薦系統(tǒng)用戶相似度計(jì)算方法研究[D].重慶:重慶大學(xué),2014.
[2] Chung W,Chen H,Nunamaker J F. A visual framework for knowledge discovery on the web:an empirical study of business intelligence exploration[J].Journal of Management Information Systems,2005,21(4):57-84.
[3] Yoon B,Lee S,Lee G.Development and application of a keyword based knowledge map for effective R&D planning[J].Scientometrics,2010,85(3):803-820.
[4] Gordon J L.Creating knowledge maps by exploiting dependent relationships[J].Knowledge-Based Systems,2000,13(2):71-79.
[5] Selvi R T,Prakash-Raj G D.Information retrieval models:a survey[J].International Journal of Research and Reviews in Information Sciences,2012,2(3):227-233.
[6] 劉 剛.面向領(lǐng)域的軟件需求一致性驗(yàn)證方法研究[D].哈爾濱:哈爾濱工程大學(xué),2008.
[7] 程 飛,賈彩燕.一種基于用戶相似性的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)工程與科學(xué),2013,35(5):161-165.
[8] 王有遠(yuǎn),趙 璐.面向產(chǎn)品設(shè)計(jì)的多維度知識(shí)推送研究[J].制造業(yè)自動(dòng)化,2015,37(14):131-133.
[9] 蔣翠清,李斌生,高家飛,等.面向協(xié)同的產(chǎn)品設(shè)計(jì)知識(shí)推送研究[J].中國(guó)機(jī)械工程,2012,23(16):1972-1977.
[10] 王曉堤,桑 婧.基于云模型的時(shí)間修正協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)工程與科學(xué),2012,34(12):160-163.
[11] 張 艷,梁欣欣,張耐民,等.基于知識(shí)地圖的航天知識(shí)推送方法研究[J].航天工業(yè)管理,2015(5):35-37.
[12] 唐積益,黃樹(shù)成.優(yōu)化相似度計(jì)算在推薦系統(tǒng)中的應(yīng)用[J].電子設(shè)計(jì)工程,2015,23(23):46-48.
[13] 劉青文.基于協(xié)同過(guò)濾的推薦算法研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2013.
[14] 熊 奇.基于知識(shí)地圖的知識(shí)檢索與推薦方法研究[D].上海:上海交通大學(xué),2009.
Research on Knowledge Push Method with Knowledge Map
QU Guo-qing,XIONG Feng,NIU Qian,WU Zu-wei,LYU Bei-xuan
(Shanghai Key Laboratory of Intelligent Manufacturing and Robotics,School of Mechatronic Engineering and Automation,Shanghai University,Shanghai 200072,China)
For knowledge-intensive and high-tech enterprises,the effective use of method with rich and complex knowledge has become an important part in development of enterprises.With the emergence and development of recommended system,a lot of classical recommendation algorithms have been produced and applied n e-commerce and social networks successfully,but all of the existed algorithms are not practically suited to more professional knowledge push for business enterprises.In order to increase matching degree between business knowledge and business employees and be efficient use of enterprise knowledge for employees,an improved collaborative filtering algorithm has been proposed.Based on an knowledge push method of knowledge map,it obtains more specific relationship according to the relativity of knowledge map and improves the similarity construction and computation considering the impact of path associated weights on the recommendation algorithm.The similarity is utilized to measure the similarity between users,enhancement of similarity evaluation between users.Theoretical analysis shows that the matching degree and the feasibility of knowledge push has been increased by modified algorithm,which has provided a new way for future business knowledge push system in enterprises.
enterprise knowledge management;knowledge map;knowledge push;collaborative filtering
2016-05-19
:2016-08-25 < class="emphasis_bold">網(wǎng)絡(luò)出版時(shí)間
時(shí)間:2017-07-05
上海市科技計(jì)劃項(xiàng)目(12DZ1505600)
渠國(guó)慶(1990-),男,碩士研究生,研究方向?yàn)槠髽I(yè)知識(shí)管理、推送;熊 偉,副研究員,研究方向?yàn)槠髽I(yè)信息化。
http://kns.cnki.net/kcms/detail/61.1450.TP.20170705.1649.012.html
TP301
:A
:1673-629X(2017)09-0082-03
10.3969/j.issn.1673-629X.2017.09.018