齊孝龍, 韓東紅, 高 翟, 喬百友
(東北大學(xué) 計算機(jī)科學(xué)與工程學(xué)院, 遼寧 沈陽 110169)
推薦系統(tǒng)可以解決海量數(shù)據(jù)導(dǎo)致的信息過載問題,旨在通過分析用戶行為、興趣、個性化需求等預(yù)測用戶感興趣的信息,諸如商品、新聞、感興趣的話題等[1].
傳統(tǒng)的推薦系統(tǒng)不能與用戶進(jìn)行很好地交互,從而影響了用戶體驗.有研究表明,對話式推薦能夠更好地解決推薦系統(tǒng)中的冷啟動問題[2],而且在可解釋性方面優(yōu)于基于深度學(xué)習(xí)的推薦系統(tǒng)[3].基于此,對話式推薦技術(shù)開始進(jìn)入學(xué)術(shù)界和工業(yè)界的視野[4-10].
已有的對話推薦研究多以目標(biāo)或話題為導(dǎo)向[7,9],即通常采用Pipeline方式,首先利用分類模型預(yù)測對話目標(biāo)、話題或推薦實體,再根據(jù)預(yù)測得到的對話目標(biāo)等指導(dǎo)生成合適的推薦對話.由于分類標(biāo)簽的空間過大(大約1 000個)[9],導(dǎo)致預(yù)測的準(zhǔn)確率不高.針對上述問題,本文提出了一種利用對話模型引導(dǎo)的對話生成推薦(dialogue guided recommendation of dialogue generation,DGRDG)模型,通過對話模型生成對話目標(biāo),因?qū)υ捘繕?biāo)的生成是逐步的,DGRDG模型在每一時間步的目標(biāo)生成模塊均融入上下文信息,生成的對話目標(biāo)質(zhì)量優(yōu)于分類模型;本文提出一種目標(biāo)重規(guī)劃策略(goal replan policy,GRP),即在生成對話目標(biāo)后,利用對話目標(biāo)之間的關(guān)系和對話目標(biāo)與對話目標(biāo)候選集中元素之間的語義相似度,調(diào)整生成的對話目標(biāo),使得對話目標(biāo)的準(zhǔn)確率比未引入該策略前提高了3.93%;最后通過在DuRecDial數(shù)據(jù)集上進(jìn)行實驗,結(jié)果驗證了所提出的模型的有效性.
推……