黃文專
(肇慶醫學高等專科學校, 口腔醫學院, 廣東, 肇慶 526020)
網絡音樂信息與用戶提供的偏好信息相結合能夠在用戶查詢網絡音樂的過程中擴大音樂搜索范圍,但現有的系統查詢方式較為單一,查詢結果的排序也難以滿足用戶需求[1-3]。為此,本文提出了一種基于深度學習的網絡音樂檢索系統,在不同機制下進行查詢結果的初排序和重排序,通過深度排序學習的方式優化最終的查詢結果,在很大程度上提升了用戶的使用體驗。
本文所設計的網絡音樂檢索系統主要包括初排序與重排序兩個模型,系統的結構和工作流程如圖1所示。

圖1 基于深度學習的網絡音樂信息檢索系統
用戶提出查詢請求后,系統根據用戶輸入的原始內容通過Galago搜索引擎進行首次查詢,得到網絡音樂信息的原始排序結果,接下來利用偽相關反饋技術擴展查詢內容并以此為基礎進行二次查詢,從而得到網絡音樂信息的初排序結果;對初排序結果中的社會信息進行特征提取,基于不同的特征或多種特征的不同組合選擇重排序機制;通過排序學習方法創建重排序融合模型,在充分融合各種排序結果的條件下輸出最優的排序結果。
在用戶進行網絡音樂信息查詢的過程中,系統會根據用戶輸入的查詢內容和網絡音樂信息中關鍵詞詞頻對輸出的結果進行排序,在系統啟動搜索程序之前,需要同時對查詢數據和音樂數據進行預處理,即通過建立信息豐富的索引來提高查詢結果的質量[4]。網絡中的部分音樂為數字形式,所以需要將其轉換為統一的文本信息[5]。本文采用Galago搜索引擎根據文本信息的具體內容分別建立四種索引:整體數據索引、元數據(作者提供的關鍵詞)索引、內容(音樂內容概括)索引、社會信息(用戶的評論及為其設定的標簽)索引。
為了獲得更多的查詢結果,可以在用戶輸入的初始查詢內容的基礎上選擇與關鍵詞意義相近的擴展詞,同輸入內容相結合組建擴充后的查詢詞句,以此來提高查詢內容的豐富性、準確性和完整性[6]。偽相關反饋技術能夠有效實現查詢擴展,且通過該技術所獲得的擴展詞是對查詢內容最大化擴展的結果[7],在基于用戶的原始查詢獲得首批網絡音樂信息后,在排序靠前的信息中提取擴展詞來進一步豐富查詢內容,可見擴展詞的數量與準確性是由這部分網絡音樂信息所決定的。
偽相關反饋技術有一個假定的前提,即根據用戶原始查詢內容所獲得的查詢結果中排序為1~k的網絡音樂信息都確實與用戶輸入的關鍵詞句相關,以此為基礎實現查詢結果初排序的流程[8]如下。
步驟1 通過用戶輸入的原始內容對查詢結果進行首次排序,依據內容相關性的強弱選出排序靠前的k個網絡音樂信息。
步驟2 從以上k個網絡音樂信息中提取內容關鍵詞,將出現次數最多的前w個詞作為與用戶輸入相關的擴展詞。
步驟3 根據用戶輸入關鍵詞與擴展詞相結合組建成的新查詢詞句進行二次查詢,獲得新的查詢結果。
步驟4 利用Galago搜索引擎的查詢似然模型對以上結果進行初排序,排序依據即相關性采用下式進行計算[9]:
(1)

對于本文所設計的檢索系統,為了擴大查詢目標的范圍,首先假定與用戶所偏好的音樂類型相近的音樂也可一并視為用戶偏好的音樂,以此為前提的重排序可通過下式進行:
scorer(Q,D)=a×score(Q,D)+(1-a)e(D)
(2)
式中,score(Q,D)代表初排序評分;e(D)代表相似音樂發揮作用的大小,其數值通過相似度加權進行計算,即:
(3)
式中,sim(Di,Dj)代表初排序結果中第i名與第j名音樂的相似程度。Q為音樂的數量集。
若以網絡音樂數據中單個域的出現次數作為重排序的依據,那么兩首歌曲之間相似度的計算方法為
Sim(Di,Dj)=cos
(4)
式中,vecDi代表排名為i的音樂的特征向量;vecDj代表排名為j的音樂的特征向量。若以組合特征的相似度作為重排序的依據,那么基于初排序結果的相似度計算方法[10]為

(5)
式中,S(Di)代表與Di類型相似的音樂。對于式(5)的計算結果,若S(Di)中包含初排序結果中的音樂,那么該音樂的標記值為1,反之則為0,由此可通過相似度的對比得到重排序的結果。在此基礎上,本文所建立的重排序機制為DTN、ITN、DT、IT、TN、T、N、I、D,其中T、N、I、D分別代表用戶標簽、瀏覽節點、相似音樂、相似音樂的相似音樂。
在以上多種重排序機制下所獲取的排序結果需要經歷一個有機融合的過程來保證排序的準確性,而當前排序融合多采用人工或半人工的方式進行,使得最終的結果極容易產生偏差,因此本文采用基于pointwise的深度排序學習方法來獲得最優排序結果。Pointwise主要用于單一文檔的處理,它能夠將文檔以特定的方式轉換為特征向量,從而以機器學習模式下回歸或分類的方式進行排序。在排序學習的過程中,以音樂的多個不同排序結果為特征向量,以音樂在最優排序結果中的排名為訓練目標,獲取多個排序結果與最優排名的映射關系,作為選擇最佳重排序機制的依據。本文引入隨機森林模型實現排序學習在重排序過程中的應用。
本文選取HIFIVE網絡平臺的音樂查詢結果建立實驗樣本集,平臺數據庫中保存了280萬首音樂的數據,每一條數據都包含豐富的內容信息和用戶添加的各種社會信息,這些信息可劃分為2種標簽域,一是

表1 實驗數據集
本次測試選用排名前10的查詢結果的準確性DB-CF算法平臺[5]作為系統性能的評價指標。選取2019年的平臺查詢記錄分別針對系統的初排序、重排序以及特征融合3個模型的不同參數進行實驗。
首先對偽相關反饋的相關參數的不同設定值進行比較,實驗結果如表2所示。Initial代表首次排序,PRF代表初排序,由表2中的數據可見在從原始排序結果前20名中提取15個關鍵詞的條件下能夠得到最優的初排序結果。

表2 初排序結果
接下來對重排序過程中所需設定的社會信息占比a的不同設定值進行比較,在表1數據集中進行初排序和全部特征組合的重排序,實驗結果如表3所示。

表3 不同a值條件下的重排序結果
由表3中的數據可見,所有重排序結果的準確性都高于初排序結果,其中以tag為重排序機制的重排序結果相較于初排序結果在訓練集與測試集中的準確率分別高出了6.17%和9.30%。
針對基于排序學習的重排序結果進行實驗,以不同重排序機制為訓練的輸入,以訓練集中的現實排序結果為標準,通過改變隨機森林模型參數組合方式進行數據集訓練,實驗結果如表4所示。

表4 基于排序學習的重排序結果
由表4中的數據可見,利用排序學習方法將不同重排序結果進行有機融合,能夠進一步提高重排序結果的準確性,其中通過排序學習使tag(T)重排序機制的準確率提高了13%,由此可見,本文所設計的系統能夠大幅提高網絡音樂信息查詢的準確性。
為了切實提高網絡音樂查詢結果的質量,本文提出并設計了一種基于深度學習的網絡音樂信息檢索系統,利用偽相關反饋技術初步擴大了網絡音樂的搜索范圍并獲得初排序結果,根據用戶在查詢過程中生成的社會信息建立了重排序機制,最終通過排序學習方法實現了不同重排序結果的融合,由此得到了最優的排序結果。系統測試結果表明,該系統在很大程度上提高了網絡音樂信息查詢的準確性,為用戶提供了良好的使用體驗。