999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向中文歌曲的音樂推薦服務(wù)型本體研究

2017-05-02 15:27:20康趙楠潘善亮
移動通信 2017年6期

康趙楠+潘善亮

【摘 要】為了構(gòu)建一個適用中文歌曲及聽眾的音樂推薦服務(wù)型本體(CHMO)來對音樂知識進行自動化處理。首先,設(shè)計一個細(xì)粒度的音樂本體模型;然后,提出合理的構(gòu)建原則和方法,并利用Protégé和OWL建立本體;接著,詳細(xì)闡述本體中的組成內(nèi)容,并采用Jena進行推理優(yōu)化模型;最后,完善本體,包括算法檢測以及本體實現(xiàn)中的支持性問題。

【關(guān)鍵詞】音樂本體建模 構(gòu)建方法 推理規(guī)則

1 引言

基于個性化的音樂推薦已經(jīng)成為推薦系統(tǒng)的研究熱點[1]。音樂作為一門憑借聲波振動而存在、在時間中展現(xiàn)、通過人類的聽覺器官而引起各種情緒反應(yīng)和情感體驗的藝術(shù)存在[2],本體(Ontology)是客觀現(xiàn)實的抽象本質(zhì)[3]。

在關(guān)于音樂本體的研究中,主要以基礎(chǔ)理論研究為主導(dǎo),其次是對其用途進行研究[5-7]。Yves Raimond等[8]開發(fā)了音樂本體Music Ontology。Han等[9]通過本體推理機分類情境實例來推理出用戶的心情和音樂偏好。Rho等[10]提出了基于情境的音樂推薦本體Context-Based Music Recommendation Ontology。由于中西方審美的差異[11-12],針對西方音樂和受眾的音樂本體在處理中文歌曲方面并不適用[13]。張冰冰結(jié)合現(xiàn)有已成熟的其他本體詞匯表得到了涵蓋影視音樂、歷史事件、地點文化等的相關(guān)本體的本體知識庫[14]。薛云在構(gòu)建好的民樂領(lǐng)域本體基礎(chǔ)之上完成語義推理[15]。

本文將詳細(xì)介紹構(gòu)建一個互聯(lián)網(wǎng)下涵蓋數(shù)字音樂領(lǐng)域知識及情境信息的可以共享的基于中文歌曲的音樂推薦本體,并對該音樂本體進行屬性約束及其一致性的檢測與分析。

2 音樂本體的構(gòu)建

2.1 音樂對象的確定

在構(gòu)建本體之前,要明確該領(lǐng)域本體的各項構(gòu)成要素,它包括了目的、范圍、表示方法和用途等等,以此使得目標(biāo)本體的主要輪廓變得清晰。本階段可以得到關(guān)于本體的開發(fā)目的和詳細(xì)的說明書。一旦確定了領(lǐng)域本體的范圍,接著盡最大可能地羅列出該領(lǐng)域本體的有關(guān)術(shù)語或概念。音樂作為一個獨立的領(lǐng)域,它所包含的對象是十分豐富的。

針對互聯(lián)網(wǎng),借鑒已有的音樂概念,增加符合基于中文歌曲和華人收聽習(xí)慣的術(shù)語描述。

音樂對象包括音樂人、專輯、歌詞、圖片、語種、風(fēng)格、場景、情感、節(jié)日、主題等多個方面。為了使用戶更加容易理解以及后續(xù)工作的使用,在音樂本體中增加標(biāo)簽來統(tǒng)一管理部分知識(能夠代表一首音樂內(nèi)在性質(zhì)的關(guān)鍵詞)。

2.2 音樂本體的構(gòu)成要素

本文所設(shè)計的數(shù)字音樂領(lǐng)域本體主要通過分類歌曲信息以進一步細(xì)化出用戶的興趣偏好。它所包含的概念或者術(shù)語間存在著上下位的關(guān)系,其本質(zhì)上是一個概念層次樹,且只含有父類和子類。父類概念是子類概念的一種泛化,而子類概念是父類概念的一種分類,它可以從不同角度對上級概念進行一個深層次的細(xì)化,同時分類的層次越深,相應(yīng)的用戶興趣劃分的力度就會越大,對用戶偏好的分析也就可以越細(xì)致。

本文在Protégé[16]平臺上使用一個七元組的形式自上而下地來描述和完善音樂本體(CHMO)模型:

CHMO={C, P, RC, HC, I, A, R} (1)

其具體描述如下:

(1)C(Class或Concept)表示本體覆蓋的類(概念、術(shù)語)的集合。當(dāng)個體具有相似的性質(zhì),可以將之抽象成相應(yīng)的類,而這里的個體就是類的實例。

(2)P(Property)表示屬性集合。屬性是對類的表征和描述,包括兩種,即對象屬性和數(shù)據(jù)屬性。

(3)RC(Relation)為關(guān)系的集合。形式上可以定義為一組n維笛卡爾積的子集R:C1×C2×...×Cn概念之間有四種基本關(guān)系,如表1所示。

(4)HC(Hierarchy)表示音樂本體概念的層次結(jié)構(gòu)。形式上可以定義為:H(C1,C2)表示概念C1是概念C2的子概念。

(5)I(Instance)表示實例集合。它是本體類包含的基本元素。

(6)A(Axiom)表示公理的集合。在音樂本體中,每個元素都有特定的意義,元素之間也存在著連接或約束,公理表示一些永真式,用來解釋元素和它們之間的相關(guān)性和約束關(guān)系。

(7)R(Ratiocination)表示推理規(guī)則。用來模仿推理能力。

依據(jù)以上描述可以看到本文所設(shè)計的音樂本體的知識結(jié)構(gòu)包括類、屬性、關(guān)系、層次、實例、公理和推理規(guī)則。這種結(jié)構(gòu)通過“類-屬性-實例”,三位一體式描述音樂并擴展其相關(guān)知識,確定其關(guān)系和層次結(jié)構(gòu),最后使用公理和推理規(guī)則約束知識,完成音樂知識網(wǎng)絡(luò)體系結(jié)構(gòu)。

2.3 音樂本體的構(gòu)建原則

參照Gruber于1995年[17]所提出的比較權(quán)威的五條標(biāo)準(zhǔn),進一步闡釋音樂本體構(gòu)建原則,包括以下方面:

(1)明確性和客觀性:即本體的術(shù)語應(yīng)該具有明確的自然語言的形式以及客觀的定義。

(2)完全性和完整性:即要對音樂本體中術(shù)語的意義提供完整、準(zhǔn)確定義和詳細(xì)說明。

(3)一致性:即本體是前后一致的。

(4)最大單調(diào)可擴展性:即添加一個新項,不需要調(diào)整原本體。

(5)編碼偏好程度最?。杭匆魳繁倔w位于知識水平的表達(dá),不限于編碼語言。

(6)與層次概念保持最小的語義距離。

(7)最小本體承諾:即建模對象的約束盡量少,只要能滿足當(dāng)前需求的特定的知識共享。

(8)盡可能使用標(biāo)準(zhǔn)化的術(shù)語名稱。

(9)使用多樣的概念層次結(jié)構(gòu)實現(xiàn)多繼承機制。

2.4 音樂本體的構(gòu)建方法

上文提到,音樂本體包含音樂人、專輯、圖片、語種、風(fēng)格、場景、情感、節(jié)日、主題、音樂獎項、專輯、時間等子本體。根據(jù)音樂本體的組織結(jié)構(gòu)和構(gòu)建原則,參照已有的TOVE法[18]和七步法[19],設(shè)計本文音樂本體的構(gòu)建方法,采用OWL DL描述語言和Protégé 4.3,主要步驟如下:

(1)音樂對象的收集和分析。對音樂知識獲取、分析和記錄,初始化管理和保護音樂對象。

(2)音樂本體內(nèi)容和范圍的合理界定,確定名詞術(shù)語的來源。一般而言,領(lǐng)域本體是覆蓋整個領(lǐng)域的本體,但具體的討論往往不是那么簡單。本文從網(wǎng)絡(luò)出發(fā),給出數(shù)字音樂本體的定義,所以沒有完全覆蓋音樂學(xué)科的基本內(nèi)容,但參照了《音樂百科詞典》和《2015-2016中國手機音樂客戶端市場研究報告》,增加專輯和標(biāo)簽等知識,細(xì)化分類,形成一個數(shù)字音樂庫。

(3)刻畫音樂本體的術(shù)語表,對名詞術(shù)語進行規(guī)范。構(gòu)建本體之前,列出所有術(shù)語表的詞匯項。

(4)確定音樂本體的類和實例。

(5)區(qū)別音樂本體結(jié)構(gòu)和類之間的關(guān)系。具體方法是自上而下、從下到上、綜合方法這三種。自上而下是先確定一般的類,不斷找到一個新的子類,最終實現(xiàn)最特別的類;從下到上先確保本體中特殊的類,不斷歸納類,最后達(dá)到本體中最一般類;綜合方法是它們的組合。本文基于綜合方法,結(jié)構(gòu)如圖1所示。

(6)借鑒和復(fù)用現(xiàn)有本體。CHMO中復(fù)用人、時間、語種等公共信息本體以及DBpedia中的部分術(shù)語,同時參考已有的The Music Ontology[20]對術(shù)語進行標(biāo)準(zhǔn)化。

(7)定義音樂本體中類的屬性。根據(jù)最常用的原則和符合用戶欣賞的特點,設(shè)置屬性,從不同的側(cè)面對音樂本體的類進行描繪。

(8)添加標(biāo)簽。鑒于國內(nèi)主流音樂平臺的使用情況,為基于中文歌曲的音樂推薦本體添加標(biāo)簽這一概念,它包含了情感、節(jié)日、語種、場景、風(fēng)格、主題子本體以及它們所各自包含的子本體,為了便于用戶理解本體的概念和使用,從而進一步完善音樂本體。

(9)描述類中的實例?;趯嵗拿枋鰜泶_定最終的實例與類關(guān)系,完成一個概念體系的構(gòu)建。

(10)建立公理庫和推理規(guī)則。利用OWL描述公理和規(guī)則,進行音樂本體的一致性分析。

(11)形成音樂本體的文檔。通過持續(xù)改進使本體逐步接近人類對客觀世界的認(rèn)知,形成文檔管理的過程。

(12)檢查異常。在Protégé中,可以使用推理機對本體自身的不一致和置入本體的實例集不一致進行檢測。

3 音樂本體的描述

3.1 類間的層次體系

本體中的類包含兩種作用:(1)對自身及其所包含的知識含義的描述。類中包含知識,知識可以是類本身,也可以是類實例的共同點。(2)限定對類的子類和實例的描述。通過分析,最終確定了“音樂人”、“時間”、“圖片”、“標(biāo)簽”、“歌詞”、“音樂獎項”、“專輯”為核心詞匯,滿足非二義性、互不相交的要求。各個頂級概念之下再擴展具體的類。部分音樂本體的類術(shù)語表如表2所示,層次概念如圖2。

3.2 屬性及關(guān)系

音樂本體的屬性包括發(fā)行時間、風(fēng)格、主題、專輯詳情、歌詞、時長等等,分為對象屬性和數(shù)據(jù)屬性。對象屬性指兩個類的實例之間的關(guān)系,定義域是類,值域是實例;數(shù)據(jù)屬性規(guī)定類的實例、文字及數(shù)據(jù)類型間的關(guān)系,定義域是某個類的實例,值域可以是int、string、float等,該屬性不能為傳遞的、對稱的和反函數(shù)的。音樂本體的屬性術(shù)語部分如表3所示,屬性關(guān)系如圖3和圖4所示。

3.3 添加標(biāo)簽

添加標(biāo)簽類目,用來代表一首音樂內(nèi)在內(nèi)容的一種性質(zhì),可以簡單理解為關(guān)鍵詞描述。它除了包括基本的分類信息:語種、主題、風(fēng)格等,還額外添加歌曲所涉及的情感和場景這兩個情境信息子類。在這兩個子類中又進一步劃分?jǐn)?shù)個類,從而達(dá)到一個細(xì)粒度的本體建模,能夠更適合互聯(lián)網(wǎng)下基于本體的音樂個性化推薦研究。

3.4 生成實例

在Protégé中的Individuals面板中可直接添加類的實例(個體),在這個實例中對每個屬性進行賦值,這樣就可以構(gòu)建音樂本體了。為了直觀地描述音樂本體類和實例,給出應(yīng)用的例子,其中歌曲類和歌曲實例《山丘》的部分框架表示如圖5所示。

3.5 基于本體和自定義規(guī)則的推理

(1)公理和推理規(guī)則的表示

依據(jù)音樂本體屬性和關(guān)系,再結(jié)合領(lǐng)域本體的公理集,采用謂詞邏輯系統(tǒng)來設(shè)計本文的音樂本體公理。主要包括了函數(shù)屬性、反函數(shù)屬性、傳遞屬性、對稱屬性、自反屬性等,其中所謂函數(shù)性是指同一個參數(shù)的函數(shù)值是唯一確定的,反函數(shù)性則與之相反。如果一個屬性是傳遞性的,那么它的逆屬性也是具有傳遞性的。傳遞性和函數(shù)性不兼容,如果一個對象屬性具有傳遞性就不可能有函數(shù)性等等,這些公理將作為推理機制中的約束。比如其中函數(shù)屬性形式化表示如下:

推理規(guī)則是一個重要的基礎(chǔ),主要分為兩點:

1)完善音樂知識,獲取隱含的信息;

2)檢測和維護音樂知識,確保本體的一致性和完整性。本文音樂本體部分自定義推理規(guī)則可以寫成如下的形式:

如果歌曲的封面是某一位歌手的照片,那么這位歌手即是其音樂人。

自定義的規(guī)則大多來自既定事實的表述。其中規(guī)則(5)和規(guī)則(6)體現(xiàn)了標(biāo)簽子類情感-幸福-快樂三者上下層關(guān)系的一個遞進。利用謂詞邏輯描述信息,然后通過自定義的規(guī)則產(chǎn)生新的、隱含的上層知識。

(2)推理工具

本文采用Jena作為推理工具,它的軟件包能夠同時支持本體推理和自定義規(guī)則的推理。

Jena[21]是支持語義網(wǎng)應(yīng)用的一個Java應(yīng)用程序接口,它包含以下模塊:RDF的API、解析器、內(nèi)存存儲與永久性存儲、推理機子系統(tǒng)、本體子系統(tǒng)和查詢模型。其中推理機子系統(tǒng)具有兩大功能:

1)支持使用RDFS和OWL語言,能夠加入一系列推理引擎或推理機來獲取額外的信息;

2)包括一個可以用于許多RDF處理或轉(zhuǎn)換任務(wù)的一般的規(guī)則引擎。

(3)推理流程

步驟1:獲取歌曲信息并描述。

步驟2:將信息持久性保存到知識庫中。

步驟3:觸發(fā)推理行為,利用推理機對信息進行推理得到上層或者新的隱含的信息。

步驟4:對比知識庫,檢測新信息的一致性和正確性。

步驟5:如果上一步產(chǎn)生沖突,則進行沖突處理。沒有沖突,則推理結(jié)束,更新知識庫。

推理流程如圖6所示:

(4)推理規(guī)則有效性驗證

將自定義規(guī)則寫入規(guī)則庫后,使用SPARQL和Jena進行當(dāng)前歌曲信息的查詢與推理本體模型,系統(tǒng)會自動校驗規(guī)則前后的狀態(tài),判斷其是否有效。通過所構(gòu)建的合理的本體推理機制,能夠?qū)﹄[含的知識進行有效地推理,節(jié)省存儲空間的同時還能夠提高讀取效率,還能優(yōu)化知識的梳理。

4 音樂本體的完善

上述步驟后已經(jīng)初步建立了一個基本的音樂本體,接下來將進一步闡釋驗證本體過程中的一些關(guān)鍵內(nèi)容。

本體的一致性是指本體中各概念沒有矛盾。一致性檢測就是根據(jù)本體中的公理和約束來判斷整個結(jié)構(gòu)是否存在矛盾,如果存在矛盾和不一致的地方需要及時進行修正。

4.1 類間關(guān)系的一致性檢測

首先,定義音樂本體的類間關(guān)系。

4.2 基于音樂公理的知識一致性分析

公理作為本體的一個重要組成部分,它的功能有兩個:第一,公理即知識;第二,公理保證本體中低水平的知識是一致的。這里所提的知識一致性指的是公理約束下的知識和公理沒有矛盾。獲取的知識的過程并不總是正確、沒有矛盾的。知識獲取的過程中知識來源的不準(zhǔn)確,人為的過失等原因,都可能導(dǎo)致知識是不一致的。當(dāng)一首歌曲是契合婚禮的這一特定情形的音樂,那么它所表達(dá)的情感一定是幸福、開心的。如果出現(xiàn)情感是悲傷的,則報告本體出現(xiàn)錯誤。

本體的一致性分析是一項非常復(fù)雜的任務(wù)。它涵蓋了本體中的類、屬性和實例等諸多方面,需要不斷地更新知識,逐步完善本體。

4.3 音樂本體實現(xiàn)中的問題及解決

目前,Protégé的中文支持性很差,而本文所構(gòu)建的互聯(lián)網(wǎng)下基于中文歌曲的音樂本體模型中所涉及的多處概念,比如標(biāo)簽、主題都是基于中文或者中文環(huán)境的。為了解決這個問題,本文通過mapping.properties文件實現(xiàn)中文到相應(yīng)英文或者拼音的映射操作。部分mapping.properties文件映射片段如圖7所示。

5 結(jié)束語

本文根據(jù)現(xiàn)代互聯(lián)網(wǎng)下數(shù)字音樂領(lǐng)域的形勢,針對中文歌曲及聽眾,通過擴展構(gòu)建新的音樂本體模型,設(shè)計音樂本體的構(gòu)建方法及構(gòu)建流程,闡明了對音樂領(lǐng)域知識構(gòu)建本體的必要性和可行性。構(gòu)建方覆蓋本體建設(shè)和維護的生命周期,與現(xiàn)有的本體建設(shè)方法相比更加細(xì)粒度且全面。本文所建立的面向中文歌曲及聽眾的音樂本體模型既先進也實用,對下一代網(wǎng)絡(luò)平臺下數(shù)字音樂服務(wù)的推廣具有重要意義,同時也將會進一步應(yīng)用在后續(xù)的音樂個性化推薦研究中。隨著信息地不斷擴充,該本體模型的完善工作將持續(xù)進行。

參考文獻(xiàn):

[1] 譚學(xué)清,何珊. 音樂個性化推薦系統(tǒng)研究綜述[J]. 現(xiàn)代圖書情報技術(shù), 2014,30(9): 22-32.

[2] 繆天瑞. 音樂百科詞典[M]. 北京: 人民音樂出版社, 1998.

[3] Gruber T R. A translation approach to portable ontology specifications[J]. Knowledge Acquisition, 1993(5): 199-220.

[4] LU R. Knowledge engineering and knowledge science at the turn of the century[M]. Beijing: Tsinghua University Press, 2001.

[5] Seheon Song, Minkoo Kim, Seungmin Rho, et al. Music Ontology for Mood and Situation Reasoning to Support Music Retrieval and Recommendation[A]. Third International Conference on Digital Society[C]. 2009: 304-309.

[6] Sefki Kolozali, Mathieu Barthet, Gy?rgy Fazekas, et al. Knowledge Representation Issues in Musical Instrument Ontology Design[A]. 12th International Society for Music Information Retrieval Conference[C]. 2011: 465-470.

[7] Marius Kaminskas, Ignacio Fernandeztobias, Ivan Cantador, et al. Ontology-Based Identification of Music for Places[Z]. 2013.

[8] Yves Raimond, Samer A, Abdallah, et al. The Music Ontology[A]. International Society for Music Information Retrieval Conference[C]. 2007: 417-422.

[9] Han B J, Rho S, Jun S, et al. Music Emotion Classification and Context-Based Music Recommendation[J]. Multimedia Tools and Applications, 2010,47(3): 433-460.

[10] Rho S, Song S, Hwang E, et al. COMUS: Ontological and Rule-Based Reasoning for Music Recommendation System[A]. Advances in Knowledge Discovery and Data Mining[C]. Springer Berlin Heidelberg, 2009: 859-866.

[11] 李姝. 中西音樂美學(xué)的比較研究[D]. 成都: 四川大學(xué), 2007.

[12] 劉正維. 中西音樂結(jié)構(gòu)的審美異同散論[J]. 音樂研究, 2003(3): 3-16.

[13] Mi Tian, Gy?rgy Fazekas, Dawn A, et al. Towards the representation of Chinese traditional music: a state of the art review of music metadata standards[A]. Dublin Core Conference[C]. 2013: 71-81.

[14] 張冰冰. 基于領(lǐng)域本體的景點影視音樂推薦[D]. 杭州: 浙江大學(xué), 2014.

[15] 薛云. 基于民樂領(lǐng)域本體的語義推理研究[J]. 情報探索, 2009(4): 104-106.

[16] Protégé. Stanford Center for Biomedical Informatics Research[EB/OL]. (2016-02-09)[2017-01-10]. http://protege.stanford.edu/.

[17] Gruber T R. Towards principles for the design of ontologies used for knowledge sharing[J]. International Journal of Human-Computer Studies, 1995(43): 907-912.

[18] University of Toronto. Faculty of Applied Science and Engineering TOVE ontologies[EB/OL]. (2013-09-18)[2017-01-10]. http://www.ie.utoronto.ca/EIL/tove/toveont.html.

[19] NOY N F, McGUINNESS D L. Ontology development 101: a guide to creating your first ontology: knowledge systems laboratory, SMI-2001-0880[R]. Stanford University, 2001.

[20] Rory Pickering. The Music Ontology[EB/OL]. (2015-11-30)[2017-01-10]. http://musicontology.co/.

[21] Apache Jena. A free and open source Java framework for building Semantic Web and Linked Data applications[EB/OL]. (2016-02-09)[2017-01-10]. http://jena.apache.org/.

主站蜘蛛池模板: 99免费在线观看视频| 久久精品aⅴ无码中文字幕 | 精品国产乱码久久久久久一区二区| 亚洲国产系列| 1769国产精品免费视频| 狠狠色丁香婷婷综合| 男人天堂伊人网| 成色7777精品在线| 亚洲V日韩V无码一区二区| 天天色综合4| 国产a v无码专区亚洲av| 91精品专区国产盗摄| a在线亚洲男人的天堂试看| 国产福利2021最新在线观看| 国产精品入口麻豆| 久久福利片| 777午夜精品电影免费看| 日韩色图区| 精品国产免费人成在线观看| 9999在线视频| 国产精品999在线| 日韩精品一区二区三区大桥未久 | 91精品啪在线观看国产| 日韩精品亚洲人旧成在线| 美女免费精品高清毛片在线视| 99尹人香蕉国产免费天天拍| 亚洲国产亚综合在线区| 国产乱论视频| 一区二区三区高清视频国产女人| 国产黑丝一区| 999福利激情视频| 女高中生自慰污污网站| 国产成人91精品免费网址在线| 久久a毛片| 在线亚洲精品福利网址导航| 日本国产精品一区久久久| 欧美性猛交一区二区三区| 青草免费在线观看| 国产91色| 免费中文字幕一级毛片| 亚洲天堂免费观看| 国产另类视频| 亚洲首页国产精品丝袜| 国产导航在线| 中文字幕人妻av一区二区| 国产Av无码精品色午夜| av午夜福利一片免费看| 日本三级欧美三级| 国产 在线视频无码| 成人自拍视频在线观看| 2020精品极品国产色在线观看| 亚洲第一黄色网址| 国产一区二区三区在线精品专区| 老司机午夜精品网站在线观看| 四虎AV麻豆| 亚洲综合二区| 国产精品久久久久鬼色| 欧美亚洲日韩中文| 久久久久青草线综合超碰| 91福利国产成人精品导航| 午夜国产小视频| 无码AV日韩一二三区| 女人毛片a级大学毛片免费 | 二级毛片免费观看全程| 日韩成人在线网站| 日韩欧美国产另类| 波多野结衣一区二区三区四区| 国产成人精品视频一区视频二区| 中文无码毛片又爽又刺激| 国产日韩精品一区在线不卡 | 国产打屁股免费区网站| 国产精品不卡片视频免费观看| 国产午夜福利在线小视频| 精品国产www| 亚洲第一精品福利| 日韩久草视频| 尤物亚洲最大AV无码网站| 欧美成人区| 久久这里只有精品8| 国产精品偷伦在线观看| 91福利免费| 喷潮白浆直流在线播放|