曾奕凡++高軍暉

摘 要:該文討論了人工智能在數(shù)字音樂中的多個(gè)應(yīng)用,并對(duì)當(dāng)前的技術(shù)成熟度做出分析,最后對(duì)人工智能在數(shù)值音樂中起到的作用做出總結(jié),并展望未來的發(fā)展方向。
關(guān)鍵詞:人工智能 數(shù)字 音樂 旋律識(shí)別流行預(yù)測(cè) 創(chuàng)作進(jìn)化樹 音樂情緒
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2015)06(c)-0043-02
人工智能(Artificial Intelligence)是20世紀(jì)中后期興起的一門學(xué)科,屬于計(jì)算機(jī)科學(xué)的范疇之內(nèi)。它的主要目的是讓機(jī)器能夠?qū)W習(xí)知識(shí)并且運(yùn)用學(xué)到的知識(shí)來解決問題。換句話說,就是讓機(jī)器能夠擁有人類的思維方式。人工智能在近三十幾年來取得了飛躍性的進(jìn)展,并且在眾多領(lǐng)域都得到了應(yīng)用,例如機(jī)器人,互聯(lián)網(wǎng),模式識(shí)別等。不僅僅如此,人工智能在數(shù)字音樂中甚至都有十分重要的應(yīng)用。數(shù)字音樂(Digital Music)是以數(shù)字的形式儲(chǔ)存的音樂,它們可以被音樂編輯軟件任意的創(chuàng)作,編輯,播放,擁有傳統(tǒng)唱片所沒有的靈活,快捷。正因?yàn)槿绱耍斯ぶ悄茉跀?shù)字音樂中有了用武之地。該文將主要討論人工智能在數(shù)字音樂中的四個(gè)應(yīng)用,分別是旋律識(shí)別,預(yù)測(cè)音樂是否流行,描繪音樂進(jìn)化樹以及心理疾病的音樂治療。
1 人工智能在數(shù)字音樂中的應(yīng)用
1.1 旋律識(shí)別
旋律識(shí)別的基本原理來自于模式識(shí)別(Pattern Recognition)。模式識(shí)別是指計(jì)算機(jī)通過數(shù)學(xué)方法來判定數(shù)據(jù)是否屬于已存在的模式之中并對(duì)數(shù)據(jù)進(jìn)行適用于該模式的處理。模式識(shí)別的價(jià)值在于讓機(jī)器通過已有的知識(shí)應(yīng)用在新的數(shù)據(jù)上,讓計(jì)算機(jī)擁有解決問題的能力。旋律識(shí)別就是把現(xiàn)有的旋律作為一個(gè)模式,儲(chǔ)存在計(jì)算機(jī)中之后,給計(jì)算機(jī)聽一段新的旋律,讓其判定是否與已知的旋律匹配,來達(dá)到識(shí)別音樂的目的。現(xiàn)在許多軟件中的“聽歌識(shí)曲”功能都來源于此。
準(zhǔn)確的旋律識(shí)別需要精密的算法,而這也是專家們研究的方向。王峰、張雪英、李炳男[1]對(duì)和弦識(shí)別進(jìn)行了研究。和弦識(shí)別是音樂調(diào)式分析和自動(dòng)標(biāo)注的基礎(chǔ),同時(shí)在分析音樂的結(jié)構(gòu)和旋律方面有著非常重要的作用。結(jié)合音樂理論和信號(hào)處理知識(shí),提出一種基于MPCP(Mel Pitch Class Profile)特征和CRFs(Conditional Random Fields)模型的和弦識(shí)別方法。利用短時(shí)傅里葉變換(STFT)對(duì)音樂信號(hào)進(jìn)行時(shí)頻變換,定義了一種新的MPCP特征,最后用CRFs對(duì)和弦進(jìn)行識(shí)別。實(shí)驗(yàn)結(jié)果表明,提出的方法在識(shí)別率上由于其他方法,具有一定的潛力[1]。胡穎、田麗紅、王峰[2]全面總結(jié)了音樂和弦識(shí)別領(lǐng)域所取得的主要研究成果,重點(diǎn)介紹了音樂特征的提取,和弦識(shí)別等方面采用的各種智能分析處理方法,并對(duì)該領(lǐng)域中存在的主要困難和將來的發(fā)展方向提出來一些看法。旋律識(shí)別是人工智能在數(shù)字音樂中非常有前景的一個(gè)應(yīng)用,將會(huì)為數(shù)字音樂的智能化做出巨大貢獻(xiàn)[2]。
1.2 預(yù)測(cè)音樂是否流行
用計(jì)算機(jī)預(yù)測(cè)音樂是否流行可以通過數(shù)據(jù)挖掘(Data Mining)來實(shí)現(xiàn)。
據(jù)the next web報(bào)道[3],英國(guó)的音樂發(fā)現(xiàn)軟件Shazam曾在2012年夏季預(yù)測(cè)過夏季將會(huì)流行的音樂榜單。Shazam怎樣得出這樣一個(gè)榜單?答案很簡(jiǎn)單:挖掘數(shù)據(jù)資源。每天有兩億用戶使用Shazam的同時(shí)會(huì)生成七百萬條標(biāo)簽,所以Shazam對(duì)流行音樂趨勢(shì)的把握總是走在我們的前面。這些數(shù)據(jù)也可以用來預(yù)測(cè)音樂流行趨勢(shì)。
對(duì)音樂流行趨勢(shì)的預(yù)測(cè)可以幫助人們更好的跟上當(dāng)前音樂的流行風(fēng)向標(biāo),讓人們能夠聽到最時(shí)髦的音樂。
1.3 音樂創(chuàng)作的進(jìn)化樹
音樂的進(jìn)化樹在音樂風(fēng)格的研究中非常重要,因?yàn)樗苁崂沓瞿硞€(gè)藝術(shù)家的音樂風(fēng)格或是某種音樂流派的發(fā)展趨勢(shì)。人工智能使得計(jì)算機(jī)能夠通過特殊的算法來分析出某種音樂的進(jìn)化樹。Joe George和Lior Shamir[4]使用了一種自動(dòng)化的定量分析法來分析一些流行音樂專輯之間的相似度。他們的算法能夠讓計(jì)算機(jī)將每首歌轉(zhuǎn)換為類似二維頻譜的視覺圖片。這張圖能夠顯示歌曲聲波變化的頻率、形狀以及紋理。接著,該算法通過比較聲音的“頻譜”來對(duì)不同的歌曲進(jìn)行分析與排序,最后利用統(tǒng)計(jì)學(xué)方法對(duì)兩首歌曲進(jìn)行相關(guān)性分析。他們對(duì)披頭士(The Beatles)的歌曲與專輯的相關(guān)度進(jìn)行了分析,并畫出了樹狀圖,見圖1。圖1中,歌曲以及之間的連線長(zhǎng)短表示它們的相似度,距離越長(zhǎng),相似度越低,反之亦然。
該算法分析出了《Please Please Me》出自披頭士的第一張專輯《With the Beatles》,它也正確地指出了披頭士不同時(shí)期的專輯順序。它同時(shí)顯示,披頭士的這些早期的歌曲和晚期的歌曲,比如“Abbey Road”是截然不同的。雖然《Let it Be》是披頭士發(fā)行的最后一首歌曲,但實(shí)際上這首歌比《Abbey Road》錄制的更早。也就是說,盡管打亂了發(fā)行日期,他們的算法仍可以根據(jù)歌曲的特征,從而正確地識(shí)別出歌曲創(chuàng)作的順序。不僅如此,他們還分析了U2,ABBA,Queen等其他著名樂隊(duì),都基本正確地排列出了專輯和歌曲正確的時(shí)間順序。
在他們的另一篇論文中,他們把目光轉(zhuǎn)向了對(duì)不同音樂流派之間相似度以及不同的音樂家與音樂流派間關(guān)系的相似度進(jìn)行了分析[5]。通過與上文類似的方法,他們成功地分析出了音樂流派之間的關(guān)系以及以流派為標(biāo)準(zhǔn)的音樂家之間的關(guān)系。這些進(jìn)化樹都大大促進(jìn)了學(xué)者們對(duì)音樂發(fā)展歷程的研究。
1.4 音樂情緒與音樂治療
丹尼爾·鮑林(Daniel Bowling)等人[6]研究音樂與情緒的關(guān)系。音樂何以通過琴弦來表現(xiàn)或歡快或悲凄的主題?一場(chǎng)振奮人心的演說往往配以激昂的大調(diào)樂曲,其鮮明的節(jié)奏,流暢優(yōu)美的旋律,常常蘊(yùn)涵著某種自得其樂的情緒在其中,如著名的G大調(diào)弦樂小夜曲。而在另一些場(chǎng)合,如要對(duì)一位頗受人們愛戴的逝者致以哀挽的悼詞時(shí),舒緩、婉約的小調(diào)樂曲無疑是最好的選擇了,人們也可以在小調(diào)曲營(yíng)造的凄切氛圍中盡情地表達(dá)自己的哀思。很顯然,要讓音樂烘托出某種氣氛,與彼時(shí)彼刻所處的場(chǎng)景以及所發(fā)生的事是密不可分的。
那么,為什么大調(diào)音使人歡欣雀躍,而小調(diào)音令人沉痛哀傷呢?這是音樂史上一個(gè)非常古老的問題。為了揭開這層神秘的面紗,美國(guó)杜克大學(xué)(Duck university)神經(jīng)學(xué)家丹尼爾?鮑林(Daniel Bowling)及其同事對(duì)大調(diào)音和小調(diào)音在7500首西方古典樂曲和芬蘭民歌中的分布作了統(tǒng)計(jì)。結(jié)果發(fā)現(xiàn),小三度音(minor thirds)占小調(diào)曲中音符總數(shù)的15%,而在大調(diào)曲中僅占不到1%。
近年來,有人用人工智能的計(jì)算方法對(duì)各種音樂標(biāo)注心情或情緒。Emokit公司在互聯(lián)網(wǎng)上建立一個(gè)平臺(tái),提供音樂來匹配用戶的情緒,使用戶產(chǎn)生感官上的共鳴。他們通過穿戴設(shè)備獲得用戶的語音、面部表情、心率等體征的數(shù)據(jù)來識(shí)別情緒,在理想情況下準(zhǔn)確率達(dá)到80%。
2 結(jié)語
人工智能所帶來的模式識(shí)別,數(shù)據(jù)挖掘,聚類分析等等技術(shù)已經(jīng)在數(shù)字音樂中有了重要的應(yīng)用。在數(shù)字音樂產(chǎn)業(yè)日漸蓬勃的今天,人工智能未來必然會(huì)在音樂領(lǐng)域發(fā)揮更加重要的作用。
參考文獻(xiàn)
[1] 王峰,張雪英,李炳男.基于CRFs和MPCP特征的和弦識(shí)別研究[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(18):198-200.
[2] 胡穎,田麗紅,王峰.音樂和弦識(shí)別算法綜述[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2010(26):149-152.
[3] ANNA HEIM. Music discovery service Shazam leverages its data to predict this summers music hits[EB/OL](2012-5-31).http://thenextweb.com/media/2012/05/31/uk-music-discovery-app-shazam-leverages-its-data-to-predict-this-summers-music-hits/.
[4] George J, Shamir L. Computer analysis of similarities between albums in popular music[J].Pattern Recognition Letters, 2014,45(11):78-84.
[5] Joe George, Lior Shamir.Unsupervised analysis of similarities between musicians and musical genres using spectrograms.Artificial Intelligence Research,2014.
[6] Bowling D L,Gill K,Choi J D,et al. Major and minor music compared to excited and subdued speech.[J].Journal of the Acoustical Society of America,2010,127(1):491-503.