999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

音樂人工智能的哲學審思

2023-12-21 11:06:03黃宗權
中央音樂學院學報 2023年3期
關鍵詞:人工智能人類創作

黃宗權

“人工智能”(Artificial Intelligence,AI)這一概念誕生于1956年在美國達特茅斯召開的“人工智能夏季研討會”(Summer Research Project on Artificial Intelligence)。不過,當時的參會者并沒有就該術語的界定達成共識,與會者更多是關注如何用機器來模擬人的智能。現在學界普遍認可的界定是科學家帕特里克·溫斯頓(Patrick Winston)的抽象定義:“人工智能是對計算的研究,以實現感知、推理和行動。”(1)Patrick Henry Winston,Artificial Intelligence,Boston:Addison-Wesley Publishing Company,1992,p.5.

在音樂人工智能領域,被譽為人工智能之父的麻省理工學院教授馬文·明斯基(Marvin Minsky,1927-2016)(他也是達特茅斯會議的發起者之一),早年寫過一本重要著作《音樂·意識·意義》(Music,Mind,andMeaning),在書中探討了“我們為什么會喜歡音樂,以及這種‘喜歡’自身的本質是什么?”(2)Marvin Minsky,“Music,Mind,and Meaning”,Computer Music Journal,vol.5,No.3,1981,pp.28-44.等問題。

隨著計算機的算力以及數據量的指數級增長,人工智能在音樂領域取得了重大進展,它正迅速成為音樂創作、音樂分析、音樂推薦、音樂信息檢索的重要工具,并以驚人的速度改變我們的創作和欣賞音樂的方式。在音樂表演領域,一些“自動”演奏的系統被不斷開發出來,另一些研究開始利用人工智能的機器學習來進行音樂和舞蹈的交互式表演。(3)Baptiste Caramiaux,Marco Donnarumma,Artificial Intelligence in Music and Performance:A Subjective Art-Research Inquiry,arXiv 15843,2007.

人工智能技術的潛力及在音樂領域一日千里的快速發展,讓人們開始思考:音樂人工智能有真正的音樂智慧、音樂理解力、音樂創作力和音樂表演能力嗎?它們是否會有美感經驗、情感理解和審美表達?人的音樂實踐有哪些是可以被人工智能取代,哪些不能被取代?這些問題顯然不僅是科學或技術問題,更是哲學和美學問題。人工智能對人類感性經驗領域的“挑戰”,切中了人類主體性的核心要旨,對這些問題進行探究,就必須從哲學、美學的維度對音樂創作和表演行為中的意識、主體性、情感、審美認知等問題進行審思。

一、當前音樂人工智能的主要技術路線和發展現狀

音樂人工智能的發展建基在人工智能技術的整體發展之上。人工智能技術的發展,從20世紀50年代起,大致經歷了三個階段:第一個階段為推理期(Logic Reasoning,1956-1960),其實質是定理自動證明系統,功能以做數學運算和推理、證明數學公式為主,如西蒙(Herbert A.Simon)和紐厄爾(A.Newell)等人創建的“邏輯理論家”系統(Logic Theorist)。到了20世紀80年代末,以數理邏輯為基礎的人工智能走到了盡頭。第二階段為知識期(Knowledge Egineering,1970-1980),這一階段的主要研究方向是把人類掌握的知識總結起來以編碼的方式“教會”機器,即所謂的“專家系統”,如菲根鮑姆(Feigenbaum)等人創建的DENDRAL系統。在這個階段,研究人員最終發現,把知識總結出來,教給機器其實非常困難。這不僅是因為人類的知識不太容易被總結和編碼,更因為人類有大量的“默會知識”(Tacit Knowledge,也譯為“隱性知識”)無法被總結和編碼。第三階段為學習期(20世紀90年代至今),這一時期研究的出發點是讓計算機系統“自我”學習。顯然,由于音樂藝術的特殊性和復雜性,在前兩個階段,音樂人工智能是無法取得實質性突破的。

在第三個階段學習期,機器學習(Machine Learning,ML)或深度學習(Deep Learning,DL)成為了人工智能發展的主流。所謂的“機器學習”,就是“通過算法,使得機器能從大量既有數據中學習規律,從而對新的樣本做智能識別或對未來做出預測”(4)余凱等:《深度學習的昨天、今天和明天》,《計算機研究與發展》,2013年,第9期,第1799—1804頁。。“深度學習”是一種基于人工神經網絡的機器學習技術,人工神經網絡仿照生物神經系統工作原理的計算模型,通過多個人工神經元之間的連接和信息傳遞,模擬人類大腦的感知、思維和決策等過程。(5)孫志軍、薛磊等:《深度學習研究綜述》,《計算機應用研究》,2012年,第29(08)卷,第2806—2810頁。深度學習屬于機器學習的一個分支,二者的主要區別在于數據的分析方法。前者依賴算法和大量的數據,后者則是以人腦為模型的人工神經網絡。

基于不同的技術路線,機器學習大致可以分為五大“流派”:符號主義(Symbolists)、聯結主義(Connectionist)、貝葉斯派(Bayesians)、進化主義(Evolutionaries)、行為類比主義(Analogizer),這些流派采用不同的算法來模仿人類思維、人體“硬件”(神經系統)和人類行為,使機器從數據中自動學習,做出預測和決策。

機器學習的興起使得廣義上的聲音創造面臨一場革命。機器學習和深度學習為音樂人工智能帶來了各種新技術。這些新技術被應用于從作曲、表演到音樂研究等不同的場景中。

現有人工智能不論采用何種技術模式,讓機器學習的過程實質都可以分為三步:訓練、預測和反饋。“訓練”是向人工智能輸入大量的數據(訓練集),并給出希望它做什么的指示,以使人工智能從大量的數據中提煉出特定的模式。“預測”是人工智能根據不同的模式,在不同的場景下,預測可能會發生何種狀況,以及如何采取應對措施,以產生一定的結果。“反饋”是對人工智能產生的結果提供評價,讓人工智能不斷修正、提升,然后進入下一個新的循環。相對應的音樂創作過程也大致分為三個步驟:(1)分析音樂(把大量的既有作品作為數據加以分析,分解成“模式-部件”)。(2)把分解的“模式-部件”進行相似性的計算、歸類。(3)根據設定的算法,把“模式-部件”重組,以生成新的音樂作品。

在人工智能技術的基礎上,在音樂創作領域產生了各類算法作曲(Algorithmic Composition),也即,采用計算機算法來生成音樂的技術。其主要的技術類型有:(1)音樂規則系統(Rule-Based Systems),根據預先定義的音樂理論規則(如,根據已有作品的和聲規則、旋律規則和節奏規則)等來生成新的音樂作品。(2)人工神經網絡(Artificial Neural Networks,ANN),使用人工搭建神經網絡模型來學習音樂數據的特征,并根據學到的特征生成新的音樂。常見的神經網絡類型包括循環神經網絡(RNN)、長短時記憶網絡(LSTM)和變分自編碼器(VAE)等。(3)遺傳算法(Genetic Algorithms,GA),模擬自然界中的進化過程,通過對音樂片段進行變異、交叉和選擇等操作,以生成新的音樂作品。(4)馬爾可夫鏈(Markov Chains),基于概率模型,通過分析音樂數據中的狀態轉移概率來生成新的音樂序列。(5)交互式作曲(Interactive Composition),將人類音樂家的創作過程與計算機算法相結合,實現人機協作的音樂創作方式。此外,還有隨機生成(Random Generation)等算法,不再一一贅述。

不同的算法和音樂結合開辟了音樂人工智能的新型應用。音樂人工智能可以分析特定的音樂流派、節奏、模式和旋律,并利用這些信息創作新的音樂作品。比如,音樂形式語法使分析和編寫音樂過程的規則形式化,它能通過研究巴赫作品的和聲規則,進而輔助創作新的作品。(6)Salim Perchy,Gerardo Sarria,“Musical Composition with Stochastic Context-Free Grammar”,in Proceedings of 8th Mexican International Conference on Artificial Intelligence (MICAI),November,2009,pp.1-12.音樂人工智能還能模擬民間傳統音樂的創作。比如,希普拉·舒克拉(Shipra Shukla)、海德爾·班卡(Haider Banka)基于馬爾可夫的遺傳算法,探索模擬印度古典音樂的創作。(7)Shipra Shukla,Haider Banka,“Markov-Based Genetic Algorithm with ∈-Greedy Exploration for Indian Classical Music Composition”,Expert Systems with Applications,vol.211,No.118561,2023.

一些音樂家與工程師合作采用組合系統,語法,概率和分形(Fractals)來創作一些不再是模仿經典名作的新音樂作品。比如,遵循進化算法(Evolutionary Algorithm)程序來使音樂各種要素(旋律、節奏、和聲等)“進化”。通過各種要素的交叉、組合、突變等一系列操作來讓音樂“進化”成特定的作品。法籍作曲澤納基斯(Iannis Xenakis)的幾部代表作(Metaux,Anaktoria和Terretektorh)等就是根據數學模型來創作的。

此外,研究者們還采用概率語法(Probabilistic Grammars)來分析音樂作品的模型化結構(8)S.Abdallah,N.Gold,A.Marsden,“Analysing Symbolic Music with Probabilistic Grammar”,in D.Meredith(eds)Computational Music Analysis,Springer:Basel,2016,pp.157-189;Donya Quick,“Learning Production Probabilities for Musical Grammars”,Journal of New Music Research,45(4),2016,pp.295-313.、基于馬爾可夫鏈通過在線的“語法歸納生成器”(Grammatical Induction Generator)來即興創作音樂等(9)K.M.Kitani,H.Koike,“Improve Generator:Online Grammatical Induction for on-the-Fly Improvisation Accompaniment”,in Proceedings of 10th Conference on New Interfaces for Musical Expression (NIME),Sydney,Australia,15-18 June 2010,pp.469-472.。

這些通過算法作曲產生的音樂作品的藝術品質如何?2023年,一項基于評估比較的研究得出的結論認為:“任何算法方法與人類創作的音樂之間仍然存在顯著差距。”(10)Z.Yin,F.Reuben,S.Stepney,et al,“Deep Learning’s Shallow Gains:A Comparative Evaluation of Algorithms for Automatic Music Generation”,Machine Learning,2023,pp.1785-1822.不過,突飛猛進的音樂人工智能所顯示出的令人震驚的音樂“創作”能力,還是讓人們禁不住思考,音樂人工智能是否可以創作出“全新”的音樂作品來?這里所謂的“全新”,指的是計算系統不是采用某種一開始就嵌入的特定作曲模型,也不是在選定的幾個作品中進行分析、重組基礎上生成新的音樂作品,而是像人類一樣“無中生有”,創作出與既有作品沒有關聯的獨立的音樂作品。人們開始思考,音樂人工智能是否可以不依賴“人工”,而獨立具有“智能”,從而創造新的風格或音樂樣式?能否通過音樂表達特定的情感?

之所以圍繞這些問題會產生一些爭論,是因為:一方面,人工智能表現出了令人驚詫的“音樂才能”;而另一方面,現有人工智能在音樂實踐中的局限又是顯而易見的。這種局限表現在其所有訓練集的來源均來自既有的數字化信息(音樂數據),而與真實的人類生活世界沒有直接交集。它依賴于特定的算法或數理邏輯。人們可以理解現有音樂人工智能的不足,將其視為新事物的初始發展階段,但音樂人工智能在將來是否能突破臨界點而具有獨立創作的能力?音樂人工智能可以取代藝術家嗎?這些問題并不容易給出簡單的答案。

筆者認為,基于音樂在創作、表演方面的特殊性,在現有技術條件下,音樂人工智能要實現獨立創作或取代藝術家,所面臨的挑戰是巨大的。從哲學(美學)的角度看,音樂人工智能至少要面臨下文所論述的幾方面的問題。這并不是說,人工智能只要解決了這些問題,就能實現對人類的取代,而是說,這些問題如果無法得到根本性的突破,音樂人工智能將有極大可能在經過一個階段的快速發展之后,陷入平臺期。

二、數理邏輯和思維過程的差異以及“藝術世界”的“非對應性”問題

麥卡錫(J.McCarthy)是當年達特茅斯人工智能“會議宣言”的主筆,這位著名的人工智能先驅,在會議倡議書的開篇,寫下了一句著名的論斷:“本研究基于這樣一種推測,即,學習的每一個方面或智能的任何其他特征,原則上都可以如此精確地被描述,以至于可以制造一臺機器來模擬它。”(11)Minsky Marvin,Rochester Nathaniel,Claude E.Shannon and McCarthy John,“A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence,August 31,1955”,AI Magazine,27(4),2006,p.12.當時與會的人工智能的先行者們都樂觀地認為,人腦的思維是有可能在人腦以外產生的。在他們看來,只要揭開大腦神經網絡背后的秘密,人類就可以構建出一個類似于人腦的電子大腦。

然而,現在看來,麥卡錫們當年的假設更像一個美好的愿望。迄今為止,人的智能活動尚未被“精確地描述出來”也未能實現“以一部機器來模擬它”。其困難在于,人類的智能活動還有許多謎題未被解開。在哲學上,人類的思維過程至今存在許多“難以理解的事情”。比如,“意識難題”(The Hard Problem of Consciousness),也即,我們很難搞清楚人類意識究竟是什么,它是怎么產生的,又是如何起作用的。因此,也就難以把它清楚地描述出來,并讓機器模擬這一過程。

如前文所提及的,在人類的思維過程和日常經驗中,存在大量的“默會知識”。這個概念由匈牙利哲學家邁克爾·波拉尼(Michael Polanyi)首先提出,所以也被后世稱為“波拉尼悖論”(Polanyi’s Paradox)(12)M.Polanyi,“Tacit Knowing:Its Bearing on Some Problems of Philosophy”,Reviews of Modern Physics,34 (4),1962,pp.601-616.。其表達的核心命題是:人類所知遠勝于其所能言傳。這一理念深刻地指出了有很多知識是我們無法借用語言等符號表意系統來闡釋清楚的,也自然無法傳授給人工智能。

具體說來,默會知識通常是指體現在人類的行為、經驗和直覺中,難以用語言或符號表達的知識或技能。它與潛意識和非語言的感知、理解密切相關。它在人的文化和社交環境中發揮著關鍵作用。波拉尼還認為,默會知識是人類理解世界的基礎,是大多數經驗(例如技能、直覺、經驗和經常性的常識(13)同注②。)的本質,“技術規則可以是有用的,但它們并不能決定藝術實踐;它們只是可以作為藝術實踐中的一種指導原則,前提是它們能夠被融合到藝術實踐的實際知識中。它們無法取代這種知識”(14)M.Polanyi,Personal knowledge:Towards a Post-Critical Philosophy,Chicago:University of Chicago Press,1958,p.52.。

從現有技術條件來看,人工智能(機器)建立的機械化和自動化過程,是一種將知識顯性化、符號化的過程。以外顯符號表征的方式使之成為人工智能可識別的數據結構。比如,要讓一臺機器完成圖像識別的任務,必須將圖像掃描、認讀、對照、識別等過程的每個步驟都設定清楚,才能編寫程序讓機器來執行。可以說,使知識顯性化(可表述化)是機器計算的重要前提。然而,音樂的創作和表演卻是一種典型的內隱(implicit)知識(技能),它極其難以被顯性化,也因此難以真正地傳授給人工智能。

而且音樂的一個重要特點是,它不具有統一普遍的“規范”。音樂的邊界往往取決于文化傳統中的“習俗慣例”或“慣例實踐”(Customary Practice)。音樂藝術總是會呈現出某一種特定的文化結構要素,體現出某種文化傳統和文化實踐的特征。也即,音樂是一個具有廣闊外延的能指,它囊括了不同文化語境下的音樂形態,而不可能只有一種單一的特征。

包括音樂在內的藝術領域存在的這種一個能指對應多個所指的現象,不僅存在于不同的文化傳統當中,也存在于不同時代的藝術作品中。哲學家丹托所說的“藝術界”(Art World)就試圖解釋藝術外延的邊界問題:“把某件物品看作是藝術作品,需要某種眼睛無法看到的東西——一種藝術理論的氛圍,一種藝術史知識:這就是藝術界。”(15)Arthur C.Danto,“Art World”,in Carolyn Korsmeyer ed.,Aesthetics:The Big Questions,Cambridge:Wiley-Blackwell,1998,p.40.也就是說,在現實生活中,一個“物件”是否成為“藝術作品”,在一定程度上不是取決于這個物件本身,而是取決于以什么樣的眼光來看待它,或人們賦予了它什么樣的意味。

哲學家波普爾也指出,藝術屬于“世界3”的范疇。即,藝術屬于知識和信息世界,具有非客觀世界的一些屬性(比如價值觀、信仰等),它區別于物理世界(客觀世界)、精神世界(主觀世界),藝術是人類對客觀世界和主觀世界的理解和解釋。“世界3”屬于“人類心靈產物的世界。例如語言、傳說、故事與宗教神話;科學猜想或理論以及數學建構;歌曲和交響曲;繪畫和雕塑。……我們可以區分科學世界和虛構世界、音樂世界和美術世界以及工程的世界,……人類心靈產物的世界”(16)〔英〕卡爾·波普爾:《通過知識獲得解放》,范景中、李本正譯,杭州:中國美術學院出版社,1996 年,第 365—366頁。。“世界3”是人類創造的而非虛構之物,它們具有實在性、自主性。波普爾的這一理念,是強調“從關注藝術作品的審美相關屬性,轉而去關注藝術作品的社會語境;沒有這一社會語境,藝術作品就不可能擁有和呈現出那些與審美相關的屬性”(17)〔新西蘭〕史蒂芬·戴維斯:《藝術諸定義》,韓振華、趙娟譯,南京:南京大學出版社,2014年,第161頁。。

這些哲學思考實質是厘清藝術品的重要特質,即,在人類社會生活中,包括音樂在內的藝術不僅是一個物理意義上的“物件”,而是具有特定的精神意味和意義指向。比如,一首音樂作品,絕不只是一些聲音的組合,而是蘊含了人的情感訴求和價值追求。這些音響之外的“意義”屬于難以被顯性化的默會知識。

然而,與人類在社會生活中逐步積累的知識經驗不同,人工智能的很多“知識”是從數據獲取的。人工智能既無法理解默會知識,也不是發自“內心”感受(或意識)到這些默會知識。人工智能并沒有內在的情感模型和價值體系,也沒有社會屬性。由此,藝術品具有的“世界3”的特性,在人工智能這里就消失了。從現狀來看,人工智能的數理邏輯無法完成如同人類的那樣的思維過程(諸如意識等),人工智能對音樂藝術的“理解”,也無法像人類那樣導向獨立的精神性。

三、音樂情感的交互表達與感受問題

《樂記》的開篇這樣說道:“凡音之起,由人心生也。人心之動,物使之然也。感于物而動,故形于聲。聲相應,故生變,變成方,謂之音。”(18)蔡仲德:《中國音樂美學史資料譯注(上)》,北京:人民音樂出版社,1990年,第225頁。中國的古人很早就意識到,音樂是情感的藝術,情感是音樂的第一源動力。在西方文化中,藝術家的藝術創作很大程度上是為了表達自我情感和對外在世界產生的情感。如巴迪歐(Alain Badiou)在《當代藝術十五論》(FifteenThesesonContemporaryArt)之三所說的:“藝術是真理的過程,這個真理總是感性或感官的真理。”(19)Alain Badiou,“Fifteen Theses on Contemporary”,Art Performance Research,9(4),2004,p.86.這里的“感性”指的是對現實的形式美的感知和理解,其重要部分是人與世界之間的情感聯系。

由于情感的重要性和獨特性,情感識別與表達也成為人工智能領域的重要問題。由此產生了“情感計算”(Affective Computing)這一新興領域。其主要的研究路徑是開發可靠的算法,采用多模態(Multi-Modal)的識別方式,即,采用視頻、音頻、圖像、語音、生理信號等多種數據,來進行面部表情識別、語音識別、心率監測等等,試圖解決人工智能識別、解釋和表達情感的問題,并在此基礎上讓人工智能理解人類的行為和心理狀態。

情感計算的產生和這樣一種理論觀點有關,即,認為人類的情感可以被認為是由主觀體驗(Subjective Experience)(20)L.Leahu,S.Schwenk,P.Sengers,“Subjective Objectivity:Negotiating Emotional Meaning”,in Johann,G.Marsden ed.,Designing Interactive Systems,New York:ACM Press,2008,pp.425-434.、外部表現(Emotion)(21)H.Binali,V.Potdar,“Emotion Detection State of the Art”,in V.Potdar ed.,Proc.of the Cube Int’l Information Technology Conf,New York:ACM Press,2012,pp.501-507.、以及生理喚醒(Physical Arousal)(22)L.Ashbarry,B.Geelan,K.D.Salas,L.Lewis,“Blood and Violence:Exploring the Impact of Gore in Violent Video Games”,in Proc.of the Symp.on Computer-Human Interaction in Play,New York:ACM Press,2016,pp.44-52.三個核心要素組成的,分別對應三個方面:(1)個體對不同情感狀態的自我感受;(2)表情狀態,即面部表情、姿態表情、語調表情、音樂表情(音調、節奏、速度等)的變化;(3)情感產生的生理反應,是一種生理的激活水平,具有不同的反應模式。

情感的識別和表達對于信息的交流和理解是必不可少的,這也是人類最大的心理需求之一。人類的認知、行為均受到情感的驅動,并影響著人際互動以及群體活動。人工智能最早的先行者們,也意識到了人工智能研究必須進行情感問題的探求。馬文·明斯基始終認為情感是機器實現智能不可或缺的能力。在《心智會社》(TheSocietyofMind)中提出智能機器的情感問題之后,(23)M.Minsky,The Society of Mind,New York:Simon &Schuster,1986.他在《音樂·意識·意義》一書里,也探究了音樂的情感認知問題,思考了規則性韻律和主題重復是如何影響情感表征框架(Representation Frames)和記憶結構的,樂句及音樂表達又是如何喚起情感反應的。(24)M.Minsky,“Music,Mind,and Meaning” (1981),Reprinted in S.M.Schwanauer and D.A.Levitt ed.,Machine Models of Music,Massachusetts:The MIT Press,1993,pp.327-354.

與其他藝術形式不同,音樂的情感在創作和欣賞中占據著重要地位,音樂也是所有藝術中,最善于傳達情感的。音樂作品傳遞的并不是簡單的聲音信息,而是包括了音樂家凝結在其中的情感。在音樂的表演實踐中,音樂則承載著表演者的情感經驗。如果人工智能無法具有情感、無法表達情感,那就無法像人類那樣創作真正的足以表達內在情感的音樂作品。如果一個智能體沒有主觀的價值、沒有主觀的情感感知,它就只能停留在表面的聲音處理,也就不可能達到與觀者(聽眾)產生深層的情感共鳴,也就無法通過音樂表演行為對音樂作品賦予可理解的意義。

那么,是否可以通過算法的改進、算力的提升和海量的數據來解決情感計算的問題,以使音樂人工智能可以識別、表達情感呢?從理論上來說并非不可能。其難點在于情感表現出來的可感特征與情感的真實狀態之間具有模糊性和不確定性。

從主觀方面看,情感屬于主觀意識的范疇。情感的表現形式具有高度的主觀隨意性、變化的隨機性、特征模糊性以及個體差異性,所以很難確定某種表情或聲音狀態與特定的情感狀態具有一成不變的對應關系。某人表現出泣不成聲的情感狀態,有可能是痛哭流涕,也有可能是喜極而泣,還有可能是悲欣交集。

從客觀方面看,在音樂的音響中,情感和音樂的聲響之間并非簡單絕對的一一對應關系。即,很難說某一(類)特定的音符(或音符組合)與復雜的、微妙的、不可言傳的情緒(情感)之間具有確定的、必然的對應關系。因此,也就很難用數學的方法來對情感進行賦值,或建立數據化的模式。也正因為此,人工智能領域對情感計算存在一些爭議,有些研究者甚至認為“情感計算”是一個錯誤的研究方向,因為“它沒有揭示情感的本質及內在邏輯程序,并且把情感的外部表現方式當作情感本身”(25)仇德輝:《情感機器人:人工情感的邏輯框圖與深度算法》,北京:臺海出版社,2018年,第47頁。。

在音樂人工智能與情感表達的問題上,阿迪亞沙·達什(Adyasha Dash)等人的最新研究表明,“基于人工智能的情感音樂生成系統”(AI-based Affective Music Generation Systems,AI-AMG)在情感的表達上面臨兩大挑戰:一是,情感“控制”(Control),它指的是允許創作者生成的音樂具有所需要的情感內容,同時,又能精確地控制音樂特征,讓這些音樂展示特定的情感信息。二是,“敘述適應性”(Narrative Adaptability),它指的是系統能生成連貫的音樂段落,且這些音樂段落可以根據給定的情感要求,準確可靠地傳達不同情感之間的過渡,以及處理不同情緒特征之間的相互作用。(26)Adyasha Dash,Kat R.Agres.,AI-Based Affective Music Generation Systems:A Review of Methods,and Challenges,arXiv:2301.06890,2023.

音樂情感的復雜性還在于,“在音樂中感知情感的能力也受文化影響,在跨文化研究中觀察到情感感知的異同”(27)M.Susino,S.Schubert,“Cross-Cultural Anger Communication in Music:Towards a Stereotype Theory of Emotion in Music”,Musicae Scientiae,21,2017,pp.60-74.。同時,由于人的情感的變化很大一部分來源于社會交往活動,音樂作品和其他藝術品一樣,常常充當了人際交往的媒介物,具有社會情感性。音樂表演其實是演奏者和觀者(聽眾)基于某一文化傳統,在共同的價值觀、社會規范、文化常識基礎上的一種交流。人們“從一段音樂中體驗到的情感是結構特征、表演特征、聽眾特征、語境特征和樂曲外特征的綜合效應”(28)Susino Marco,Emery Schubert,“Musical Emotions in the Absence of Music:A Cross-Cultural Investigation of Emotion Communication in Music by Extra-Musical Cues”,PLOS ONE,15(11),2020,pp.1-21.。

人工智能沒有類似人類的人際交往或者社會情感方面的認知。這就使得當前的“情感計算”最多能讓人工智能看起來“具有”情緒特征,但這只是讓其“表現出有情感”的樣子,與真正有意識的由內而外的情緒是兩回事。由此,很難說人工智能具有了人類擁有的一般意義上的情感或情緒。人工智能是根據特定的程序和訓練來“運算”及處理信息,它沒有人類那樣的感知、意識,也不體驗情感。雖然它可能會生成描述或模擬情緒的文本和音響,但并不意味著它自身具有情緒。

在音樂創作和表演中,個體的情感狀態和作品表現出來的情感特征也并不是總是一致的。聽起來悲傷的作品,完全可能是在快樂的心境下創作。在音樂創作之外,音樂表演也需要情感,音樂表演的重要目的是使人產生共鳴。每個表演者對音樂表情符號的情感表達方式有不同的理解,如果這種理解是基于某種規則的標準化演奏,則對音樂作品的闡釋會導致僵化。如波蘭鋼琴家和作曲家帕德瑞夫斯基(Ignacy Jan Paderewski,1860-1941)所說的:“當使用espressivo、con molto、sentimento、con passione等詞時,都要求(……)一定量的情緒,而情緒排除了規律性……演奏肖邦的G大調夜曲,要有節奏的僵硬和對所指示的運動速度的虔誠尊重,那就是(……)令人難以忍受的單調(……),肖邦發自內心的演奏。他的演奏不是理性的,而是情緒化的”。(29)E.Coutinho,M.Gimenes,J.M.Martins &E.R.Miranda,“Computational Musicology:An Artificial Life Approach”,2005 Portuguese Conference on Artificial Intelligence,2005,pp.85-93.這種個性化的演奏,顯然是人工智能所無法達到的。人工智能對待音樂作品所“表現”的對象或音樂“傳達”出的意味,與人類的處理方式是完全不同的。由于數理邏輯的程序化和標準化,人工智能的音樂呈現或許在技術上是精準無誤,但是在審美價值方面卻極有可能陷入平庸的境況。

四、音樂表現中的“身心感知”與意識問題

傳統的認知理論將人的大腦類比于計算機,能處理大量復雜的信息,這些信息由感覺、知覺系統輸入,經過一系列加工、處理最終完成認知過程。這種“身心二元論”(Mind-Body Dualism)或者“實體二元論”(Substance Dualism)的主張受到了笛卡爾主義(Cartesianism)的影響。該哲學觀點認為,意識和身體是兩個不同的實體或物質,由不同的物質或要素組成,它們之間存在著互動關系。但意識是能夠獨立于身體存在的,身體是意識的物理容器。

而現代的具身認知(Embodied Cognition)理論則認為:“首先,認知取決于具有各種感覺運動能力的身體所產生的經驗類型;其次,這些個體的感覺運動能力本身嵌入了更廣泛的生物、心理和文化背景中。”(30)F.J.Varela,E.Thompson,&E.Rosch,The Embodied Mind:Cognitive Science and Human Experience,Massachusetts:The MIT Press,1991,pp.172-173.也即,主張“大腦-身體-環境”在認知發生過程中構成一個動態的統一體。其中,身體是認知過程發生的核心;認知是在身體與環境接觸所獲得經驗的基礎上形成的;認知取決于個體的具身行為所產生全部經驗。認知由身體的感知、意欲、動作和響應過程構成。

具身認知理論不支持身心二元論觀點,而是認為,“符號信息加工認知理論和聯結主義心理學等將人類的認知過程定義為對符號、信息的加工和操作,忽視了身體、活動與經驗在認知中的作用”(31)葉浩生:《西方心理學中的具身認知研究思潮》,《華中師范大學學報(人文社會科學版)》,2011年,第4期,第153—160頁。。并認為這種認識忽視了身體的感官系統存在的差異,會導致認知存在偏差。

行為與環境的“耦合”模型與大腦的內部獨立“計算”模型,哪一種更接近人的認知真相?身體情況和環境對認知過程是否具有重要影響?不同的哲學立場決定了對此的不同看法。與傳統身心二元論的類計算機模型相反,具身認識觀強調作為主體的身體在認知能力中的重要性。強調感(知)覺經驗、人的身體,以及外部環境共同構成人的認知系統,三者不可分。這種觀點進而主張感(知)覺經驗和身體的感(知)覺高度相關。具身認知支持者的觀點是,身體或身體與環境的互動構成(或促進)了認知。因為,心理過程不是簡單計算過程,“知識沒有單獨存在的實體,而是嵌入、分布在實時的感知、記憶、注意和行動過程中,并與這些心理和行為的過程密不可分”(32)J.Kevin O’Regan,Alva No?,“A Sensorimotor Account of Vision and Visual Consciousness”,Behavioral and Brain Sciences,24,2001,pp.939-1031.。

具身認知理論對我們看待音樂表演實踐是有啟發的,按照這種觀點,在音樂表演中,無論是表演者的呈現還是聽眾的感知,都不是被動地接收聲音,身體和環境影響了音樂表演行為和聆聽欣賞。音樂表演的本質,實際上是在一個特定的“美學空間”里,演奏者將作曲家創作的“聲音藍圖”,轉化成聽眾可感知的聲音結構,并清楚地展示給聽眾。每一次的演繹,都有著獨特的聲音存在樣式,這個樣式有著獨一無二的結構和奧秘,有經驗的聽眾是可以感受和認知這一奧秘的。而計算機的智能只是機械的智能,它的本質還是按照人的指令進行精密、快速的計算,或者按照某種規則呈現某種聲音,它無法真正代替人類觀賞同類的表演行為。

與身心認知相關的另一個核心問題是意識。簡單地說,所謂“意識”就是體驗和感知自身和他者存在的一種狀態及其產生的感受,其重要體現是能夠區分自我意識(自身的想法)和他我意識(他人的想法),這是心智理論(Theory of Mind)的重要內容。

意識能夠把一切經驗之物納入思考范圍,這使無限思想成為可能。另一方面,意識能夠對意識本身進行反思,即,把意識自身作為一個思考對象。這是人類和人工智能一個很大的不同。人類并不是只對輸入的信息做出固定的、程序化的反應,人類會不斷追問諸如“我是誰?”“我的種種主觀的想法、念頭和感受是怎么來的”這類問題,針對意識的意識就具有了“元意識”(Meta Mind)的性質,這種元意識能夠對藝術的創作、演出行為進行反思。創作者和表演者能夠清楚地意識到自身的行為將會給他者帶來什么,并調整自身的行為。

這種反思能力是形成自我意識的關鍵,人類不僅能產生符號化的知覺表征,還能對知覺行為本身進行表征。比如,人類的演奏者,不僅能識別出某個樂譜的符號(一階知覺);還會說(或者在頭腦中默想):我剛才認出了那個音符,或者我剛才演奏了那個音符(二階知覺);可能還會對自己的知覺結果提出疑問:我剛才看的那個音符是某個音,我會不會看錯(演奏錯了)了?(三階知覺)。這種三階知覺能力,能夠讓人類產生一種非常新穎高級的意識活動,不斷地提升、調整音樂實踐行為,進而影響聽眾的觀賞體驗。

然而,人工智能并不理解其工作的意義(至少現在和可以預見的將來是如此)。無論是創作還是表演,人工智能所做的工作實際上是計算出既有作品的特征。從數學的角度看,它其實是將一些音樂的特征進行賦值,并依據特定的算法,用這些賦值產生另外一個作品,但它本身沒有自我意識,也就更談不上即時的互動和反思了。自我意識的缺位,導致人工智能在音樂的創作和表演行為中,并非像人類一樣是發自內心的“自我”驅動,而是執行特定的算法和受到數據的驅動,這一區別顯然也導致人類和人工智能創作(或通過表演呈現)的作品,具有本質的不同。

五、藝術經驗與音樂的創造性問題

2021年,音樂人工智能界一件備受矚目的事是德國卡拉揚研究所羅德(M.Roder)組織了上百人的一個AI音樂團隊,根據貝多芬殘存的音樂手稿和其他線索,完成了人工智能版的《貝多芬第十交響曲》的創作和演出。

該項目的主要研究者有:美國羅格斯大學的艾爾格莫(A.Elgammal),主要負責用貝多芬的音樂來訓練并構建AI神經網絡系統,再從中生成所需的貝多芬音樂片段;奧地利作曲家沃爾佐瓦(Werzowa),負責從AI生成的音樂素材中選擇最合適的片段來合成最終的作品;康奈爾大學計算音樂學專家高特姆(M.Gotham),負責貝多芬的樂譜手稿的識別工作,以及AI生成的樂譜編輯合成工作;古譜研究專家(鋼琴演奏家)萊文(R.D.Levin),負責校訂貝多芬樂譜手稿,擔任鋼琴視奏,通過視奏AI生成的樂譜,并讓深諳貝多芬風格的專家審定AI生成的音樂是否符合貝多芬音樂風格。

經過手稿研究、數據學習、神經網絡構建、算法調試、MIDI樂譜輸出、試奏視聽、生成樂隊總譜等復雜工作,最終使作品得以搬上舞臺。不得不說,這部作品具有濃郁的“貝多芬風格”,比如,長大的尾聲和貝多芬特有的力度對比、和聲進行、動機展開和終止式等等。熟悉貝多芬作品的人,完全能毫不費力地感受到這首作品與貝多芬本人創作的作品有清晰可辨的“似曾相識”之處。

但是,這是一種還原還是一種創造呢?貝多芬自己創作的九首交響作品每一首的風格特點都不盡相同,何以“第十”會是前面九首的“概括式總結”呢?一位評論家(Henk Douwes)的話也許代表了很多人的困惑:(作品)“聽起來絕對是‘貝多芬式的’。單就音樂而言,聽起來很像對貝多芬之前作品的低級翻版,其中明顯有《第五交響曲》諧謔樂章的痕跡,聽起來很刺耳。其實完全可以學習第七、第八或第九《交響曲》的諧謔樂章。即使留存的樂譜草稿確實有貝多芬之前音樂的影子,也不意味著作品就應發展成目前的樣子。天才的貝多芬能容忍這種平庸的‘翻唱’嗎?”(33)韓寶強:《人工智能續創貝多芬〈第十交響曲〉帶給我們的啟示》,《音樂與表演》(南京藝術學院學報),2022年,第1期,第118—121頁。

其實,早在1981年,美國作曲家、人工智能研究者戴維·庫伯(David Cope)就創立了音樂智能實驗(Experiments in Musical Intelligence),通過人工智能來創作音樂。庫伯分別采用了“通過規則創作”與“重組匹配”兩種方法來創作音樂,前者要求每次為新作品編寫新的規則,后者采用重組方法將現有音樂重新組合,以新的邏輯創作新作品。1997年,在一次演講中,他播放了一首以重組方法創作的巴赫作品,聽眾無法分辨到底是計算機創作的還是巴赫本人創作的。(34)見戴維·庫伯的個人網站http://artsites.ucsc.edu/faculty/cope/biography.htm(最后登錄時間2023.4.9)。

在風格模仿方面,音樂人工智能的創作早已到了足以“以假亂真”的地步。通過算法和分析,可以輕易地對已有作品的特點進行提煉,并基于提煉的特質創作出新作品。但是,在獨立創作方面,目前音樂人工智能的創作尚乏善可陳。這一現象背后的原因并不復雜,主要歸結于兩點:一是,音樂人工智能無法實現基于審美經驗的藝術創作;二是,音樂創作中,創造思維的復雜度遠超過現有人工智能的計算能力。

就藝術經驗而言,以休謨(David Hume,1711-1776)為代表的經驗主義者認為,人類的知識和思想都來源于感性經驗,即,通過感覺、體驗、經歷而獲得經驗。所有的概念和原則,是通過感性經驗建立的,只有通過經驗才能知道世界真相和現實的本質。休謨認為:“一切科學牢固的基礎是人性,而人性的牢固基礎則是經驗,即我們要理解人性,只有通過經驗以及與之相關的觀察,在觀察的基礎上得到經驗。”(35)文聘元編著:《西方哲學通史》,南昌:江西美術出版社,2019年,第157頁。

也許休謨的經驗論或多或少有些偏激,但就藝術創作而言,感性經驗而非理性的計算起到了更為重要的作用,這在人類的創作中已經無數次被證明了。經歷豐富、情感豐厚的藝術家總比情感貧乏的人更能創作出打動人心的作品。腦科學家格林菲爾德(S.Greenfield)的研究也一定程度支持了休謨的觀點:“客觀可觀察的事件如何轉變為獨特個人經驗的第一手感覺,無法通過數學公式而得到。”(36)〔英〕蘇珊·格林菲爾德:《大腦的一天》,韓萌、范穹宇譯,上海:上海文藝出版社,2020年,第4頁。

與藝術經驗密切相關的是藝術創造問題。斯滕伯格(Robert Sternberg)曾提出一個 “三元智能理論”,他把智能劃分為分析問題的能力(Analytical Intelligence)、實際解決問題的能力(Practical Intelligence)、創造力(Creative Intelligence)。(37)Robert J.Sternberg,Beyond IQ:A Triarchic Theory of Human Intelligence,New York:Cambridge University Press,1985.

在《現代漢語大詞典》中,“創造”的意思是“發明;制造前所未有的事物”。“創造力”是指“人們創造新事物的才能和力量”(38)阮智富、郭忠新編著:《現代漢語大辭典》(上),上海辭書出版社,2009年,第233頁。。“創造”的本質特征其實是“無中生有”。藝術創造的本質是產生新穎的、異乎尋常的觀念,并創制有藝術價值的藝術作品。這是人類最高智慧的體現,問題在于,人類自身是如何產生新穎的想法,又是如何產生藝術靈感的?這些問題至今仍然沒有明確的答案。

現有研究還沒有解開人類創造行為的密碼。但是人們已經意識到,人類的“創造性”是一個復雜綜合的身心過程,它無法單獨通過心理學、神經學、生理學來解釋,更難以通過函數和程序來表示。人工智能的本質是數理邏輯,而創造性有著邏輯或者數學難以表達的特質。

現有人工智能在音樂領域體現出來的“創作”,其實很難稱得上是真正的“創造”,其實只是特定程序在輸入參數或數據之后所做的“組合”。當然,對于什么是“真正的創造”的理解本身也沒有統一的標準,但顯然,僅僅用“新”(即,與既有的存在物具有不同特征)來定義“創造性”是不夠的。如趙汀陽所說:”創造性在于改變力,在于能夠改變世界或歷史,改變生活或經驗,改變思想或事物,或者說,創造性在于為存在增加一個變量。”(39)趙汀陽:《人工智能提出了什么哲學問題》,《文化縱橫》,2020年,第1期,第43—57頁。建立一個與人類大腦認知水平相當的,具有創造性的人工大腦,在理論上即使具有可能性,在實踐中也是極為困難的,在音樂領域尤其如此。

本文對音樂人工智能的幾點哲學審思,絕非要否定人工智能已經取得的成績,更非低估人工智能巨大無比的潛力,而是認為,音樂人工智能如果不能解決本文所論及的幾個問題,將難以實現取代有真正創造力的作曲家的目標。

如果從人類漫長的歷史來看,人工智能的本質不過是人類創造的諸多工具之一,與所有人類創造工具一樣,它們在很多方面勝過了人類的能力。工具的作用是將人類的某一能力給予延伸,并在某一方面代替人類。人工智能與既往人類的工具相比,是人類腦力的延伸,但仍沒有改變其工具的本質。

正是基于此,本文認為,在藝術(尤其是音樂領域),能真正代替音樂家的強人工智能(Artificial General Intelligence)在可見的未來還無法實現。不過,鑒于人工智能驚人的迭代速度,伴隨著人工智能的三駕馬車算法、算力、數據一日千里的發展,我們也有理由對它的廣闊前景報以審慎的樂觀。當然,我們人類也有足夠的理由保持這樣一種尊嚴和自信:只要我們還會不斷“自我反思”,還會不斷地拓展我們的審美經驗,還會不斷增進對同類的理解,還會不斷地探索、拓展我們的藝術表達手段,人類就一定會持續創作不朽的音樂,用以充實我們永恒的精神世界。

機器的歸機器,人類的歸人類。

猜你喜歡
人工智能人類創作
人類能否一覺到未來?
創作之星
創作(2020年3期)2020-06-28 05:52:44
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
1100億個人類的清明
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
《一墻之隔》創作談
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
人類正在消滅自然
奧秘(2015年2期)2015-09-10 07:22:44
主站蜘蛛池模板: 99久久精品无码专区免费| 国产黄在线免费观看| 精品欧美日韩国产日漫一区不卡| 国产在线自在拍91精品黑人| 91无码人妻精品一区二区蜜桃| 99久久99这里只有免费的精品| 精品国产电影久久九九| 国产男人的天堂| 狠狠干欧美| 一级毛片网| 色综合天天综合| 国产1区2区在线观看| 91免费国产高清观看| 韩日无码在线不卡| 国产手机在线ΑⅤ片无码观看| 三上悠亚在线精品二区| 青青国产在线| 爱色欧美亚洲综合图区| 美女被狂躁www在线观看| 久久青草视频| 黄色网页在线观看| 中文字幕无线码一区| 欧美乱妇高清无乱码免费| 日韩成人午夜| 无码网站免费观看| 青青极品在线| 欧美午夜小视频| 亚欧成人无码AV在线播放| 免费人欧美成又黄又爽的视频| 亚洲欧美激情小说另类| 欧美中文字幕一区| 免费a级毛片18以上观看精品| 免费a在线观看播放| 欧亚日韩Av| 亚洲成肉网| 在线精品自拍| 欧美日韩一区二区在线免费观看| 呦女亚洲一区精品| 狠狠综合久久久久综| 久久香蕉欧美精品| 国产国语一级毛片在线视频| 免费国产小视频在线观看| 成人午夜亚洲影视在线观看| 欧美日韩综合网| 亚洲无码高清一区二区| 三级国产在线观看| 国产91麻豆免费观看| 91精品在线视频观看| 欧美另类视频一区二区三区| 区国产精品搜索视频| 中文字幕欧美日韩高清| 亚洲第一成人在线| 青草视频在线观看国产| 久久天天躁狠狠躁夜夜2020一| www.狠狠| 亚洲第一区精品日韩在线播放| 亚洲欧美一级一级a| 欧亚日韩Av| 大学生久久香蕉国产线观看| 中文字幕日韩久久综合影院| 国产不卡一级毛片视频| 亚洲二三区| 99国产精品国产| 日本午夜网站| 曰韩人妻一区二区三区| 亚洲精品卡2卡3卡4卡5卡区| 91精品专区| 色香蕉影院| 精品视频一区在线观看| 狠狠综合久久久久综| 亚洲无码四虎黄色网站| 午夜福利免费视频| 久久综合亚洲色一区二区三区| 亚洲高清无在码在线无弹窗| 欧美一区二区三区欧美日韩亚洲| 久久鸭综合久久国产| 日韩免费成人| 无码专区第一页| 91九色最新地址| 国产精品所毛片视频| 国产一区二区网站| 91福利免费视频|