999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能寫作中小說標題生成的算法研究

2019-09-12 13:56:38
寫作 2019年4期
關鍵詞:語義人工智能小說

劉 賽

如今中國數字社會的日均流量產值可達19萬億G,隨著人工智能技術和大數據可用性的不斷改進,投放市場的文學流量也日益龐大。在這種發展背景下,如何收集和優化小說出版的數據資源,如何為自己的小說創作一組大小標題,讓它們在上述流量大戰中勝出?人工智能可能會發揮越來越多的作用,它使小說與讀者的交互得到大數據的支撐,使內容生產獲得更深層次的數據加工和挖掘,尤其是可以應用于小說人物設計、情節策劃。作為小說內容創作和策劃的最精要部分,標題與小說內容緊密聯系,以其簡約而凝練的特點,對小說主題進行適應性概括,從而提升小說吸引力。本文通過搜索、輸出和篩選環節,展示了小說標題生成的算法運用,并討論了人工智能寫作算法中的生成問題。

一、一種自動創建小說標題的算法模型

何謂算法?“算法,是指通過數學的思想和方法,提供解決問題的思路,運用編程的手段來完成問題的解決或處理。”①鄭舸:《淺議計算機算法認識》,《通訊世界》2018年第12期。對于本文來說,就是借用數字符號的算法模型來解決標題生成問題。人工智能的標題創作需要以下步驟:首先,建立單詞的語義搜索空間;其次,以各種輸出函數表達式建立神經元,本文中主要構建比喻句式的輸出函數表達式;再次,每兩個神經元節點為一個加權值,賦予輸出函數不同加權值,進而依此值導出單詞排列信息;最后,導入遺傳算法進行評估,經過篩選符合標準的目標詞和修飾詞,最終形成完整標題。人工智能標題創作借鑒了神經網絡算法,其算法模型主要包含語義空間算法(搜索)、比喻修辭算法(輸出)和遺傳算法(篩選)。這種神經網絡式的算法模型具有深度學習特征,它使新一代AlphaGo迅速擊敗人類圍棋高手。這一代的AlphaGo采用神經網絡算法,以策略網絡和價值網絡兩個模塊組成的蒙特卡洛樹搜索,其優勢在于可以針對篩選后的落棋點進行深度計算,降低了搜索的維度。簡而言之,就是通過優化數據庫中的搜索方式,來達到一局面一搜索,一直到最終的勝負①程思雨、林鋒:《計算機圍棋AlphaGo算法對人類圍棋算法的影響》,《中國科技信息》2019年第2期。。這和從前根據圍棋規約編寫圍棋程序不同,不再是僅僅模擬旗手們的下棋策略,而是不斷增加對語義空間算法的改進。類似例子還有Libratus在為期20天、12萬張牌的撲克比賽里擊敗了四位來自世界各地的著名撲克選手。

二、基礎算法與數據庫:語義空間的算法構建

正如人腦具有記憶功能,語義空間算法作為基礎算法,承擔提供數據庫支持的功能。在數據為王的信息社會里,國家與市場可以使用語義空間算法為公文、新聞、小說快速提供語料庫詞匯和語段支撐,例如在2017年四川九寨溝地震中,中國地震臺網官方微信將地震災情快速向公眾傳播,該稿件生產僅用時25秒②白龍、林楹:《人工智能背景下“機器寫作”在災難報道中的應用和發展趨勢》,《吉林廣播電視大學學報》2018年第12期。。而且,語義空間算法不僅為目標詞提供可替換數據庫,后續環節的數據搜索、語段輸出、篩選和評估都要在其中展開。語義空間算法是大數據和人工智能的完美結合,它一方面不斷補充與完善,另一方面具有不同類型與使用功能。

在人文科學領域,語義空間算法為其研究帶來了極大便利。人文學者可以通過語義空間算法搭建人文數字研究平臺,并利用平臺查找人文資料,分析人文數據,甚至做個性化研究。國外在這方面的數據庫搭建較為完善,例如基于網絡的包含20億組單詞語義空間數據庫ukWaC2;中文圈語義空間數據庫做的時間較長、完善度較高的,有中國歷代人物傳記資料庫(CBDB),這是由哈佛大學費正清研究中心、北京大學中國古代史研究中心等聯合搭建的語義空間資料庫。此外,還有數位人文學術研究平臺(DocuSky),它由臺灣大學數位人文研究中心、資訊工程學系數位典藏與自動推論實驗室規劃,具有“堪輿與分析”“時空資訊”“視覺化”等功能,旨在建設一個開源鏈接與友善互動的數字人文研究環境,自主且自由地融合數字人文科技進行研究的數據平臺。在圖1中,筆者利用Docusky數位人文平臺繪制了《石遺室詩話》《蕙風詞話》《小三吾亭詞話》三本書涉及人物的關系圖,為各書對不同人物的關注度做數據展示。

圖1 《石遺室詩話》《蕙風詞話》與《小三吾亭詞話》書中涉及人物關系圖

小說標題的語義空間算法,首先選定目標單詞(例如“英雄”)和形容詞(例如“悲劇的”),構建語義空間(兩種語義空間),其次生成標題骨架,因為標題骨架是短語的解析樹,因此要構建標題骨架語義空間(便于標題骨架的生成),這樣做的目的是重用有效標題的句法結構。在小說標題中,可以觀察到重用有效標題結構的例子如《為了忘卻的記念》和《為了一夜的愛》。除此之外,修辭算法和遺傳算法也要用到語義空間算法,修辭算法通過搜尋語義空間,產生多種表達的結果,之后遺傳算法通過語義空間,篩選和評估留下有趣表達效果的標題。

要說明的是,為填充標題骨架,需構建兩種語義空間:“亞文化語義空間”和“大眾語義空間”。“亞文化語義空間”包含網民偏愛的詞匯符號,“大眾語義空間”包含所有可填充擬標題骨架的詞匯符號。目標詞在“亞文化語義空間”搜索相關詞(相關詞和目標詞之間需有比喻關系),搜索中要確保相關詞的抽象性。這個抽象系數算法已由Glucksberg①Glucksberg.S.Understanding Figurative Language:From Metaphor to Idioms Oxford:Oxford University Press,2001.在2001年提出,經過確定抽象系數,在大眾語義空間中篩選出相關詞,并最終填充標題骨架。因此,對于輸出標題骨架來說,其最終形態既要有“亞文化語義空間”的趣味性,也要符合主流文化價值觀。

無論以小說詩歌、媒體新聞為代表的內容創作,以資料整理、數據分析為代表的數字人文研究,還是指向文化建設和政治建設的國家管理,社會對于人工智能創作的需求已經越來越多。盡管語義空間算法在不斷更新完善,數據庫類型和內容也在不斷多樣化,但是對于人工智能創作而言,提出并實踐語義空間算法只是第一步,人工智能創作的核心并不在語義空間算法,制約人工智能創作的要害是對于修辭算法的理解與開發。對于社會整體需求來說,目前修辭算法的發展還是杯水車薪,隨著人們對于內容創作的要求提高,修辭算法的研究與開發已經迫在眉睫。

三、深層算法與敘事語法:修辭句式的算法構建

小說標題,是表現小說內涵的令人難忘的語段,通常用于小說的指稱和媒介傳播活動。在小說標題中,比喻、比擬、夸張等修辭手法經常出現,而人工智能創作的修辭算法研究,不僅包含句法的具體表達形式,還要深入語段的深層意義中,如何利用算法完成優秀的修辭表達,是人工智能創作的重要研究范疇。2014年,Miller.D.W和Toman.M就已經開始了相關研究,他們對2390個小說標題做數據分析,發現其中92%的標題至少包含一個修辭手法,并針對這些修辭手法進行排列對比,發現其中最常見的修辭手法是比喻,最常出現的修辭組合是比喻和押韻②Miller D.W and Toman.M,"An Analysis of Rhetori-cal Figures and other Linguistic Devices in Corporation Brand Slogans."Journal of Marketing Communications,22.5(2014):474-493。。Reece是標題領域的研究專家,他提出,當讀者回憶小說的時候主要依賴于小說標題,而不是小說的主題內涵③Reece,B.B,"What Makes a Slogan Memorable and Who Remembers It."Journal of Current Issues & Research in Advertising,16.2(1994):41-57。。而且在標題中,不同的修辭手段對于讀者會有不同的影響,含有修辭手法的標題更有說服,更加優秀①Burgers,C,Konijn,E.A,Steen,G.J and Iepsma,M.A.R."Making Ads Less Complex,Yet More Creative and Persuasive:The Effects of Conventional Metapors and Irony in Print Advertising."International Journal of Advertising,2015,16.2(1994):.41-57。。因此,構建新穎有趣的小說標題表達,對于小說來說是一種數據資源優化的方式,誰能夠最早在修辭算法的研究中拔得頭籌,誰就能占據未來人工智能小說市場的先機。

權重邏輯是修辭算法中的核心,也是修辭表達效果的重要參數。拿比喻修辭算法來看,使用比喻句式算法,首先,構建與目標單詞(本體單詞)相關的語義空間。其次,通過篩選本體和喻體的形容詞②Richards,I.A,The Philosophy of Rhetoric,Oxford University Press,1936.,搜尋喻體單詞,形成比喻修辭的表達式。具體說來,即通過權重邏輯,提取出本體相關的修飾詞,再通過修飾詞的權重邏輯,提取喻體單詞,最終將喻體單詞納入表達式中。Granroth等人曾使用Meta4meaning語義空間③Xiao,P,Alnajjar,K,Granroth-Wilding,M,Agres,K and Toivonen,Meta4meaning:Automatic metaphor in-terpretation using corpus-derived word associations,ICCC,2016.來構建語義模型,并以此找到本體喻體在語義上的相關單詞,例如,在比喻句式“時間就是金錢”中,“時間”(本體單詞)的相關詞是“珍貴”,而“珍貴又與“金錢”(喻體單體)關聯度很高,于是“金錢”就被篩選出來放置到表達式中。

對于人文學者特別是創意寫作的研究者來說,人工智能創作中的修辭算法是一項富于挑戰性的任務。創意寫作中的敘事語法是旨在建立一套共同敘事模式、規則和符號系統④葛紅兵:《小說類型學的基本理論問題》,上海:上海大學出版社2012年版。,所以敘事語法研究是內容生產層面的研究。從內容生產層面來看,語義空間算法是一種句法層的算法,它做的是人工智能創作算法的形式開發,而修辭算法通過提高話語表現力,以此增加對受眾吸引力,進一步深入人工智能創作算法的語義層。語義層研究是為了構筑話語所指的意義集域,這個意義集域正是創意寫作敘事語法研究的歸結點和落腳點。人工智能創作里面的算法,和一切別的人工智能算法一樣,仍繼續保持在它的生產里,但卻在一種特定的敘事語法中產生它的內容。所以,人工智能創作算法研究和創意寫作敘事話語研究,二者之間具有共性,極有研究價值。

人工智能創作的理論研究會有很多路徑,要想把握其算法層面的創作意義,我們可以在人工智能創作與創意寫作的聯系里去尋求。筆者嘗試提出一種身心關系,即以創作算法為實踐形式,以敘事語法為理念內容,反映創意寫作其內在學科邏輯,即文學創作與技術實踐的密切關系,這種關系是寫作理念社會化的自為發展,這在人工智能創作算法研究中,可以視為核心部分。

四、評估機制與篩選機制:遺傳算法構建

遺傳算法是1969年由美國霍蘭德教授根據生物進化論提出,經后人總結整理而成的一種模擬進化過程并求解極值的自適應人工智能算法⑤葛繼科、邱玉輝、吳春明、蒲國林:《遺傳算法研究綜述》,《計算機應用研究》2008年第10期。,它能夠運用于一切具有自然選擇特性的人工智能實踐問題。由前文可知,小說標題創作在經過語義空間算法和修辭算法后,需要在語義空間中繼續進行結果篩選和效果表達評估,這是一個多結果選擇過程,那些語義準確、結構完整、修辭表達效果良好的生成標題將被保留,不符合標準的、表達效果不佳的或者因算法問題而產生突變的生成標題將被淘汰,直到最終產生最優的結果,因此遺傳算法也適用于人工智能的小說標題創作。

在進行遺傳算法前,小說標題經歷了以下算法步驟:第一,要導入目標詞,構建詞匯語義空間;第二,構建標題骨架語義空間,篩選輸出標題骨架;第三,通過權重邏輯和語義空間搜索,導出本體詞匯的語義詞(形容詞和喻體詞匯);最后,通過遺傳算法進行篩選和評估,將最佳詞匯填充標題骨架,并最終選出最佳表達效果的小說標題。要注意的是,在遺傳算法中,以面為單位的搜索,比以點為單位的搜索,更能發現全局最優解①秦可凡:《人工智能中遺傳算法的研究與應用》,《中國戰略新興產業》2017年第8期。。因為在算法模型的運行中,整個群體執行了多個方向的篩選,它們要在代數、權值系數和抽象系數等參數上做出不同評估,以此支持這些方向上的信息構成和交換。

遺傳算法的篩選要符合國家的內容審核機制。小說標題作為高效傳達信息的語段,在各類數字媒介平臺上被傳播,其規則和標準既要合乎讀者的接受心理,也要符合寫作的規則,因此標題創作的算法規約要在篩選和評估環節重點考慮市場與人文性。一方面篩選環節要刪除任何不可被市場接受或無效的表達式,其標準是:生成標題中的目標詞與修飾詞要和積極情緒之間呈現正相關性,并刪除含有暴力、宗教、色情、政治等敏感詞匯。另一方面評估環節則被用于最大限度優化標題的敘事深度,其標準是:與小說主題呈現正相關性,語言規范要正確,關鍵詞要呈現,修辭方法要正確使用。

包括遺傳算法在內的算法開發和研究要遵循這樣的前提:算法原理要公開透明,且篩選和評估機制要重點考察,尤其是具有多代選擇的遺傳算法或者具有自動化決定能力的相關算法。尤瓦爾·赫拉利在《未來簡史》中把算法上升到具有擴張性和普遍性的哲學地位,甚至預言人工智能的發展會將地球帶回到少數精英創造歷史的時代。2017年5月起,歐盟要求所有人工智能算法解釋其輸出原理,這意味著在歐盟,閉環的深度學習算法成為非法的算法。這不是危言聳聽,算法之所以被推崇到這種地位,是因其具有不可忽視的地方。康德在《純粹理性批判》中認為,人類能認識到現象,而永遠認識不到本體。如果說通過人工智能算法使得人類進入了數據海洋時代,那么未來人工智能算法的深度學習以及機器的自我學習會使得人類進入數據宇宙時代,那這樣的世界人類是否還可以認識具有普遍性的現象?隨著人工智能算法深度學習,如人工智能的遺傳算法,模擬遺傳代數不是幾十代,而是幾萬代甚至是幾十萬代來篩選結果時,我們人類還如何確保最終得到的結果不帶有“突變基因”結果?當有了人類意識不到的改變后,人工智能自我默認并規定新的存在物,這種存在也許將會超越人類的認知。這種認知的不足是很現實的,假如未來的人工智能制造問題或者產生新知識的速度加快,人類修補問題的速度和學習新變化的速度能跟上嗎?這對于人工智能來說,它意味著人工智能捕捉到并使用了這些人類所認識不到的新東西后,那還能說人工智能沒有意識嗎?人工智能對于世界的理解與人類會越來越不同,人工智能最終會也會產生哲學意義上的意識,相較于弱人工智能的自動化決定,這才是真正意義上的黑箱。假如這些情況出現了,那將是人類未曾踏足之地,也可能是人類也無力追尋之地。

五、結語

在本文中,筆者描述了一個具有修辭表達效果的小說標題的自動生成算法模型。該模型首先采用語義空間算法來構建標題的語料庫和語義搜索模型,它在內容層面上屬于句法層的基礎算法研究。其次,通過修辭算法來使得標題的表達式更有趣味性,修辭算法以提高話語表現力增加對受眾吸引力,它在內容層上屬于語義層的深層算法研究。通過句法層和語義層的意義集域指向,筆者進一步分析了人工智能算法和創意寫作敘事語法之間的重要關系。最后,使用多目標選擇的遺傳算法,使標題在語義空間中繼續進行結果篩選和效果表達評估,以此得到最優的結果標題。因此,在邏輯層次上語義空間算法是內容構建的基礎算法,修辭語法是內容生成深層算法,而遺傳算法是內容修正的篩選和評估算法。另外,在對多目標多代選擇處理的遺傳算法描述中,我們認識到不能忽視人工智能算法深度學習可能帶來的危機。也許,隨著算法的不斷研究和發展,算法會從錯誤中自我學習,形成“黑箱”。黑格爾說:“意識本質上乃是客觀事物的內容的產生者,于是主觀的思維本質上是主動的。”在模擬人類思維和決策,不斷深度研發算法的人工智能時代,同樣可以做到客觀事物內容生產的機器算不算意識呢?算是主觀思維嗎?和人類意識有區別嗎?至少在人類中心主義的社會中,當算法產生了無意識的行為,則算法的理性概念會消解,由此帶來的不確定性我們并不一定能夠承受。因此,我們既要關注人工智能為自動創作帶來的便利,也不能忽視對人工智能算法的篩選和評估。

猜你喜歡
語義人工智能小說
叁見影(微篇小說)
紅豆(2022年9期)2022-11-04 03:14:42
遛彎兒(微篇小說)
紅豆(2022年9期)2022-11-04 03:14:40
勸生接力(微篇小說)
紅豆(2022年3期)2022-06-28 07:03:42
語言與語義
那些小說教我的事
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
主站蜘蛛池模板: 另类综合视频| 久久亚洲国产最新网站| 99视频在线免费看| 国产美女久久久久不卡| 国产激爽大片高清在线观看| 青青草一区二区免费精品| 亚洲v日韩v欧美在线观看| 91国内视频在线观看| 四虎影视无码永久免费观看| 久久久久无码精品国产免费| 久久情精品国产品免费| 91久久国产综合精品| 日本AⅤ精品一区二区三区日| 中文字幕伦视频| 在线国产欧美| 91久久精品国产| 日韩福利视频导航| 国产伦片中文免费观看| 日韩福利在线观看| 亚洲国产天堂久久九九九| 中字无码av在线电影| 久久久久亚洲精品成人网| 亚洲swag精品自拍一区| 国产精品999在线| 欧美日韩国产系列在线观看| 成人日韩视频| 亚洲精品天堂自在久久77| 亚洲天堂视频在线免费观看| 日韩成人免费网站| 成人国产免费| 中文字幕日韩欧美| 综合亚洲色图| 亚洲精品成人7777在线观看| 亚洲国产系列| 亚洲女同一区二区| 国产一二三区在线| 午夜a级毛片| 欧美 国产 人人视频| 老司机精品一区在线视频| 国产爽爽视频| 国产成人夜色91| 国产乱子精品一区二区在线观看| 午夜国产理论| 欧美午夜网| 亚洲毛片一级带毛片基地| 久久婷婷综合色一区二区| 性做久久久久久久免费看| 国产黄视频网站| 伊人久久综在合线亚洲2019| 精品国产自在现线看久久| 国产一级裸网站| 日本午夜视频在线观看| 国产好痛疼轻点好爽的视频| 亚洲三级网站| 欧美成人精品在线| 99久久精品国产麻豆婷婷| 男女男精品视频| 一级全黄毛片| 午夜欧美理论2019理论| 精品撒尿视频一区二区三区| 热久久国产| 亚洲人成网线在线播放va| 国产亚洲精品在天天在线麻豆 | 日韩精品中文字幕一区三区| 午夜免费小视频| 久久国产精品嫖妓| 999国产精品永久免费视频精品久久 | 日韩第九页| 麻豆国产原创视频在线播放| 无码精品国产dvd在线观看9久| 久久夜夜视频| 狼友视频国产精品首页| 久久夜色撩人精品国产| 91视频精品| 青草免费在线观看| 91香蕉国产亚洲一二三区 | 国产成在线观看免费视频| 波多野结衣中文字幕一区二区| 国产成人精品一区二区| 欧美成人午夜在线全部免费| 丰满少妇αⅴ无码区| 国产精品成人免费视频99|