999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LSTM的圖像生成詩歌模型*

2019-04-24 08:15:54何立健翁海瑞
關(guān)鍵詞:評價模型

何立健,林 穗,翁海瑞

(廣東工業(yè)大學(xué) 計算機學(xué)院,廣東 廣州 510006)

0 引言

中華文化淵源悠長,詩歌更是博大精深,在絕妙的詩詞中,可以感受到前人的智慧與古代文化。

隨著人工智能技術(shù)的快速發(fā)展,自然語言處理與圖像處理技術(shù)[1]相結(jié)合,使得機器有了看圖說話的能力[2]。在大計算力時代,從圖像輸出人們能夠讀懂的語言是基礎(chǔ),輸出更生動的語言是對科技的進一步要求[3]。而詩詞是一種用高度凝練的語言,形象生動表達作者對一些情景的豐富情感,集中反映社會生活,并具有一定節(jié)奏和韻律的文學(xué)體裁。雖然機器能生成風趣幽默、貼近日常生活的描述性句子,但是對于從圖像直接生成中國人更喜歡的古典詩詞是一種挑戰(zhàn)。為解決這個問題,本文做了以下工作:

(1)將VGG16模型[4]用于圖像關(guān)鍵詞提取,VGG16模型[4]原本輸出的關(guān)鍵詞為英文,為此利用一些翻譯工具將ImageNet 1000的英文標簽翻譯成中文標簽;

(2)在詩歌生成過程中,利用一個讀寫記憶模型[5]來記錄詩歌生成的順序,并加入詩歌韻律模型進行策略控制;

(3)進行選優(yōu)的級聯(lián)計算之前,加入緩沖池模型進行過濾。

1 相關(guān)工作

人工智能是長期以來公眾關(guān)注的熱點,當中發(fā)展并不順暢,利用機器自動生成詩歌的研究[6]可以追溯到幾十年前。早期的方法是讓機器基于規(guī)則和模板[7],其實現(xiàn)的方式需要大量的人工干預(yù),首先系統(tǒng)設(shè)置關(guān)聯(lián)詞袋形成一個術(shù)語列表,并隨機將術(shù)語插入到一定格式的詩歌模板中,這樣的系統(tǒng)導(dǎo)致生成詩歌句子閱讀感差、不自然。在20世紀90年代開始,圖像到語言的端到端的研究向統(tǒng)計機器翻譯方面進行,如遺傳算法[8]和統(tǒng)計機器翻譯(SMT)[9]。近年,神經(jīng)網(wǎng)絡(luò)復(fù)興[10],并得到快速發(fā)展,運用的范疇越來越廣,并在用于詩歌生成方面有明顯的優(yōu)勢。神經(jīng)網(wǎng)絡(luò)前期用于生成詩歌是專注于詩歌的風格和韻律等方面。初期的神經(jīng)網(wǎng)絡(luò)在詩歌方面運用,是基于序列學(xué)習的神經(jīng)網(wǎng)絡(luò)模型,利用生成的前文歷史壓縮為一個統(tǒng)一的歷史詞向量,例如文獻[11]提出的RNN Encoder-Decoder結(jié)構(gòu),輸入一個話題單詞作為輸出的情感基調(diào);文獻[12]提出基于遞歸神經(jīng)網(wǎng)絡(luò)生成中文四行詩,生成的詩句轉(zhuǎn)化為卷積向量的表達形式,然后把整個模型壓縮為一個歷史詞向量,因此增強了語句的關(guān)聯(lián)性,此外需要兩個SMT特征;文獻[13]創(chuàng)新提出了一種多重歷史詞向量多次解析的迭代拋光模式,使得詩歌質(zhì)量有所提升。通過一段時間的發(fā)展,神經(jīng)網(wǎng)絡(luò)用于詩歌生成的重點轉(zhuǎn)移到了注意力機制,例如通過語言模型預(yù)先將關(guān)鍵字分類,然后在生成的每一行中在預(yù)定的子關(guān)鍵字中搜索。文獻[14]提出了一種基于注意力的模型,這個模型可以自動學(xué)習描述圖像內(nèi)容,使用反向傳播技術(shù)[15],通過訓(xùn)練來確定模型的最差狀況。最近來自英國詩歌的研究,把整首詩作為一個長序列并按每個字生成,其中的生成歷史隱式地沿著RNN傳播[16]。

2 模型

在最新的圖像處理和自然語言處理的研究中,成果越來越貼合人們的生活實際,詩歌生成的質(zhì)量越來越好,借助前人的智慧,本文提出一個新的詩歌生成模型來實現(xiàn)從照片輸入到詩歌輸出的端到端效果,如圖1。

圖1 基于LSTM單字模型的圖像生成詩歌模型

首先,利用VGG16模型對圖片進行預(yù)測分類,該模型在ImageNet圖庫圖片分類預(yù)測的排名中取得了前五的成績。然后,利用翻譯軟件,將VGG16模型的1 000 多個類翻譯成中文標簽,圖像經(jīng)過VGG16模型訓(xùn)練后,得到相應(yīng)的中文分類標簽,形成對應(yīng)該輸入圖像的中文標簽集合。最后,使用一個基于LSTM的單詞級別語言模型訓(xùn)練,使得整個詩歌生成模型更加專注于內(nèi)容,得出豐富的文本描述。在LSTM模型訓(xùn)練中,可以從網(wǎng)上收集現(xiàn)成的詩詞,擴充語料庫,因此可以訓(xùn)練一個帶有2 048個隱含特征、3層的LSTM模型[17],再利用隨機梯度下降法[18],使得模型能預(yù)測給定當前字的下一個字。但是為了剔除數(shù)據(jù)的不規(guī)則性和噪聲,額外加入一個詩歌聲調(diào)韻律模型[19],這需要一個額外的分類器來約束當前的詩歌生成模型,使生成的詩歌更具可讀性。從圖片得出的中文標簽,需要被LSTM單詞級別模型訓(xùn)練,最后經(jīng)過級聯(lián)計算輸出最佳的詩歌。每條路徑都包含著初始狀態(tài)及結(jié)束狀態(tài),每條路徑都有一個輸入標簽和輸出標簽,每個序列都包含許多這樣的路徑,這符合級聯(lián)的思想,整個流程由多函數(shù)構(gòu)成。

W(x,z)=A(x|y)°B(y|z)°C(z)

(1)

其中W(x,z)被定義為各個級聯(lián)的路徑概率的累加和,x和z分別為輸入序列和輸出序列。級聯(lián)模型包含很多的路徑,每條路徑的概率的和是連續(xù)的,并且是并行獲得的,所以式(1)又可以表示如下:

(2)

通過簡化,最終可以合并表示為:

(3)

通過級聯(lián)最大化期望計算在詩歌的語料庫中獲得一個概率分類模型,使每一句詩歌的音韻得到了比較好的效果。

在單詞級別的LSTM語言模型到級聯(lián)計算最大化期望中間,本模型使用了一個緩沖池,以對整個詩歌模型施加約束。緩沖池是從前文的LSTM語言模型抽取部分詩歌序列作為樣本,這限制了詩句的音律分布。由于緩沖池有過濾功能,如當緩沖區(qū)拒絕當前的輸入序列時,則將整個運行狀態(tài)回滾到最后一個可接受的級聯(lián)模型當中,刪除被緩沖池過濾的字詞,達到篩選詞語輸出的效果。

3 實驗數(shù)據(jù)與環(huán)境

3.1 實驗數(shù)據(jù)

本文數(shù)據(jù)包含兩種數(shù)據(jù)集:圖片數(shù)據(jù)集和詩歌數(shù)據(jù)集。圖片數(shù)據(jù)集使用了有1 000多種分類的Image 1000 數(shù)據(jù)集。而詩歌數(shù)據(jù)集采用中國詩歌庫(CPC)的詩歌數(shù)據(jù),通過人工篩選,選取了12 000首唐詩,并在其中隨機選取了2 000首進行訓(xùn)練。

3.2 實驗環(huán)境

整個實驗使用系統(tǒng)為Linux,并采用NVIDIA TITAN X的GPU進行模型訓(xùn)練。VGG16模型是一個開源模型,當模型運行得到中文標簽結(jié)果時會做自檢查,以防亂碼以及非中文標簽的情況。當?shù)贸鲋形臉撕灂r,進一步使用word2vec進行關(guān)鍵詞向量化預(yù)處理。對于詩歌輸出部分需要訓(xùn)練的模型是LSTM以及詩歌聲調(diào)韻律模型,嵌入字的維數(shù)為1 024,均使用SGD模型配合AdaDelta算法進行訓(xùn)練。

4 評價

由圖產(chǎn)生詩是一個端到端的生成模型,對于這樣的模型來設(shè)計評價模型更是一個具有挑戰(zhàn)性的任務(wù)。在此選擇了平均支配因子和3個不同的專家評價指標來對結(jié)果進行評價。

4.1 平均支配因子

平均支配因子可以反映從當前詞預(yù)測下一個詞有多少種選擇,也是一種基于信息熵的表現(xiàn)評價,如下:

(4)

其中,N代表句子S的長度,P(Wi)代表當前詞的可能生成概率。總地來說,P(S)的值越小,相應(yīng)的表現(xiàn)結(jié)果越好,詩歌的質(zhì)量就越好。

4.2 專家評價

審閱一首詩歌時,人們十分注重詩歌的韻律與深意,因此專家評判是有必要的。本文主要從詩歌的“句法”、“語義”、“相關(guān)性”三項進行滿意度評分。句法體現(xiàn)了詩歌的整體結(jié)構(gòu)狀況,語義反映詩歌的字詞連貫以及深意,相關(guān)性是指詩句與輸入圖片的相關(guān)程度。

本次研究的重點為從給定的圖像通過模型自動化生成詩歌,通過與前人的模型橫向?qū)Ρ龋灸P偷玫搅撕芎玫脑u分。

如表1所示,基于機器學(xué)習模型(SMT)的詩歌生成模型不能完全實現(xiàn)全自動地端到端輸出,需要大量的人工干預(yù),因此語義方面質(zhì)量較高;AGG16-Image模型基于圖像識別的關(guān)鍵字標簽生成詩歌,雖然在專家評價中有不錯的表現(xiàn),但是不能完全表達圖片包含的信息。本模型在客觀評價指標平均支配因子和專家評價中各個指標均優(yōu)于前人模型,在基本契合圖片信息的同時滿足詩歌韻律的要求,尤其生成的詩歌相關(guān)性比較優(yōu)異,說明從圖片到生成詩歌的端到端模型表現(xiàn)良好。

5 結(jié)論

本文基于LSTM、計算機視覺以及自然語言處理提出一種新的從圖像生成詩歌模型。用現(xiàn)代人工智能時代的技術(shù),使得機器生成的詩歌更具有可讀性和深意,并且使人難以分辨是否為機器生成。未來,希望能借鑒更能契合詩歌特點的大規(guī)模深度學(xué)習架構(gòu),使得生成的詩歌質(zhì)量越來越好。

猜你喜歡
評價模型
一半模型
SBR改性瀝青的穩(wěn)定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
中藥治療室性早搏系統(tǒng)評價再評價
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
基于Moodle的學(xué)習評價
關(guān)于項目后評價中“專項”后評價的探討
保加利亞轉(zhuǎn)軌20年評價
主站蜘蛛池模板: 91青青草视频在线观看的| 99在线免费播放| 99在线视频免费| 久久人午夜亚洲精品无码区| 亚洲日韩精品无码专区97| 欧美性猛交一区二区三区| 国产精品亚欧美一区二区 | 亚洲色图欧美在线| 免费无码网站| 香蕉视频国产精品人| 亚洲AⅤ综合在线欧美一区| 久草性视频| 一级福利视频| 亚洲无码91视频| 亚洲日本一本dvd高清| 成人小视频网| 亚洲国产成人麻豆精品| 免费国产高清视频| 精品欧美日韩国产日漫一区不卡| 国产亚洲精| 午夜日本永久乱码免费播放片| 亚洲无码高清免费视频亚洲| 国产91丝袜在线观看| 亚洲无码免费黄色网址| 毛片在线区| 亚洲欧美成aⅴ人在线观看| 成人91在线| 1024国产在线| 欧美人在线一区二区三区| 99激情网| 亚洲中文制服丝袜欧美精品| 2024av在线无码中文最新| 亚洲综合天堂网| 99r在线精品视频在线播放| 天天躁日日躁狠狠躁中文字幕| 一本大道无码日韩精品影视| 99在线视频网站| 亚洲无码精品在线播放 | 美女无遮挡拍拍拍免费视频| 国产青榴视频| 久久99热66这里只有精品一| 国产无码性爱一区二区三区| 2020久久国产综合精品swag| 天天躁狠狠躁| 久久99国产乱子伦精品免| 欧洲成人在线观看| 欧美影院久久| 亚洲成av人无码综合在线观看| 国产福利大秀91| 伊人成人在线| 亚洲视频欧美不卡| 欧美va亚洲va香蕉在线| 国产精品香蕉在线| 老司机精品久久| 午夜福利亚洲精品| 欧美一区二区三区不卡免费| 亚洲综合九九| 激情视频综合网| 98精品全国免费观看视频| 激情网址在线观看| 亚洲色欲色欲www网| 中文字幕在线不卡视频| 国产精品免费入口视频| 精品无码一区二区三区电影| 国产精品综合久久久| 国产自产视频一区二区三区| 麻豆国产原创视频在线播放| 污污网站在线观看| 欧美 亚洲 日韩 国产| 国产小视频a在线观看| 亚洲国产天堂在线观看| 4虎影视国产在线观看精品| 波多野结衣一区二区三区AV| 黄色三级网站免费| 国产精品私拍99pans大尺度| 欧美亚洲欧美| av一区二区三区在线观看 | 伊在人亚洲香蕉精品播放| 日本午夜三级| 欧美日韩国产高清一区二区三区| 免费人成黄页在线观看国产| 国产成人高精品免费视频|