李培菡
摘 要 智能寫作技術的發展正使得機器生成文本的應用變得越來越普遍,但發展至今始終缺乏一個客觀的評價標準。如果選擇繼續使用已有的文本評價標準,應如何合理地評價機器生成文本?或可將人工智能技術原理和已有的文本評價標準結合,提出一套新的更適用于機器生成文本的評價體系。
關鍵詞 智能寫作;機器生成文本;客觀評價;評價標準
中圖分類號 G2 文獻標識碼 A 文章編號 1674-6708(2019)235-0136-02
自20世紀70年代維諾格拉德(Winogand)通過程序算法成功實現人機對話以來,自然語言處理(Nature Language Processing, NLP)技術已經獲得了長足的進步,與之密切相關的智能寫作領域也因此不斷發展并越來越多的應用在實際社會生活中。如今,機器生成文本已經悄然滲透進人們生活的各個領域,體育新聞、金融資訊、大數據預測甚至是小說出版行業都能見到機器生成文本的身影。隨著技術的繼續進步、實際應用的繼續推廣,在可預見的將來,機器生成文本必將會引起全社會的廣泛關注。
然而,不同于以往由人創作的文本內容,機器生成文本受制于技術的發展水平,機器人寫作雖然已在體育新聞、金融速報等某些確定領域擁有了很多成功的實踐,但在大多數需要依靠人類情感以及抽象思維能力的創作領域,如詩歌、小說、散文等,仍然與人類作者的寫作水平有很大差距;另外,涉及人工智能以及機器人的倫理問題。
因此,如果只單一地使用人類目前已有文本評價標準來看待機器生成文本,既會限制智能寫作技術的長遠發展,也會引發社會在機器人倫理問題上的困惑。提出一個立足于智能寫作領域,同時又為大眾所理解認可的機器生成文本評價標準勢在必行。
1 根據已有文本評價標準看待機器生成文本
已有的文本評價標準自文字誕生之日起,發展至今已經形成了十分成熟的評價體系,并且衍生出了大量的相關學科,因此本章節主要對已有的文本評價標準進行框架性描述并將之與機器生成文本的評價相結合,從而整理出一條評價機器生成文本的邏輯過程,并且只介紹為大多數學者所接受的主流文本評價標準。
1.1 對機器生成文本文體選擇的評價
在已有的文本評價標準中,要展開對文本的評價首先要對它的“文體”進行區別。文體,指能夠獨立成篇文本的體制、體裁或樣式,是在長久寫作實踐過程中演變出的某種文本規格和模式。
通常情況下,文體被分為文章體裁和文學體裁兩大類,針對機器生成文本的評價首先要在區分了文本文體的基礎上進行,以文章體裁為區分的文本和以文學體裁為區分的文本擁有不同的創作目的和評價標準,因此是否能夠準確選擇符合創作目的的文體是評價機器生成文本好壞的重要準則。
1.2 以文章體裁進行區分的文本評價
文章體裁分為記敘文、議論文、說明文三類,不同的文章類型,擁有的寫作目的也就不同,相應的評價標準也不一樣。
1)記敘文的評價。對記敘文的評價緊緊圍繞著所謂記敘文六要素展開,即時間、地點、人物、事件的起因、經過及結果。針對這六要素發展出了多種寫作方法,如敘事線索、敘述順序、人物描寫、環境描寫等,這些方法也成為判斷一篇記敘文好壞的評價標準。
2)議論文的評價。與記敘文類似,對于議論文的評價也是圍繞其構成要素展開的。對一篇議論文來說,最核心的是其論點,論點要做到鮮明簡潔,整篇文章都圍繞論點展開;論據確鑿有力,論證過程具有說服性。論點、論據、論證的寫作同樣擁有許多具體的寫作方法,如例證法、對比法等,在此不做贅述。
3)說明文的評價。評價一篇說明文的方法簡單來說就是,找準說明對象,弄清說明對象的特征,然后用巧妙的方法將說明對象解釋清楚。
1.3 以文學體裁進行區分的文本評價
針對機器人創作的文學文本,可以采用文學批評的方法進行評價。文學批評是一個將科學理性同情感感性相融合的學科,它圍繞著文學作品展開,同時也將與之相關的文學活動和現象納入評價分析的范圍,常常帶有批評家鮮明的個人烙印。
主流觀點下,文學批評方法分為六種,對于機器生成的文學文本也應根據這六種批評方法評價。
1)社會歷史批評:站在歷史發展角度,分析文學和社會生活的關系;2)精神分析批評:主要分析作家、作品的無意識內容,特別是對性的欲望;3)語義批評:闡釋文本的語言意義,主要針對詩歌體裁;4)敘事批評:對敘事文的敘述結構和敘述方式進行分析;5)性別批評:站在女性意識的角度開展分析;6)讀者生產批評:對讀者在文學批評過程中發揮的創造性作用進行分析。
2 從機器生成文學的角度設定新的評價標準
2.1 新標準設定的目的
隨著智能寫作技術的不斷發展以及在商業領域越來越廣泛的應用,由寫作機器人創作生產的文本數量正在不斷增加。可以預見,未來由機器生產創作的文本數量必將增長到一個可觀的數據規模,并將引發全社會的廣泛關注。但作為一件新興事物,機器生成文本目前處在一個尷尬的境地。因為技術的限制,其生成的文本質量不足以支持將之置于人類已有的文本評價標準之下,另外寫作機器人不同于人,這之中還涉及機器人倫理的問題。
但同時機器生成文本又缺乏一套被廣泛接受且適用于自身特點和發展方向的評價標準,對文本的評價僅僅取決于開發人員和讀者個人的主觀體驗。因此,有必要為機器生成文本設定一套適用于自身特點和未來發展的評價標準,為技術人員的研發提供思路方面的參考;為讀者判斷一份文本的好壞提供客觀的評價體系;促進智能寫作技術的發展。
2.2 新標準設定原則
1)專業性。這份標準應該具備較強的專業性,能夠為技術人員評價機器生成文本提供參考和改進思路。2)易讀性。考慮到智能寫作未來的發展趨勢,機器生成文本必將滲透進普通人生活的各個方面。因此,這份標準還應該對普通讀者態度友好,能夠讓普通讀者依據這份標準合理評價機器生成文本,并幫助他們更好的理解智能寫作技術。3)機器生成文本生產的基本步驟可以被簡單地拆分為:依靠硬件設備平臺,通過算法處理,輸出文本。考慮到評價標準應該兼顧專業性和易讀性,因此,該標準評價的重點應放在輸出的最終結果即輸出文本上,不對硬件設備以及機器算法過多涉及。4)該評價標準只針對機器生成文本,不將讀者閱讀文本后產生的感想延伸納入評價。
2.3 理論基礎
1)自然語言處理:Natural Language Generation, NLG旨在讓機器基于結構化的文本、數據、音頻等生成人類可以理解的自然語言形式的文本。2)符號主義:實現認知的基本單元是符號,認知過程即符號運算過程;人工智能的研究方法為功能模擬法,即通過使用計算機模擬人類認知系統的機理和功能來實現人工智能,主張用邏輯方法來建立人工智能體系。3)聯結主義:認為思維的基本單元是神經元,思維過程是神經元并行聯結活動的過程;主張用基于神經元的人腦工作模式替換符號主義主張的,基于符號運算的電腦工作模式。4)人工神經網絡:一個用大量的簡單處理單元經廣泛并行聯結構成的人工網絡。5)語法、語用和語義:語法指,在一種自然語言中用來指出詞匯間正確搭配關系以及句子合理結構的一套規則;語義指一個句子所要表達的真實含義;語用指語言使用過程中的外界環境因素。
2.4 評價標準
1)生成文本能否清晰準確地表達創作目的。具體評價需要對生成文本進行文體選擇上的分析、詞匯分析、詞法分析、句法分析、語義分析以及語用分析。2)針對不同的文體、語境,是否選擇了合適的硬件設備及算法。對于應用在體育賽事報道、金融信息資訊、行業簡報等相似語境下的機器生成文本,這類文本對內容的邏輯性有很高的要求,而對文章的意境、創新性、啟發性等文學元素要求很低。這與符號主義所主張的通過邏輯方法來建立人工智能體系的追求相符合,因此為了節約成本、提高寫作速度,這類文本應選擇由合適的NLG(Nature Language Generation)算法生成,對硬件設備沒有特殊要求。如果對生成文本有較高的文學要求,比如,需要寫作機器人創作詩歌、小說或者散文,抽象思維、形象思維以及靈感思維能力則成為了寫作機器人不可或缺的功能。參考人腦的生理結構,這些活動的實現與人腦神經細胞之間并行式的生理結構密切相關,在這樣的要求下,單純以串行結構編寫而成的二進制算法是無法滿足機器生成文本的創作要求的。因此,需要使用特殊的硬件設備來滿足這種需要,具有自學習、自適應、自組織、模糊推理、聯想等與人腦類似功能的人工神經網絡搭配合適的NLG算法應該作為生成這一類文本的技術要求。
參考文獻
[1]Stuart J.Russell, Peter Norvig.人工智能:一種現代的方法(第3版)[M].殷建平,譯.清華大學出版社,2013:34,106.
[2]歐陽友權.文學理論[M].北京:北京大學出版社,2006:321.
[3]王萬森.人工智能原理及其應用[M].北京:電子工業出版社,2000:17.