李真
ChatGPT( Chat Generative Pre-trained Transformer)是由美國人工智能研究實驗室OpenAI 開發的一種自然語言處理模型,它是基于GPT(generative pre-trained transformer)模型改進而來的。GPT 是一種基于深度神經網絡的語言模型,通過預訓練和微調的方式,基于大量語言訓練,能夠生成與輸入文本相關的連貫、流暢的文本。目前,ChatGPT 的應用場景十分廣泛,包括客戶服務、內容創作、教育輔助、語言學習、社交互動等,引起了社會各界的廣泛關注和討論。
在出版領域,雖然大多數研究者認為人工智能只是工具,并不能替代編輯工作,但也有極少數研究者認為引入人工智能技術后的編輯工作將對從業人員提出更高要求,甚至引起相關崗位的功能遷移,導致出版業從業人員面臨減薪乃至失業的風險。[1]當前,一些學者圍繞ChatGPT 在出版行業中應用的可能性展開了分析。例如,李博等[2]認為ChatGPT可以幫助編輯人員高效處理文本,識別文本存在的語法、拼寫、標點符號等錯誤,輔助修改和潤色,進而提高編輯和校對工作的效率。任宇等[3]認為ChatGPT 在檢索、翻譯和寫作方面表現突出,能夠提高編輯工作效率。周青[4]認為可將ChatGPT 應用于糾正錯別字、統一標點符號、修改敏感詞語等校對工作,以節省時間、提高效率。關于ChatGPT 在編校工作中的適用范圍,張重毅等[5]指出大語言模型擅于發現文本、語言邏輯、語法等方面的錯誤。崔玉潔[6]認為ChatGPT 尤其適用于修改拼寫錯誤和語法錯誤。徐敬宏等[7]提出ChatGPT 可以識別并修改文字表達、語法、標點符號等錯誤,為編輯工作減負。陳帥等[8]認為ChatGPT 可以對學術論文進行文本編輯和校對潤色,有效減輕編校人員的工作量。李侗侗等[9]認為ChatGPT 可以幫助編輯“校正語法錯誤、簡化復雜的語言表述、使用規范的學術語言,進而優化文章的表述效果”。田在儒[10]認為ChatGPT 等聊天機器人可以勝任重復性工作,如對文章進行編輯加工、校對等,進而節省編輯人員的時間和精力。
通過梳理文獻可以發現,研究者們普遍認為ChatGPT 可以在語法檢查、文本糾錯、標點符號校正、知識核查和語言翻譯等方面有效幫助編校人員提高工作效率。由于當前這類研究大多數是基于經驗的解析,缺乏實證數據的支持,為探討ChatGPT 在圖書編校中的實際應用效果,本研究擬通過測試和分析ChatGPT 對語法類錯誤、字詞類錯誤、標點符號類錯誤和知識性錯誤的編校處理情況,評估其對提高編校工作效率所能發揮的作用,為圖書編校人員迎接人工智能的挑戰提供參考。
研究對象為美國人工智能研究實驗室OpenAI 開發的ChatGPT 3.5 版。測試文本選自商務印書館2019 年出版的《圖書編校質量差錯案例》中的200 條編校差錯典型案例及其修改后的正確文本,具體包括文字差錯案例、詞語差錯案例、科技名詞差錯案例、語法差錯案例、標點符號差錯案例、知識性差錯案例等。將包含200 條編校差錯典型案例的測試文本進一步劃分為語法類差錯案例、字詞類差錯案例、標點符號類差錯案例和知識性差錯案例4 類。每個類別包含50 條差錯案例及其修改后的正確文本,涵蓋了圖書編校中最常見的問題,故研究樣本具有代表性。
借助200 條典型差錯案例文本信息進行ChatGPT 編校能力測試。為了保證測試結果符合要求,在輸入語法類差錯案例測試文本時添加任務命令性語句“請修改以下病句”;在輸入字詞類差錯案例測試文本時添加任務命令性語句“請校對以下句子中的字詞”;在輸入標點符號類差錯案例測試文本時添加任務命令性語句“請校對以下句子中的標點符號”;在輸入知識性差錯案例測試文本時添加任務命令性語句“請核查并修改以下句子中的知識性錯誤”。然后,將ChatGPT 輸出的文本與測試文本逐一對應,形成200 組對照文本。通過比對使用ChatGPT 編校后的文本是否改正了典型差錯案例中存在的問題,分析ChatGPT 在編校中的實際應用效果。
測試結果顯示,ChatGPT 在圖書編校中的應用表現一般,整體上未能識別和修改錯誤的比例較高。在對200 條差錯案例文本的測試中,能正確識別錯誤并準確修改的數量為57 條,占比28.5%;未能識別錯誤并進行修改的數量為127 條,占比63.5%;能正確識別并修改錯誤,但同時修改了原句中其他正確表達的數量為16 條,占比8.0%。ChatGPT在對語法類錯誤、字詞類錯誤、標點符號類錯誤和知識性錯誤的編校處理上表現存在差異,具體情況如下。
在50 組語法類差錯案例對照文本中,ChatGPT 自動識別和準確修改了14 條(28.0%)文本的語法錯誤;未能準確識別和修改的文本為31 條(62.0%);在對5 條(10.0%)文本的語法錯誤進行識別和修改的同時,還修改了原句中其他正確的表達。例如,ChatGPT成功識別出“通過努力,我們的發行數量提高了一倍。”中錯誤使用“提高”一詞,并將其改為“增加”;ChatGPT 沒有識別出“對于這種浪費人才的現象,至今沒有引起有關部門的重視。”中主語殘缺的語法錯誤,未能將差錯案例中“對于”二字刪除;ChatGPT 雖然識別出了“他多么渴望一個學習的機會!”中的謂語殘缺的語法錯誤,將句子修改為“他非常渴望獲得一個學習的機會!”,但將沒有差錯的“多么”同義替換為“非常”。
在50 組字詞類差錯案例對照文本中,ChatGPT 自動識別和準確修改了22 條(44.0%)文本的字詞錯誤;未能準確識別和修改的文本為22 條(44.0%);在對6 條(12.0%)文本的字詞錯誤進行識別和修改的同時,還修改了原句中其他正確表達用詞。例如,ChatGPT成功識別出“他當了二十多年的帳房。”中的錯別字“帳”,并正確修改為“賬”;ChatGPT沒有識別出“張總最近很累,有點兒心率不齊。”中“率”字的錯用,反而把“有點兒”改成了“有些”。
在50 組標點符號類差錯案例對照文本中,ChatGPT 自動識別和準確修改了11 條(22.0%)文本的標點符號錯誤;未能準確識別和修改的文本為39 條(78.0%)。例如,ChatGPT成功識別出了“人如果發熱(體溫超過37.5℃,)通常就會感覺不舒服。”中逗號位置錯誤,將其改為“人如果發熱(體溫超過37.5℃),通常就會感覺不舒服。”;ChatGPT認為“《讀者雜志》深受讀者喜愛。”中不存在標點符號錯誤,說明其較難準確判斷常識問題,沒有判斷出《讀者》是雜志的名稱;ChatGPT 不僅未能識別出“因此,正確答案為personal touch.”中句號使用錯誤,還錯誤地將英文詞組personal touch 加上了雙引號,不符合《中文出版物夾用英文的編輯規范》(CY/T 154—2017)中的規定。
在50 組知識性差錯案例對照文本中,ChatGPT 自動識別和準確修改了10 條(20.0%)文本的知識性錯誤;未能準確識別和修改的文本為35 條(70.0%);在對5 條(10.0%)文本的知識性錯誤進行識別和修改的同時,還修改了原句中其他正確的表達。例如,ChatGPT 正確識別出“公元220 年,曹丕稱帝,即魏文帝,國號黃初。”中混淆了國號和年號,將“國號黃初”改為“國號曹魏”;ChatGPT 認為“孟子曰:‘食色,性也。仁,內也,非外也。義,外也,非內也。’”中沒有知識性錯誤,但事實上這句話并非孟子所說,乃是出自告子之口;ChatGPT 雖然正確識別并修改了“預防矽肺病的關鍵是要改善生產環境,減少粉塵吸入。”中的知識性錯誤,將“矽肺病”改為“硅肺病”,但是在修改過程中卻增加了“控制粉塵的生成和擴散”這一原句沒有的內容。
ChatGPT 在差錯案例文本的測試中表現出28.5% 的糾錯率,說明其確實能夠在圖書編校上對編輯工作有所助益,特別是在錯誤字詞的糾正上,糾錯率可達44.0%。然而,由于使用上的各種限制,目前ChatGPT 在圖書編校中的應用效果并不理想,存在較多局限。首先,ChatGPT 的使用權限尚未對我國開放,網絡獲取存在限制,不少編校人員僅聞其名,卻沒有真正接觸過,更別說是主動將其應用在圖書編校工作中。其次,ChatGPT 作為聊天機器人,其輸入和輸出的字符都有限制,不可能做到對整本書進行編校,因此無法準確認識一本書的整體邏輯框架。即便是采用人機結合方式,編校人員手動將存在問題的語句輸入ChatGPT 對話框內以獲得結果,仍然發現其給出的結果良莠不齊,需要編校人員再次核實和修改,遠遠達不到提高工作效率的目的。而手工輸入對話框會使文本會失去原本的格式,導致無法對體例和格式進行編校。最后,由于ChatGPT 是基于英語語料庫訓練的模型,這意味著它能夠理解和處理英語的文本信息,生成符合英語語言的回復。雖然它可以嘗試理解和處理中文的文本信息,但是由于語言和文化的差異,其可靠性和準確性相對較低,甚至可能產生一些錯誤的回復。例如,在對標點符號的編校上,ChatGPT作出的很多修改與中文標點符號的使用規范有悖,說明ChatGPT 對中文使用的標準規范并沒有準確掌握。而在對原文語句的潤色修改上,ChatGPT 常常表現出不符合作者寫作風格、用詞習慣的問題。在測試過程中發現,盡管已經添加了明確的“校對字詞”指令,但ChatGPT 仍然會對文字加以潤色修改,同義替換原句的字詞,甚至增加原文沒有的內容。在圖書編校中,應警惕過度改稿,堅持“可改可不改的不改”。使用ChatGPT 輔助編校,編輯人員還需要核對原稿,將經潤色修改但沒有實質錯誤的內容還原,徒增了工作負擔。
雖然,ChatGPT 目前在圖書編校上的應用表現欠佳,但人工智能的發展日新月異,可以期待經過多次升級換代、擴展應用場景,ChatGPT 將能成為圖書編校工作的有力輔助工具。
我國應加快研發基于中文語料的智能編校工具并不斷擴展其應用場景。圖書編輯日常需要處理大量的知識核查工作,包括核查引文、注釋、參考文獻、專業性名詞等。相信憑借人工智能強大的學習能力以及龐大的學習語料數據庫,基于中文語料的智能工具可以更好地幫助解決編校中的難題,助力中文圖書編校提質增效。目前,圖書編校人員在工作中較常使用的智能審校系統(如方正智能輔助審校系統)可以審校整本圖書,提供包括字詞檢查、知識性檢查、重點內容檢查和體例格式檢查等功能。倘若ChatGPT 等人工智能工具在性能上能結合這類審校系統的優勢,則其功能會更為強大,真正助力圖書編校工作,提升工作效率。
和眾多研究者一樣,本研究也認同ChatGPT 等人工智能工具不會取代人工編輯,但確實會給編校人員帶來新的挑戰。作為圖書編校人員,需要主動擁抱技術、迎接挑戰。通過對ChatGPT 編校能力的測試結果不難看出ChatGPT 在理解文化內涵上存在困難,這正是人工編輯難以被取代之處,也是編校人員所擅長和應該繼續精進的技能。圖書編校人員需要通過不斷提升專業技能、職業素養和工作能力,以適應新挑戰和新要求,不能埋頭于案頭工作不顧世界的變化,要接觸新領域、了解新技術、掌握新技能,主動擁抱技術使其為我所用,借助ChatGPT 等人工智能工具處理繁雜的事務性工作,從而集中精力打造精品圖書。
作為一種新興的人工智能技術,ChatGPT強大的功能已經引起社會各界的廣泛關注,其應用領域也在不斷拓展。在圖書編校上,ChatGPT 確實可以輔助糾正語法、字詞、標點符號和部分知識性錯誤,但目前其應用表現一般。ChatGPT 應用于圖書編校上存在局限,具體包括:使用受限;不能整本編校;編校質量良莠不齊且無法識別體例和格式問題;限于語言和文化的差異,可靠性和準確性低;潤色修改過度。鑒于此,人工編輯的重要性不言而喻。圖書編校人員應不斷提升自身的文化素養和專業能力,更好地利用不斷優化升級的人工智能工具輔助圖書編校,以提高圖書編校質量和效率。