寇穎丹
摘 要:本文簡要介紹了目前人工智能技術在新聞傳媒行業自動寫作場景下的應用,并分析了記者、編輯、決策者等不同角色的擴展使用需求,進而對未來人工智能技術與智能創作場景的深度結合進行了展望和功能設計。本文有助于新聞出版從業人員了解新技術應用趨勢和行業需求。
隨著人工智能及大數據技術的發展,新聞傳媒業大力推進與科技的融合。智能寫作技術作為人工智能技術在新聞信息領域中的具體應用,逐步為新聞傳媒機構所關注和嘗試。
從目前國內外智能寫作的發展來看,以寫稿機器人為代表的智能寫作工具已在國內外一些新聞機構都有不同程度的應用,特別是在有大量格式化、規范化新聞信息的財經金融新聞信息領域、體育新聞、突發事件報道等方面。國內的產品基本上以自動寫稿為核心功能,國外的產品則涵蓋范圍更廣,不僅包含自動寫稿,還有輔助傳播工具、自動標引工具和內容審核工具等。
除了格式化、規范化新聞信息的自動寫作之外,在更廣泛的場景下,是否能夠通過大數據、人工智能提供智能輔助創作技術,為內容創作提供更進一步的輔助支撐成為可以探究的問題。
一、智能輔助創作的演進分析
智能輔助創作主要為新聞傳媒單位內部的編輯記者提供服務,按照不同角色對智能輔助創作的需求各有其側重點,大致分為幾類不同角色,其使用需求如下。
(一)記者對智能輔助創作的需求
記者的主要職責是發現選題和采訪寫作。在發現選題方面,除了傳統的跑線和爆料之外,記者會通過互聯網獲取大量信息,包括政府相關部門官方網站、互聯網門戶的財經頻道、一些專業和垂直領域的經濟類網站及公眾號、社交媒體及自媒體等,從這些信息中心挖掘潛在熱點和有價值的新聞線索,因此信息的獲取和歸類整理、分析將會占用記者的相當一部分精力和時間。在這方面,希望智能輔助創作可以提供支撐,例如在采訪寫作方面,可以幫助記者獲取創作靈感、發現寫作角度。
(二)編輯對智能輔助創作的需求
編輯的主要職責是更好地呈現選題,他們對記者提供的稿件進行二次加工和內容把關,對稿件內容中的報道角度、引用的數據與觀點、語法及描述、配圖等方面進行審核,糾正錯誤,確保內容的高質量。在內容審核中,對數據和引用觀點的核實可以借助智能輔助創作的數據抓取與分析能力,為編輯提供參考,減輕編輯人工查找信息的工作量。希望智能輔助創作可以為編輯提供信息收集、整合、分析、推送服務。
(三)采編部門領導對智能輔助創作的需求
采編部門領導(部門主任或副主任)通常直接負責本部門(板塊)的選題決策、重大選題策劃等工作。除了類似于記者和編輯的需求之外,部門領導還對信息的宏觀把控和分析有需求,包括新聞的傳播分析、本部門的選題分析等。
二、智能輔助創作的功能設計
根據對不同角色的需求分析,智能輔助創作的功能可以按照線索發現、選題策劃、創作支撐工具三個階段進行設計。
(一)線索發現
線索發現階段主要為記者和編輯提供全網熱點新聞的自動化呈現,并通過量化指標對其進行評估,從中挖掘潛在新聞線索。線索發現階段的核心功能及業務流程包括線索抓取、熱點發現、線索訂閱與推送。
1.線索抓取
線索抓取功能主要包含三部分:第一,基于用戶指定的抓取源(網站、微博、微信),自動定時及手動抓取信息,并實現信息的自動清洗、過濾、標引、分類、聚類、入庫,可根據需要實現全量、增量的信息抓取,用戶可自定義抓取源和抓取模板。第二,抓取的新聞線索信息,系統可實現自動標引,包括新聞標題、作者、來源、發表時間、新聞中的關鍵人物、地名、機構,該篇新聞的摘要信息,同時系統可對具有相同主題的新聞線索進行聚類。第三,用戶可以基于線索內容或標題的關鍵字、地域、時間、分類等各種屬性對新聞線索進行方便、快捷的檢索,用戶還可以針對新聞線索進行主題檢索,按照“主題-線索”的方式組織和顯示線索數據。
2.熱點分析
熱點分析功能包含兩部分:第一,系統預設新聞熱度模型,模型指標包括新聞的閱讀量、轉發量、評論量、點贊量、分享量,并且可對指標設定不同權重;基于預設的新聞熱度模型,計算抓取的新聞熱度值,生成熱度排行榜(日、周、月),并展示給客戶。第二.系統提供新聞熱度計算的基本模型,包含閱讀量、轉發量、評論量、點贊量、分享量等多個指標,用戶可基于基礎指標進行熱度模型的自定義設置,對不同指標設定相應權重,從而可以優化熱度模型。
3.線索訂閱與推送
編輯記者可根據自己的喜好,通過設定關鍵詞或主題的方式進行訂閱,定制關注的新聞線索分類(板塊)。通過大數據輿情分析,將生成如下分析結果:事件概況、傳播趨勢、渠道信息、輿論聚合、人群畫像、信息列表;同時,系統可按照最新、最熱兩個維度,將互聯網熱點信息(線索)實時推送給用戶,用戶在登錄Web系統的狀態可及時收到推送消息,并通過點擊消息直接查看推送的新聞線索信息。
(二)選題策劃
在選題策劃階段,智能輔助創作系統主要為記者編輯提供選題管理和支撐選題策劃的背景信息參考服務。
1.選題日歷
系統提供手工錄入新聞選題功能,包含選題基本信息、選題預計時間、選題關鍵詞等。系統以日歷的方式展示一個月內每日的選題安排,點擊某個選題后,可顯示其詳細信息,除了顯示該選題的預設信息外,還可根據預設的關鍵詞自動推送與其相關的當前熱點新聞,供記者和編輯參考。對于快到期的選題,系統可提供自動提醒功能。
2.背景信息提供
對于給定的選題,系統可檢索并呈現基于該選題的相關背景信息,如相關人物、相關機構、相關事件,以及與選題有關的其他新聞報道內容。
相關人物和相關機構的信息一方面可來源于新聞報道,另一方面可關聯目前現有的媒資庫系統,從媒資庫系統中的人物庫和機構庫中獲取數據。
相關事件可通過新聞主題聚類的方式,將與該選題有關聯的其他新聞主題及詳細新聞報道進行層次化的展示。層次劃分為:給定選題-相關主題(事件)-相關新聞。相關人物和機構采用圖形化呈現方式,相關事件與相關新聞報道之間存在關聯關系,展示信息的同時也要將相互關聯關系展示出來。
(三)創作支撐
內容生產階段,智能輔助創作系統主要提供半自動成稿和模板成稿兩個層面的支撐服務。
1.半自動成稿
可提供給定選題的相關新聞素材,內容包括文字片段和圖片,相關人物、相關機構、相關事件,來源包括數據抓取源采集的各類網站和自媒體。
除了基本新聞內容素材推薦之外,系統還可以對以下幾種新聞素材進行推薦:觀點聚合類素材,對給定選題的相關新聞內容進行深度分析聚合,形成相同觀點的新聞內容聚合素材;自動摘要類素材,系統可根據預先設定的新聞主題,自動對相關新聞內容進行精練概括,抽取核心內容,形成摘要素材;事件脈絡類梳理素材,系統可根據預先設定的新聞主題,自動按照時間對相關新聞報道的演變發展進行梳理,形成新聞事件發展脈絡素材。
2.模板成稿
對于具有相對固定格式的短消息類新聞,例如統計局公布月度CPI數據等,智能輔助創作系統可直接自動生成新聞稿件。自動生成稿件包含兩個核心,新聞寫作模板的梳理定義、新聞內容的自動套用模板與改寫成稿。在建設中,一方面要通過大量同類新聞內容,借助深度學習能力不斷自我總結與完善,抽取形成特定類型和用途的新聞寫作模板,另一方面要通過內容自動摘要和改寫技術實現對寫作模板的調用和內容填充。
三、結語
智能輔助創作是新聞傳媒機構適應互聯網時代信息處理智能化趨勢,是人工智能技術在新聞傳媒領域的跨界融合與滲透。自動寫作可為新聞信息采寫創新注入新活力,其把記者從基礎的、過程重復的新聞信息采寫中解放出來,使他們有更多的時間采寫鮮活靈動的內容,做有獨立見解的深度分析、獨到角度的調研,從總體上進一步促進了新聞信息的生產能力。
(作者單位系研究出版社)