王曉雪
(中國石油報社,北京 100011)
隨著技術的不斷進步,人工智能(Artificial Intelligence,AI)和語音識別技術在新聞行業發揮越來越重要的作用。尤其是新聞采訪和訪談,相較過去,不僅效率有了極大的提高,而且質量得到了大幅提升。AI 和語音識別技術的應用,拓寬了新聞采訪和訪談的工作邊界,讓新聞采訪和訪談更加智慧化。
AI 指機器學習、深度學習、自然語言處理及計算機視覺等一系列技術和算法的綜合應用。通過這些技術和算法,計算機可以模擬人類的智能行為。語音識別技術指將人類語音轉換為計算機可處理的文本形式的技術,是自然語言處理的重要組成部分。
AI 和語音識別技術在新聞采訪和訪談中應用的優勢主要體現在4 個方面。第一,提高效率,可以實現實時語音轉寫和文本摘要,大大提高了采訪和訪談的效率。第二,增加可訪問性,可以幫助聽覺障礙人士通過文字轉寫來獲取訪談內容,從而增加他們對新聞報道的了解和參與。第三,降低成本,可以替代繁重的人工工作,以此降低人力成本[1]。第四,數據挖掘和分析,可以發現隱藏的模式、趨勢,能更好地了解受眾需求,提供更加精準和個性化的新聞報道[2]。
AI 和語音識別技術在新聞采訪和訪談中的關鍵應用主要是指智能問答和交互系統,主要采用了語音識別技術、自然語言處理技術以及機器學習算法等技術,作用是使人與機器通過提問、回答、互動的方式進行信息交流和溝通。文章后續將基于智能問答和交互系統,分別對3 種技術在新聞采訪和訪談中的應用進行闡述。智能問答和交互系統的實現過程如圖1 所示。

圖1 智能問答和交互系統的實現過程流程圖
3.1.1 語音識別技術的基本原理
語音識別技術的基本工作過程主要有6個步驟。第一,音頻錄制。首先使用麥克風或其他音頻設備錄制待識別的語音,將語音信號轉化為數字音頻數據。第二,預處理。對錄制的語音信號進行預處理,主要是針對語音信號進行去噪、增強等操作,通過這些操作提高識別的準確性。第三,特征提取。根據語音信號的時域和頻域特征,通過梅爾頻率倒譜系數、線性預測編碼等方法提取出能夠表征語音的特征向量。第四,聲學模型訓練。將特征向量與對應的文本標注進行配對,并構建訓練數據集。然后對聲學模型進行訓練,學習語音特征與文本之間的關聯。第五,語音識別。將待識別的語音信號進行預處理和特征提取,通過聲學模型將特征向量映射為概率分布序列。使用語言模型計算各個可能的文本序列的概率,并通過搜索算法找到最有可能的文本序列作為識別結果。第六,后期處理。主要針對語音識別結果進行錯誤修正、斷句分詞等操作。
3.1.2 語音識別技術在新聞采訪中的具體應用
在新聞采訪中,智能問答和交互系統是當前十分新穎的應用,語音識別技術在該應用中的作用十分關鍵。在新聞采訪智能問答和交互系統的使用過程中,語音識別技術主要支持語音提問,用戶可以通過語音向智能系統提出問題,無須輸入文字,方便快捷。同時支持語音回答,智能系統可以通過語音生成技術將回答轉化為語音,以口頭形式回復用戶的問題。語音識別技術還可以實現多輪對話,用戶可以通過語音進行連續的提問和回答,實現更自然、流暢的交互體驗。語音識別技術還可以通過用戶發出的語音指令來控制智能系統的操作,如播放音樂、調整音量、發送消息等。除此之外,該系統能通過語音識別技術根據用戶的語音指令和回答內容,提供個性化的服務和建議,如推薦電影、點播音樂等。在新聞采訪過程中,語音識別技術可以分析用戶的語音特征,識別情感狀態,并據此進行相應的回應或建議,改善用戶體驗。
3.2.1 自然語言處理技術的基本原理
自然語言處理技術的基本工作原理主要分為基礎任務、復雜任務兩類。基礎任務主要包括分詞、詞性標注及句法分析3 個功能。分詞主要是將文本劃分為單個的詞或標記,形成詞匯單位;詞性標注主要是確定每個詞在上下文中的詞性,句法分析主要是確定句子中各個詞之間的語法關系。復雜任務主要包括語義分析、情感分析、實體關系抽取、機器翻譯及文本生成這5 個功能。語義分析指理解句子的意義和語義關系,情感分析指識別文本中的情感傾向,如正面、負面、中性等;實體關系抽取是指從文本中提取出實體之間的關系,機器翻譯指基于相關模型或語言資料庫的訓練,將一種語言的文本自動翻譯成另一種語言的文本[3]。
3.2.2 自然語言處理技術在新聞訪談中的具體應用
在新聞訪談中,自然語言處理技術同樣是智能問答和交互系統的關鍵技術。在智能問答和交互過程中,自然語言處理技術能夠幫助系統理解被采訪者的問題,并識別其中的語義和意圖,有助于更好地理解被采訪者的觀點和立場,推動對話的深入交流。自然語言處理技術可以實現在采訪過程中抽取關鍵信息,進行總結,大大提高了采訪過程的效率。自然語言處理技術還可以進行情感分析。這里的情感分析與語音識別的情感分析存在區別。自然語言處理是將被采訪者的語音轉變成文字,通過文字進行情感分析,有助于探測被采訪者回答中的情感傾向,了解其態度和情緒。除此之外,自然語言處理技術可以對采訪過程的語音進行實時翻譯,并生成相關的字幕,輔助在采訪過程中進行針對性提問。
3.3.1 機器學習算法的基本原理
機器學習算法的基本工作主要分為5 個步驟。第一,數據收集和預處理,收集和準備用于訓練算法的數據。第二,特征選擇和提取。在機器學習中,數據通常包含多個特征或屬性。特征選擇和提取的目標是從原始數據中選擇最相關的特征,或通過轉換和組合特征來提取更有信息量的特征。第三,模型選擇和訓練。根據問題的性質和數據的特點,利用線性回歸、決策樹、支持向量機及神經網絡等模型,通過訓練數據對模型進行訓練,使其能夠正確預測或分類輸入數據。第四,模型評估和調優。使用測試數據集對訓練好的模型進行評估,以了解其在未知數據上的性能表現。如果模型的性能不理想,可以通過調整模型的參數或改進特征工程等方式進行優化。第五,模型應用和預測。將模型應用于實際問題,給定新的輸入數據,模型可以生成相應的預測結果或分類結果[4]。
3.3.2 機器學習算法在新聞采訪和訪談中的具體應用
無論是在新聞采訪還是訪談過程中,智能問答和交互系統的核心技術都是機器學習算法。機器學習算法通過大量的語言數據進行學習和訓練,使得智能問答和交互系統可以快速、自動地回復用戶的問題。這個回答不是簡單的回答,而是經過語言模型深度學習、經過思考后的回答,最終通過語音識別技術把回答內容用語言表達出來。不僅如此,它也可以用于情感分析。這里的情感分析與語音識別技術、自然語言處理技術的情感分析不同,智能問答和交互系統可以根據被采訪者的態度和情緒,及時、智能地調整溝通提問的方式,提出的問題也會變得更加深入[5]。
2019 年兩會期間,中國日報社聯合百度公司開發了一款名為“智能記者”的AI 機器人,可以通過語音識別、自然語言處理和智能問答等技術,實現對代表的自動采訪。“智能記者”可以自動化地提問、記錄、生成文本和摘要等,大大減輕了記者的工作負擔,節省了采訪時間。
AI 和語音識別技術在新聞采訪和訪談中的應用具有廣闊的發展前景。未來的語音識別技術將更加注重理解和推斷訪談內容的語義。它們將能夠更準確地識別并理解說話者的意圖、情感和上下文,從而提供更深入和全面的訪談結果。隨著語音識別技術的廣泛應用,隱私保護和安全性將成為關注的焦點,未來還將注重確保訪談內容的安全傳輸和存儲,以及對用戶個人信息的保護。AI 與語音識別技術在新聞采訪和訪談中的應用在未來的發展具有潛力,將為新聞業帶來更多創新和發展。
隨著AI 與語音識別技術的不斷發展和進步,新聞采訪和訪談將迎來更多創新應用。這些應用會使得新聞報道更加高效、準確和智能化,進一步推動新聞行業的智慧化發展。