999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“5G+AI”環境下個性化內容生產技術應用研究

2022-08-19 13:36:00孫甲飛馮恩達
西部廣播電視 2022年13期
關鍵詞:文本內容情感

孫甲飛 馮恩達 邱 夕

(作者單位:新華報業傳媒集團)

1 研究背景

2019年6月6日,我國工業和信息化部向中國聯通、中國電信、中國移動和中國廣電發放了5G商用牌照,標志著我國的5G技術進入了全面商用化的新時代。5G通信技術高速率、高帶寬、低時延的特性可以大大提升現有信息傳輸的質量與速度。同時,其泛在網的特點使得業界對“萬物皆媒”的設想有了實現的可能。截至2019年8月底,中國5G使用人數已突破1億人。與此同時,隨著5G技術的普遍運用,用戶閱讀新聞的習慣也發生了轉變[1]。

依托于云計算、大數據、人工智能等技術領域里的機器深度學習、自然語義理解和推薦系統等應用技術的發展,基于算法的新聞生產日益興起,寫稿機器人成為各大媒體內容生產隊伍中的新武器。寫稿機器人最早出現在2009年,一款名為StatsMonkey的人工軟件完成了一篇關于美國職業棒球大聯盟季后賽的新聞稿,速度完勝人類記者,人工智能(Artificial Intelligence,AI)自動寫稿技術自此進入人們的視野。之后,洛杉磯時報、美聯社等媒體都相繼 引入了新聞智能平臺。我國在這方面起步較晚,但是發展速度迅猛。2015年9月,騰訊的寫稿機器人Dreamwriter在騰訊財經頻道發布了一篇名為《8月CPI同比上漲2.0% 創12個月新高》的報道,引起了行內不小的反響,此舉可謂開啟了國內新聞界利用機器人寫稿的先河。隨后,新華社的“快筆小新”、南方報業集團的“小南”、字節跳動的“Xiaomingbot”、錢江晚報的“小冰”等一系列基于人工智能技術應用的寫作機器人也相繼投入使用,且內容產出能力驚人。

2 個性化內容生產技術的應用

2.1 適應高速內容生產要求的熱點捕捉方法

5G技術的廣泛應用將帶來媒介的敘事話語權的轉變,話語權正隨著媒介生產關系的改變而改變,以前處于價值鏈末端的媒體消費者借助網絡和新媒體技術,逐漸擺脫被動的消費地位,向價值鏈中端甚至上游環節轉移,變成主動的參與者、生產者,他們不再是價值的消耗者,而是價值的創造者[2]。網絡上將會有比現在數量級大得多的媒體信息,要從這些信息中抓取熱點,再組織成熱點新聞報道,就對熱點捕捉的效率提出了更高的要求。

2.1.1 改良捕捉算法提高海量數據抓取效率

目前,比較流行的中文信息歸納方法是基于劃分或基于密度的聚類方法。針對新聞資訊海量的數據量,以及新聞熱點捕捉分類明確、時效性較高的要求,本文推薦采用搜索能力強,且快速收斂的經過改良的K-MEANS算法捕捉文本熱點。在聚類之前,可以選用針對文本特征抽取且算法簡單、計算效率高的TF-IDF算法,對大量資訊數據降維,進一步提升熱點捕捉、數據挖掘的效率。

2.1.2 優化聚類算法快速挖掘新聞熱點

考慮到傳統的TF-IDF算法只根據詞頻和文本頻率進行特征抽取,而忽略了詞匯其他屬性對于文本的貢獻,所以為了提高效率可以采用優化的TF-IDF算法。優化的TF-IDF算法是在傳統的TF-IDF算法理論基礎上,對于特征詞符號、詞匯詞性、出現位置及詞匯長度等特征添加權重。優化的TF-IDF算法基于多因子權重選擇,可以更具針對性、更高效地實現新聞特征向量抽取。同時,傳統聚類算法結果常常收斂于局部最優,且由于聚類中心初始選取容易產生聚類干擾。針對這一問題而構造的改進果蠅優化算法(Ameliorated Fruit Fly Optimization Algorithm,AFOA),通過設定文本編碼、優化fitness適應值計算、調整個體搜索步長及計算群體適值度方差,避免了傳統聚類算法的缺點。使用AFOA算法結合大數據技術,可以實現熱點新聞話題的快速發現與挖掘[3],生成熱點卡片輔助采編寫稿。

2.2 帶有溫度感的內容生成方法

2.2.1 結合溫度采樣的自動內容生成

對于給定的選題,可以通過LSTM長短記憶算法來完成文本的自動生成(如圖1所示)。LSTM是一種深度學習算法,它能夠對文本的統計潛在空間進行機器學習,對當前標記詞的下一個標記進行建模和訓練進而得到語言模型[4]。一旦訓練得到這樣的字符級神經語言模型,即可從中采樣,利用循環神經網絡,生成與訓練數據具有相似特征的文本。

在研究中,筆者在模型中輸入選題,即模型的條件數據,模型會循環生成接下來的文本內容。生成的輸出文本將被循環添加作為LSTM層的輸入。其中通過對語料庫中的詞匯進行softmax得到概率分布來生成輸出。由此,循環可以根據實際需要生成任意長度的文本序列。通過對語料庫的篩選限制,可以在一定程度上對機器生成內容的文風進行約束,從而避免生成和公用機器寫稿平臺文風極度相似的新聞稿件。

在生成文本的過程中,生成下一個輸出的采樣策略尤其關鍵。經研究,貪婪采樣的概率分布的熵最小,會得到預測度最高的結果,但這樣形成的文本重復詞匯較多且不連貫。與之相反的純隨機采樣概率分布的熵最大,會得到最有創造性的結果但采樣過程中無法控制隨機性的大小。因此引入softmax溫度參數temperature∈[0,1]來表示采樣分布的熵的大小,用于對模型softmax輸出進行加權,得到合適的概率分布。更低的溫度參數會產生文風更確定的文本,而更高的溫度會生成更具創造性也更不可控的文本(當溫度參數temperature=1時,甚至可以創造出新的詞匯)。

2.2.2 基于情感分析的文本采納

情感分析又稱為意見挖掘,可以自動分析文本中包含的情感,是自然語言研究的重要領域之一[5]。其基本過程是通過抽取計算文本中包含情感的詞匯,得到該文本的正負情感導向。在寫稿機器人的應用中,對于完成的稿件,可以使用情感分析識別挑選合適當前情感導向的文本。

在實際應用中,可以在使用NLTK自然語言工具對選題進行中文分詞后,將得到的情感詞匯使用SentiWordNet基于WordNet進行情感分析。SentiWordNet將詞林中的每個詞條對應不同的情感值(Sentiment Score of the Meaning,SSM)。目前,詞庫包含十多萬條記錄,每條記錄都由6部分組成,即詞性分類、詞條ID、正向情感分值、負向情感分值、同義詞詞條名、注釋。在SentiWordNet中,同一個詞可以包含不止一種詞性,如名詞、形容詞、副詞和動詞等。而在同一詞性中,一個詞也可以有不同種含義。不同的詞性和含義將對應不同的情感值。同時,每一種含義都有對應的指數值(IndexNum),1/IndexNum即該詞義的權重系數。對于某詞第i種含義的情感值有:

考慮該含義權重系數,由此得到情感得分:

在對稿件文本進行情感計算之后,可以根據其情感傾度,選擇情感導向更合適的文本。例如:對于期望具有正面情感傾向的稿件,可以挑選情感得分更趨近1的文本;對于期望描述客觀中立的稿件,可以挑選情感得分更趨近0的文本,篩去情感得分為負的文本。鑒于此,可以利用情感分析對LSTM自動生成的稿件進行篩選。

2.3 個性化內容訂制

2.3.1 從訂閱到訂制

進入Web 2.0時代以來,網絡上的信息開始和瀏覽者有了交互,信息訂閱功能的加入使某一位作者或者欄目有新的內容發布時用戶可以收到提醒并可以快速瀏覽到指定內容。之后“訂閱”理念慢慢衍生為現在普及率很高的“關注”功能,成為現在互聯網內容與用戶交互的基礎手段之一。而訂閱和關注都是需要用戶作為興趣的主動暴露者來實現的內容定向推送。隨著科技的進步,用戶呈現出了越來越“懶”的趨勢。字節跳動等公司利用大數據技術和機器學習算法,根據機器對內容的理解、用戶畫像、受眾情境等信息,預估并在應用程序中推送用戶可能感興趣的新聞內容[6]。

基于人工智能等技術進行個性化推送現在已經得到各大媒體的廣泛應用,但目前主要是把互聯網上與用戶匹配度較高的內容推送給用戶。隨著“5G+AI”在媒體行業的深度應用,智能引擎可以在5G網絡快速回傳大量實時用戶數據的情況下通過智能算法利用用戶畫像、用戶場景等信息幫助內容生產者發現選題、確定事件切入點,拓展報道的廣度、深度,預判內容的傳播效果,從而根據內容推送前置指導內容生產,實現內容定制化。

2.3.2 適應交互式閱讀的內容定制生產

《2019年中國網民新聞閱讀習慣變化的量化研究》基于3萬人的問卷調查得出結論:新媒體已經成為我國公眾獲取新聞信息的主要渠道。其中騰訊微信是用戶最多、最廣泛的新聞信息獲取平臺[7]。微信正以其社交屬性與強聯系的傳播特點成為目前和未來的主要傳播媒介,可以適應此類帶有強聯系、社交屬性的渠道傳播、閱讀的內容,極有可能成為“5G+AI”時代新聞內容的爆款。

目前,寫稿機器人僅用0.3秒就可以生成一篇新聞稿件,這為交互式新聞生產提供了速度上的保證。在此基礎上,使用目的導向的對話機器人模型,在人機對話的過程中逐步收斂用戶需求,便可實現快速的、個性化的交互式新聞生產。例如:每年“兩會”都會有大篇幅的報道稿件,但不同用戶關注的點很可能不一樣,新媒體平臺就可以通過對話過程聚焦用戶的不同關注點,匹配智能媒資庫中的編目數據實時生成內容,將圖、文、視音頻通過交流的形式傳遞給受眾。

任務導向的對話機器人系統在指定的自然語言生成語料庫中預訓練后,使用SC-LSTM模型進行編碼,可以幫助用戶通過交互模式更準確地獲取期望的資訊[8]。任務導向的對話機器人實現交互式新聞的過程如圖2所示。

3 結語

人工智能及其機器人寫作技術正在蓬勃發展,伴隨著5G的發展,低延時、高速度的特性在熱點捕捉方面得到充分利用,由此機器化內容生產和信息推送可以加入溫度感,加入深交互,使得內容生產更加個性化,進而推動個性化內容生產技術的應用和發展。

猜你喜歡
文本內容情感
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 99在线观看视频免费| 伊人色天堂| 亚洲浓毛av| 91青青视频| 欧美一区二区精品久久久| 视频一本大道香蕉久在线播放 | 老司机久久99久久精品播放| 天天色综网| 99精品一区二区免费视频| 91国内在线观看| 日韩第八页| AV天堂资源福利在线观看| 中文字幕丝袜一区二区| 熟女视频91| 伦精品一区二区三区视频| 精品国产成人高清在线| 亚洲福利一区二区三区| 波多野结衣视频网站| 久久a毛片| 91探花在线观看国产最新| 免费一级成人毛片| 日本高清视频在线www色| 国产高清无码麻豆精品| 黄色免费在线网址| 亚洲系列无码专区偷窥无码| 中文字幕调教一区二区视频| 大陆国产精品视频| 国产区精品高清在线观看| 91久久夜色精品国产网站| 九九线精品视频在线观看| 在线观看热码亚洲av每日更新| 亚洲国产精品VA在线看黑人| 99久久无色码中文字幕| 色综合激情网| 亚洲成a人在线观看| 久久大香伊蕉在人线观看热2| 国产精品亚洲一区二区三区在线观看| 国产91特黄特色A级毛片| 日韩在线2020专区| 日韩av手机在线| 美女国内精品自产拍在线播放| 国产91丝袜在线播放动漫 | 日韩精品成人在线| 国产一区成人| 一级片一区| 无码中文字幕乱码免费2| 欧美狠狠干| 亚洲精品视频在线观看视频| 91久久大香线蕉| 18禁高潮出水呻吟娇喘蜜芽| 日韩欧美国产综合| 四虎亚洲精品| 精品国产自在现线看久久| 色综合久久无码网| 日韩毛片免费观看| 一区二区欧美日韩高清免费| 日韩无码一二三区| 久久狠狠色噜噜狠狠狠狠97视色 | 国产三级精品三级在线观看| 亚洲高清在线天堂精品| 99ri精品视频在线观看播放| 日本不卡在线播放| 婷婷色一二三区波多野衣| 国产熟睡乱子伦视频网站| 中国成人在线视频| 欧美人与性动交a欧美精品| 精品国产中文一级毛片在线看| 国产区网址| 国产精品永久免费嫩草研究院| 91亚瑟视频| 特黄日韩免费一区二区三区| 亚洲区欧美区| 日韩在线第三页| 精品乱码久久久久久久| 91丝袜乱伦| 亚洲综合九九| 亚洲人妖在线| 88av在线| 欧美国产综合色视频| 亚洲色图综合在线| 最新日本中文字幕| 国产精品主播|