999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向6G的語義通信*

2021-08-03 08:33:28牛凱戴金晟張平姚圣時王思賢
移動通信 2021年4期
關鍵詞:語義文本信息

牛凱,戴金晟,張平,姚圣時,王思賢

(1.北京郵電大學泛網無線通信教育部重點實驗室,北京 100876;2.鵬城實驗室,廣東 深圳 518000;3.北京郵電大學網絡與交換技術國家重點實驗室,北京 100876)

0 引言

2019年11月3日召開的6G技術研發工作啟動會,標志著我國6G研發正式提上日程。芬蘭奧盧大學的6G白皮書[1],列出了6G的主要性能指標:峰值傳輸速率達到100 Gbps~1 Tbps;通信時延50~100 μs;超高可靠性:中斷概率小于10-6;超高密度:連接設備密度達到每立方米大于100;超大容量:采用THz頻段,大幅度提高網絡容量。總體而言,6G系統的性能指標,相比5G將提升10到100倍。

在未來第六代(6G)移動通信系統中,用戶的智能需求將被進一步挖掘和實現,并以此為基準進行技術規劃與演進布局。6G不僅包含5G涉及的人、機、物這3類服務對象,還引入第四類服務對象—靈(Genie)[2]。作為人類用戶的智能代理,靈存在于虛擬世界,基于實時采集的大量數據和高效機器學習技術,存儲和交互用戶的所說、所見和所思,完成用戶意圖的獲取以及決策的制定。由此可見,未來6G移動通信需要服務人-機-物-靈四類對象,同時滿足低時延高可靠、高頻譜效率、高密度大連接的性能要求。

自從1948年香農奠基信息論[3]以來,現代通信技術,特別是移動通信技術的發展已經逐步逼近通信理論極限,例如信源編碼技術已經逼近了信源熵/率失真函數,LDPC碼、極化碼等先進信道編碼技術已經逼近信道容量。建立在概率信息基礎上的通信系統,迫切需要技術突破與變革,才能應對未來6G移動通信的發展需求。

近年來,語義信息(Semantic Information)研究成為學術界的關注熱點。基于語義信息的數據傳輸將是非常有競爭力的一種6G候選技術。本文旨在介紹面向6G傳輸需求的語義通信技術,展望語義信息處理的應用前景。

1 語義信息論簡介

從認識論觀點看,信息分為三個層次:語法、語義和語用。經典信息論只研究語法信息,在研究范疇、研究層次與研究維度方面存在局限,從而限制了信息與通信系統性能的持續提升。擴展信息研究的層次,從語法信息深入到語義信息,將為通信系統優化提供新的研究角度,具有重要的變革意義。

1.1 語義信息概念探索

在經典信息論誕生后不久,人們就展開了語義信息論的研究。1953年,Weaver[4]考慮了信息分析的三個層次,他指出“與發射機預期含義相比,語義問題更關心接收機對收到信息含義的統一性解釋”。Weaver的先驅工作啟發了人們對語義信息的探索與研究。

Carnap與Bar-Hillel提出了語義信息論[5-6]的概念框架,試圖對傳統通信理論進行補充。他們認為語句中含有的語義信息,應當基于語句內容的邏輯概率來定義。Barwise與Perry進一步提出了場景邏輯原則定義語義信息[7]。Floridi提出強語義信息理論[8],指出Carnap語義信息理論中,語句矛盾將具有無窮大的信息。2011年,Alfonso進一步引入了類真性概念[9],對語義信息進行度量。鐘義信從信息的三位一體特征出發,對語義信息理論進行總結,證明語義信息表征具有唯一性[10]。

盡管人們一直在進行語義信息的研究探索,但與經典信息論相比,語義信息的理論框架遠未成熟,語義信息的定義與度量也尚未達成一致。最近二十年,腦科學與認知科學取得了巨大進展,特別是神經認知科學的發展,對神經網絡與深度學習理論產生了深遠影響。最近,華為公司提出的后香農時代十大問題[11],將語義信息論列為首要的基礎理論問題。人們對語義信息的度量、提取與表征的關注越來越多,這一方向有望成為6G移動通信的基礎理論之一。

1.2 語義信息度量

正如Weaver所指出的,語義信息不僅與發送者有關,更與接收者的理解有關,因此具有概率性與模糊性的雙重不確定性。事實上,具有語法與語義特征的信源均為廣義信源,既具有隨機性,又具有模糊性,單純的隨機和模糊不能全面刻畫廣義信源特征。

經典信息論建立在概率論基礎上,不考慮信息的內容和含義,它主要對信息的隨機性進行度量,稱為信息熵,確切地說,是概率信息熵。但現實生活中,最常用的便是自然語言信息,也即語義信息,其典型特征是模糊性。比如:高、矮、胖、瘦、大概、差不多等,這些語義描述是模糊變量而不是隨機變量,需要借助模糊集合論作定性和定量分析。

1972年,De Luca與Termini[12-13]首先研究了純模糊性引入的不確定性,把概率信息熵移植到了模糊集合上,給出了模糊熵的定義。他們將隨機與模糊這兩方面不確定性的聯合熵定義為總熵,但這個定義不便于推廣。1982年吳偉陵進一步推廣了模糊熵概念,提出了廣義聯合熵、廣義條件熵與廣義互信息[14],建立了語義信息的基本度量方案。

原則上,已知概率分布,選擇合適的隸屬函數,對于給定信源,就可以計算信源的概率熵與模糊熵,從而度量信源的語法與語義信息。但是由于語義信息蘊含在語法信息中,隸屬函數通常都是復雜的非線性形式,并且可能動態變化,因此式(2)的廣義熵形式只具有理論意義,難以對語義通信進行實際指導。文獻[15]提出了語義基(Seb, Semantic Base)的思想,基于神經網絡模型,提取語義特征,用于語義信息度量,避免了隸屬函數選擇的困難問題,是值得深入研究的新思路。

基于概率與模糊二重不確定性的廣義熵以及廣義互信息,對于面向6G的語義通信系統優化,具有重要的理論指導意義。但這些語義信息的定量指標分析仍然是開放問題,還需要隨著語義信息論的發展,逐步明確并加以完善。

2 語義通信系統框架

所謂語義通信(Semantic Communications),是指從信源中提取語義信息并編碼,在有噪信道中傳輸的通信方式。傳統的語法通信,要求接收端譯碼信息與發送端編碼信息嚴格一致,即實現比特級的無差錯傳輸。而語義通信與之相反,并不要求譯碼序列與編碼序列嚴格匹配,只要求接收端恢復的語義信息與發送語義信息匹配即可。由于放松了信息傳輸的差錯要求,語義通信有望突破經典通信系統的傳輸瓶頸,為6G移動通信提供新的解決思路[15]。

學術界對于語義通信已經有一些初步研究。Xie等人[16]針對文本信息傳輸提出了基于深度學習的語義通信系統(DeepSC),初步考慮了信源-信道聯合編碼,使接收端從語義角度恢復文本。針對文本信源,Farsad等人[17]設計了基于雙向長短期記憶模型(BiLSTM)的語義編解碼方案,本文作者提出了改進方案[21],可以達到滿意的語義誤詞率(WER, Word Error Rate)性能。針對圖像信源,Gunduz與Kurka等人基于卷積神經網絡,設計了多種模擬式的語義編解碼方案[18-20],具有顯著的壓縮效率,并且能夠對抗無線信道傳輸中的差錯。

如前所述,在6G移動通信的各種場景中,人-機-物-靈四類通信對象之間會產生大量不同形態的數據,各種對象之間的通信不再僅僅是傳輸比特數據,而是借助其“智能”特性實現以“達意”為目標的語義通信。智能任務復雜多變,語義通信對實現6G業務對象間的高效通信與準確控制具有重要意義,有著廣闊的研究和應用前景。

面向6G移動通信的語義通信系統如圖1所示,在發送端,信源產生的信息首先送入語義提取模塊,產生語義表征序列,接著送入語義信源編碼器,對語義特征壓縮編碼,然后送入信道編碼器,產生信道編碼序列,送入傳輸信道。在接收端,信道輸出信號首先送入信道譯碼模塊,輸出的譯碼序列再送入語義信源譯碼器,得到的語義表征序列再送入語義恢復與重建模塊,最終得到信源數據送入信宿。

圖1 面向6G的語義通信系統結構

在語義通信系統中,信道編譯碼器屬于經典通信系統,而語義提取與編碼模塊則屬于語義通信系統,經典通信信道通過統計轉移概率建模,而語義信道則通過語義標簽之間的邏輯轉移概率來建模。

語義通信與經典通信最重要的差異在于,語義編碼與譯碼模塊基于海量數據訓練的知識庫,通過深度學習網絡,提取與重建語義信息,該過程對經典信號傳輸提供強先驗知識,有效提升傳輸有效性和可靠性。在發送端,語義提取模塊基于知識庫和深度學習網絡,對信源消息提取語義特征。其中,語義提取模塊根據信源冗余特性,采用不同結構的深度學習網絡模型。例如,時序以及文本信源采用循環神經網絡(RNN)網絡模型、圖像信源采用卷積神經網絡(CNN)模型、圖數據源采用圖卷積網絡(GCN)模型。在接收端,語義綜合模塊基于知識庫和深度學習網絡,對接收的語義信息進行重建。若信源具有多模態或異構性,則語義提取編碼時還需要對多源數據進行語義綜合。收發兩端共享云端知識庫,通過數據驅動的方法賦予神經網絡特定場景下的先驗知識。

定義知識庫K,設信源消息集合為X,語義信息集合為S,語義消息碼序列構成的集合為U,信宿接收碼序列集合為V,重建語義信息集合為S′,信宿譯碼消息集合為Y。

當H(S)

與香農信道容量類似,語義信道容量定義為可以實現任意小語義誤差的最大傳輸速率:

其中,I(S;S′)為S與S′之間的互信息,H(Y)為接收端語法信息Y的熵。

基于語義信道容量或語義率失真函數的通信系統優化,為6G移動通信高譜效、高可靠通信提供了新的技術思路。但是,如前所述,現有語義信息論研究在語義信息度量與優化指標方面還沒有明確結論。因此,語義信息熵、語義信道容量、語義率失真函數建模與評估還是開放問題,需要進一步深入研究。

3 語義通信初步結果

在語義通信系統結構的基本框架下,本文針對典型文本和圖像信源,采用不同的語義編解碼器,根據語義評價指標,設計對應的語義通信系統結構。

3.1 文本信源的語義編碼傳輸

對于文本信源,傳輸的目的是傳遞文本表達的內容及含義,而文本的組織方式,如助詞、連接詞、標點符號的使用是實現通暢且符合語法規則表達文本內容的手段。因此文本信源除具有統計冗余外,還含有額外的語義冗余。文本信源可采用雙向長短期記憶(BiLSTM)神經網絡模型進行語義提取與關聯建模[17,21],如圖2所示:

圖2 基于BiLSTM網絡的文本語義編碼傳輸示意

文本語義編碼傳輸的評估指標包括:

(1)誤詞率(WER)。誤詞率可以用歸一化Levenshtein距離(編輯距離)評估。

(2)雙語評估替換分數(BLEU, Bilingual Evaluation Understudy)可評估任意兩段文本之間的差異性。連續n個單詞(n-gram)準確率越高,恢復語義越準確。BLEU為n-gram準確率的加權得分,定義如下:

其中Pn為n-gram的準確率,wn為權重系數。

圖3給出了在占用相同帶寬條件下,傳統編碼與文本語義編碼在AWGN信道下的傳輸性能對比,其中文本信源采用BiLSTM模型進行編碼,信道編碼采用LDPC碼,碼率R=0.75。子圖(a)為WER性能,子圖(b)為BLEU分數。如圖3(a)所示,語義編碼傳輸方案的誤詞率遠低于傳統信源信道編碼方案,如Huffman編碼,定長5 bit編碼與RS編碼。圖3(b)給出了文本語義編碼在不同句長條件下的平均BLEU分數和長句(30詞)的重建分數。由圖可知,與傳統的Huffman+RS編碼相比,語義編碼傳輸的BLEU分數有大幅度提升,特別是在低信噪比條件下,能顯著改善傳輸可靠性。

圖3 傳統編碼與文本語義編碼的性能對比

下面給出文本語義編碼在AWGN信道中傳輸的一個樣例:

原始文本:I hope that even more study courses will be set up which offer this as an integral part of the course.

5bit編碼+RS編碼重建文本:i t!pe dhat evmn moqe qtudy aourses will ba gt up which offer dfis as an integzal part of xgm cpurse.

語義編碼重建文本:I hope that even more study reading can be applied, which already this as an integral part of the course.

對比原始文本與5 bit編碼+RS編碼重建文本、語義編碼重建文本可知,由于傳統編碼存在差錯,因此重建文本存在語義錯誤。而語義編碼能夠很好地對抗信道傳輸差錯,其重建文本與原始文本的含義一致。

3.2 圖像信源的語義編碼傳輸

圖4 圖像語義編碼傳輸框架

將語義提取與編碼網絡、語義分析與綜合網絡級聯信道編譯碼模塊在無線信道中進行聯合訓練,采用隨機梯度下降算法迭代更新網絡的參數,網絡的損失函數L建模為:

其中α和β用于權衡兩種失真。

模型的訓練集采集自真實工業場景的監控攝像頭,分辨率為256×256,訓練500 000次迭代后使用1 080p分辨率進行微調。訓練過程固定學習率為0.000 2,當loss穩定時對學習率進行一次0.1倍的衰減。在幀內編碼模式(全I幀)下與H.264經典編碼方案進行比較,信道編碼為LDPC碼。由于經典的逐像素比較指標如峰值信噪比(PSNR)、多尺度結構相似度(MS-SSIM)[22]往往與用戶的真實感知相去甚遠,本文采用基于深度學習的圖像相似度指標LPIPS[23]用于評估圖像的感知相似度,仿真參數配置如表1所示:

表1 仿真參數配置

由表可知,H.264編碼級聯LDPC信道碼方案雖然在PSNR評價指標上占據優勢,但在用戶感知相似度(LPIPS)接近的情況下,語義編碼方案的編碼速率僅有H.264編碼方案的1/5,因此前者相比后者,能大幅度降低傳輸帶寬開銷,從而顯著提升了頻譜效率。

圖5給出了AWGN信道下兩種編碼方案的重建樣本對比。可以看出H.264+LDPC重建圖像(子圖(c))產生了差錯傳播現象,而語義編碼傳輸方案(子圖(b))對信道差錯更魯棒,且重建質量與在主觀感受上沒有差距。

圖5 H.264編碼與圖像語義編碼對比示例

4 結束語

本文簡述了語義信息論以及語義編碼通信技術的基本原理。語義編碼通過對信源語義信息的深度挖掘與充分利用,有望突破經典信息論的約束,為6G移動通信的高頻譜效率與高可靠傳輸提供新型解決思路。

目前,語義通信技術仍然在快速發展中,語義信息論有眾多基本概念與基礎問題亟待討論與完善,針對多種信源媒體特征的語義編譯碼方案層出不窮,但編碼方案的優化設計與適用場景還需要深入探討。總而言之,面向6G的語義通信技術,是一個新的研究領域,存在大量的理論與應用問題,需要學術界同仁共同推動完成。

猜你喜歡
語義文本信息
語言與語義
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
認知范疇模糊與語義模糊
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
主站蜘蛛池模板: 免费无码又爽又黄又刺激网站 | 久久久久亚洲精品成人网| 97精品伊人久久大香线蕉| 女人av社区男人的天堂| 第一页亚洲| 丁香亚洲综合五月天婷婷| 欧美成人精品高清在线下载| 精品午夜国产福利观看| 久久精品66| 福利视频久久| 天天综合天天综合| 无码有码中文字幕| 中文字幕乱码二三区免费| 亚洲高清在线天堂精品| 亚洲人成在线免费观看| 97亚洲色综久久精品| 四虎永久在线精品国产免费| 国产精品美女网站| a级毛片免费看| 九色在线观看视频| 日韩国产精品无码一区二区三区| 91视频精品| 最新国产网站| 国产午夜无码专区喷水| 国产成人精品午夜视频'| 欧洲欧美人成免费全部视频| 国产真实乱子伦视频播放| 婷婷五月在线| 国产成人精品三级| 国产一级做美女做受视频| 成人一级黄色毛片| 久久国产精品77777| 亚洲娇小与黑人巨大交| 亚洲VA中文字幕| 国产在线一区二区视频| 在线观看视频99| 毛片免费网址| 国产精品毛片一区| 国产视频久久久久| 亚洲欧美一级一级a| 亚洲无码37.| 美女内射视频WWW网站午夜| 国产全黄a一级毛片| 丰满人妻被猛烈进入无码| 久久亚洲国产一区二区| 国产9191精品免费观看| 国产在线观看高清不卡| 国产黄在线免费观看| 91精品伊人久久大香线蕉| 久久永久精品免费视频| 制服无码网站| 亚洲无码免费黄色网址| 欧洲高清无码在线| 国产办公室秘书无码精品| 久久精品电影| 国产精品9| 日本影院一区| 99精品欧美一区| 国产美女无遮挡免费视频| 国产三级成人| 久久综合婷婷| 日韩东京热无码人妻| 国产成人综合亚洲欧美在| 精品国产美女福到在线不卡f| 亚洲午夜久久久精品电影院| 国产丝袜91| 亚洲一区国色天香| 中国一级毛片免费观看| 免费看a级毛片| 国产亚洲欧美日韩在线观看一区二区| 亚洲久悠悠色悠在线播放| 最新精品久久精品| 亚洲免费人成影院| 亚洲精品视频网| 一级看片免费视频| 91久久国产综合精品女同我| 中文字幕亚洲电影| 精品无码国产一区二区三区AV| 免费啪啪网址| 亚洲国产中文欧美在线人成大黄瓜 | 国语少妇高潮| 欧美综合区自拍亚洲综合天堂|