999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

文本詞向量與預訓練語言模型研究

2020-09-03 00:57:38徐菲菲馮東升
上海電力大學學報 2020年4期
關鍵詞:單詞詞匯文本

徐菲菲, 馮東升

(上海電力大學 計算機科學與技術學院, 上海 200090)

自然語言是經人類抽象發展而來的數據,含有豐富的語義信息,計算機無法直接識別。因此,自然語言處理的首要步驟就是將文本等非結構化的字符數據進行字詞編碼,轉換為可計算的數值數據,從而確定文本和數字空間的對應關系。

文本向量化應當盡可能地包含原空間信息,若在空間映射時丟失部分信息,那么后續的處理任務中也不可能再重新獲取。最早的研究方法是將文本劃分為獨立的單詞,每個單詞被表示為詞匯表中的一個索引,或單詞對應的索引位置為1,其余為0的獨熱編碼向量。該方法雖然簡單,但單詞間無相似性,且沒有聯系,也不包含任何語義信息。另外,獨熱編碼是稀疏向量,易造成維數災難。針對以上問題,有人提出了詞的分布式表示法——詞向量。詞向量是一個維度較低且稠密的向量,每個維度上都有實數。在詞向量與神經網絡結合后,便廣泛地應用于自然語言處理中,例如命名實體識別、實體抽取、閱讀理解和機器問答等。

在利用詞向量解決了數據稀疏和計算復雜的問題后,研究人員開始運用詞向量進行自然語言處理的預訓練。自然語言處理領域的預訓練是受到圖像處理領域預訓練的啟發,目前已成為自然語言處理領域的熱門研究方向。一般在開始訓練模型時需要隨機初始化參數,但是存在兩個方面的問題:一是如果訓練的數據集不夠大,則有可能不足以訓練復雜的網絡;二是模型隨機初始化參數會使訓練速度變慢,即收斂速度變慢。……

登錄APP查看全文

猜你喜歡
單詞詞匯文本
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
在808DA上文本顯示的改善
本刊可直接用縮寫的常用詞匯
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
看圖填單詞
看完這些單詞的翻譯,整個人都不好了
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
本刊一些常用詞匯可直接用縮寫
主站蜘蛛池模板: 国产在线观看一区精品| 国产一区二区影院| 啊嗯不日本网站| 亚洲美女一级毛片| 国产美女叼嘿视频免费看| 四虎精品国产AV二区| 最新国产成人剧情在线播放| 久久久久亚洲av成人网人人软件 | 怡春院欧美一区二区三区免费| 茄子视频毛片免费观看| 国产成人一区在线播放| 97视频精品全国在线观看| 国内精品视频| 免费无码AV片在线观看中文| 国产一区二区网站| 爽爽影院十八禁在线观看| 国产极品美女在线播放| 亚洲欧洲日韩综合色天使| 伊人久久久久久久久久| 青草精品视频| 91在线播放国产| 91口爆吞精国产对白第三集| 狠狠v日韩v欧美v| 日韩二区三区| 中文字幕中文字字幕码一二区| 日韩小视频在线播放| 91视频区| 亚洲国模精品一区| 亚洲欧洲国产成人综合不卡| 亚洲精品第五页| 99精品视频九九精品| 五月婷婷亚洲综合| 99精品伊人久久久大香线蕉 | 色综合激情网| 亚洲欧美自拍一区| 欧美伦理一区| a欧美在线| 亚洲中久无码永久在线观看软件| 日韩欧美网址| 一级香蕉人体视频| 亚洲精品自产拍在线观看APP| 在线看国产精品| 亚洲中文字幕在线观看| 无码综合天天久久综合网| 国产欧美日韩va另类在线播放| 亚洲综合欧美在线一区在线播放| 亚洲视频a| 亚洲床戏一区| 欧美日韩在线第一页| 九色最新网址| 97se亚洲综合在线| 国产粉嫩粉嫩的18在线播放91 | 五月婷婷导航| 国内精品视频| 国产日本视频91| 亚洲三级视频在线观看| swag国产精品| 午夜无码一区二区三区| 大香伊人久久| 日韩在线第三页| 国产成人综合网| 欧美日本在线观看| 日本人妻丰满熟妇区| 成人综合在线观看| аⅴ资源中文在线天堂| 日本高清在线看免费观看| 婷婷久久综合九色综合88| 十八禁美女裸体网站| 动漫精品啪啪一区二区三区 | 啦啦啦网站在线观看a毛片| 久久永久免费人妻精品| 亚洲性一区| 99无码中文字幕视频| 伊人AV天堂| 91精品国产自产91精品资源| 亚洲乱强伦| 四虎永久免费网站| 日韩毛片在线播放| 日本亚洲国产一区二区三区| 在线无码私拍| 五月天久久综合国产一区二区| 欧美日韩国产在线观看一区二区三区|