999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于領域本體的文本語義挖掘方法現狀分析

2018-02-01 15:04:16
時代農機 2018年3期
關鍵詞:語義分類文本

劉 鋒

(黑龍江工業學院,黑龍江 雞西 158100)

語料庫技術又分為兩種方法,分別為主題建模和文本分類。主題模型用于發現隱藏大型數據模型,該技術可以有效降低語料庫的維度;文本分類在組織大量無序文本中起著至關重要的作用。

1 主題建模方法研究

主體建模方法主要分為潛在語義分析(蘊SA)和概率潛在語義分析(P蘊SA)。

蘊SA通常被用于信息檢索,在該方法中,主要是分析和管理大數據,從而提高了算法的效率。利用該方法可以創建多語言語義空間,不需要經過查詢翻譯機制,就可以直接使用另一種語言編寫的文檔,同時在多個數據集上實現了該系統,取得了良好的效果。為了進一步查看語料庫,引入可視化技術,在該技術中使用一個二維文件圖冊,這種文件圖冊可以更好地使數據進行可視化。針對較低維度的語義空間又該如何描述呢?這是可以引入多維文檔分析方法,方法包括一個訓練集的樣本協方差矩陣,這有助于從文檔中有效地挖掘本地信息,并使用術語關聯和空間分布,該分析模型在精度和計算效率方面效果明顯。在目前的情況下,許多研究人員使用蘊SA進行特征提取,針對質量和參與數量分別進行特征提取。但是由于參與人數太多,產生了信息超載。這種特征提取的方法只能有效解決其中一個問題。

概率潛在語義分析(P蘊SA)使用生成潛在類模型來執行概率混合分解,這一模型可以應用于各個領域,但有些人認為該方法對不同類型的文本搜索的有效性產生了質疑,最后通過實驗結果表明P蘊SA的性能優于標準蘊SA方法。為了解決新的問題,P蘊SA方法也在不斷改進,當前有兩個問題是比較嚴峻的,其一是如何使用GPU上有限的內存來處理較大的文本數據,其二是如何使用GPU的功能加速??梢圆捎谜龢拥姆椒▉磉M行解決:首先使用矩陣向量乘法加速算法;其次,采用同樣的過程以節省空間和降低復雜度;最后使用并發執行加速進程。

2 文本分類技術

支持向量機(SVM)該方法的總體思路是將輸入向量映射到高維特征向量空間,并構造一個線性決策面。通過支持向量機試圖找到解決兩組分類問題的方法,其中為了能夠有效的分離一組對象,引入了超平面,該模型解釋了該方法可以減少在標準歸納和轉換設置中標記訓練實例的需要,用一個版本空間概念給出了算法的理論解釋,在實驗驗證中,用一個個低次多項式數據,并嘗試映射和檢測實現問題,經過采用了快速線性SVM方法,進行集中于快速訓練和測試,實驗結果表明這對某些大型數據集是有用的。針對上述問題,有些學者提出了一種基于SVM的先進多類實例選擇方法,該方法提高了SVM的熟練度和準確性,通過仿真實驗結果表明,該模型提高了支持向量機的分類精度,比基于鄰域的模式選擇(NPPS)算法更好。同時也有學者推薦了一種將SVM集成到基于上下文相關和上下文無關的用戶首選項分組的策略,該策略支持向量機,有助于提高建議的準確性,并給出更精確的預測結果,對實際服務數據進行了實驗研究,驗證了模型的有效性。

最近鄰居(KNN)法是一種新的降維方法。利用矢量聚合物理論和特征提取方法,減少了空間的維數。由于web中的文檔分布不均勻,為了解決不均勻的問題,有些學者提出了基于密度的最近鄰居法,該方法對大量非結構化分布式文檔具有更好的效果。也可以采用加權法進行文本分類,以分類的速度、準確性和質量作為評價的依據,基于用戶的行為,通過點擊流數據而形成的自動實時推薦系統,而在實施過程中,他們還訓練識別并匹配數據集市中類似類的點擊流數據,并引入了一個叫做粗糙集的新概念,將數據集劃分為兩個文本向量空間,即特定的和不確定的區域。對于某些部分,他們直接判斷其類別,對于不確定的區域,它們通過基于關聯分析的KNN來確定向量的類型,通過該方法的驗證,表明該算法提高了文本分類的效率。

樸素貝葉斯(NB)方法解決了系統問題以及與多項式模型相關的問題。通過對樸素貝葉斯方法的研究,提出了一些改建意見,如文本轉換,解決不均勻訓練數據的問題,規范分類權重等。這種方法以機器學習為基礎,采用樸素貝葉斯分類器來預測基因。該模型使用樸素貝葉斯分類器對每個讀取進行分類,并為每個讀取提供完整的分類,有助于用戶檢查數據集的分類組合,并在合理的時間內使用和運行整個數據集得到了良好的預測效果。

3 分析結論

通過對分類算法和主題建模方法的分析,對潛在語義分析、概率潛在語義分析、向量機、最近鄰居法和樸素貝葉斯等文本分類算法的分析,可以幫助人們了解和得到最合適的算法和方法。

猜你喜歡
語義分類文本
分類算一算
語言與語義
在808DA上文本顯示的改善
分類討論求坐標
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
數據分析中的分類討論
教你一招:數的分類
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
認知范疇模糊與語義模糊
主站蜘蛛池模板: 国产主播一区二区三区| 亚洲精品大秀视频| 国产精品分类视频分类一区| 亚洲精品成人7777在线观看| 孕妇高潮太爽了在线观看免费| 国产精品9| 久久这里只有精品国产99| 亚洲无码精品在线播放| 91久久性奴调教国产免费| 国产在线自揄拍揄视频网站| 99久久国产综合精品女同| 午夜日韩久久影院| 欧美成a人片在线观看| 亚洲首页国产精品丝袜| 久久精品一品道久久精品| 亚洲天堂视频网| 免费一极毛片| 欧美黑人欧美精品刺激| 无码一区18禁| 婷婷六月激情综合一区| 国产高清在线精品一区二区三区| 在线播放国产一区| 欧美综合区自拍亚洲综合绿色 | 亚洲视频三级| 亚洲乱码视频| 精品乱码久久久久久久| 国产精品无码久久久久AV| 亚洲丝袜第一页| 456亚洲人成高清在线| a国产精品| 亚洲国产精品日韩欧美一区| 极品私人尤物在线精品首页| 亚洲综合婷婷激情| 国语少妇高潮| 国产性猛交XXXX免费看| 久久91精品牛牛| 久久亚洲AⅤ无码精品午夜麻豆| 久久女人网| 国产成人a毛片在线| 日韩高清欧美| 久久精品人人做人人综合试看| 国产白浆一区二区三区视频在线| 亚洲国产成人精品无码区性色| 亚洲有码在线播放| 国产偷国产偷在线高清| 亚洲有无码中文网| 免费欧美一级| 久久精品中文无码资源站| 亚洲欧洲自拍拍偷午夜色| 国产精品无码AⅤ在线观看播放| 国产一级无码不卡视频| 欧美一区二区三区欧美日韩亚洲| 日韩美毛片| 免费人成又黄又爽的视频网站| 国产成人无码Av在线播放无广告| 国产va免费精品观看| 久久精品人人做人人爽电影蜜月| 无码专区第一页| 国产簧片免费在线播放| 亚洲国产成人麻豆精品| 国产玖玖视频| 九九线精品视频在线观看| 亚洲视频一区在线| 亚洲欧美自拍中文| 中文字幕日韩欧美| 国产第二十一页| 欧美成人aⅴ| a级毛片一区二区免费视频| 免费国产在线精品一区| 中文无码精品A∨在线观看不卡| 国产又粗又爽视频| 91色爱欧美精品www| 亚洲国内精品自在自线官| 最新加勒比隔壁人妻| 精品夜恋影院亚洲欧洲| 91福利片| 97综合久久| 国产女人18水真多毛片18精品| 一级一毛片a级毛片| 中文字幕丝袜一区二区| 欧美劲爆第一页| 欧美日韩一区二区三|