999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據技術的網絡熱搜關鍵詞提取算法

2021-07-03 04:15:56王珊珊梁同樂
電子測試 2021年10期

王珊珊,梁同樂

(1.廣東輕工職業技術學院信息技術學院,廣東廣州,510300;2.廣東郵電職業技術學院計算機學院,廣東廣州,510630)

0 引言

針對基數過大的網絡熱搜關鍵詞提取很容易出現提取查全率低的現象,證明以往研究存在一定的局限性[1]。因此,有必要對網絡熱搜關鍵詞提取算法展開優化設計。大數據技術作為一種信息化技術,主要針對巨量資料展開,具有高效性、真實性的優勢,以其強大的統一功能在眾多技術中脫穎而出,成為線下主流應用技術?;诖耍欣碛蓪⒋髷祿夹g應用在網絡熱搜關鍵詞提取算法中,基于大數據技術設計網絡熱搜關鍵詞提取算法,希望能夠在提高網絡熱搜關鍵詞提取查全率的同時,為網絡熱搜關鍵詞提取方面的發展提供新思路。

1 大數據技術

大數據技術主要是通過互聯網的優越性,徹底打破了時間以及空間的限制,在海量信息中挖掘出有價值的信息[2]。大數據技術下的信息特征為以多元的方式呈現數據,形成龐大的信息隊列,其中也隱含了實時性的優勢。大數據下借助信息化技術為依托,通過在大量數據中提取出有價值的信息,并挖掘數據中存在的內部規律[3]。結合國外針對大數據技術的研究中,主要將大數據技術分為兩大類,包括:數據存儲技術以及數據處理技術?;诖髷祿夹g具有效率高、精度高、使用方便等優點,已經被廣泛應用在各個領域中?;诖?,本文設計的基于大數據技術,網絡熱搜關鍵詞提取算法,其具體內容,詳見下文。

2 基于大數據技術的網絡熱搜關鍵詞提取算法

2.1 確定網絡熱搜關鍵詞特征的模糊空間

網絡熱搜關鍵詞信息特征的模糊空間示意圖,如圖1所示。

在圖1中,以A、B、C為網絡熱搜關鍵詞信息特征的模糊空間中的映射直線。結合ai1、ai2與ai3的關系可見,網絡熱搜關鍵詞信息特征空間維數越大,網絡熱搜關鍵詞信息特征模糊空間的面積越?。环粗?,網絡熱搜關鍵詞信息特征模糊空間的面積越大。因此,網絡熱搜關鍵詞信息特征的模糊空間只適用于對單一網絡熱搜關鍵詞信息特征進行描述,針對綜合網絡熱搜關鍵詞信息的特征還需要基于大數據技術,加權融合網絡熱搜關鍵詞。

圖1 網絡熱搜關鍵詞信息特征的模糊空間示意圖

2.2 基于大數據技術加權融合網絡熱搜關鍵詞

在確定網絡熱搜關鍵詞特征的模糊空間的基礎上,本文針對綜合網絡熱搜關鍵詞信息的特征通過大數據技術進行加權融合[4]。本文以網絡熱搜關鍵詞語義的重要程度為指標,以關鍵詞中的Hamming距離為標準,計算網絡熱搜關鍵詞模糊語義距離。設其為Sim(x,y),可得公式(1):

公式(1)中,n 指的是網絡熱搜關鍵詞語義特征矢量;i指的是綜合網絡熱搜關鍵詞信息的特征個數,為實數;w指的是平滑系數;m 指的是摩擦系數;k指的是網絡熱搜關鍵詞信息權值系數;g指的是關鍵詞隸屬度函數;μ指的是關鍵詞特征嵌入維數;x指的是網絡熱搜關鍵詞信息一維距平化Hamming距離橫坐標;y指的是網絡熱搜關鍵詞信息一維距平化Hamming距離縱坐標。網絡熱搜關鍵詞信息一維距平化Hamming距離橫坐標以及縱坐標能夠直接決定關鍵詞在模糊語義距離屬性中的具體點位信息,即為模糊語義特征描述?;谀:Z義距離屬性的基本特征,計算網絡熱搜關鍵詞信息模糊特征數值以及網絡熱搜關鍵詞信息特征距離,得到模糊語義網絡熱搜關鍵詞信息特征距離綜合信息表,為基于大數據技術加權融合網絡熱搜關鍵詞提供基礎信息。并以此為網絡熱搜關鍵詞分數索引,網絡熱搜關鍵詞分數越高證明其在網絡熱搜關鍵詞提取時的優先級越高,從而保證了盡可能多的關鍵詞結點被提取。

2.3 提取網絡熱搜關鍵詞

采用大數據技術Reduce中的稀疏表示技巧,得到完整的基于大數據技術的網絡熱搜關鍵詞提取算法,可得公式(2):

公式(2)中,u指的是網絡熱搜關鍵詞提取頻率。以公式(2)為基于大數據技術提取網絡熱搜關鍵詞的最終方程式,根據網絡熱搜關鍵詞特征矢量的位置,輸出網絡熱搜關鍵詞提取結果。至此,完成基于大數據技術的網絡熱搜關鍵詞提取算法設計。

3 實例分析

3.1 實驗準備

本文通過設計實例分析的方式,在web平臺中選取2個真實數據集作為實驗對象。首先,使用本文設計的提取算法基于大數據技術提取網絡熱搜關鍵詞,通過matalb軟件記錄網絡熱搜關鍵詞提取的查全率,將其設為實驗組;再使用傳統提取算法提取網絡熱搜關鍵詞,同樣通過matalb軟件記錄網絡熱搜關鍵詞提取的查全率,將其設為對照組。由此可見,本次實驗主要內容為測試兩種提取算法的查全率,網絡熱搜關鍵詞提取的查全率越高證明提取更加全面、可靠。通過設置10次實驗,針對matalb軟件測得的查全率,記錄實驗數據。

3.2 實驗結果分析與結論

將兩種提取算法下的查全率進行對比,查全率對比結果,如下表1所示。

表1 網絡熱搜關鍵詞提取查全率對比

根據表1可知,通過實驗組測得的查全率高于對照組兩倍以上,基于大數據技術設計的網絡熱搜關鍵詞提取算法在查全率方面相比傳統算法具有明顯的優勢。綜上所述,設計的網絡熱搜關鍵詞提取算法對網絡熱搜關鍵詞提取更全面,有理由直接投入現實應用。

4 結束語

文章針對基于大數據技術的網絡熱搜關鍵詞提取算法展開研究,通過以上研究可以表明,利用本文設計的基于大數據技術的網絡熱搜關鍵詞提取算法能夠在網絡熱搜關鍵詞提取過程中取得顯著的應用效果,解決以往網絡熱搜關鍵詞提取難的問題。因此,有理由加大大數據技術在網絡熱搜關鍵詞提取中的應用力度。由此可見,未來網絡熱搜關鍵詞提取算法方面的發展可以以大數據技術為核心,為網絡熱搜關鍵詞提取領域的研究提供學術意義。

主站蜘蛛池模板: 美女无遮挡免费网站| 国产成人精品亚洲日本对白优播| 一本综合久久| 色婷婷亚洲十月十月色天| 中文成人在线视频| 干中文字幕| a毛片在线播放| 在线观看国产精品一区| 国产另类视频| 97国产成人无码精品久久久| 久久a级片| 91精品专区国产盗摄| 国产av剧情无码精品色午夜| 女人av社区男人的天堂| 精品人妻系列无码专区久久| 久草网视频在线| 麻豆精品视频在线原创| 国产第八页| 欧美日韩国产综合视频在线观看 | 亚洲精品成人片在线观看| 国产对白刺激真实精品91| 国产小视频在线高清播放| 福利视频一区| 91小视频在线| 日本精品视频一区二区| 久久免费看片| 91精品小视频| 国产人免费人成免费视频| 国产精品粉嫩| 亚洲国产成人久久77| 国产精品男人的天堂| 看国产一级毛片| 日韩福利视频导航| 久久这里只精品国产99热8| 国产网站免费| 97在线免费视频| 天堂岛国av无码免费无禁网站| 成人中文字幕在线| 亚洲二三区| 91在线一9|永久视频在线| 国产日韩精品欧美一区灰| 亚洲国产成人在线| 国产免费网址| 久久久精品国产SM调教网站| 呦女亚洲一区精品| 亚洲男人的天堂网| 国产欧美日韩专区发布| 久久99国产精品成人欧美| 日韩欧美国产区| 国产成年女人特黄特色毛片免| 欧美一级99在线观看国产| 国产在线一区视频| 亚洲欧洲美色一区二区三区| 国产激情在线视频| 99er这里只有精品| 亚洲视频四区| 第一区免费在线观看| 少妇精品网站| 在线a视频免费观看| 丰满少妇αⅴ无码区| 欧美人人干| 极品性荡少妇一区二区色欲 | 天天摸夜夜操| 久久免费精品琪琪| 亚洲AV一二三区无码AV蜜桃| 国产福利小视频在线播放观看| 午夜国产不卡在线观看视频| 亚洲精品视频免费| 日本www色视频| 久久国产黑丝袜视频| 亚洲成年人网| 国产精品成人AⅤ在线一二三四| 亚洲天堂免费| 精品人妻一区无码视频| 国产女人爽到高潮的免费视频| 久久精品国产一区二区小说| 日韩成人在线网站| 麻豆AV网站免费进入| 国产精品3p视频| 一级爱做片免费观看久久| 狠狠做深爱婷婷综合一区| 男人天堂亚洲天堂|