999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

試論大數(shù)據(jù)庫的相似記錄檢測方法

2019-03-30 04:01:30王艷喜
中國新通信 2019年21期

王艷喜

【摘要】? ? 在現(xiàn)階段的大數(shù)據(jù)庫相似記錄檢測中,存在著誤差相對較大的問題?;诖?,本文對二次模糊評判進(jìn)行了改進(jìn),并提出了一種優(yōu)化后的大數(shù)據(jù)庫相似記錄檢測方法。經(jīng)過與基于決定屬性值聚類算法的大數(shù)據(jù)庫相似記錄檢測方法的實(shí)驗(yàn)對比,證實(shí)了該檢測方法的優(yōu)越性。

【關(guān)鍵詞】? ? 大數(shù)據(jù)庫? ? 相似記錄檢測方法? ? 二次模糊評判

引言:

現(xiàn)階段,大數(shù)據(jù)庫被廣泛應(yīng)用于各個行業(yè)領(lǐng)域匯中,在決策型形成、總結(jié)與分析等方面發(fā)發(fā)揮著重要作用。但是,在大數(shù)據(jù)庫的實(shí)際使用中,常存在相似或重復(fù)記錄,造成數(shù)據(jù)冗余,導(dǎo)致了數(shù)據(jù)存儲空間的浪費(fèi)。基于這樣的情況,開發(fā)一種大數(shù)據(jù)庫相似記錄檢測方法極為重要。

一、大數(shù)據(jù)庫相似記錄檢測方法的原理分析

在進(jìn)行大數(shù)據(jù)庫相似記錄檢測時,需要完成部分記錄對的采集,并提取記錄字段相似的特征函數(shù),形成訓(xùn)練樣本集,最終構(gòu)建起該大數(shù)據(jù)庫的相似記錄檢測模型。在該模型的支持下,能夠完成數(shù)據(jù)庫中記錄相似度的計(jì)算,并確定一個閾值。通過比較記錄相似度數(shù)值與閾值,實(shí)現(xiàn)了該大數(shù)據(jù)庫相似記錄的檢測[1]。

但是,在該方法中,難以消除大數(shù)據(jù)庫中的非常重要數(shù),導(dǎo)致相似記錄檢測的實(shí)際效率降低。基于這樣的情況,筆者對二次模糊評判進(jìn)行改進(jìn),提出了一種優(yōu)化后的大數(shù)據(jù)庫相似記錄檢測方法。

二、大數(shù)據(jù)庫相似記錄檢測方法的優(yōu)化探究

2.1數(shù)據(jù)屬性的二次模糊評判

在大數(shù)據(jù)庫中,不同的記錄均對應(yīng)著一個重要程度存在差異的實(shí)體屬性。這就需要利用用戶對記錄中不同屬性展開模糊的綜合評價(jià),對部分非重要屬性記性消除,確定重要屬性向量集,并搭建起屬性評價(jià)因素表。同時,結(jié)合用戶的自身經(jīng)驗(yàn),完成該屬性評價(jià)因素表的二次評價(jià),形成用戶屬性因素評價(jià)表,完成大數(shù)據(jù)庫中不同記錄重要屬性權(quán)值的確定[2]。

此時,利用公式能夠完成屬性因素最終重要等級值的確定,其中,N為用戶數(shù)量、k為大數(shù)據(jù)庫中數(shù)據(jù)集的屬性數(shù)量、G為屬性等級集合。此時,主要從屬性類型、語義、寬度、排列位置完成數(shù)據(jù)庫中數(shù)據(jù)屬性的評價(jià),利用公式能夠完成比重向量的計(jì)算,其中,p為所有屬性中重要屬性的占比、F`為依照Ti形成的重要屬性向量集。需要多個用戶完成保留重要屬性的二次評價(jià),利用公式能夠完成用戶對重要屬性中某因素的評判結(jié)果計(jì)算,其中,(1~m)為各個屬性等級;1為評價(jià)重要性最低;m為評價(jià)重要性最高、pij為某用戶(j)對重要屬性的第i個評價(jià)因素的評價(jià)等級。

利用表達(dá)式能夠完成某屬性的用戶評價(jià)等級的計(jì)算,其中,f為屬性因素類型、p為用戶對屬性x的評價(jià)等級。使用公式能夠完數(shù)據(jù)屬性評價(jià)結(jié)果的均衡,其中,Pj為客觀屬性取值種類數(shù)的向量。

完成上述計(jì)算后,需要將該數(shù)據(jù)庫中的所有數(shù)據(jù)集內(nèi)部的各個屬性重要性等級展開統(tǒng)一的轉(zhuǎn)換,完成權(quán)值確定。

此時,使用公式能夠權(quán)值的計(jì)算。使用公式可以實(shí)現(xiàn)記錄屬性權(quán)值的重新賦值。使用公式能夠?qū)崿F(xiàn)對數(shù)據(jù)庫中所有數(shù)據(jù)記錄屬性的分組。其中,ξ為最終生成屬性取值種類數(shù)的向量、θ`為所有數(shù)據(jù)的主觀等級向量。

總體來說,在大數(shù)據(jù)庫相似記錄優(yōu)化檢測的過程中,需要先完成數(shù)據(jù)庫中所有數(shù)據(jù)屬性的一次評判,對數(shù)據(jù)庫中的非重要數(shù)據(jù)屬性展開消除,并落實(shí)其余數(shù)據(jù)的二次模糊評判,獲取數(shù)據(jù)屬性的評判結(jié)果。同時,以此為基礎(chǔ),完成所有數(shù)據(jù)屬性的分組,為相似檢測提供支持。

2.2特征向量指導(dǎo)下的數(shù)據(jù)庫相似記錄檢測

對于大數(shù)據(jù)庫中的相似記錄來說,其差異主要是由字符串造成的。所以,在進(jìn)行大數(shù)據(jù)庫相似記錄檢測的過程中,需要重點(diǎn)完成記錄字段的相似度計(jì)算。在這一過程中,可以將完成分組后的數(shù)據(jù)記錄屬性作為基礎(chǔ),結(jié)合隨意兩個記錄之間的共有字符順序、數(shù)量,完成兩個記錄之間的字符相似度計(jì)算,實(shí)現(xiàn)對相似度特征向量的提取。

在這一過程中,可以使用公式完成記錄之間字符相似度的計(jì)算;完成權(quán)值V(w,s`)的確定后,可以使用完成字符間匹配窗口的計(jì)算,其中,當(dāng)字符相似度小于等于該數(shù)值,則能夠說明兩記錄字符相似。利用公式以及,能夠?qū)崿F(xiàn)全部記錄字段相似度特征向量的確定。以此為基礎(chǔ),能夠構(gòu)建起大數(shù)據(jù)庫中相似記錄的檢測模型,并完成相似記錄分析。

2.3仿真結(jié)果分析

為了保證本研究的科學(xué)性以及該模型的合理性,筆者進(jìn)一步展開了仿真分析。在這一過程中,主要使用了基于決定屬性值聚類算法的大數(shù)據(jù)庫相似記錄檢測方法與該方法進(jìn)行實(shí)驗(yàn)對比。主要依照結(jié)果的查全率、查準(zhǔn)率、運(yùn)行時間完成判定。實(shí)驗(yàn)結(jié)果顯示,本文提出的相似記錄檢測方法查全率、查準(zhǔn)率明顯高于對比方法,運(yùn)行時間約為對比方法的二分之一。由此能夠證實(shí),該方法整體有效,具備較高的使用價(jià)值與科學(xué)性。

三、總結(jié)

綜上所述,本文對二次模糊評判進(jìn)行改進(jìn),提出了一種優(yōu)化后的大數(shù)據(jù)庫相似記錄檢測方法。經(jīng)過仿真對比實(shí)驗(yàn)顯示,優(yōu)化后的檢測方法在查全率、查準(zhǔn)率方面明顯優(yōu)于傳統(tǒng)方法,且運(yùn)行時間更短,具備實(shí)用性與科學(xué)性。

參? 考? 文? 獻(xiàn)

[1]李莉,張曉雯.基于劃分的海量數(shù)據(jù)相似重復(fù)記錄檢測[J].計(jì)算機(jī)系統(tǒng)應(yīng)用, 2019, 28(03):172-178.

[2]涂靜文.大數(shù)據(jù)庫的相似記錄檢測方法研究[J].計(jì)算機(jī)仿真, 2017,34(03):410-413.

主站蜘蛛池模板: 中国丰满人妻无码束缚啪啪| 亚洲香蕉久久| 亚洲男人的天堂久久香蕉 | 国产成人综合亚洲网址| 国产成年女人特黄特色大片免费| 亚洲中文字幕久久精品无码一区| 久久香蕉国产线看观| 国产成人资源| 黄色网址免费在线| 无码丝袜人妻| 九九这里只有精品视频| 亚洲成a人在线观看| 欧美在线观看不卡| 亚洲国产天堂久久综合| 日韩免费毛片视频| 美女无遮挡免费网站| 国产欧美日韩专区发布| 国产在线日本| 日韩第一页在线| 国产99视频精品免费视频7| 高清欧美性猛交XXXX黑人猛交 | 欧美五月婷婷| 欧美日韩精品综合在线一区| 在线观看视频一区二区| 欧美日本激情| 欲色天天综合网| 亚洲女人在线| 欧美一级在线| 精品伊人久久久大香线蕉欧美| 在线播放国产一区| 2018日日摸夜夜添狠狠躁| 色婷婷在线播放| 久精品色妇丰满人妻| 九九视频免费看| 久久五月视频| 日韩一区精品视频一区二区| 高潮毛片免费观看| 一区二区三区在线不卡免费| 国产尤物视频在线| 久热re国产手机在线观看| 日韩av在线直播| 欧美一级高清免费a| 成人免费网站久久久| 国产在线观看人成激情视频| 日韩精品无码不卡无码| 国产日韩久久久久无码精品| 欧美成人一级| 欧美第二区| 欧美色伊人| 国产成人高清在线精品| 91香蕉国产亚洲一二三区| 国产成人免费手机在线观看视频| 这里只有精品免费视频| 亚洲最新在线| 国产精品久久久久久搜索| 九色最新网址| 第一区免费在线观看| 午夜精品一区二区蜜桃| 美女被操91视频| 中文字幕精品一区二区三区视频| 国产麻豆精品在线观看| 四虎国产在线观看| 中文字幕第4页| 性色在线视频精品| 婷婷亚洲综合五月天在线| 人人91人人澡人人妻人人爽| 日本成人一区| 伊人久久福利中文字幕| 亚洲人成亚洲精品| 中文字幕日韩久久综合影院| 久久无码av三级| 欧美日韩国产综合视频在线观看 | AV网站中文| 毛片网站在线看| 伊人无码视屏| 19国产精品麻豆免费观看| 国产自产视频一区二区三区| 日韩欧美国产另类| 伦精品一区二区三区视频| 久久国产高清视频| 少妇极品熟妇人妻专区视频| 亚卅精品无码久久毛片乌克兰|