999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于特征聚類的近似查詢分塊選擇方法

2024-08-22 00:00:00周云亮張淳瑞
科技創(chuàng)新與應(yīng)用 2024年24期

摘 要:大數(shù)據(jù)集群環(huán)境中,隨機(jī)訪問(wèn)的低效性使得基于行級(jí)別抽樣的近似查詢處理方法在構(gòu)建樣本時(shí)效率低下。該文將利用集群環(huán)境中數(shù)據(jù)分塊存儲(chǔ)的特性,以分塊級(jí)別來(lái)進(jìn)行抽樣。在基準(zhǔn)測(cè)試數(shù)據(jù)集和真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn),顯示此方法在降低數(shù)據(jù)讀取率,提高查詢響應(yīng)速度的同時(shí),保持較高的查詢精度。實(shí)驗(yàn)中,僅需要讀取少于20%的數(shù)據(jù)就可以獲得低于5%的查詢誤差,且為數(shù)據(jù)集每個(gè)分塊的預(yù)計(jì)算的特征數(shù)據(jù)所需要的存儲(chǔ)空間小于數(shù)據(jù)集所占空間的0.04%。

關(guān)鍵詞:近似查詢處理;聚類;分塊抽樣;數(shù)據(jù)跳過(guò);特征計(jì)算

中圖分類號(hào):TP274 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2024)24-0019-05

Abstract: In big data cluster environment, the inefficiency of random access makes the approximate query processing method based on row-level sampling inefficient in constructing samples. This paper will make use of the characteristics of data block storage in the cluster environment to sample at the block level. Experiments on benchmark data sets and real data sets show that this method not only reduces the data reading rate and improves the query response speed, but also maintains high query accuracy. In the experiment, only less than 20% of the data need to be read to obtain a query error of less than 5%, and the storage space required for the precalculated feature data for each block of the dataset is less than 0.04% of the space occupied by the dataset.

Keywords: approximate query processing; clustering; block sampling; data skip; feature calculation

隨著近幾十年來(lái)數(shù)據(jù)存儲(chǔ)數(shù)量的指數(shù)級(jí)增長(zhǎng),單機(jī)數(shù)據(jù)庫(kù)逐漸不能滿足人們對(duì)于數(shù)據(jù)的存儲(chǔ)和查詢的需求,越來(lái)越多的人選擇將數(shù)據(jù)存儲(chǔ)到分布式的大數(shù)據(jù)集群中。但即便是配合一些大規(guī)模數(shù)據(jù)分析引擎,要處理數(shù)TB量級(jí)的數(shù)據(jù),完整計(jì)算得到準(zhǔn)確結(jié)果的時(shí)間消耗也常是無(wú)法接受的。通過(guò)使用近似查詢處理方法[1],可以犧牲查詢結(jié)果的一部分準(zhǔn)確性,來(lái)獲得更快的查詢響應(yīng)。

在近似查詢處理方法中,抽樣是最常見(jiàn)的一種策略,它使用數(shù)據(jù)集中的一部分?jǐn)?shù)據(jù)作為樣本來(lái)回答查詢。要為存儲(chǔ)在大數(shù)據(jù)集群上的數(shù)據(jù)集構(gòu)建行級(jí)別抽樣的樣本,在讀取數(shù)據(jù)上的消耗很高,與掃描整個(gè)數(shù)據(jù)集無(wú)異。在HDFS文件系統(tǒng)中,數(shù)據(jù)被分塊存儲(chǔ),行級(jí)別的隨機(jī)訪問(wèn)十分低效。如果考慮到構(gòu)建樣本的時(shí)間消耗,很多場(chǎng)景下,使用行級(jí)別抽樣的近似查詢并不能帶來(lái)速度上的提升。……

登錄APP查看全文

主站蜘蛛池模板: 免费国产高清精品一区在线| 免费在线色| 综合人妻久久一区二区精品| 国产成人精品无码一区二 | 亚洲中字无码AV电影在线观看| 亚洲精品男人天堂| 99精品在线看| 国产自视频| 九月婷婷亚洲综合在线| 国产一区成人| 国产精品久久久久久搜索| 亚洲欧美另类中文字幕| 中文字幕在线日韩91| 日韩午夜福利在线观看| lhav亚洲精品| 粉嫩国产白浆在线观看| 美女被操91视频| 青青草原偷拍视频| 成人在线欧美| 国产精品无码AV中文| 国精品91人妻无码一区二区三区| 天天躁夜夜躁狠狠躁图片| 91国语视频| 国产精品美女自慰喷水| 久久国产精品电影| 91久久夜色精品国产网站 | 欧美激情第一欧美在线| 国产第八页| 精品成人一区二区| 亚洲自偷自拍另类小说| 国产中文一区二区苍井空| 香蕉国产精品视频| 蜜芽国产尤物av尤物在线看| 成人字幕网视频在线观看| 日本欧美午夜| 日本手机在线视频| 日本精品一在线观看视频| 婷婷色狠狠干| 亚洲美女高潮久久久久久久| 九九免费观看全部免费视频| 国产美女无遮挡免费视频| 成年A级毛片| 亚洲一区二区在线无码| 国产一区亚洲一区| 欧美一级99在线观看国产| 久久精品波多野结衣| 色播五月婷婷| 黄片在线永久| 国禁国产you女视频网站| 亚洲精品动漫| 久久久久青草大香线综合精品 | 五月天在线网站| 亚洲人在线| 免费不卡在线观看av| 日本午夜视频在线观看| 国产女人喷水视频| 国产一区二区三区在线观看视频| 亚洲网综合| 日韩精品一区二区三区大桥未久 | 中文字幕日韩久久综合影院| 日本午夜精品一本在线观看 | 亚洲精品另类| 国产精品黑色丝袜的老师| 久久国产V一级毛多内射| 色欲色欲久久综合网| 麻豆AV网站免费进入| 国产精品久久久久久久久久98| 免费一看一级毛片| 99热国产这里只有精品无卡顿"| 婷婷成人综合| 国产丝袜无码一区二区视频| 青青操国产| 亚洲一级毛片在线观播放| 少妇极品熟妇人妻专区视频| 国产精品欧美日本韩免费一区二区三区不卡 | 亚洲欧美不卡| 欧美日韩亚洲综合在线观看| 亚洲综合专区| 很黄的网站在线观看| 2021国产乱人伦在线播放| 国产91在线|日本| 四虎永久在线|