999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類算法的GIS深度數(shù)據(jù)挖掘模型研究

2021-11-07 10:32:17熊燕
科技信息·學(xué)術(shù)版 2021年22期
關(guān)鍵詞:時(shí)間

摘要:本文基于項(xiàng)目研究,結(jié)合GIS數(shù)據(jù)的特點(diǎn)及業(yè)務(wù)領(lǐng)域特征,基于聚類算法進(jìn)一步研究了深度數(shù)據(jù)挖掘方案,得到新的算法模型。本文闡述了多維建模過程及模式,對(duì)樣本數(shù)據(jù)進(jìn)行分類的方法,聚類規(guī)則等,并在來源項(xiàng)目中得到驗(yàn)證。

關(guān)鍵詞:聚類,GIS,時(shí)間,位置,文件

前言

GIS 數(shù)據(jù)不僅具有空間特征,又具有屬性特征,并隨時(shí)間變化。因此,數(shù)據(jù)量大且結(jié)構(gòu)復(fù)雜。如今,社會(huì)上許多行業(yè)和部門都在使用 GIS。面向不同應(yīng)用領(lǐng)域的GIS數(shù)據(jù),還會(huì)同時(shí)產(chǎn)生更多維度的數(shù)據(jù),如人文信息。如果沒有合適的數(shù)據(jù)分析和挖掘方案,GIS就不可能發(fā)揮其最大的效能,許多數(shù)據(jù)間的關(guān)聯(lián)及潛在“知識(shí)”不會(huì)被發(fā)現(xiàn)。

1. GIS數(shù)據(jù)的特性

1.1 時(shí)空特性

地理數(shù)據(jù)是與空間相關(guān)的。它可以被分配坐標(biāo)或任何空間引用。數(shù)據(jù)在地球表面,包括位置和組織。地理數(shù)據(jù)的規(guī)模可以從一般到具體,從簡單到復(fù)雜。地理數(shù)據(jù)是動(dòng)態(tài)的,包括空間動(dòng)態(tài)(空間變化)和時(shí)間動(dòng)態(tài)(時(shí)間變化)。地理數(shù)據(jù)既具有空間特征,又具有屬性特征,并隨時(shí)間變化。因此,數(shù)據(jù)量非常大。

1.2 業(yè)務(wù)特性

當(dāng)今,許多行業(yè)已經(jīng)將GIS納入了自己的業(yè)務(wù)系統(tǒng)。在這些業(yè)務(wù)系統(tǒng)中,GIS中的數(shù)據(jù)與用戶的其他在線活動(dòng)相關(guān)聯(lián)。GIS數(shù)據(jù)來源包括地圖、遙感圖像、文本數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)、實(shí)測數(shù)據(jù)、多媒體數(shù)據(jù)、現(xiàn)有系統(tǒng)數(shù)據(jù)等。由于標(biāo)準(zhǔn)化,不同系統(tǒng)之間的數(shù)據(jù)共享和互換性正變得越來越強(qiáng)。這擴(kuò)大了數(shù)據(jù)的可用性,增加了數(shù)據(jù)的潛在價(jià)值。因此,在挖掘 GIS中的信息時(shí),首先要明確業(yè)務(wù)需求,確定數(shù)據(jù)源。本文主要研究了用戶在網(wǎng)絡(luò)和數(shù)字地圖上的活動(dòng)數(shù)據(jù)。事實(shí)上,有很多數(shù)據(jù)庫系統(tǒng)是關(guān)系數(shù)據(jù)庫。

2. 聚類算法及挖掘架構(gòu)

2.1 聚類算法

聚類(Cluster)分析是由若干模式(Pattern)組成的,通常,模式是一個(gè)度量(Measurement)的向量,或者是多維空間中的一個(gè)點(diǎn)。聚類分析以相似性為基礎(chǔ),在一個(gè)聚類中的模式之間比不在同一聚類中的模式之間具有更多的相似性。聚類分析的算法可以分為劃分法(Partitioning Methods)、層次法(Hierarchical Methods)、基于密度的方法(Density-based Methods)、基于網(wǎng)格的方法(Grid-based Methods)、基于模型的方法(Model-Based Methods)。

基于某種業(yè)務(wù),很難說具體應(yīng)用了哪種聚類算法,因?yàn)檫@些類別可能重疊,從而使得一種方法具有幾類的特征。因此在聚類基本劃分方法的基礎(chǔ)上,如何針對(duì)業(yè)務(wù)領(lǐng)域設(shè)計(jì)出相應(yīng)的新算法是有一定挑戰(zhàn)的。

2.2 挖掘架構(gòu)

在來源項(xiàng)目的研究中發(fā)現(xiàn),數(shù)據(jù)資源可以通過訪問公眾、收集地理信息等方式獲得。我們可以把所有的數(shù)據(jù)分成幾種類型。一般的挖掘過程包括:挖掘?qū)ο蟠_定、數(shù)據(jù)準(zhǔn)備、模式提取、模式評(píng)價(jià)。

基于項(xiàng)目研究領(lǐng)域的特點(diǎn),新挖掘算法模型的產(chǎn)生基于這樣的架構(gòu):數(shù)據(jù)維的劃分、切片、聚類、識(shí)別。該模型關(guān)注的是地理數(shù)據(jù)的維度,這些數(shù)據(jù)被信息需求分割。然后高密度區(qū)域被劃分為集群。在對(duì)數(shù)字地圖進(jìn)行聚類之后,用戶可以進(jìn)一步識(shí)別地圖上的深度信息。

3. 多維數(shù)據(jù)模型的建立

3.1 維度確定

數(shù)據(jù)在轉(zhuǎn)換后被加載到一個(gè)關(guān)系數(shù)據(jù)庫中。選擇多維數(shù)據(jù)允許我們從數(shù)據(jù)庫的各個(gè)方面觀察數(shù)據(jù)。多維數(shù)據(jù)矩陣由模式表示:

C (A1,A2,...,Am,count)

矢量 Ai (i = 1,2,...,m)表示其中一個(gè)維度。參數(shù)count是一個(gè)變量。

在數(shù)據(jù)矩陣中,根據(jù)實(shí)驗(yàn)要求選擇多個(gè)維度:時(shí)間維度、空間維度、 url 維度、用戶維度、文件維度。建立數(shù)據(jù)矩陣后,可用于分析來自多個(gè)方向的數(shù)據(jù)。

3.2 模式設(shè)計(jì)

創(chuàng)建多維數(shù)據(jù)模式在關(guān)系數(shù)據(jù)庫中,數(shù)據(jù)模型由實(shí)體及其關(guān)聯(lián)的集合組成。該數(shù)據(jù)模型適用于在線事務(wù)處理。然后,我們構(gòu)造了一個(gè)星型模式來表示數(shù)據(jù)倉庫中的多維數(shù)據(jù)結(jié)構(gòu)。這個(gè)模式包含一些部分,如圖1所示。

星型模式由兩部分組成:

(1)中心表也是事實(shí)表。這個(gè)表包含了大量的數(shù)據(jù),這些數(shù)據(jù)并不是冗余的。

(2)還附加了一組維度表,每個(gè)維度對(duì)應(yīng)一個(gè)維度表。

4.多維視圖的聚類分析算法

在以前構(gòu)建的數(shù)據(jù)倉庫中采用聚類分析算法,從數(shù)據(jù)庫引擎中提取數(shù)據(jù)的三個(gè)維度:日期、文件、位置。在數(shù)字地圖中,位置維度按街道劃分。日期尺寸除以年份。文件尺寸按文件類型劃分。

根據(jù)原始數(shù)據(jù)經(jīng)過清理和轉(zhuǎn)換后的數(shù)據(jù)矩陣,用戶對(duì)數(shù)據(jù)的訪問用2D 表示。我們?cè)谶@個(gè)二維表示中使用日期維度和文件維度。日期維度是按年組織的,例如:y1,y2,y3,y4。文件維度按訪問的文件類型進(jìn)行組織,例如:file1,file2,file3。事實(shí)或度量是屬性 visit _ count。屬性 visit _ count 的值表示每次訪問一個(gè)文件的次數(shù)。

DBSCAN (Density-Based Spatial Clustering of Application with Noise)是一種針對(duì)高密度連接區(qū)域的密度聚類算法。該算法將具有足夠密度的區(qū)域劃分為若干個(gè)簇。任何形狀的聚類都可以在帶有“噪聲”的空間數(shù)據(jù)庫中找到。集群被定義為與密度相關(guān)的最大點(diǎn)集。基于密度的聚類包含了一些新的定義,例如:

(1)neighborhood是給定物體的區(qū)域,該區(qū)域的半徑為r。

(2)如果一個(gè)對(duì)象的鄰域至少包含一個(gè)最小數(shù)量的對(duì)象,該對(duì)象被稱為核心對(duì)象。

(3)給定一個(gè)對(duì)象集 d,如果對(duì)象 p 在對(duì)象 q 的鄰域內(nèi),q 是核心對(duì)象,我們說對(duì)象 p 是直接從對(duì)象 q 密度可達(dá)的。

結(jié)語:

該算法模型在來源項(xiàng)目中進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果驗(yàn)證了該聚類分析算法及模型的有效性。數(shù)據(jù)被劃分為多個(gè)維度,并通過星型模式存儲(chǔ)在數(shù)據(jù)倉庫中。新的聚類算法給出了一些定義和規(guī)則。根據(jù)這些算法規(guī)則,對(duì)多維數(shù)據(jù)進(jìn)行計(jì)算和分析,最終可獲得更深層次信息。

參考文獻(xiàn):

[1]呂奕. 基于改進(jìn)密度峰值聚類算法的軌跡行為分析[J]. 計(jì)算機(jī)工程與應(yīng)用. 2021,4

[2]Nagpal Mayank. Keyword Selection Strategies in Search Engine Optimization:How Relevant is Relevance [J]. Journal of Retailing. 2020,12

[3]Hamid Saadatfar. A New K-Nearest Neighbors Classifier for Big Data Based on Efficient Data Pruning [J]. Mathematics Volume 8,Issue 2. 2020

項(xiàng)目來源:面向復(fù)雜來源的大數(shù)據(jù)分析架構(gòu)及算法模型研究,湖北省教育廳2019年度科研計(jì)劃項(xiàng)目,項(xiàng)目編號(hào)B2019285

作者簡介:熊燕,女,副教授,湖北省武漢市武昌理工學(xué)院,人工智能學(xué)院。

猜你喜歡
時(shí)間
Spatial—Temporal Metaphor of“qian/hou”in Chinese and English
時(shí)間與空間:新聞采訪中無聲的語言
新聞愛好者(2016年9期)2016-11-15 19:32:34
時(shí)間消滅空間?
新聞界(2016年12期)2016-11-08 21:36:56
“時(shí)間”面前人人平等
湯姆?提克威影片的審美特征
主站蜘蛛池模板: 国产国拍精品视频免费看 | 精品视频第一页| 人妻91无码色偷偷色噜噜噜| 国产门事件在线| www.亚洲一区| 性激烈欧美三级在线播放| 日韩高清中文字幕| 四虎成人精品在永久免费| 国产精品欧美亚洲韩国日本不卡| 青草视频网站在线观看| 久996视频精品免费观看| 99久视频| 国内精品视频| 国产第一页免费浮力影院| 国产一级裸网站| 最新痴汉在线无码AV| 国产青青草视频| 九九线精品视频在线观看| 欧美成人免费午夜全| 久久黄色免费电影| 在线不卡免费视频| 88av在线播放| 久久性视频| 久久黄色影院| 91福利在线观看视频| 午夜无码一区二区三区在线app| 欧美福利在线| 精品视频免费在线| 91精品国产91欠久久久久| 亚洲中文字幕无码mv| 日本五区在线不卡精品| 亚洲三级影院| 91热爆在线| 亚洲综合第一区| 在线视频97| 亚洲国产成人精品无码区性色| 欧美成人看片一区二区三区 | 一区二区理伦视频| 欧美综合中文字幕久久| 欧美在线综合视频| 黄片在线永久| 国产一区二区在线视频观看| a级毛片在线免费| 国产一区二区网站| 日韩精品视频久久| 国产尤物在线播放| 美女被操黄色视频网站| 日本人又色又爽的视频| 久久一本精品久久久ー99| 色妞www精品视频一级下载| 亚洲成a人在线观看| 日韩在线第三页| 黄色福利在线| 亚洲无码高清免费视频亚洲| 欧美在线精品一区二区三区| 国模视频一区二区| 国产成人无码综合亚洲日韩不卡| 波多野结衣视频一区二区| 免费观看男人免费桶女人视频| 五月综合色婷婷| 国产日韩丝袜一二三区| 五月天久久婷婷| 国产一级毛片高清完整视频版| 四虎永久免费地址在线网站 | 99精品视频在线观看免费播放| 自拍偷拍欧美日韩| 亚洲无码高清一区二区| 国产一级在线观看www色| 久久精品波多野结衣| 成年女人a毛片免费视频| 国产精品欧美激情| 日韩天堂视频| 欧美日韩中文字幕在线| 99久久国产自偷自偷免费一区| 国产成人综合日韩精品无码首页| 亚洲一区二区日韩欧美gif| 99手机在线视频| 在线欧美a| www.99精品视频在线播放| 亚洲视屏在线观看| 国产成人乱无码视频| 国产96在线 |