999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜的軌跡挖掘研究可視化分析

2021-08-09 03:23:44馮健文
電子技術(shù)與軟件工程 2021年11期
關(guān)鍵詞:語義分析研究

馮健文

(韓山師范學(xué)院教務(wù)處 廣東省潮州市 521041)

1 引言

分析人類世界各種移動對象的軌跡以發(fā)現(xiàn)隱含的行為模式和社會演進(jìn)規(guī)律,一直是研究者關(guān)注的重要問題。尤其在當(dāng)前物聯(lián)網(wǎng)應(yīng)用已廣泛應(yīng)用在社會各領(lǐng)域的背景下,移動對象軌跡通過射頻識別技術(shù)(RFID)、傳感器、日志記錄等形式存儲,促進(jìn)了軌跡挖掘技術(shù)的高速發(fā)展。目前對軌跡挖掘的文獻(xiàn)分析較為主觀,而采用知識圖譜技術(shù)可客觀梳理文獻(xiàn)的研究特征和隱含的共現(xiàn)關(guān)系。鑒于此,本文以國內(nèi)近五年軌跡挖掘研究文獻(xiàn)為對象,采用文獻(xiàn)識別與科學(xué)計量分析的方法,研究兩個問題:

(1)軌跡挖掘研究的演進(jìn)規(guī)律;

(2)總結(jié)軌跡挖掘研究的特征,指出下一步研究重點(diǎn)方向。

期間,借助SATI 和VOSviewer 知識圖譜工具輔助分析,增加文獻(xiàn)分析的客觀性和減少人工勞動。

2 研究設(shè)計

2.1 文獻(xiàn)識別和收集

以中國知網(wǎng)(CNKI)作為數(shù)據(jù)來源和檢索工具,采用高級檢索方式,按照“主題”為“軌跡挖掘”邏輯檢索,時間范圍為2016年5月-2021年5月年共五年,檢索到中文文獻(xiàn)238 篇。剔除與軌跡挖掘研究無關(guān)文獻(xiàn)后,得到文獻(xiàn)232 篇。

2.2 研究方法

根據(jù)研究問題,采取文獻(xiàn)識別與科學(xué)計量的研究方法,分析目標(biāo)包括:文獻(xiàn)特征及研究特征,如表1 所示。文獻(xiàn)特征包括出版年份、作者及期刊來源,用于分析文獻(xiàn)的基本特征。研究特征包括研究主題,用于分析文獻(xiàn)蘊(yùn)含的研究規(guī)律。

根據(jù)分析目的和數(shù)據(jù)類別的不同,采用合適的分析方法。文獻(xiàn)特征采用SATI 文獻(xiàn)分析工具分析;研究主題采用VOSviewer 知識圖譜工具。

2 軌跡挖掘研究的演進(jìn)規(guī)律

2.1 文獻(xiàn)特征分析

圖1:軌跡挖掘年發(fā)文量

圖2:軌跡挖掘研究關(guān)鍵詞詞頻及共現(xiàn)分析知識圖譜

圖3:軌跡挖掘研究關(guān)鍵詞聚類密度分析知識圖譜

2.1.1 年發(fā)文量分析

對篩選文獻(xiàn)發(fā)文時間進(jìn)行統(tǒng)計,如圖1 所示。軌跡挖掘研究發(fā)文量從2016年開始逐年增加,尤其是2016-2018年該研究領(lǐng)域文獻(xiàn)數(shù)量呈現(xiàn)急劇增長趨勢,分別是18 篇、45 篇、63 篇,反映我國軌跡挖掘研究熱度處于上升趨勢。

2.1.2 文獻(xiàn)來源分析

對文獻(xiàn)的來源期刊及載文量進(jìn)行分析發(fā)現(xiàn),前五名期刊載文量共17 篇,占文獻(xiàn)總數(shù)18.46%,如表2 所示。其中《計算機(jī)應(yīng)用》、《計算機(jī)應(yīng)用研究》2 個期刊占文獻(xiàn)總數(shù)11.95%,表明我國軌跡挖掘研究與社會應(yīng)用聯(lián)系緊密。

2.1.3 作者來源分析

對文獻(xiàn)的全部作者分析,所在研究單位人數(shù)最多前5 名如表3所示。南京師范大學(xué)、中國科學(xué)院等大學(xué)和研究機(jī)構(gòu)是軌跡挖掘研究的主要力量,作者共20 人次,占文獻(xiàn)總數(shù)12%。另外南京其他高校如南京工業(yè)大學(xué)、南京理工大學(xué)等也在研究單位之列,表明南京高校已形成有規(guī)模的軌跡挖掘研究團(tuán)隊(duì)。

2.2 研究特征分析

2.2.1 關(guān)鍵詞詞頻及共現(xiàn)分析

為提高規(guī)范性和知識圖譜可理解度,需建立關(guān)鍵詞數(shù)據(jù)字典對關(guān)鍵詞進(jìn)行歸一化處理,方法包括合并名稱相近關(guān)鍵詞和含義相同關(guān)鍵詞,得到702個關(guān)鍵詞。圖2是采用VOSviewer工具的分析結(jié)果,其中前十大高頻關(guān)鍵詞是:軌跡挖掘、軌跡數(shù)據(jù)、軌跡聚類、出租車軌跡、軌跡、語義軌跡、可視化、頻繁模式、熱點(diǎn)區(qū)域、GPS 軌跡。值得注意,頻次為1 的關(guān)鍵詞多達(dá)610 個,表明軌跡挖掘應(yīng)用領(lǐng)域廣泛、涉及關(guān)鍵技術(shù)多樣、研究處于百家爭鳴階段。

2.2.2 關(guān)鍵詞聚類密度分析

軌跡挖掘研究關(guān)鍵詞聚類密度分析知識圖譜如圖3 所示。可發(fā)現(xiàn),圖譜以軌跡挖掘?yàn)闊狳c(diǎn)中心,根據(jù)關(guān)鍵詞相互的共現(xiàn)關(guān)系形成軌跡聚類、軌跡數(shù)據(jù)、出租車軌跡、語義軌跡等較大聚類區(qū)域,還有若干個較小聚類區(qū)域。

3 我國軌跡挖掘研究特征

3.1 軌跡聚類

研究者主要根據(jù)解決問題需要,對主流的K-means、DBSCAN等聚類算法進(jìn)行改進(jìn),目標(biāo)是對軌跡分類。朱敬華對傳感器網(wǎng)絡(luò)中多目標(biāo)不確定軌跡,采用馬爾科夫鏈模型表示,根據(jù)軌跡相似性改進(jìn)K-means 算法進(jìn)行聚類分組[1]。朱姣改進(jìn)DBSCAN 算法計算分叉航道內(nèi)船舶行為模式,為水上監(jiān)管人員提供水域交通態(tài)勢[2]。朱家輝改進(jìn)K-means 算法,采用時間維度和軌跡中的空間差異性語義將交通網(wǎng)絡(luò)劃分為單個密集時間的交通網(wǎng)絡(luò)區(qū)域[3]。趙淼佟以軌跡數(shù)據(jù)的空間屬性和時間屬性進(jìn)行軌跡聚類分析,發(fā)現(xiàn)用戶的運(yùn)動規(guī)律和行為模式,并為用戶提供不同時段的有針對性的推薦服務(wù)[4]。趙端從礦井下人員軌跡的關(guān)鍵位置序列數(shù)據(jù)聚類為關(guān)鍵區(qū)域,從而發(fā)現(xiàn)人員的日常軌跡,再利用關(guān)鍵區(qū)域和軌跡結(jié)構(gòu)相似度篩選出異常軌跡[5]。張翔宇采用聚類算法從用戶GPS 軌跡中自動挖掘興趣地點(diǎn)[6]。

3.2 軌跡數(shù)據(jù)

相比于軌跡聚類的分類作用,對軌跡數(shù)據(jù)的預(yù)處理是實(shí)現(xiàn)軌跡挖掘的質(zhì)量根本。由于軌跡數(shù)據(jù)類別繁多,研究者需要根據(jù)數(shù)據(jù)的特點(diǎn)和挖掘應(yīng)用的需要,研究針對某類軌跡數(shù)據(jù)的預(yù)處理技術(shù)。朱家輝利用均值濾波器、快速排序算法修復(fù)軌跡漂移點(diǎn)并剔除冗余數(shù)據(jù),提出基于雙重偏移限制的軌跡分段壓縮算法,識別特征點(diǎn)完成分段壓縮以實(shí)現(xiàn)軌跡質(zhì)量優(yōu)化提升[3]。趙雨娟提出面向車間RFID生產(chǎn)數(shù)據(jù)的清洗模型,解決生產(chǎn)數(shù)據(jù)質(zhì)量中數(shù)據(jù)異常和冗余問題[7]。趙梁濱對瓊州海峽水域的船舶AIS 軌跡數(shù)據(jù),采用子軌跡長度和量化壓縮精度的方法,使用Douglas-Peucker 算法壓縮數(shù)據(jù)量又保留原數(shù)據(jù)的交通流特性[8]。張沛朋針對巨量軌跡數(shù)據(jù),采用時間維度、軌跡點(diǎn)速度和曲率屬性,劃分子軌跡[9]。在停留點(diǎn)提取的問題上,綜合考慮軌跡數(shù)據(jù)的時間,速度,空間等多維屬性,提出停留點(diǎn)預(yù)選區(qū),張春風(fēng)研究非結(jié)構(gòu)化車聯(lián)網(wǎng)大數(shù)據(jù)存儲與處理技術(shù),改進(jìn)K-Means 算法對停留點(diǎn)預(yù)選區(qū)進(jìn)行聚類提高精度[10]。岳過在室內(nèi)移動對象的行為模式挖掘預(yù)處理過程中,使用Hadoop 平臺與Spark計算框架將原始定位信息轉(zhuǎn)換成保留軌跡中關(guān)鍵信息的語義軌跡序列[11]。于文利通過聚類放牧軌跡數(shù)據(jù),得到牲畜的不同覓食、進(jìn)食區(qū)域,并計算草場不同區(qū)域放牧強(qiáng)度以支持放牧預(yù)警機(jī)制的研究[12]。

表1:軌跡挖掘研究文獻(xiàn)分析框架

表2:軌跡挖掘研究期刊及其載文情況

表3:軌跡挖掘研究文獻(xiàn)的研究單位作者人次排名情況

3.3 出租車軌跡

出租車都裝有GPS,成為軌跡數(shù)據(jù)挖掘在交通應(yīng)用領(lǐng)域的研究熱點(diǎn)。研究者主要針對司機(jī)、乘客、交通管理部門應(yīng)用需求展開研究。周倫采用聚類算法從出租車軌跡數(shù)據(jù)中,挖掘城市的載客熱點(diǎn)和載客區(qū)域,以設(shè)計行車信息推薦服務(wù)[13]。鄭林江對重慶市出租車軌跡劃分成網(wǎng)格單元,統(tǒng)計網(wǎng)格內(nèi)軌跡點(diǎn)密度來定義城市的熱點(diǎn)區(qū)域,進(jìn)而分析重慶市居民出行行為[14]。趙玲計算西安市出租汽車載客熱點(diǎn)區(qū)域,并以總量統(tǒng)計和時間排序進(jìn)行區(qū)域分類,把公共汽車和出租車數(shù)據(jù)合并分析,支持完善城市綜合交通運(yùn)輸體系。楊振娟從蘭州市出租車的GPS 軌跡數(shù)據(jù)提取載客時空軌跡。姚銳基于DBSCAN 聚類統(tǒng)計出租車載客及乘客上車位置和時間段,為司機(jī)和乘客推薦最優(yōu)匹配方案。

3.4 語義軌跡

語義軌跡是在時空軌跡上附加有應(yīng)用信息,以發(fā)現(xiàn)蘊(yùn)含的有價值行為模式。研究者主要根據(jù)應(yīng)用需求語義指導(dǎo)時空軌跡挖掘的同時,得到更為實(shí)用的挖掘結(jié)果。趙斌綜述語義軌跡研究現(xiàn)狀與發(fā)展,重點(diǎn)討論模型定義、語義標(biāo)注技術(shù)、多源數(shù)據(jù)建模,認(rèn)為未來應(yīng)關(guān)注語義軌跡數(shù)據(jù)管理、分類和預(yù)測、流式數(shù)據(jù)挖掘、隱私保護(hù)、多粒度挖掘、評價方法等方面。周燕研究語義軌跡頻繁模式提取用戶停留點(diǎn)。吳瑕研究了近似到達(dá)時間約束下的語義軌跡頻繁模式AAFP 挖掘方法。劉春采用語義軌跡頻繁模式解決拼車需求問題。金瑩基于“用腳投票”理論,利用語義軌跡挖掘?qū)τ脩袈弥械呐d趣點(diǎn)分類,提高選址準(zhǔn)確率、高效性及高適用性。

4 總結(jié)與展望

通過對最新的軌跡挖掘文獻(xiàn)分析發(fā)現(xiàn):軌跡挖掘研究已成為數(shù)據(jù)挖掘領(lǐng)域研究熱點(diǎn),不僅形成南京、中科院等核心研究團(tuán)隊(duì),不少研究者也把支持向量機(jī)、深度學(xué)習(xí)、過程發(fā)現(xiàn)等方法引入軌跡挖掘研究,應(yīng)用領(lǐng)域涉及城市交通、旅游、生產(chǎn)、船舶、礦井、牧場等,研究主要集中在挖掘的數(shù)據(jù)預(yù)處理、挖掘算法和結(jié)果解釋。

時空軌跡是以連續(xù)的采樣點(diǎn)構(gòu)成在多個維度上綜合形成的曲線,以前研究更多關(guān)注軌跡的時空分布,即運(yùn)動模式,未來的研究應(yīng)更多集中在語義軌跡研究,因?yàn)闀r空軌跡挖掘的目標(biāo)是為了發(fā)展社會規(guī)律進(jìn)而解決隱含的社會問題。語義軌跡中語義信息融合是研究的難點(diǎn),尤其是軌跡數(shù)據(jù)預(yù)處理技術(shù),原因是不同的應(yīng)用會產(chǎn)生異構(gòu)的軌跡數(shù)據(jù)和語義維度數(shù)據(jù),不僅需要傳統(tǒng)的數(shù)據(jù)抽取、清洗、融合等方法,還需要把聚類、過程挖掘等智能技術(shù)從挖掘端前移至挖掘前階段,以提供高質(zhì)量和易處理的軌跡數(shù)據(jù)。在移動對象數(shù)量方面分為單體與群體運(yùn)動模式研究,在挖掘運(yùn)動模式、規(guī)律和異常事件等方面都是持續(xù)的研究熱點(diǎn)。在數(shù)據(jù)容量方面,巨量軌跡數(shù)據(jù)挖掘需要傳統(tǒng)軌跡挖掘方法進(jìn)行創(chuàng)新性改進(jìn),包括提高數(shù)據(jù)預(yù)處理效率、采用形式化方法進(jìn)行模型驗(yàn)證等。同時,面對小規(guī)模數(shù)據(jù)集的邊緣計算下的軌跡挖掘未來也應(yīng)受到更多關(guān)注。當(dāng)前在出租車、船舶、旅游等應(yīng)用領(lǐng)域已積累較多研究成果,研發(fā)領(lǐng)域通用軌跡挖掘分類器系統(tǒng)可進(jìn)一步擴(kuò)大軌跡挖掘應(yīng)用范圍,使得研究從理論走向?qū)嵺`,體現(xiàn)軌跡挖掘研究的重要意義。

猜你喜歡
語義分析研究
FMS與YBT相關(guān)性的實(shí)證研究
遼代千人邑研究述論
隱蔽失效適航要求符合性驗(yàn)證分析
語言與語義
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統(tǒng)及其自動化發(fā)展趨勢分析
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
認(rèn)知范疇模糊與語義模糊
主站蜘蛛池模板: 国产在线98福利播放视频免费| 99久久精品国产麻豆婷婷| 国产丰满成熟女性性满足视频| 亚洲男女天堂| 精久久久久无码区中文字幕| 欧美a在线视频| 亚洲无线一二三四区男男| 色国产视频| 国产成人盗摄精品| 在线日韩日本国产亚洲| 国产精品无码久久久久AV| 亚洲国产中文在线二区三区免| 国产精品亚洲综合久久小说| 国产丝袜一区二区三区视频免下载| 2021国产在线视频| 91成人在线观看| 国产手机在线ΑⅤ片无码观看| 91成人在线观看| 久久青草精品一区二区三区 | 亚洲 日韩 激情 无码 中出| 深夜福利视频一区二区| 国产成人高清在线精品| 高清无码一本到东京热| 精品一区国产精品| 91精品国产麻豆国产自产在线 | 亚洲视频一区| 中国一级毛片免费观看| 亚洲视频免费在线看| 精品一区二区三区水蜜桃| 久久综合亚洲色一区二区三区| 亚瑟天堂久久一区二区影院| 视频二区中文无码| 国产青榴视频| 成人伊人色一区二区三区| 国产女人喷水视频| 国产视频只有无码精品| 国产区在线观看视频| 国产网友愉拍精品| 久久久无码人妻精品无码| 国产精品hd在线播放| 国产精品第一区| 一级看片免费视频| 中文字幕乱码二三区免费| 国产不卡一级毛片视频| 十八禁美女裸体网站| 青草午夜精品视频在线观看| 成人无码一区二区三区视频在线观看| 在线看片中文字幕| 国产综合亚洲欧洲区精品无码| 欧美日韩另类在线| 亚洲天堂网2014| 999国产精品| 国产欧美日韩专区发布| 成人亚洲国产| 漂亮人妻被中出中文字幕久久| 国产成人欧美| 亚洲美女一区| 亚洲福利一区二区三区| 国产浮力第一页永久地址| 成人另类稀缺在线观看| 中文字幕 日韩 欧美| 2048国产精品原创综合在线| 欧美色99| 久久综合亚洲鲁鲁九月天| 少妇精品网站| 国产精品成人免费视频99| 精品无码人妻一区二区| 中文字幕在线播放不卡| 欧美视频在线第一页| 狠狠亚洲五月天| 人人看人人鲁狠狠高清| 免费一级大毛片a一观看不卡| 喷潮白浆直流在线播放| 综合色区亚洲熟妇在线| 欧美国产综合视频| 国产情精品嫩草影院88av| 欧美激情伊人| 人人91人人澡人人妻人人爽 | 九九热精品在线视频| 日韩欧美91| 精品撒尿视频一区二区三区| 97在线国产视频|