999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于web的數(shù)據(jù)庫技術(shù)與應(yīng)用研究

2020-09-16 13:29:19宋超
科學(xué)與信息化 2020年14期
關(guān)鍵詞:數(shù)據(jù)庫

宋超

摘要:本文對基于Web的數(shù)據(jù)庫技術(shù)進(jìn)行探討,確定基于Web的數(shù)據(jù)庫系統(tǒng)總體框架,詳細(xì)劃分了系統(tǒng)的總體功能并進(jìn)行分別闡述,通過MySQL數(shù)據(jù)庫設(shè)計信息的采集、分析以及管理過程,確定并設(shè)計了各模塊的主要功能,經(jīng)實踐證實,該系統(tǒng)可實現(xiàn)對系統(tǒng)的有效管理,可自動跟蹤互聯(lián)網(wǎng)信息并進(jìn)行分析與處理,自動生成網(wǎng)絡(luò)信息簡報,可滿足用戶對獲取信息的需求。

關(guān)鍵詞:數(shù)據(jù)庫;Web開發(fā)技術(shù);系統(tǒng)開發(fā)

互聯(lián)網(wǎng)技術(shù)不斷發(fā)展的當(dāng)前,通過網(wǎng)絡(luò)獲取信息具有方便、快速的優(yōu)勢,因此人們已經(jīng)習(xí)慣于這一信息獲取方式。本文探討了基于Web的數(shù)據(jù)庫開發(fā),可實現(xiàn)自動跟蹤信息并獲取,分析信息并處理,生成網(wǎng)絡(luò)信息簡報,能滿足人們對信息獲取的需求。

1Web信息獲取方法

Web的圖形界面良好,容易操作,因此受到人們的廣泛認(rèn)可。Web上的信息資源豐富,但是Web基于文件系統(tǒng),通過靜態(tài)HTML文本形式儲存,不能像數(shù)據(jù)庫系統(tǒng)一樣來對數(shù)據(jù)進(jìn)行管理。當(dāng)前信息量不斷增加,為了為人們發(fā)現(xiàn)知識以及查詢信息提供便利,需要研制基于Web的檢索系統(tǒng)及索引。信息獲取系統(tǒng)主要有人工轉(zhuǎn)換與自動轉(zhuǎn)換這兩種。

人工轉(zhuǎn)換這一方法利用搜索引擎來實現(xiàn)對HTML等信息的獲取,經(jīng)人工處理轉(zhuǎn)化為數(shù)據(jù)庫系統(tǒng),之后進(jìn)行查詢、排序以及索引,這種方法的優(yōu)勢在于實現(xiàn)難度低,但是其重要缺陷在于周期較長,因此無法滿足迅速更新數(shù)據(jù)的要求。

自動轉(zhuǎn)換這一方法經(jīng)系統(tǒng)在指定范圍內(nèi)迅速且自動地發(fā)現(xiàn)新信息并進(jìn)行自動更新,能通過搜索引擎實現(xiàn)數(shù)據(jù)的收集及索引。

2基于Web的數(shù)據(jù)庫開發(fā)

2.1系統(tǒng)總體設(shè)計

系統(tǒng)為數(shù)據(jù)庫、信息采集以及信息管理等服務(wù)器組成,通過互聯(lián)網(wǎng)實現(xiàn)彼此的通信。系統(tǒng)用戶有兩類,普通用戶以及系統(tǒng)管理員,從系統(tǒng)管理員的權(quán)限上劃分可以細(xì)化為管理員與操作員。普通用戶的權(quán)限只有對相應(yīng)文檔進(jìn)行查閱與下載;管理員可登錄信息管理服務(wù)器創(chuàng)建采集任務(wù),在數(shù)據(jù)庫中存入配置數(shù)據(jù)。信息采集服務(wù)器讀取相關(guān)數(shù)據(jù)后,采集信息并分析,在數(shù)據(jù)庫中儲存分析結(jié)果。信息管理服務(wù)器對采集任務(wù)結(jié)果進(jìn)行讀取并進(jìn)行統(tǒng)計及展示。

2.2功能模塊設(shè)計

子系統(tǒng)主要包括采集系統(tǒng)、處理系統(tǒng)、分析體統(tǒng)以及信息服務(wù)系統(tǒng)。

(1)信息采集系統(tǒng)

該系統(tǒng)負(fù)責(zé)對指定范圍的網(wǎng)站內(nèi)容進(jìn)行定向采集,支持對PDF、word、PHP、ASP、JSP等動態(tài)內(nèi)容的分頁抓取,將信息抓取后以文件的形式單獨保存,也可以在數(shù)據(jù)庫的字段中進(jìn)行存儲,采集范圍可包括整站采集、板塊內(nèi)容以及部分欄目采集。

通過關(guān)鍵詞:在常用搜索引擎中自動搜索數(shù)據(jù),結(jié)合實際需要來設(shè)計采集狀態(tài)、采集數(shù)量、開始/結(jié)束采集等,具備對站點資源數(shù)據(jù)進(jìn)行查找、刪除、增添以及修改等管理權(quán)限。自動識別采集主體后追蹤采集任務(wù)。

(2)信息處理系統(tǒng)

這一系統(tǒng)可以設(shè)置行業(yè)用戶信息類以及報紙類等不同網(wǎng)站站點的開發(fā)優(yōu)先級,經(jīng)專題設(shè)置實現(xiàn)對信息的管理及分類,結(jié)合需要來對數(shù)據(jù)進(jìn)行增添、刪除、編輯以及整理等管理維護(hù);以媒體的時間、來源等為依據(jù)對采集到的目標(biāo)媒體數(shù)據(jù)進(jìn)行分類統(tǒng)計,之后自動生成信息目錄;采用平面媒體報告的形式將所采集的信息展示出來;獲取地址中的指定內(nèi)容;生成信息簡報并進(jìn)行編輯;導(dǎo)入/導(dǎo)出需要采集的站點數(shù)據(jù)。

(3)信息分析系統(tǒng)

其功能包括對采集到的信息進(jìn)行分析,對信息的主題進(jìn)行識別,同時多角度跟蹤,通過熱詞以及聚類等方法來對發(fā)展趨勢進(jìn)行判斷以及對所需內(nèi)容進(jìn)行提取。基于上述功能統(tǒng)計根據(jù)信息的站點分布以及采集時間統(tǒng)計,輸出圖表形式的報告。

(4)信息服務(wù)系統(tǒng)

其功能包括對系統(tǒng)賬戶以及權(quán)限進(jìn)行管理,確定信息采集詞;監(jiān)測專題采集,顯示信息詳情;對關(guān)注信息進(jìn)行收藏。

2.3整體功能流程

根據(jù)專題出結(jié)果時,單個網(wǎng)站配置,之后在專題里設(shè)置關(guān)鍵詞:并添加網(wǎng)址,對篩選進(jìn)行設(shè)置,對采集時間進(jìn)行設(shè)置最后進(jìn)入信息分析流程。當(dāng)選擇根據(jù)詞頻出結(jié)果時,配置單個網(wǎng)站,確定模塊或者板塊,對篩選及采集時間進(jìn)行設(shè)置,根據(jù)熱度給出關(guān)鍵詞:,最后進(jìn)入信息分析流程。

進(jìn)行信息分析時,信息的采集管理包括專題配置以及單個網(wǎng)站配置,確定信息采集管理之后選擇采集方式,采集方式包括專題采集、全網(wǎng)采集以及網(wǎng)站采集,之后進(jìn)行定時采集,對內(nèi)容進(jìn)行識別,分析信息并進(jìn)行統(tǒng)計,生成簡報。

分別根據(jù)網(wǎng)站采集以及專題采集做出配置說明,采集方式包括全網(wǎng)(主要是搜狗以及百度等潴留搜索引擎)、專題(主要是網(wǎng)站中的某個欄目板塊)以及網(wǎng)站(指定的網(wǎng)站)這三種,指定采集數(shù)據(jù)類型,當(dāng)進(jìn)行全網(wǎng)采集時,要求指定關(guān)鍵詞:。

信息采集效率直接影響系統(tǒng)的使用效果,因此采用多線程方式來設(shè)計總體信息采集框架以提高信息采集效率,各線程執(zhí)行不同操作,從而充分利用資源。

2.4數(shù)據(jù)庫設(shè)計

由于系統(tǒng)設(shè)計大量數(shù)據(jù)表,需要通過多表分離的方式來對荷載進(jìn)行均衡,為了解決數(shù)據(jù)的檢索及存儲問題,采用MySQL數(shù)據(jù)庫,其具有容易操作且高效、安全的優(yōu)勢,能為信息的管理以及統(tǒng)計分析提供便利。建立字段并完善,從而做到準(zhǔn)確、全面地查詢數(shù)據(jù)。

邏輯結(jié)構(gòu)中,采集任務(wù)信息表最為關(guān)鍵,采用關(guān)聯(lián)設(shè)計的方法來對相關(guān)的關(guān)鍵數(shù)據(jù)表進(jìn)行設(shè)計。

3系統(tǒng)主要功能

3.1用戶管理功能

正如上文所說,系統(tǒng)的用戶有管理員與普通用戶兩種。具體的權(quán)限劃分方面,系統(tǒng)管理員可管理各模塊的內(nèi)容,設(shè)置采集時間權(quán)限等;操作員沒有權(quán)限操作用戶管理模式,但是有對其他模塊進(jìn)行操作的權(quán)限;普通用戶只有對文檔進(jìn)行查閱及下載的權(quán)限。根據(jù)這些需求,首先對系統(tǒng)模塊功能進(jìn)行確定,對功能點進(jìn)行排序標(biāo)號,組合相應(yīng)用戶類型,在數(shù)據(jù)庫的用戶權(quán)限表中進(jìn)行儲存,將功能點的耦合度降低,基于此關(guān)聯(lián)匹配新用戶與指定用戶類型,從而配置用戶權(quán)限。

3.2采集及分析功能

分析需要采集的網(wǎng)站,基于此定義信息采集規(guī)則、處理流程。在網(wǎng)站的對應(yīng)目錄下自定義配置文件,編寫對應(yīng)網(wǎng)站的處理代碼。讀取采集任務(wù)時,先與數(shù)據(jù)庫連接,之后進(jìn)行SQL語句的編寫。采集信息時,對采集任務(wù)的網(wǎng)站模塊ID、時間間隔、關(guān)鍵詞以及采集方式等進(jìn)行解析讀寫,基于此將采集線程開啟,執(zhí)行采集任務(wù)。當(dāng)成功采集結(jié)果主要內(nèi)容時,先以文章的位置為依據(jù)來編寫正則表達(dá)式,過濾結(jié)構(gòu)化標(biāo)簽,之后再提取文章主要信息。分析信息時,過濾文本無用符號,先建立系統(tǒng)通用詞庫,再通過調(diào)用功能去除文本通用詞,最后采用TextRank~法對關(guān)鍵詞進(jìn)行提取,信息采集階段已經(jīng)在數(shù)據(jù)庫中存放了標(biāo)題,處理階段已經(jīng)在磁盤上存放了正文,依次讀取文章信息,通過算法分析關(guān)鍵詞,待相同采集任務(wù)相關(guān)的文章都已經(jīng)分析完畢時,提取熱度最高的五個詞,這些詞就是關(guān)鍵詞。

4系統(tǒng)測試

通過黑盒測試法來測試該系統(tǒng)的主要功能模塊的主要功能,進(jìn)而檢測該系統(tǒng)穩(wěn)定性與實用性。經(jīng)測試證明,系統(tǒng)管理員能有效管理系統(tǒng),能以用戶的需求為依據(jù)設(shè)置信息采集的目標(biāo)站點、時間間隔以及主體,能通過多角度跟蹤主題的后續(xù)發(fā)展,且該系統(tǒng)在信息的采集、讀取以及分析方面表現(xiàn)良好,可通過平面媒體報告的形式將結(jié)果呈現(xiàn)給用戶。該系統(tǒng)的拓展性以及穩(wěn)定性良好,可投入使用。

5結(jié)束語

為了能夠滿足用戶的需求,本文對基于Web的數(shù)據(jù)庫技術(shù)進(jìn)行探討,與Web技術(shù)以及HTTP協(xié)議相結(jié)合確定基于Web的數(shù)據(jù)庫系統(tǒng)總體框架,詳細(xì)劃分了系統(tǒng)的總體功能并進(jìn)行分別闡述,基于系統(tǒng)整體拓?fù)浣Y(jié)構(gòu),通過MySQL數(shù)據(jù)庫設(shè)計信息的采集、分析以及管理過程,確定并設(shè)計了各模塊的主要功能,最終經(jīng)實踐證實,該系統(tǒng)可實現(xiàn)對系統(tǒng)的有效管理,可自動跟蹤互聯(lián)網(wǎng)信息并進(jìn)行分析與處理,自動生成網(wǎng)絡(luò)信息簡報,可滿足用戶對獲取信息的需求。

猜你喜歡
數(shù)據(jù)庫
數(shù)據(jù)庫
財經(jīng)(2017年15期)2017-07-03 22:40:49
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
兩種新的非確定數(shù)據(jù)庫上的Top-K查詢
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
數(shù)據(jù)庫
財經(jīng)(2015年3期)2015-06-09 17:41:31
數(shù)據(jù)庫
財經(jīng)(2014年21期)2014-08-18 01:50:18
數(shù)據(jù)庫
財經(jīng)(2014年6期)2014-03-12 08:28:19
數(shù)據(jù)庫
財經(jīng)(2013年6期)2013-04-29 17:59:30
主站蜘蛛池模板: 色婷婷综合激情视频免费看| 婷婷色在线视频| 国产青青操| 欧美精品成人一区二区在线观看| 五月激激激综合网色播免费| 国产高清不卡视频| 中文字幕乱码二三区免费| 欧美成人一区午夜福利在线| 国产日韩欧美在线播放| 亚洲精品va| 五月天丁香婷婷综合久久| 国产福利免费在线观看| 国产精品jizz在线观看软件| 99在线视频免费| 国产精品视频导航| 色男人的天堂久久综合| www.国产福利| 在线观看国产小视频| 国产乱子伦手机在线| 一区二区三区国产| a级毛片免费网站| 亚洲色中色| 日韩在线欧美在线| 日本午夜影院| 内射人妻无码色AV天堂| 偷拍久久网| 性欧美久久| 欧美色视频在线| aaa国产一级毛片| 亚洲高清中文字幕| 婷婷在线网站| 波多野结衣的av一区二区三区| 99手机在线视频| 国产精品久久久久久久久久久久| 日韩在线影院| 久久亚洲美女精品国产精品| 伊人久热这里只有精品视频99| 欧美中文字幕无线码视频| 日韩精品亚洲精品第一页| 亚洲动漫h| 91青青在线视频| 亚洲欧美一区二区三区图片| 高潮毛片免费观看| 91九色视频网| 成年人国产网站| 免费大黄网站在线观看| 999国产精品| 色老二精品视频在线观看| 2020国产精品视频| 日韩高清欧美| 国产偷倩视频| 国产精品一区二区国产主播| 青青青国产视频手机| 国产日本欧美在线观看| 亚洲午夜天堂| h视频在线播放| 欧美精品综合视频一区二区| 成年女人18毛片毛片免费| 国产特一级毛片| 97久久人人超碰国产精品| 久久精品91麻豆| 亚洲精品久综合蜜| 午夜精品福利影院| 色色中文字幕| 久久99国产综合精品1| 日韩黄色在线| 午夜不卡视频| 国产精品99久久久久久董美香| 五月婷婷丁香综合| 日韩在线观看网站| 国产精品林美惠子在线观看| 波多野结衣的av一区二区三区| 国产三级精品三级在线观看| 亚洲一区毛片| 亚洲成人黄色在线| 欧美精品亚洲精品日韩专区va| 午夜福利网址| 日韩AV手机在线观看蜜芽| 99热亚洲精品6码| 露脸一二三区国语对白| 天天综合网色| 91福利在线观看视频|