999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

校園智能化信息檢索系統的設計與實現

2016-12-12 09:55:20鄭昕欣劉明銘
中文信息 2016年10期
關鍵詞:信息檢索智能化校園

鄭昕欣+劉明銘

摘 要: 本文通過對不同用戶的需求、信息獲取途徑的深入了解以及對智能化信息檢索進行了可行性分析后,對其作了需求分析、功能模塊劃分、數據庫的設計、算法設計以及界面設計,選定在校大學生作為適用群體,完成了校園信息智能化檢索系統的開發。它可以應用于校園、企業、網站等諸多實體,因此具有一定的使用價值。

關鍵詞:智能化 信息檢索 校園 檢索系統

中圖分類號:TP3 文獻標識碼:A 文章編號:1003-9082(2016)10-0016-01

一、引言

本文以在校大學生為服務對象,針對上述信息服務系統的不足,設計研發了針對大學生的智能化信息檢索系統,實現了根據對用戶自身特性、用戶需求和漢語言自身特點等多方面的綜合考量進行有針對性地信息推送這一功能。通過使用本系統,可以提高在校大學生獲取信息的便利度和快捷度,同時也方便了大學生之間的交流和溝通。

二、系統分析

1.系統總體目標

在用戶方面,本系統致力于帶來便捷的用戶體驗、簡潔大方的用戶接口;在管理員方面,本系統致力于實現簡便的后期維護,如要對功能模塊方面作修改,則無需進行整個系統的重新架構。

2.技術可行性分析

本系統是一個典型的數據庫應用程序?,F有的數據庫應用程序開發技術已非常成熟,利用現有技術完全可以實現預定的功能。Java語言簡單、功能強大并容易掌握。而MySQL是一個非常優秀的中型數據庫管理軟件,使用方便,性能穩定。故采用Java+MySQL技術完全能夠實現本系統的開發。

三、系統設計

1.功能模塊描述

1.1登錄模塊

將用戶輸入的用戶名和密碼帶入數據庫,在數據庫中進行匹配,驗證賬號和密碼,

1.2主頁面模塊

在此模塊中列舉本系統所包含的所有子功能模塊以及一些推薦信息。

1.3近期活動模塊

發布內容來自學校社團等活動主辦方,并根據實時情況更改發布內容。

1.4生活服務模塊

學生成功登錄后,可以自行發布信息,該信息經過排版發布于子功能模塊中,并可被其他登陸用戶看到。

1.5自助查詢模塊

用戶成功登錄后,可以根據需要發起搜索,后臺服務器根據搜索記錄進行智能匹配,并在子功能模塊中反饋給用戶。

四、信息檢索關鍵技術及系統實現

1.基于網絡爬蟲的網頁信息提取

本系統采用Java和MySQL數據庫聯動的方式,在每一次抽取新的URL時,通過Jsoup類庫解析出document實例對象,在此實例對象中抽取需要的元素(如文章內容等),同時將URL和該網頁的標題加入數據庫,形成標題與URL一一對應的表結構。

由于互聯網上的信息總是實時更新的,存儲在數據庫中作為信息儲備的所有信息也必須配合互聯網得到時效性,實現實時更新。本系統通過調用Mycrawler類中的refresh方法來實現定時更新,利用多線程來監督更新并計時。

2.提取信息的分詞實現

在分詞部分,核心要點是 1.詞典樹的構建 2.中文詞匯的匹配,即對一句話中詞語切割的位置。為此,本系統采用了IKAnalyzer分詞技術。IKAnalyzer是一個開源的,基于java語言開發的輕量級的中文分詞工具包。

在詞語的匹配過程當中,IK中默認用到三個子分詞器,分別是LetterSegmenter(字母分詞器),CN_QuantifierSegment(量詞分詞器),CJKSegmenter(中日韓分詞器)。分詞會先后經過這三個分詞器,首先要對輸入的字符串進行處理,將字符串轉換為char型進行匹配輸入字符串以char的形式進行匹配,一個char如果能取到hitList,那么會鎖定hitList,循環到第二個char,如果能在hitList里與上一個char匹配成詞,則保存當前的newLexeme,并加入到輸出結果集。isEnd()判斷是否結束,如果是,則context.currCursor偏移1位,繼續取詞。以此類推,直到整個字符串遍歷完畢。

3.智能化方法及實現

隨著計算機技術的不斷發展,智能化以其良好的用戶體驗一躍成為今后軟件設計的一個必然趨勢。本系統的智能化主要體現在:根據同義詞、近義詞詞庫,實現同義詞匹配搜索。即,根據用戶輸入的關鍵字,通過同義詞匹配,將與用戶搜索內容詞義相近的搜索結果按照其不同的匹配度降序排列,同樣也反饋給用戶。

在獲取了用戶的搜索指令之后,本系統對關鍵詞進行同義詞查詢,使用戶搜索內容得到一定擴充。同義詞部分在Lucene4.6中通過SynonymFilterFactory實現查詢。

Lucene是Apache軟件基金會Jakarta項目組的一個子項目,是一個開放源代碼的全文搜索引擎工具包,但它不是一個完整的全文搜索引擎,而是一個全文搜索引擎架構,提供了完整的查詢引擎和索引引擎,部分文本分析引擎。

本系統首先通過新建Hashmap儲存相關版本信息和同義詞詞典信息,并載入相關內容。而后將已提取到的多個關鍵詞進行stream化以供索引。最后借助SynonymFilterFactory類,根據同義詞詞庫,以自然語言中的意群作為標準,實現同義詞查詢。

五、總結與展望

本系統從用戶的角度出發,發現了現代信息社會特定群體獲取信息時存在的一些弊端,并根據這些弊端提出了一種更優的實現方法,該方法不同于當今較通用的智能匹配,同時兼顧了用戶群體和自然語言特征兩個方面,將用戶需求進一步細分,仿真方法證明了該方法在數據量很大的情況下依然有效。

參考文獻

[1](美)西爾伯沙茨(Silberschatz.A.)等著.數據庫系統概念:Database System Concepts[M].楊冬青,李紅燕,唐世渭等譯.原書第六版.北京:機械工業出版社,2012年:41-42.

[2]李剛.瘋狂Java講義(精粹)[M].第二版.北京:電子工業出版社,2014,236-242.

猜你喜歡
信息檢索智能化校園
智能化戰爭多維透視
軍事文摘(2022年19期)2022-10-18 02:41:14
印刷智能化,下一站……
印刷工業(2020年4期)2020-10-27 02:45:52
基于“物聯網+”的智能化站所初探
校園的早晨
琴童(2017年3期)2017-04-05 14:49:04
春滿校園
醫學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
基于神經網絡的個性化信息檢索模型研究
開心校園
石油石化演進智能化
能源(2015年8期)2015-05-26 09:15:56
爆笑校園
主站蜘蛛池模板: 91啪在线| 日韩二区三区| 美女无遮挡免费网站| 97色婷婷成人综合在线观看| 国产成人精品无码一区二 | 成人国产免费| 国产精品毛片一区| 日韩色图区| 国产精品网址你懂的| 无码乱人伦一区二区亚洲一| 亚洲中文无码h在线观看| 色噜噜在线观看| 黄色在线不卡| 国产美女91呻吟求| 国产第一页屁屁影院| 一级毛片高清| 男女性色大片免费网站| 97久久超碰极品视觉盛宴| 一级毛片免费不卡在线| 亚洲日韩AV无码一区二区三区人| 亚洲国产欧美中日韩成人综合视频| 自拍偷拍欧美| 精品天海翼一区二区| 国产青榴视频| 免费高清a毛片| 欧美激情综合| 亚洲精品777| 亚洲色图在线观看| 真实国产乱子伦高清| a级毛片免费播放| 日韩视频福利| 天堂亚洲网| 国产精品 欧美激情 在线播放| 在线欧美日韩| 58av国产精品| 欧美性天天| 18禁色诱爆乳网站| 国产黄网站在线观看| 欧美久久网| 青青青视频蜜桃一区二区| 色婷婷电影网| 欧日韩在线不卡视频| www.99在线观看| 国产亚洲第一页| 亚洲天堂.com| 三上悠亚在线精品二区| 毛片a级毛片免费观看免下载| 国产精品对白刺激| 综合亚洲网| 伊人色天堂| 亚洲不卡影院| 色网站免费在线观看| 国产在线精彩视频二区| 成人福利在线看| 免费国产黄线在线观看| 香蕉精品在线| 国产chinese男男gay视频网| 成人午夜免费观看| 91福利在线看| 亚洲成人福利网站| 亚洲另类国产欧美一区二区| 中文字幕一区二区人妻电影| 国产v精品成人免费视频71pao| 久草青青在线视频| 国产一级α片| 久久亚洲美女精品国产精品| 亚洲人成网站色7777| 久久精品丝袜高跟鞋| 婷五月综合| 高h视频在线| 老色鬼欧美精品| 极品国产一区二区三区| 欧美一级色视频| 中国一级特黄视频| 欧洲一区二区三区无码| 福利片91| 熟妇无码人妻| 99在线观看国产| 国产人人射| 亚洲aaa视频| 亚洲日韩国产精品综合在线观看| 国产sm重味一区二区三区|